Tìm kiếm mờ nhạt thông tin văn bản là tìm kiếm các chuỗi tương tự hoặc gần với truy vấn tìm kiếm.

Đồng thời, mức độ mờ hoặc tương đồng của chuỗi văn bản thường được đánh giá bằng cách sử dụng khoảng cách chỉnh sửa (khoảng cách Levenshtein). Và khoảng cách chỉnh sửa của hai chuỗi là số lượng tối thiểu của các hoạt động thay thế ký tự, chèn và xóa cần thiết để chuyển đổi một chuỗi thành một chuỗi khác. Việc chuyển vị hai ký tự liền kề cũng có thể được coi là một hoạt động chỉnh sửa hợp lệ (khoảng cách Damerau-Levenshtein).

Một tìm kiếm mờ trong PDF ví dụ cho một giá trị mờ nhất định của 2 chỉnh sửa là truy vấn tìm kiếm "cây" và kết quả tìm kiếm "những". Ở đây ký tự "r" được thay thế bằng "h" và các ký tự "e" và "s" được chuyển đổi. Đó là, khoảng cách Damerau-Levenshtein cho hai từ này là 2 trong tìm kiếm mờ này trong ví dụ PDF.

Các phương pháp sau đây thường được sử dụng để thực hiện tìm kiếm mờ:

Ứng dụng web Fuzzy tìm kiếm trong PDF được xây dựng trên cơ sở của công cụ tìm kiếm toàn văn GroupDocs.Search. Việc thực hiện kết hợp mờ trong thư viện này có các tính năng tốt nhất của các phương pháp được liệt kê:

Trong ứng dụng này, để có được một kết hợp mờ của các từ trong PDF, bạn cần chỉ định số lượng lỗi cần thiết (giá trị mờ) từ 1 đến 9 ký tự. Bạn cũng có thể đặt tùy chọn tìm kiếm các từ chỉ có số lượng khác biệt tối thiểu hoặc tìm kiếm tất cả các từ trong một số khác biệt nhất định.

Thư viện GroupDocs.Search có nhiều tùy chọn kết hợp mờ nhạt khác. Ví dụ: bạn có thể đặt số lượng khác biệt giữa các từ như một hàm tuyến tính của độ dài từ hoặc thậm chí đặt số lượng khác biệt riêng lẻ cho mỗi giá trị của độ dài từ.

Làm thế nào để tìm một kết hợp mờ của văn bản trong PDF

  • Bấm vào bên trong vùng thả tệp để tải lên tệp PDF hoặc kéo & thả tệp PDF.
  • Sau khi tải lên hoàn tất, bạn sẽ có thể thực hiện tìm kiếm trong tệp PDF của mình.
  • Nhập truy vấn tìm kiếm của bạn bao gồm một hoặc nhiều từ được ngăn cách bởi các khoảng trống.
  • Chọn loại tìm kiếm: cụm từ, tất cả các từ, bất kỳ từ nào.
  • Đặt số lỗi được phép trong một từ từ 1 đến 9; nếu cần thiết, hãy đặt cờ để chỉ có được kết quả tốt nhất.
  • Nhận kết quả bằng cách nhấp vào nút "Tìm kiếm".
  • Thêm nhiều tệp PDF với nút "Thêm tệp".
  • Chọn các tệp đã thêm để đưa chúng vào chỉ mục và thực hiện tìm kiếm.

Câu hỏi thường gặp

  • Ứng dụng trực tuyến Fuzzy Search in PDF hoạt động như thế nào?

    Việc tìm kiếm được thực hiện trong hai giai đoạn. Đầu tiên, tài liệu được thêm vào một chỉ mục. Và chỉ sau đó tìm kiếm được thực hiện trong chỉ mục.
  • Còn về quyền riêng tư, sử dụng ứng dụng trực tuyến Fuzzy Search trong PDF có an toàn không?

    Quyền truy cập vào thư mục của bạn với các tệp đã tải lên và lập chỉ mục chỉ có sẵn cho người có liên kết. Tất cả các tệp đã tải lên sẽ bị xóa khỏi máy chủ sau 24 giờ.
  • Có cần kết nối internet để sử dụng ứng dụng trực tuyến Fuzzy Search trong PDF không?

    Ứng dụng này là máy khách-máy chủ. Nếu mất kết nối Internet trong khi sử dụng ứng dụng, bạn sẽ không thể nhận kết quả tìm kiếm.
  • Tôi có thể tìm kiếm trên Linux, Mac OS, Android không?

    Bạn có thể tìm kiếm từ bất kỳ thiết bị nào, bất kể hệ điều hành, có trình duyệt hiện đại và kết nối internet.

Các định dạng tệp khác được hỗ trợ bởi ứng dụng tìm kiếm Fuzzy

Bạn cũng có thể thực hiện tìm kiếm mờ ở nhiều định dạng tệp khác. Vui lòng xem danh sách đầy đủ bên dưới.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner