文字資訊的模糊搜索是對與搜索查詢相似或接近的字串的搜索。

同時,文本字串的模糊或相似程度通常使用編輯距離(Levenshtein 距離)進行評估。 兩個字串的編輯距離是將一個字串轉換為另一個字串所需的字元替換、插入和刪除操作的最小數量。 兩個相鄰字元的換位也可以被視為有效的編輯操作(Damerau-Levenshtein 距離)。

給定模糊值為 2 次編輯的模糊搜索範例是搜索查詢「樹」和搜尋結果」這些」。。 此處,字元"r"被替換為"h",字元"e"和"s"被換位。 也就是說,在這個模糊搜索示例中,這兩個單詞的 Damerau-Levenshtein 距離為 2。

以下方法最常用於實現模糊搜索:

搜尋應用 Web 應用程式基於 GroupDocs.Search 全文搜尋引擎構建。 此庫中模糊匹配的實現具有所列方法的最佳功能:

若要在搜索應用中獲取單詞的模糊匹配,你需要指定所需的錯誤數(模糊值),範圍為 1 到 9 個字元。 您還可以將選項設置為僅搜索具有最小差異數的單詞,或搜索給定差異數內的所有單詞。

GroupDocs.Search 庫具有許多其他模糊匹配選項。 例如,您可以將單詞之間的差異數設置為單詞長度的線性函數,甚至可以為每個單詞長度值單獨設置差異數。

如何在文檔中查找文本的模糊匹配項

  • 在檔案拖放區域內按下以上傳檔或拖放檔。
  • 上傳完成後,您將能夠在文件中執行搜索。
  • 輸入由一個或多個單詞組成的搜索查詢,這些單詞由空格分隔。
  • 選擇搜索類型:短語、所有字詞、任何字詞。
  • 將一個單詞中允許的錯誤數從1設置為9;如有必要,請設置僅獲得最佳結果的標誌。
  • 通過按兩下「搜索」按鈕獲取結果。
  • 使用「添加檔」按鈕添加更多檔。
  • 選擇添加的檔以將其包含在索引中並執行搜索。

常見問題

  • 在線應用程式「文檔中的模糊搜索」如何工作?

    搜索分兩個階段執行。首先,將文件添加到索引中。然後才在索引中執行搜索。
  • 隱私呢,使用在線應用程式在文檔中進行模糊搜索是否安全?

    只有擁有連結的使用者才能訪問包含已上傳檔和已編入索引的檔的資料夾。所有上傳的檔將在24小時後從伺服器中刪除。
  • 使用在線應用程式「文檔中的模糊搜索」是否需要互聯網連接?

    此應用程式是客戶端-伺服器。如果您在使用該應用程式時失去互聯網連接,您將無法獲得搜尋結果。
  • 我可以搜索Linux、Mac OSAndroid嗎?

    您可以從具有現代瀏覽器和互聯網連接的任何設備進行搜索,無論操作系統如何。

模糊搜索應用支援的檔案格式

您可以執行多種檔案格式的模糊搜尋。請參閱下面的完整清單。

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner