文字資訊的模糊搜索是對與搜索查詢相似或接近的字串的搜索。

同時,文本字串的模糊或相似程度通常使用編輯距離(Levenshtein 距離)進行評估。 兩個字串的編輯距離是將一個字串轉換為另一個字串所需的字元替換、插入和刪除操作的最小數量。 兩個相鄰字元的換位也可以被視為有效的編輯操作(Damerau-Levenshtein 距離)。

DOCX 示例中給定模糊值為 2 個編輯的模糊搜索是搜索查詢"樹"和搜尋結果"這些"。 此處,字元"r"被替換為"h",字元"e"和"s"被換位。 也就是說,在 DOCX 示例中的模糊搜索中,這兩個單詞的 Damerau-Levenshtein 距離為 2。

以下方法最常用於實現模糊搜索:

DOCX 中的 Web 應用程式模糊搜索建立在 GroupDocs.Search 全文搜尋引擎的基礎上。 此庫中模糊匹配的實現具有所列方法的最佳功能:

在此應用程式中,要獲得 DOCX 中單詞的模糊匹配,您需要指定所需的錯誤數(模糊值),從 1 到 9 個字元。 您還可以將選項設置為僅搜索具有最小差異數的單詞,或搜索給定差異數內的所有單詞。

GroupDocs.Search 庫具有許多其他模糊匹配選項。 例如,您可以將單詞之間的差異數設置為單詞長度的線性函數,甚至可以為每個單詞長度值單獨設置差異數。

如何在 DOCX 中查找文本的模糊匹配項

  • 按下檔案掉落區域內以上傳DOCX檔或拖動和刪除DOCX檔。
  • 上傳完成後,您將能夠在DOCX檔中執行搜索。
  • 輸入由一個或多個單詞組成的搜索查詢,這些單詞由空格分隔。
  • 選擇搜索類型:短語、所有字詞、任何字詞。
  • 將一個單詞中允許的錯誤數從1設置為9;如有必要,請設置僅獲得最佳結果的標誌。
  • 通過按兩下「搜索」按鈕獲取結果。
  • 使用「添加檔」按鈕添加更多DOCX檔。
  • 選擇添加的檔以將其包含在索引中並執行搜索。

常見問題

  • 在線應用程式DOCX中的模糊搜索如何工作?

    搜索分兩個階段執行。首先,將文件添加到索引中。然後才在索引中執行搜索。
  • 隱私呢,在DOCX中使用在線應用程式模糊搜索是否安全?

    只有擁有連結的使用者才能訪問包含已上傳檔和已編入索引的檔的資料夾。所有上傳的檔將在24小時後從伺服器中刪除。
  • 在DOCX中使用在線應用程式模糊搜索是否需要互聯網連接?

    此應用程式是客戶端-伺服器。如果您在使用該應用程式時失去互聯網連接,您將無法獲得搜尋結果。
  • 我可以搜索Linux、Mac OSAndroid嗎?

    您可以從具有現代瀏覽器和互聯網連接的任何設備進行搜索,無論操作系統如何。

模糊搜索應用程式支援的其他檔案格式

您還可以以許多其他檔案格式執行模糊搜索。請參閱下面的完整清單。

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner