文本信息的模糊搜索是对与搜索查询相似或接近的字符串的搜索。

同时,文本字符串的模糊或相似程度通常使用编辑距离(Levenshtein 距离)进行评估。 两个字符串的编辑距离是将一个字符串转换为另一个字符串所需的字符替换、插入和删除操作的最小数量。 两个相邻字符的换位也可以被视为有效的编辑操作(Damerau-Levenshtein 距离)。

DOCX 示例中给定模糊值为 2 个编辑的模糊搜索是搜索查询"树"和搜索结果"这些"。 此处,字符"r"被替换为"h",字符"e"和"s"被换位。 也就是说,在 DOCX 示例中的模糊搜索中,这两个单词的 Damerau-Levenshtein 距离为 2。

以下方法最常用于实现模糊搜索:

DOCX 中的 Web 应用程序模糊搜索建立在 GroupDocs.Search 全文搜索引擎的基础上。 此库中模糊匹配的实现具有所列方法的最佳功能:

在此应用程序中,要获得 DOCX 中单词的模糊匹配,您需要指定所需的错误数(模糊值),从 1 到 9 个字符。 您还可以将选项设置为仅搜索具有最小差异数的单词,或搜索给定差异数内的所有单词。

GroupDocs.Search 库具有许多其他模糊匹配选项。 例如,您可以将单词之间的差异数设置为单词长度的线性函数,甚至可以为每个单词长度值单独设置差异数。

如何在 DOCX 中查找文本的模糊匹配项

  • 在文件放置区域内单击以上传 DOCX 个文件或拖放 DOCX 个文件。
  • 上传完成后,您将能够在DOCX文件中执行搜索。
  • 输入由一个或多个单词组成的搜索查询,这些单词由空格分隔。
  • 选择搜索类型:短语、所有字词、任何字词。
  • 将一个单词中允许的错误数从1设置为9;如有必要,请设置仅获得最佳结果的标志。
  • 通过单击"搜索"按钮获取结果。
  • 使用"添加文件"按钮添加更多DOCX文件。
  • 选择添加的文件以将其包含在索引中并执行搜索。

常见问题

  • 在线应用程序DOCX中的模糊搜索如何工作?

    搜索分两个阶段执行。首先,将文档添加到索引中。然后才在索引中执行搜索。
  • 隐私呢,在DOCX中使用在线应用程序模糊搜索是否安全?

    只有拥有链接的用户才能访问包含已上传文件和已编入索引的文件的文件夹。所有上传的文件将在 24 小时后从服务器中删除。
  • 在DOCX中使用在线应用程序模糊搜索是否需要互联网连接?

    此应用程序是客户端-服务器。如果您在使用该应用程序时失去互联网连接,您将无法获得搜索结果。
  • 我可以搜索Linux、Mac OSAndroid吗?

    您可以从具有现代浏览器和互联网连接的任何设备进行搜索,无论操作系统如何。

模糊搜索应用程序支持的其他文件格式

您还可以以许多其他文件格式执行模糊搜索。请参阅下面的完整列表。

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner