文本信息的模糊搜索是对与搜索查询相似或接近的字符串的搜索。

同时,文本字符串的模糊或相似程度通常使用编辑距离(Levenshtein 距离)进行评估。 两个字符串的编辑距离是将一个字符串转换为另一个字符串所需的字符替换、插入和删除操作的最小数量。 两个相邻字符的换位也可以被视为有效的编辑操作(Damerau-Levenshtein 距离)。

给定模糊值为 2 次编辑的模糊搜索示例是搜索查询"树"和搜索结果"这些"。 此处,字符"r"被替换为"h",字符"e"和"s"被换位。 也就是说,在这个模糊搜索示例中,这两个单词的 Damerau-Levenshtein 距离为 2。

以下方法最常用于实现模糊搜索:

搜索应用 Web 应用程序基于 GroupDocs.Search 全文搜索引擎构建。 此库中模糊匹配的实现具有所列方法的最佳功能:

若要在搜索应用中获取单词的模糊匹配,你需要指定所需的错误数(模糊值),范围为 1 到 9 个字符。 您还可以将选项设置为仅搜索具有最小差异数的单词,或搜索给定差异数内的所有单词。

GroupDocs.Search 库具有许多其他模糊匹配选项。 例如,您可以将单词之间的差异数设置为单词长度的线性函数,甚至可以为每个单词长度值单独设置差异数。

如何在文档中查找文本的模糊匹配项

  • 在文件拖放区域内单击以上传文件或拖放文件。
  • 上传完成后,您将能够在文件中执行搜索。
  • 输入由一个或多个单词组成的搜索查询,这些单词由空格分隔。
  • 选择搜索类型:短语、所有字词、任何字词。
  • 将一个单词中允许的错误数从1设置为9;如有必要,请设置仅获得最佳结果的标志。
  • 通过单击"搜索"按钮获取结果。
  • 使用"添加文件"按钮添加更多文件。
  • 选择添加的文件以将其包含在索引中并执行搜索。

常见问题

  • 在线应用程序“文档中的模糊搜索”如何工作?

    搜索分两个阶段执行。首先,将文档添加到索引中。然后才在索引中执行搜索。
  • 隐私呢,使用在线应用程序在文档中进行模糊搜索是否安全?

    只有拥有链接的用户才能访问包含已上传文件和已编入索引的文件的文件夹。所有上传的文件将在 24 小时后从服务器中删除。
  • 使用在线应用程序“文档中的模糊搜索”是否需要互联网连接?

    此应用程序是客户端-服务器。如果您在使用该应用程序时失去互联网连接,您将无法获得搜索结果。
  • 我可以搜索Linux、Mac OSAndroid吗?

    您可以从具有现代浏览器和互联网连接的任何设备进行搜索,无论操作系统如何。

模糊搜索应用支持的文件格式

您可以执行多种文件格式的模糊搜索。请参阅下面的完整列表。

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner