テキスト情報のあいまい検索は、検索クエリに類似または近い文字列の検索です。

同時に、テキスト文字列のあいまいさや類似性の程度は、ほとんどの場合、編集距離(レーベンシュタイン距離)を使用して評価されます。 また、2 つの文字列の編集距離は、ある文字列を別の文字列に変換するために必要な文字置換、挿入、および削除操作の最小数です。 隣接する2つの文字の転置は、有効な編集操作(Damerau-Levenshtein距離)と考えることもできます。

DOCX の 2 編集の特定のあいまいさ値に対するあいまい検索は、検索クエリ "tree" と検索結果 "these" です。 ここでは、文字 "r" は "h" に置き換えられ、文字 "e" と "s" は転置されます。 つまり、この 2 つの単語のダメラウ-レーベンシュタイン距離は、DOCX 例のこのあいまいな検索では 2 です。

次のメソッドは、あいまい検索を実装するために最もよく使用されます。

DOCXのWebアプリケーションファジィ検索は、GroupDocs.Search全文検索エンジンをベースに構築されている。 このライブラリでのあいまい一致の実装には、リストされたメソッドの最高の機能があります。

本アプリでは、DOCXで単語のあいまい一致を取得するには、必要なミス回数(あいまいさ値)を1~9文字の範囲で指定する必要があります。 また、最小数の相違点のみを持つ単語を検索するか、特定の差異数内のすべての単語を検索するようにオプションを設定することもできます。

GroupDocs.Search ライブラリには、他にも多くのファジーマッチングオプションがあります。 たとえば、単語間の差異の数を単語長の一次関数として設定したり、単語長の値ごとに差異の数を個別に設定したりすることもできます。

DOCX でテキストのあいまい一致を見つける方法

  • ファイルドロップエリア内をクリックしてDOCXファイルをアップロードするか、DOCXファイルをドラッグ&ドロップします。
  • アップロードが完了すると、DOCXファイルで検索できるようになります。
  • スペースで区切られた 1 つ以上の単語で構成される検索クエリを入力します。
  • 検索の種類 (語句、すべての単語、任意の単語) を選択します。
  • 単語で許可される間違いの数を 1 から 9 に設定します。必要に応じて、最良の結果のみを得るためのフラグを設定します。
  • 「検索」ボタンをクリックして結果を取得します。
  • 「ファイル追加」ボタンでDOCXファイルをさらに追加します。
  • 追加したファイルを選択してインデックスに含め、検索を実行します。

よくある質問

  • DOCXのオンラインアプリあいまい検索はどのように機能しますか?

    検索は2段階で実行されます。まず、ドキュメントがインデックスに追加されます。そしてその時だけ、検索はインデックスで実行されます。
  • プライバシーはどうですか、DOCXでオンラインアプリのあいまい検索を使用しても安全ですか?

    アップロードおよびインデックスが作成されたファイルを含むフォルダへのアクセスは、リンクを知っているユーザーのみが利用できます。アップロードされたすべてのファイルは、24時間後にサーバーから削除されます。
  • DOCXでオンラインアプリのあいまい検索を使用するにはインターネット接続が必要ですか?

    このアプリケーションはクライアントサーバーです。アプリの使用中にインターネット接続が失われると、検索結果を取得できなくなります。
  • Linux、Mac OS、Androidで検索できますか?

    オペレーティングシステムに関係なく、最新のブラウザとインターネット接続を備えた任意のデバイスから検索できます。

ファジー検索アプリでサポートされているその他のファイル形式

また、他の多くのファイル形式であいまい検索を実行することもできます。以下の全リストをご覧ください。

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner