Fuzzy vyhledávání textových informací je hledání řetězců podobných nebo blízkých vyhledávacímu dotazu.

Míra neostrosti či podobnosti textových řetězců se přitom nejčastěji posuzuje pomocí editační vzdálenosti (Levenshtein distance). A editační vzdálenost dvou řetězců je minimální počet operací nahrazování, vkládání a mazání znaků potřebných k transformaci jednoho řetězce na jiný. Transpozici dvou sousedních znaků lze také považovat za platnou editační operaci (vzdálenost Damerau-Levenshtein).

Příkladem fuzzy hledání pro danou hodnotu fuzziness 2 úprav je vyhledávací dotaz „stromy“ a výsledek vyhledávání „tyto“. Zde je znak "r" nahrazen "h" a znaky "e" a "s" jsou transponovány. To znamená, že vzdálenost Damerau-Levenshtein pro tato dvě slova je v tomto příkladu fuzzy vyhledávání 2.

K implementaci fuzzy vyhledávání se nejčastěji používají následující metody:

Webová aplikace Fuzzy vyhledávání v dokumentu je postavena na bázi fulltextového vyhledávače GroupDocs.Search. Implementace fuzzy párování v této knihovně má nejlepší vlastnosti z uvedených metod:

Chcete-li v této aplikaci získat fuzzy shodu slov v dokumentu, musíte zadat požadovaný počet chyb (hodnota neostrosti) od 1 do 9 znaků. Můžete také nastavit možnost vyhledávat slova pouze s minimálním počtem rozdílů nebo hledat všechna slova v rámci daného počtu rozdílů.

Knihovna GroupDocs.Search má mnoho dalších možností fuzzy shody. Můžete například nastavit počet rozdílů mezi slovy jako lineární funkci délky slova nebo dokonce nastavit počet rozdílů individuálně pro každou hodnotu délky slova.

Jak najít fuzzy shodu textu v dokumentu

  • Klepnutím do oblasti přetažení souboru nahrajte soubor nebo soubor přetáhněte.
  • Po dokončení nahrávání budete moci ve svém souboru vyhledávat.
  • Zadejte vyhledávací dotaz složený z jednoho nebo více slov oddělených mezerami.
  • Vyberte typ vyhledávání: fráze, všechna slova, libovolné slovo.
  • Nastavte počet povolených chyb ve slově od 1 do 9; v případě potřeby nastavte příznak pro získání pouze nejlepších výsledků.
  • Výsledky získáte kliknutím na tlačítko "Hledat".
  • Přidejte další soubory pomocí tlačítka "Přidat soubory".
  • Vyberte přidané soubory, které chcete zahrnout do indexu a proveďte vyhledávání.

Nejčastější dotazy

  • Jak funguje online aplikace Fuzzy Search in Document?

    Vyhledávání se provádí ve dvou fázích. Nejprve jsou dokumenty přidány do indexu. A teprve pak se vyhledávání provádí v indexu.
  • A co soukromí, je bezpečné používat online aplikaci Fuzzy Search in Document?

    Přístup ke složce s nahranými a indexovanými soubory je k dispozici pouze uživatelům, kteří mají odkaz. Všechny nahrané soubory jsou ze serverů odstraněny po 24 hodinách.
  • Je k používání online aplikace Fuzzy Search in Document vyžadováno připojení k internetu?

    Tato aplikace je klient-server. Pokud při používání aplikace ztratíte připojení k internetu, nebudete moci získat výsledky vyhledávání.
  • Mohu vyhledávat na Linux, Mac OS, Android?

    Můžete vyhledávat z libovolného zařízení, bez ohledu na operační systém, které má moderní prohlížeč a připojení k internetu.

Formáty souborů podporované aplikací Fuzzy search

Fuzzy vyhledávání můžete provádět v mnoha formátech souborů. Úplný seznam naleznete níže.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner