Fuzzy vyhľadávanie textových informácií je vyhľadávanie reťazcov podobných alebo blízkych vyhľadávaciemu dopytu.

Zároveň sa miera neostrosti alebo podobnosti textových reťazcov najčastejšie posudzuje pomocou editačnej vzdialenosti (Levenshteinova vzdialenosť). A editačná vzdialenosť dvoch reťazcov je minimálny počet operácií nahradenia, vloženia a vymazania znakov potrebných na transformáciu jedného reťazca na iný. Za platnú editačnú operáciu možno považovať aj transpozíciu dvoch susedných znakov (vzdialenosť Damerau-Levenshtein).

Príkladom fuzzy vyhľadávania pre danú hodnotu fuzziness 2 úprav je vyhľadávací dopyt „stromy“ a výsledok vyhľadávania „tieto“. Tu je znak "r" nahradený "h" a znaky "e" a "s" sú transponované. To znamená, že vzdialenosť Damerau-Levenshtein pre tieto dve slová je v tomto príklade fuzzy vyhľadávania 2.

Na implementáciu fuzzy vyhľadávania sa najčastejšie používajú tieto metódy:

Webová aplikácia Fuzzy vyhľadávanie v dokumente je postavená na báze fulltextového vyhľadávača GroupDocs.Search. Implementácia fuzzy párovania v tejto knižnici má najlepšie vlastnosti z uvedených metód:

Ak chcete v tejto aplikácii získať fuzzy zhodu slov v dokumente, musíte zadať požadovaný počet chýb (hodnota neostrosti) od 1 do 9 znakov. Môžete si tiež nastaviť možnosť hľadať slová len s minimálnym počtom rozdielov alebo hľadať všetky slová v rámci daného počtu rozdielov.

Knižnica GroupDocs.Search má mnoho ďalších možností fuzzy zhody. Môžete napríklad nastaviť počet rozdielov medzi slovami ako lineárnu funkciu dĺžky slova alebo dokonca nastaviť počet rozdielov individuálne pre každú hodnotu dĺžky slova.

Ako nájsť fuzzy zhodu textu v dokumente

  • Kliknutím do oblasti presunutia súboru nahráte súbor alebo súbor pretiahnete myšou.
  • Po dokončení nahrávania budete môcť v súbore vyhľadávať.
  • Zadajte svoj vyhľadávací dopyt pozostávajúci z jedného alebo viacerých slov oddelených medzerami.
  • Vyberte typ vyhľadávania: fráza, všetky slová, ľubovoľné slovo.
  • Nastavte počet povolených chýb v slove od 1 do 9; ak je to potrebné, nastavte príznak na získanie len najlepších výsledkov.
  • Výsledky získate kliknutím na tlačidlo „Hľadať“.
  • Pridajte ďalšie súbory pomocou tlačidla "Pridať súbory".
  • Vyberte pridané súbory, aby ste ich zahrnuli do indexu a vykonajte vyhľadávanie.

Často kladené otázky

  • Ako funguje online aplikácia Fuzzy Search in Document?

    Vyhľadávanie sa vykonáva v dvoch fázach. Najprv sa dokumenty pridajú do indexu. A až potom sa vyhľadávanie vykoná v indexe.
  • A čo súkromie, je bezpečné používať online aplikáciu Fuzzy Search in Document?

    Prístup k vášmu priečinku s nahranými a indexovanými súbormi je k dispozícii iba niekomu, kto má prepojenie. Všetky nahrané súbory sa zo serverov odstránia po 24 hodinách.
  • Je na používanie online aplikácie Fuzzy Search in Document potrebné internetové pripojenie?

    Táto aplikácia je klient-server. Ak počas používania aplikácie stratíte internetové pripojenie, nebudete môcť získať výsledky vyhľadávania.
  • Môžem vyhľadávať na Linux, Mac OS, Android?

    Môžete vyhľadávať z ľubovoľného zariadenia bez ohľadu na operačný systém, ktoré má moderný prehliadač a internetové pripojenie.

Formáty súborov podporované aplikáciou Fuzzy search

Fuzzy vyhľadávanie môžete vykonávať v mnohých formátoch súborov. Úplný zoznam nájdete nižšie.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner