Fuzzy vyhľadávanie textových informácií je vyhľadávanie reťazcov podobných alebo blízkych vyhľadávaciemu dopytu.

Zároveň sa miera neostrosti alebo podobnosti textových reťazcov najčastejšie posudzuje pomocou editačnej vzdialenosti (Levenshteinova vzdialenosť). A editačná vzdialenosť dvoch reťazcov je minimálny počet operácií nahradenia, vloženia a vymazania znakov potrebných na transformáciu jedného reťazca na iný. Za platnú editačnú operáciu možno považovať aj transpozíciu dvoch susedných znakov (vzdialenosť Damerau-Levenshtein).

Nejasné vyhľadávanie v príklade MHT pre danú hodnotu fuzziness 2 úprav je vyhľadávací dopyt „stromy“ a výsledok vyhľadávania „tieto“. Tu je znak "r" nahradený "h" a znaky "e" a "s" sú transponované. To znamená, že vzdialenosť Damerau-Levenshtein pre tieto dve slová je v tomto fuzzy vyhľadávaní v príklade MHT 2.

Na implementáciu fuzzy vyhľadávania sa najčastejšie používajú tieto metódy:

Webová aplikácia Fuzzy vyhľadávanie v MHT je postavená na báze fulltextového vyhľadávača GroupDocs.Search. Implementácia fuzzy párovania v tejto knižnici má najlepšie vlastnosti z uvedených metód:

V tejto aplikácii, aby ste získali fuzzy zhodu slov v MHT, musíte zadať požadovaný počet chýb (hodnota fuzziness) od 1 do 9 znakov. Môžete si tiež nastaviť možnosť hľadať slová len s minimálnym počtom rozdielov alebo hľadať všetky slová v rámci daného počtu rozdielov.

Knižnica GroupDocs.Search má mnoho ďalších možností fuzzy zhody. Môžete napríklad nastaviť počet rozdielov medzi slovami ako lineárnu funkciu dĺžky slova alebo dokonca nastaviť počet rozdielov individuálne pre každú hodnotu dĺžky slova.

Ako nájsť fuzzy zhodu textu v MHT

  • Kliknutím do oblasti presunutia súboru nahrajte súbor MHT alebo presuňte myšou súbor MHT.
  • Po dokončení odovzdávania budete môcť vyhľadávať v súbore MHT.
  • Zadajte svoj vyhľadávací dopyt pozostávajúci z jedného alebo viacerých slov oddelených medzerami.
  • Vyberte typ vyhľadávania: fráza, všetky slová, ľubovoľné slovo.
  • Nastavte počet povolených chýb v slove od 1 do 9; ak je to potrebné, nastavte príznak na získanie len najlepších výsledkov.
  • Výsledky získate kliknutím na tlačidlo „Hľadať“.
  • Pridajte ďalšie súbory (MHT) pomocou tlačidla „Pridať súbory“.
  • Vyberte pridané súbory, aby ste ich zahrnuli do indexu a vykonajte vyhľadávanie.

Často kladené otázky

  • Ako funguje online aplikácia Fuzzy Search v MHT?

    Vyhľadávanie sa vykonáva v dvoch fázach. Najprv sa dokumenty pridajú do indexu. A až potom sa vyhľadávanie vykoná v indexe.
  • A čo súkromie, je bezpečné používať online aplikáciu Fuzzy Search v MHT?

    Prístup k vášmu priečinku s nahranými a indexovanými súbormi je k dispozícii iba niekomu, kto má prepojenie. Všetky nahrané súbory sa zo serverov odstránia po 24 hodinách.
  • Je na používanie online aplikácie Fuzzy Search v MHT potrebné internetové pripojenie?

    Táto aplikácia je klient-server. Ak počas používania aplikácie stratíte internetové pripojenie, nebudete môcť získať výsledky vyhľadávania.
  • Môžem vyhľadávať na Linux, Mac OS, Android?

    Môžete vyhľadávať z ľubovoľného zariadenia bez ohľadu na operačný systém, ktoré má moderný prehliadač a internetové pripojenie.

Ďalšie formáty súborov podporované aplikáciou Fuzzy search

Môžete tiež vykonávať fuzzy vyhľadávanie v mnohých iných formátoch súborov. Úplný zoznam nájdete nižšie.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner