Tekstilise teabe uduotsing on otsingupäringuga sarnaste või sellele lähedaste stringide otsing.

Samal ajal hinnatakse tekstistringide hägususe või sarnasuse astet kõige sagedamini redigeerimiskauguse (Levenshtein distance) abil. Ja kahe stringi redigeerimiskaugus on minimaalne tähemärkide asendamise, sisestamise ja kustutamise toimingute arv, mis on vajalik ühe stringi teisendamiseks. Kahe kõrvuti asetseva märgi transponeerimist võib samuti pidada kehtivaks redigeerimistoiminguks (Damerau-Levenshteini kaugus).

Hägusotsingu näide antud hägususe väärtuse jaoks, mis koosneb kahest muudatusest, on otsingupäring "puud" ja otsingutulemus "need". Siin asendatakse märk "r" tähega "h" ja märgid "e" ja "s" on transponeeritud. See tähendab, et nende kahe sõna Damerau-Levenshteini kaugus on selles ähmase otsingu näites 2.

Hägusotsingu rakendamiseks kasutatakse kõige sagedamini järgmisi meetodeid:

Veebirakendus Dokumendi häguotsing on üles ehitatud täistekstiotsingumootori GroupDocs.Search alusel. Häguse sobitamise rakendamisel selles teegis on loetletud meetodite parimad omadused:

Selles rakenduses peate dokumendis sõnade ähmase vaste saamiseks määrama vajaliku vigade arvu (hägususe väärtus) vahemikus 1 kuni 9 tähemärki. Samuti saate määrata võimaluse otsida sõnu, millel on minimaalne erinevus, või otsida kõiki sõnu teatud arvu erinevuste piires.

GroupDocs.Searchi teegil on palju muid hägusaid sobitamisvalikuid. Näiteks saate määrata sõnade vaheliste erinevuste arvu sõna pikkuse lineaarse funktsioonina või isegi määrata erinevuste arvu iga sõna pikkuse väärtuse jaoks eraldi.

Kuidas leida dokumendist udune vaste tekstile

  • Faili üleslaadimiseks või faili pukseerimiseks klõpsake faili pukseerimisalal.
  • Kui üleslaadimine on lõppenud, saate oma failist otsida.
  • Sisestage oma otsingupäring, mis koosneb ühest või mitmest tühikutega eraldatud sõnast.
  • Valige otsingu tüüp: fraas, kõik sõnad, mis tahes sõna.
  • Määrake lubatud vigade arv sõnas vahemikus 1 kuni 9; vajadusel seadke lipp ainult parimate tulemuste saamiseks.
  • Tulemuste saamiseks klõpsake nuppu "Otsi".
  • Lisage rohkem faile nupuga "Lisa failid".
  • Valige lisatud failid, et lisada need registrisse ja teha otsinguid.

Korduma kippuvad küsimused

  • Kuidas veebirakendus Fuzzy Search in Document töötab?

    Otsing toimub kahes etapis. Esiteks lisatakse registrisse dokumendid. Ja alles siis tehakse otsing indeksis.
  • Kuidas on lood privaatsusega, kas veebirakenduse Fuzzy Search in Document kasutamine on ohutu?

    Juurdepääs üleslaaditud ja indekseeritud failidega kaustale on saadaval ainult lingiga inimesele. Kõik üleslaaditud failid kustutatakse serveritest 24 tunni pärast.
  • Kas veebirakenduse Fuzzy Search in Document kasutamiseks on vaja Interneti-ühendust?

    See rakendus on klient-server. Kui kaotate rakenduse kasutamise ajal Interneti-ühenduse, ei saa te otsingutulemeid hankida.
  • Kas ma saan otsida Linux, Mac OS Android?

    Saate otsida mis tahes seadmest, olenemata operatsioonisüsteemist, millel on kaasaegne brauser ja Interneti-ühendus.

Fuzzy otsingurakenduse toetatavad failivormingud

Häguotsingut saate teha paljudes failivormingutes. Vaadake allolevat täielikku loendit.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner