Neaiškia tekstinės informacijos paieška – tai eilučių, panašių į paieškos užklausą ar jai artimų, paieška.

Tuo pačiu metu teksto eilučių neryškumo ar panašumo laipsnis dažniausiai vertinamas naudojant redagavimo atstumą (Levenshtein distance). O dviejų eilučių redagavimo atstumas yra minimalus simbolių pakeitimo, įterpimo ir ištrynimo operacijų skaičius, reikalingas vienai eilutei transformuoti į kitą. Dviejų gretimų simbolių perkėlimas taip pat gali būti laikomas tinkama redagavimo operacija (Damerau-Levenshtein atstumas).

Neaiškios paieškos pavyzdys, kai pateikta 2 redagavimų neapibrėžtumo reikšmė, yra paieškos užklausa „medžiai“ ir paieškos rezultatas „šie“. Čia simbolis „r“ pakeičiamas „h“, o simboliai „e“ ir „s“ perkeliami. Tai reiškia, kad šiame neaiškios paieškos pavyzdyje šių dviejų žodžių Damerau-Levenshtein atstumas yra 2.

Neaiškiai paieškai įgyvendinti dažniausiai naudojami šie metodai:

Žiniatinklio programa Nepaprastoji paieška dokumente sukurta remiantis GroupDocs.Search viso teksto paieškos sistema. Neaiškios atitikties įgyvendinimas šioje bibliotekoje turi geriausias išvardytų metodų savybes:

Šioje programoje, norėdami gauti neaiškią žodžių atitiktį dokumente, turite nurodyti reikiamą klaidų skaičių (neapibrėžtumo reikšmę) nuo 1 iki 9 simbolių. Taip pat galite nustatyti parinktį ieškoti žodžių, turinčių tik minimalų skirtumų skaičių, arba ieškoti visų žodžių pagal nurodytą skirtumų skaičių.

GroupDocs.Search bibliotekoje yra daug kitų neaiškių atitikimo parinkčių. Pavyzdžiui, galite nustatyti žodžių skirtumų skaičių kaip tiesinę žodžio ilgio funkciją arba net nustatyti skirtumų skaičių atskirai kiekvienai žodžio ilgio reikšmei.

Kaip rasti neaiškią teksto atitiktį dokumente

  • Spustelėkite failo nuleidimo sritį, kad įkeltumėte failą arba nuvilkite failą.
  • Kai įkėlimas bus baigtas, faile galėsite atlikti paiešką.
  • Įveskite paieškos užklausą, kurią sudaro vienas ar daugiau žodžių, atskirtų tarpais.
  • Pasirinkite paieškos tipą: frazė, visi žodžiai, bet kuris žodis.
  • Nustatykite žodyje leidžiamų klaidų skaičių nuo 1 iki 9; jei reikia, nustatykite vėliavėlę, kad gautumėte tik geriausius rezultatus.
  • Gaukite rezultatus spustelėję mygtuką „Ieškoti“.
  • Pridėkite daugiau failų naudodami mygtuką „Pridėti failus“.
  • Pasirinkite pridėtus failus, kad įtrauktumėte juos į indeksą ir atliktumėte paieškas.

Dažniausiai užduodami klausimai

  • Kaip veikia internetinė programa "Fuzzy Search in Document"?

    Paieška atliekama dviem etapais. Pirma, dokumentai pridedami prie indekso. Ir tik tada paieška atliekama indekse.
  • O kaip dėl privatumo, ar saugu naudoti internetinę programą "Fuzzy Search in Document"?

    Prieiga prie aplanko su nusiųstais ir indeksuotais failais pasiekiama tik tiems, kurie turi saitą. Visi įkelti failai ištrinami iš serverių po 24 valandų.
  • Ar norint naudoti internetinę programą reikalingas interneto ryšys Fuzzy Search in Document?

    Ši programa yra klientas-serveris. Jei naudodami programą prarasite interneto ryšį, negalėsite gauti paieškos rezultatų.
  • Ar galiu ieškoti Linux, Mac OS Android?

    Galite ieškoti iš bet kurio įrenginio, nepriklausomai nuo operacinės sistemos, kuriame yra moderni naršyklė ir interneto ryšys.

Failų formatai, kuriuos palaiko Fuzzy paieškos programa

Galite atlikti neaiškią paiešką daugeliu failų formatų. Žr. visą sąrašą žemiau.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner