Neaiškia tekstinės informacijos paieška – tai eilučių, panašių į paieškos užklausą ar jai artimų, paieška.
Tuo pačiu metu teksto eilučių neryškumo ar panašumo laipsnis dažniausiai vertinamas naudojant redagavimo atstumą (Levenshtein distance). O dviejų eilučių redagavimo atstumas yra minimalus simbolių pakeitimo, įterpimo ir ištrynimo operacijų skaičius, reikalingas vienai eilutei transformuoti į kitą. Dviejų gretimų simbolių perkėlimas taip pat gali būti laikomas tinkama redagavimo operacija (Damerau-Levenshtein atstumas).
Neaiškia paieška DOCX pavyzdyje, kai pateikta 2 redagavimų neapibrėžtumo reikšmė, yra paieškos užklausa „medžiai“ ir paieškos rezultatas „šie“. Čia simbolis „r“ pakeičiamas „h“, o simboliai „e“ ir „s“ perkeliami. Tai reiškia, kad šių dviejų žodžių Damerau-Levenshtein atstumas yra 2 šioje neaiškioje paieškoje DOCX pavyzdyje.
Neaiškiai paieškai įgyvendinti dažniausiai naudojami šie metodai:
Šioje programoje, norėdami gauti neaiškią žodžių atitiktį DOCX, turite nurodyti reikiamą klaidų skaičių (neaiškumų reikšmę) nuo 1 iki 9 simbolių. Taip pat galite nustatyti parinktį ieškoti žodžių, turinčių tik minimalų skirtumų skaičių, arba ieškoti visų žodžių pagal nurodytą skirtumų skaičių.
GroupDocs.Search bibliotekoje yra daug kitų neaiškių atitikimo parinkčių. Pavyzdžiui, galite nustatyti žodžių skirtumų skaičių kaip tiesinę žodžio ilgio funkciją arba net nustatyti skirtumų skaičių atskirai kiekvienai žodžio ilgio reikšmei.
Taip pat galite atlikti neaiškią paiešką daugelyje kitų failų formatų. Žr. visą sąrašą žemiau.