Neizrazito pretraživanje tekstualnih informacija je traženje nizova sličnih ili bliskih upitu za pretraživanje.
Istodobno, stupanj nejasnosti ili sličnosti tekstualnih nizova najčešće se procjenjuje pomoću udaljenosti uređivanja (Levenshteinova udaljenost). A udaljenost uređivanja dva niza minimalan je broj operacija zamjene znakova, umetanja i brisanja potrebnih za transformaciju jednog niza u drugi. Transpozicija dvaju susjednih znakova također se može smatrati valjanom operacijom uređivanja (Damerau-Levenshteinova udaljenost).
Nejasno pretraživanje u primjeru PDF za danu vrijednost nejasnoće od 2 uređivanja je upit za pretraživanje "stabla" i rezultat pretraživanja "ovi". Ovdje je znak "r" zamijenjen sa "h", a znakovi "e" i "s" su transponirani. To jest, udaljenost Damerau-Levenshtein za ove dvije riječi je 2 u ovom nejasnom pretraživanju u primjeru PDF.
Za implementaciju neizrazitog pretraživanja najčešće se koriste sljedeće metode:
U ovoj aplikaciji, da biste dobili nejasno podudaranje riječi u PDF, morate navesti potreban broj pogrešaka (vrijednost nejasnosti) od 1 do 9 znakova. Također možete postaviti opciju traženja riječi s minimalnim brojem razlika ili traženje svih riječi unutar određenog broja razlika.
Biblioteka GroupDocs.Search ima mnoge druge opcije nejasnog podudaranja. Na primjer, možete postaviti broj razlika između riječi kao linearnu funkciju duljine riječi ili čak postaviti broj razlika pojedinačno za svaku vrijednost duljine riječi.
Također možete izvršiti neizrazito pretraživanje u mnogim drugim formatima datoteka. Pogledajte cijeli popis u nastavku.