Neizrazito pretraživanje tekstualnih informacija je traženje nizova sličnih ili bliskih upitu za pretraživanje.
Istodobno, stupanj nejasnosti ili sličnosti tekstualnih nizova najčešće se procjenjuje pomoću udaljenosti uređivanja (Levenshteinova udaljenost). A udaljenost uređivanja dva niza minimalan je broj operacija zamjene znakova, umetanja i brisanja potrebnih za transformaciju jednog niza u drugi. Transpozicija dvaju susjednih znakova također se može smatrati valjanom operacijom uređivanja (Damerau-Levenshteinova udaljenost).
Primjer neizrazitog pretraživanja za danu vrijednost nejasnosti od 2 uređivanja je upit za pretraživanje "stabla" i rezultat pretraživanja "ovi". Ovdje je znak "r" zamijenjen sa "h", a znakovi "e" i "s" su transponirani. To jest, udaljenost Damerau-Levenshtein za ove dvije riječi je 2 u ovom primjeru nejasnog pretraživanja.
Za implementaciju neizrazitog pretraživanja najčešće se koriste sljedeće metode:
U ovoj aplikaciji, da biste dobili nejasno podudaranje riječi u dokumentu, trebate navesti potreban broj pogrešaka (vrijednost nejasnosti) od 1 do 9 znakova. Također možete postaviti opciju traženja riječi s minimalnim brojem razlika ili traženje svih riječi unutar određenog broja razlika.
Biblioteka GroupDocs.Search ima mnoge druge opcije nejasnog podudaranja. Na primjer, možete postaviti broj razlika između riječi kao linearnu funkciju duljine riječi ili čak postaviti broj razlika pojedinačno za svaku vrijednost duljine riječi.
Možete izvršiti neizrazito pretraživanje u mnogim formatima datoteka. Pogledajte cijeli popis u nastavku.