Neskaidra teksta informācijas meklēšana ir virkņu meklēšana, kas ir līdzīgas vai tuvu meklēšanas vaicājumam.
Tajā pašā laikā teksta virkņu izplūduma vai līdzības pakāpe visbiežāk tiek novērtēta, izmantojot rediģēšanas attālumu (Levenshtein distance). Un divu virkņu rediģēšanas attālums ir minimālais rakstzīmju aizstāšanas, ievietošanas un dzēšanas darbību skaits, kas nepieciešams, lai pārveidotu vienu virkni citā. Divu blakus esošo rakstzīmju transponēšanu var uzskatīt arī par derīgu rediģēšanas darbību (Damerau-Levenshtein attālums).
Neskaidra meklēšana PDF piemērā noteiktai izplūduma vērtībai 2 labojumos ir meklēšanas vaicājums "koki" un meklēšanas rezultāts "šie". Šeit rakstzīme "r" tiek aizstāta ar "h", un rakstzīmes "e" un "s" tiek transponētas. Tas nozīmē, ka Damerau-Levenshtein attālums šiem diviem vārdiem ir 2 šajā neskaidrajā meklēšanā PDF piemērā.
Izplūdušās meklēšanas ieviešanai visbiežāk tiek izmantotas šādas metodes:
Šajā lietojumprogrammā, lai iegūtu neskaidru vārdu atbilstību valodā PDF, ir jānorāda nepieciešamais kļūdu skaits (izplūduma vērtība) no 1 līdz 9 rakstzīmēm. Varat arī iestatīt iespēju meklēt vārdus ar minimālu atšķirību skaitu vai meklēt visus vārdus noteiktā atšķirību skaitā.
Bibliotēkā GroupDocs.Search ir daudzas citas neskaidras atbilstības opcijas. Piemēram, jūs varat iestatīt atšķirību skaitu starp vārdiem kā lineāru vārda garuma funkciju vai pat iestatīt atšķirību skaitu atsevišķi katrai vārda garuma vērtībai.
Varat arī veikt izplūdušo meklēšanu daudzos citos failu formātos. Lūdzu, skatiet pilnu sarakstu zemāk.