Neskaidra teksta informācijas meklēšana ir virkņu meklēšana, kas ir līdzīgas vai tuvu meklēšanas vaicājumam.
Tajā pašā laikā teksta virkņu izplūduma vai līdzības pakāpe visbiežāk tiek novērtēta, izmantojot rediģēšanas attālumu (Levenshtein distance). Un divu virkņu rediģēšanas attālums ir minimālais rakstzīmju aizstāšanas, ievietošanas un dzēšanas darbību skaits, kas nepieciešams, lai pārveidotu vienu virkni citā. Divu blakus esošo rakstzīmju transponēšanu var uzskatīt arī par derīgu rediģēšanas darbību (Damerau-Levenshtein attālums).
Neskaidras meklēšanas piemērs noteiktai izplūduma vērtībai, kurā ir 2 labojumi, ir meklēšanas vaicājums "koki" un meklēšanas rezultāts "šie". Šeit rakstzīme "r" tiek aizstāta ar "h", un rakstzīmes "e" un "s" tiek transponētas. Tas nozīmē, ka Damerau-Levenshtein attālums šiem diviem vārdiem ir 2 šajā neskaidrajā meklēšanas piemērā.
Izplūdušās meklēšanas ieviešanai visbiežāk tiek izmantotas šādas metodes:
Šajā lietojumprogrammā, lai dokumentā iegūtu neskaidru vārdu atbilstību, ir jānorāda nepieciešamais kļūdu skaits (izplūduma vērtība) no 1 līdz 9 rakstzīmēm. Varat arī iestatīt iespēju meklēt vārdus ar minimālu atšķirību skaitu vai meklēt visus vārdus noteiktā atšķirību skaitā.
Bibliotēkā GroupDocs.Search ir daudzas citas neskaidras atbilstības opcijas. Piemēram, jūs varat iestatīt atšķirību skaitu starp vārdiem kā lineāru vārda garuma funkciju vai pat iestatīt atšķirību skaitu atsevišķi katrai vārda garuma vērtībai.
Jūs varat veikt izplūdušo meklēšanu daudzos failu formātos. Lūdzu, skatiet pilnu sarakstu zemāk.