Mehko iskanje besedilnih informacij je iskanje nizov, podobnih ali blizu iskalni poizvedbi.
Hkrati se stopnja nejasnosti ali podobnosti besedilnih nizov najpogosteje ocenjuje z uporabo razdalje urejanja (Levenshteinova razdalja). In razdalja urejanja dveh nizov je najmanjše število operacij zamenjave znakov, vstavljanja in brisanja, potrebnih za pretvorbo enega niza v drugega. Transpozicija dveh sosednjih znakov se prav tako lahko obravnava kot veljavna operacija urejanja (razdalja Damerau-Levenshtein).
Mehko iskanje v primeru PDF za dano vrednost mehkosti 2 urejanj je iskalna poizvedba "drevesa" in rezultat iskanja "ta". Tu je znak "r" nadomeščen s "h", znaka "e" in "s" pa sta prestavljena. To pomeni, da je razdalja Damerau-Levenshtein za ti dve besedi 2 v tem mehkem iskanju v primeru PDF.
Za izvajanje mehkega iskanja se najpogosteje uporabljajo naslednje metode:
Če želite v tej aplikaciji dobiti mehko ujemanje besed v PDF, morate določiti zahtevano število napak (vrednost mehkosti) od 1 do 9 znakov. Nastavite lahko tudi možnost iskanja besed z najmanjšim številom razlik ali iskanja vseh besed znotraj danega števila razlik.
Knjižnica GroupDocs.Search ima veliko drugih možnosti mehkega ujemanja. Na primer, lahko nastavite število razlik med besedami kot linearno funkcijo dolžine besede ali celo nastavite število razlik posebej za vsako vrednost dolžine besede.
Izvajate lahko tudi mehko iskanje v številnih drugih formatih datotek. Oglejte si celoten seznam spodaj.