Căutarea neclară a informațiilor textuale este căutarea de șiruri similare sau apropiate de interogarea de căutare.
În același timp, gradul de fuzziness sau similitudinea șirurilor de text este cel mai adesea evaluat folosind distanța de editare (distanța Levenshtein). Iar distanța de editare a două șiruri este numărul minim de operații de substituție, inserare și ștergere a caracterelor necesare pentru a transforma un șir în altul. O transpunere a două caractere adiacente poate fi, de asemenea, considerată ca o operațiune de editare validă (distanța Damerau-Levenshtein).
Un exemplu de căutare fuzzy pentru o anumită valoare fuzziness de 2 editări este interogarea de căutare "copaci" și rezultatul căutării "acestea". Aici caracterul "r" se înlocuiește cu "h", iar caracterele "e" și "s" sunt transpuse. Adică, distanța Damerau-Levenshtein pentru aceste două cuvinte este 2 în acest exemplu de căutare neclar.
Următoarele metode sunt cel mai adesea folosite pentru a implementa căutarea fuzzy:
În această aplicație, pentru a obține o potrivire neclară a cuvintelor într-un document, trebuie să specificați numărul necesar de greșeli (valoare fuzziness) de la 1 la 9 caractere. De asemenea, puteți seta opțiunea de a căuta cuvinte cu doar un număr minim de diferențe sau de a căuta toate cuvintele într-un anumit număr de diferențe.
Biblioteca GroupDocs.Search are multe alte opțiuni de potrivire neclare. De exemplu, puteți seta numărul de diferențe dintre cuvinte ca funcție liniară a lungimii cuvântului sau chiar puteți seta numărul de diferențe individual pentru fiecare valoare a lungimii cuvântului.
Puteți efectua o căutare neclară în mai multe formate de fișiere. Vă rugăm să consultați lista completă de mai jos.