Wyszukiwanie rozmyte informacji tekstowych to wyszukiwanie ciągów podobnych lub bliskich wyszukiwanemu zapytaniu.
Jednocześnie stopień rozmycia lub podobieństwa ciągów tekstowych jest najczęściej oceniany za pomocą odległości edycji (odległość Levenshteina). A odległość edycji dwóch ciągów to minimalna liczba operacji podstawiania, wstawiania i usuwania znaków wymaganych do przekształcenia jednego ciągu w drugi. Transpozycja dwóch sąsiednich znaków może być również uznana za prawidłową operację edycyjną (odległość Damerau-Levenshtein).
Wyszukiwanie rozmyte w przykładzie PDF dla danej wartości rozmytości 2 edycji to zapytanie "drzewa" i wynik wyszukiwania "te". Tutaj znak "r" zastępuje się "h", a znaki "e" i "s" są transponowane. Oznacza to, że odległość Damerau-Levenshtein dla tych dwóch słów wynosi 2 w tym rozmytym wyszukiwaniu w przykładzie PDF.
Następujące metody są najczęściej używane do implementacji wyszukiwania rozmytego:
W tej aplikacji, aby uzyskać rozmyte dopasowanie słów w PDF, należy określić wymaganą liczbę błędów (wartość rozmytości) od 1 do 9 znaków. Można również ustawić opcję wyszukiwania wyrazów z minimalną liczbą różnic lub wyszukiwania wszystkich słów w obrębie określonej liczby różnic.
Biblioteka GroupDocs.Search zawiera wiele innych opcji dopasowywania rozmytego. Na przykład można ustawić liczbę różnic między wyrazami jako liniową funkcję długości słowa, a nawet ustawić liczbę różnic indywidualnie dla każdej wartości długości słowa.
Można również przeprowadzać wyszukiwanie rozmyte w wielu innych formatach plików. Zobacz pełną listę poniżej.