Размито търсене на текстова информация е търсене на низове, подобни или близки до заявката за търсене.
В същото време степента на размиване или сходство на текстовите низове най-често се оценява с помощта на разстоянието за редактиране (разстояние Левенштейн). А разстоянието за редактиране на два низа е минималният брой операции за заместване, вмъкване и изтриване на знаци, необходими за трансформиране на един низ в друг. Транспонирането на два съседни знака също може да се счита за валидна операция за редактиране (разстояние Damerau-Levenshtein).
Размито търсене в PDF пример за дадена стойност на размиване от 2 редакции е заявката за търсене „дървета“ и резултатът от търсенето „тези“. Тук символът "r" се заменя с "h", а знаците "e" и "s" се транспонират. Тоест разстоянието Дамерау-Левенщайн за тези две думи е 2 в това размито търсене в примера PDF.
Най-често се използват следните методи за реализиране на размито търсене:
В това приложение, за да получите размито съвпадение на думи в PDF, трябва да посочите необходимия брой грешки (стойност на размиването) от 1 до 9 знака. Можете също да зададете опцията за търсене на думи само с минимален брой разлики или за търсене на всички думи в рамките на даден брой разлики.
Библиотеката GroupDocs.Search има много други опции за размито съвпадение. Например, можете да зададете броя на разликите между думите като линейна функция от дължината на думата или дори да зададете броя на разликите поотделно за всяка стойност на дължината на думата.
Можете също да извършите размито търсене в много други файлови формати. Моля, вижте пълния списък по-долу.