Размито търсене на текстова информация е търсене на низове, подобни или близки до заявката за търсене.

В същото време степента на размиване или сходство на текстовите низове най-често се оценява с помощта на разстоянието за редактиране (разстояние Левенштейн). А разстоянието за редактиране на два низа е минималният брой операции за заместване, вмъкване и изтриване на знаци, необходими за трансформиране на един низ в друг. Транспонирането на два съседни знака също може да се счита за валидна операция за редактиране (разстояние Damerau-Levenshtein).

Пример за размито търсене за дадена стойност на размиване от 2 редакции е заявката за търсене „дървета“ и резултатът от търсенето „тези“. Тук символът "r" се заменя с "h", а знаците "e" и "s" се транспонират. Тоест разстоянието Дамерау-Левенщайн за тези две думи е 2 в този пример за размито търсене.

Най-често се използват следните методи за реализиране на размито търсене:

Уеб приложението Размито търсене в документ е изградено на базата на пълнотекстовата търсачка GroupDocs.Search. Изпълнението на размито съвпадение в тази библиотека има най-добрите характеристики на изброените методи:

В това приложение, за да получите размито съвпадение на думи в документ, трябва да посочите необходимия брой грешки (стойност на размиването) от 1 до 9 знака. Можете също да зададете опцията за търсене на думи само с минимален брой разлики или за търсене на всички думи в рамките на даден брой разлики.

Библиотеката GroupDocs.Search има много други опции за размито съвпадение. Например, можете да зададете броя на разликите между думите като линейна функция от дължината на думата или дори да зададете броя на разликите поотделно за всяка стойност на дължината на думата.

Как да намерите размито съвпадение на текст в документ

  • Щракнете в областта за пускане на файл, за да качите файл или плъзнете и пуснете файл.
  • След като качването завърши, ще можете да извършите търсене във вашия файл.
  • Въведете вашата заявка за търсене, състояща се от една или повече думи, разделени с интервали.
  • Изберете типа търсене: фраза, всички думи, всяка дума.
  • Задайте броя на допустимите грешки в една дума от 1 до 9; ако е необходимо, задайте флага за получаване само на най-добри резултати.
  • Получете резултати, като щракнете върху бутона "Търсене".
  • Добавете още файлове с бутона "Добавяне на файлове".
  • Изберете добавени файлове, за да ги включите в индекса и извършете търсене.

Често задавани въпроси

  • Как работи онлайн приложението Fuzzy Search in Document?

    Търсенето се извършва на два етапа. Първо, документите се добавят към индекс. И едва тогава търсенето се извършва в индекса.
  • Какво ще кажете за поверителността, безопасно ли е да използвате онлайн приложението Fuzzy Search in Document?

    Достъпът до вашата папка с качени и индексирани файлове е достъпен само за някой, който има връзка. Всички качени файлове се изтриват от сървърите след 24 часа.
  • Необходима ли е интернет връзка, за да използвате онлайн приложението "Размито търсене в документ"?

    Това приложение е клиент-сървър. Ако загубите интернет връзката си, докато използвате приложението, няма да можете да получавате резултати от търсенето.
  • Мога ли да търся по Linux, Mac OS, Android?

    Можете да търсите от всяко устройство, независимо от операционната система, което има модерен браузър и интернет връзка.

Файлови формати, поддържани от приложението Fuzzy search

Можете да извършите размито търсене в много файлови формати. Моля, вижте пълния списък по-долу.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner