Нечіткий пошук текстової інформації - це пошук рядків, подібних або близьких до пошукового запиту.

При цьому ступінь нечіткості або схожості текстових рядків найчастіше оцінюється за допомогою відстані редагування (відстань Левенштейна). А відстань редагування двох рядків - це мінімальна кількість операцій підстановки, вставки та видалення символів, необхідних для перетворення одного рядка в інший. Транспозиція двох суміжних символів також може розглядатися як дійсна операція редагування (відстань Дамерау-Левенштейна).

Нечітким прикладом пошуку для заданого значення нечіткості 2 редагувань є пошуковий запит "дерева" і результат пошуку "ці". Тут символ "r" замінюється на "h", а символи "e" і "s" транспонуються. Тобто відстань Дамерау-Левенштейна для цих двох слів дорівнює 2 в цьому нечіткому прикладі пошуку.

Для реалізації нечіткого пошуку найчастіше використовуються такі методи:

Веб-додаток Нечіткий пошук в документі побудований на базі повнотекстової пошукової системи GroupDocs.Search. Реалізація нечіткої відповідності в цій бібліотеці має кращі особливості перерахованих методів:

У цій програмі, щоб отримати нечітку відповідність слів в документі, потрібно вказати необхідну кількість помилок (значення нечіткості) від 1 до 9 символів. Ви також можете встановити опцію пошуку слів лише з мінімальною кількістю відмінностей або пошуку всіх слів у межах заданої кількості відмінностей.

Бібліотека GroupDocs.Search має багато інших нечітких варіантів відповідності. Наприклад, можна встановити кількість відмінностей між словами як лінійну функцію довжини слова або навіть встановити кількість відмінностей окремо для кожного значення довжини слова.

Як знайти нечітку відповідність тексту в документі

  • Клацніть всередині області скидання файлів, щоб завантажити файл, або перетягніть файл.
  • Після завершення завантаження ви зможете виконувати пошук у своєму файлі.
  • Введіть пошуковий запит, що складається з одного або кількох слів, розділених пробілами.
  • Виберіть тип пошуку: фраза, всі слова, будь-яке слово.
  • Встановіть кількість допущених помилок в слові від 1 до 9; при необхідності встановіть прапор для отримання тільки найкращих результатів.
  • Отримайте результати, натиснувши кнопку «Пошук».
  • Додайте більше файлів за допомогою кнопки "Додати файли".
  • Виберіть додані файли, щоб включити їх до індексу та виконати пошук.

Питання, що часто ставляться

  • Як працює онлайн-додаток Fuzzy Search in Document?

    Пошук проводиться в два етапи. Спочатку документи додаються до індексу. І тільки потім пошук виконується в індексі.
  • Як щодо конфіденційності, чи безпечно використовувати онлайн-додаток Fuzzy Search in Document?

    Доступ до папки з переданими та індексованими файлами має лише користувач, який має посилання. Всі завантажені файли видаляються з серверів через 24 години.
  • Чи потрібне підключення до Інтернету для використання онлайн-програми Fuzzy Search in Document?

    Ця програма клієнт-сервер. Якщо ви втратите інтернет-з'єднання під час використання програми, ви не зможете отримувати результати пошуку.
  • Чи можна шукати Linux, Mac OS Android?

    Ви можете шукати з будь-якого пристрою, незалежно від операційної системи, який має сучасний браузер та підключення до Інтернету.

Формати файлів, підтримувані програмою нечіткого пошуку

Ви можете виконувати нечіткий пошук у багатьох форматах файлів. Будь ласка, дивіться повний список нижче.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner