Нечіткий пошук текстової інформації - це пошук рядків, подібних або близьких до пошукового запиту.

При цьому ступінь нечіткості або схожості текстових рядків найчастіше оцінюється за допомогою відстані редагування (відстань Левенштейна). А відстань редагування двох рядків - це мінімальна кількість операцій підстановки, вставки та видалення символів, необхідних для перетворення одного рядка в інший. Транспозиція двох суміжних символів також може розглядатися як дійсна операція редагування (відстань Дамерау-Левенштейна).

Нечіткий пошук у прикладі DOC для даного значення нечіткості 2 редагувань - це пошуковий запит "дерева" та результат пошуку "ці". Тут символ "r" замінюється на "h", а символи "e" і "s" транспонуються. Тобто відстань Дамерау-Левенштейна для цих двох слів дорівнює 2 в цьому нечіткому пошуку в прикладі DOC.

Для реалізації нечіткого пошуку найчастіше використовуються такі методи:

Веб-додаток Нечіткий пошук в DOC побудований на базі GroupDocs.Search повнотекстової пошукової системи. Реалізація нечіткої відповідності в цій бібліотеці має кращі особливості перерахованих методів:

У цій програмі, щоб отримати нечітку відповідність слів в DOC, потрібно вказати необхідну кількість помилок (значення нечіткості) від 1 до 9 символів. Ви також можете встановити опцію пошуку слів лише з мінімальною кількістю відмінностей або пошуку всіх слів у межах заданої кількості відмінностей.

Бібліотека GroupDocs.Search має багато інших нечітких варіантів відповідності. Наприклад, можна встановити кількість відмінностей між словами як лінійну функцію довжини слова або навіть встановити кількість відмінностей окремо для кожного значення довжини слова.

Як знайти нечітку відповідність тексту в DOC

  • Клацніть всередині області скидання файлів, щоб завантажити файл DOC або перетягніть файл DOC.
  • Після завершення завантаження ви зможете виконати пошук у файлі DOC.
  • Введіть пошуковий запит, що складається з одного або кількох слів, розділених пробілами.
  • Виберіть тип пошуку: фраза, всі слова, будь-яке слово.
  • Встановіть кількість допущених помилок в слові від 1 до 9; при необхідності встановіть прапор для отримання тільки найкращих результатів.
  • Отримайте результати, натиснувши кнопку «Пошук».
  • Додайте більше DOC файлів за допомогою кнопки "Додати файли".
  • Виберіть додані файли, щоб включити їх до індексу та виконати пошук.

Питання, що часто ставляться

  • Як працює онлайн-додаток Fuzzy Search in DOC?

    Пошук проводиться в два етапи. Спочатку документи додаються до індексу. І тільки потім пошук виконується в індексі.
  • А як щодо конфіденційності, чи безпечно використовувати онлайн-додаток Fuzzy Search in DOC?

    Доступ до папки з переданими та індексованими файлами має лише користувач, який має посилання. Всі завантажені файли видаляються з серверів через 24 години.
  • Чи потрібне підключення до Інтернету для використання онлайн-програми Fuzzy Search in DOC?

    Ця програма клієнт-сервер. Якщо ви втратите інтернет-з'єднання під час використання програми, ви не зможете отримувати результати пошуку.
  • Чи можна шукати Linux, Mac OS Android?

    Ви можете шукати з будь-якого пристрою, незалежно від операційної системи, який має сучасний браузер та підключення до Інтернету.

Інші формати файлів, підтримувані програмою нечіткого пошуку

Ви також можете виконувати нечіткий пошук у багатьох інших форматах файлів. Будь ласка, дивіться повний список нижче.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner