Онлайн приложение Расширенный поиск в PDF представляет собой систему полнотекстового поиска по текстовому содержимому файлов PDF и имеет следующие возможности:
-
Три режима поиска: всех слов из запроса, любого слова из запроса, целой фразы.
-
Регистрозависимый и регистронезависимый поиск.
-
Нечеткий поиск (приблизительное сопоставление строк) с возможностью задания значения нечеткости от 1 до 9.
-
Поиск с подстановочными знаками (поддерживаются знаки: "?" – для одиночного символа, "*" – для группы символов или пустой подстроки).
-
Поиск различных словоформ, синонимов и омофонов.
Система полнотекстового поиска GroupDocs.Search, на базе которой построено данное приложение, имеет гораздо более широкие возможности, например:
-
Продвинутый логический поиск – слова запроса могут комбинироваться логическими операторами в выражение произвольной сложности.
-
Для нечеткого поиска может задаваться функция зависимости нечеткости от длины слова линейная или ступенчатая.
-
Продвинутый поиск слов по шаблону с подстановочными знаками.
-
Фасетный поиск в любом поле файла PDF.
-
Продвинутый поиск диапазонов чисел и дат в любом формате.
Расширенный поиск в PDF в данном веб приложении выполняется в два этапа:
-
Индексирование файлов PDF.
-
Поиск в индексе.
Результаты поиска формируются в виде:
-
Списка сегментов текста содержащих слова и фразы запроса.
-
Целого извлеченного текста файла PDF с подсветкой найденных слов и фраз.
-
Постранично отформатированного файла PDF с подсветкой найденных слов и фраз.