텍스트 정보의 퍼지 검색은 검색 쿼리와 유사하거나 가까운 문자열을 검색하는 것입니다.
동시에, 텍스트 문자열의 퍼지 또는 유사성의 정도는 편집 거리 (Levenshtein 거리)를 사용하여 가장 자주 평가됩니다. 그리고 두 문자열의 편집 거리는 한 문자열을 다른 문자열로 변환하는 데 필요한 최소 문자 대체, 삽입 및 삭제 작업 수입니다. 인접한 두 문자의 전치는 유효한 편집 작업으로 간주 될 수도 있습니다 (Damerau-Levenshtein 거리).
2개의 편집의 주어진 퍼지 값에 대한 PDF 예제의 퍼지 검색은 검색 쿼리 "트리"와 검색 결과 "이들"입니다. 여기서 문자 "r"은 "h"로 대체되고 문자 "e"와 "s"는 바뀝니다. 즉, 이 두 단어에 대한 Damerau-Levenshtein 거리는 PDF 예제에서 이 퍼지 검색에서 2입니다.
다음 메서드는 퍼지 검색을 구현하는 데 가장 자주 사용됩니다.
이 응용 프로그램에서 PDF의 단어가 흐릿하게 일치하려면 필요한 실수 수(퍼지 값)를 1자에서 9자까지 지정해야 합니다. 또한 최소 수의 차이만 있는 단어를 검색하거나 지정된 수의 차이 내에서 모든 단어를 검색하는 옵션을 설정할 수도 있습니다.
GroupDocs.Search 라이브러리에는 다른 많은 퍼지 일치 옵션이 있습니다. 예를 들어 단어 간의 차이 수를 단어 길이의 선형 함수로 설정하거나 단어 길이의 각 값에 대해 차이 수를 개별적으로 설정할 수도 있습니다.