Мәтіндік ақпаратты бұлыңғыр іздеу - іздеу сұрауына ұқсас немесе жақын жолдарды іздеу.
Бұл ретте бұлыңғырлық дәрежесі немесе мәтіндік жолдардың ұқсастығы көбінесе өңдеу қашықтығын (Левенштейн арақашықтығы) пайдалана отырып бағаланады. Ал екі жолды өңдеу қашықтығы - таңба алмастырудың, кірістірудің және жою операцияларының бір жолды екінші жолға түрлендіру үшін қажетті ең аз саны. Іргелес екі таңбаның транспозициясын дұрыс редакциялау операциясы ретінде де қарастыруға болады (Дамерау-Левенштейн арақашықтығы).
2 өңдеудің берілген бұлыңғыр мәні үшін бұлыңғыр іздеу мысалы «ағаштар» іздеу сұрауы және іздеу нәтижесі «осылар» болып табылады. Мұнда «р» таңбасы «h» таңбасымен ауыстырылады, ал «е» және «с» таңбалары ауысады. Яғни, осы екі сөз үшін Дамерау-Левенштейн арақашықтығы осы бұлыңғыр іздеу үлгісінде 2-ге тең.
Бұлыңғыр іздеуді жүзеге асыру үшін көбінесе мынадай әдістер қолданылады:
Бұл қосымшада құжаттағы сөздердің бұлыңғыр сәйкестігін алу үшін қателердің қажетті санын (бұлыңғырлық мәнін) 1-ден 9 таңбаға дейін көрсету қажет. Сондай-ақ, айырмашылықтардың ең аз саны бар сөздерді іздеу немесе берілген айырмашылықтар шегінде барлық сөздерді іздеу параметрін орнатуға болады.
GroupDocs.Search кітапханасының басқа да көптеген бұлыңғыр сәйкестік параметрлері бар. Мысалы, сөздер арасындағы айырмашылықтар санын сөз ұзындығының сызықтық функциясы ретінде орнатуға, тіпті сөз ұзындығының әрбір мәні үшін айырмашылықтар санын жеке-жеке белгілеуге болады.
Бұлыңғыр іздеуді көптеген файл пішімдерінде орындауға болады. Төмендегі толық тізімді қараңыз.