جستجوی فازی اطلاعات متنی، جستجوی رشته های مشابه یا نزدیک به عبارت جستجو است.
در عین حال، درجه مبهم یا شباهت رشته های متنی اغلب با استفاده از فاصله ویرایش (فاصله Levenshtein) ارزیابی می شود. و فاصله ویرایش دو رشته حداقل تعداد عملیات تعویض، درج و حذف کاراکتر مورد نیاز برای تبدیل یک رشته به رشته دیگر است. جابجایی دو کاراکتر مجاور نیز می تواند به عنوان یک عملیات ویرایش معتبر (فاصله Damerau-Levenshtein) در نظر گرفته شود.
یک جستجوی فازی در PDF برای یک مقدار فازی داده شده از 2 ویرایش، عبارت جستجوی "درخت" و نتیجه جستجو "this" است. در اینجا کاراکتر "r" با "h" جایگزین شده و کاراکترهای "e" و "s" جابجا می شوند. یعنی فاصله Damerau-Levenshtein برای این دو کلمه در این جستجوی فازی در مثال PDF 2 است.
روش های زیر اغلب برای پیاده سازی جستجوی فازی استفاده می شود:
در این برنامه برای به دست آوردن تطابق فازی کلمات در PDF، باید تعداد اشتباهات مورد نیاز (مقدار فازی) را از 1 تا 9 کاراکتر مشخص کنید. همچنین می توانید گزینه جستجوی کلماتی با حداقل تعداد تفاوت یا جستجوی همه کلمات در تعداد معینی از تفاوت را تنظیم کنید.
کتابخانه GroupDocs.Search گزینه های تطبیق فازی بسیاری دارد. به عنوان مثال، می توانید تعداد تفاوت بین کلمات را به عنوان یک تابع خطی از طول کلمه تنظیم کنید یا حتی تعداد تفاوت ها را به صورت جداگانه برای هر مقدار طول کلمه تنظیم کنید.
همچنین می توانید جستجوی فازی را در بسیاری از فرمت های فایل دیگر انجام دهید. لطفا لیست کامل را در زیر ببینید.