การค้นหาข้อมูลแบบข้อความแบบเลือนคือการค้นหาสตริงที่คล้ายคลึงกันหรือใกล้เคียงกับแบบสอบถามการค้นหา
ในเวลาเดียวกันระดับของความเลือนรางหรือความคล้ายคลึงกันของสตริงข้อความมักได้รับการประเมินโดยใช้ระยะทางการแก้ไข (ระยะทาง Levenshtein) และระยะการแก้ไขของสองสตริงคือจํานวนต่ําสุดของการแทนที่อักขระการแทรกและการลบที่จําเป็นในการแปลงสตริงหนึ่งไปเป็นอีกสตริงหนึ่ง การถ่ายทอดอักขระที่อยู่ติดกันสองตัวถือได้ว่าเป็นการดําเนินการแก้ไขที่ถูกต้อง (ระยะทาง Damerau-Levenshtein)
ตัวอย่างการค้นหาเลือนใน PDF สําหรับค่าความเลือนลางที่กําหนดของการแก้ไข 2 ครั้งคือคําค้นหา "ต้นไม้" และผลการค้นหา "เหล่านี้" ที่นี่อักขระ r จะถูกแทนที่ด้วย h และอักขระ และ s จะถูกเปลี่ยนรูป นั่นคือระยะทาง Damerau-Levenshtein สําหรับคําสองคํานี้คือ 2 ในการค้นหาเลือนนี้ในตัวอย่าง PDF
วิธีการต่อไปนี้มักใช้ในการค้นหาเลือน:
ในแอปพลิเคชันนี้เพื่อให้ได้คําที่ตรงกันอย่างเลือนลางใน PDF คุณต้องระบุจํานวนข้อผิดพลาดที่ต้องการ (ค่าความเลือนราง) จาก 1 ถึง 9 ตัวอักษร คุณยังสามารถตั้งค่าตัวเลือกในการค้นหาคําที่มีจํานวนความแตกต่างน้อยที่สุด หรือค้นหาคําทั้งหมดภายในจํานวนความแตกต่างที่กําหนด
ห้องสมุด GroupDocs.Search มีตัวเลือกการจับคู่เลือนอื่น ๆ อีกมากมาย ตัวอย่างเช่น คุณสามารถตั้งค่าจํานวนความแตกต่างระหว่างคําเป็นฟังก์ชันเชิงเส้นของความยาวคํา หรือแม้แต่ตั้งค่าจํานวนความแตกต่างแยกกันสําหรับแต่ละค่าของความยาวของคํา
คุณยังสามารถทําการค้นหาเลือนในรูปแบบไฟล์อื่น ๆ อีกมากมาย โปรดดูรายการทั้งหมดด้านล่าง