A szöveges információk fuzzy keresése a keresési lekérdezéshez hasonló vagy ahhoz közeli karakterláncok keresése.
Ugyanakkor a szöveges karakterláncok homályosságának vagy hasonlóságának mértékét leggyakrabban a szerkesztési távolság (Levenshtein távolság) segítségével értékelik. Két karakterlánc szerkesztési távolsága pedig az egyik karakterlánc másikká alakításához szükséges minimális karaktercsere-, beillesztési és törlési műveletek száma. Két szomszédos karakter transzponálása is érvényes szerkesztési műveletnek tekinthető (Damerau-Levenshtein távolság).
Egy fuzzy keresés a(z) DOCX példában egy adott, 2 szerkesztésből álló fuzzyness értékre a "fák" keresési lekérdezés és a "these" keresési eredmény. Itt az "r" karaktert "h" váltja fel, és az "e" és "s" karaktereket transzponálja. Vagyis ennek a két szónak a Damerau-Levenshtein távolsága 2 ebben a fuzzy keresésben a(z) DOCX példában.
A fuzzy keresés megvalósításához leggyakrabban a következő módszereket használják:
Ebben az alkalmazásban a(z) DOCX nyelvű szavak homályos egyezésének eléréséhez meg kell adnia a hibák szükséges számát (fuzziness value) 1 és 9 karakter között. Azt is beállíthatja, hogy a minimális számú eltéréssel rendelkező szavakat keresse, vagy az összes szót egy adott számú eltérésen belül keresse.
A GroupDocs.Search könyvtár számos más homályos illesztési lehetőséget kínál. Például beállíthatja a szavak közötti különbségek számát a szóhossz lineáris függvényeként, vagy akár külön-külön is beállíthatja a különbségek számát a szóhossz minden értékéhez.
Számos más fájlformátumban is végezhet fuzzy keresést. Kérjük, tekintse meg a teljes listát alább.