A szöveges információk fuzzy keresése a keresési lekérdezéshez hasonló vagy ahhoz közeli karakterláncok keresése.
Ugyanakkor a szöveges karakterláncok homályosságának vagy hasonlóságának mértékét leggyakrabban a szerkesztési távolság (Levenshtein távolság) segítségével értékelik. Két karakterlánc szerkesztési távolsága pedig az egyik karakterlánc másikká alakításához szükséges minimális karaktercsere-, beillesztési és törlési műveletek száma. Két szomszédos karakter transzponálása is érvényes szerkesztési műveletnek tekinthető (Damerau-Levenshtein távolság).
Egy fuzzy keresési példa adott, 2 szerkesztésű fuzzyness értékre a "fák" keresési lekérdezés és a "these" keresési eredmény. Itt az "r" karaktert "h" váltja fel, és az "e" és "s" karaktereket transzponálja. Ez azt jelenti, hogy a két szó Damerau-Levenshtein távolsága 2 ebben a fuzzy keresési példában.
A fuzzy keresés megvalósításához leggyakrabban a következő módszereket használják:
Ebben az alkalmazásban ahhoz, hogy egy dokumentumban a szavak homályos egyezését kapja meg, meg kell adnia a hibák szükséges számát (fuzziness érték) 1 és 9 karakter között. Azt is beállíthatja, hogy a minimális számú eltéréssel rendelkező szavakat keresse, vagy az összes szót egy adott számú eltérésen belül keresse.
A GroupDocs.Search könyvtár számos más homályos illesztési lehetőséget kínál. Például beállíthatja a szavak közötti különbségek számát a szóhossz lineáris függvényeként, vagy akár külön-külön is beállíthatja a különbségek számát a szóhossz minden értékéhez.
Számos fájlformátumban végezhet fuzzy keresést. Kérjük, tekintse meg a teljes listát alább.