Suddig sökning av textinformation är sökning efter strängar som liknar eller ligger nära sökfrågan.
Samtidigt bedöms graden av suddighet eller likhet av textsträngar oftast med hjälp av redigeringsavståndet (Levenshtein-avståndet). Och redigeringsavståndet för två strängar är det minsta antalet teckenersättnings-, insättnings- och borttagningsåtgärder som krävs för att omvandla en sträng till en annan. Ett införlivande av två intilliggande tecken kan också betraktas som en giltig redigeringsåtgärd (Avstånd Damerau-Levenshtein).
Ett luddigt sökexempel för ett givet luddighetsvärde på 2 redigeringar är sökfrågan "träd" och sökresultatet "dessa". Här ersätts tecknet "r" med "h" och tecknen "e" och "s" transponeras. Det vill säga avståndet Damerau-Levenshtein för dessa två ord är 2 i detta luddiga sökexempel.
Följande metoder används oftast för att implementera fuzzy-sökning:
I det här programmet, för att få en fuzzy match av ord i ett dokument, måste du ange det önskade antalet misstag (fuzziness value) från 1 till 9 tecken. Du kan också ange alternativet att söka efter ord med bara ett minsta antal skillnader, eller att söka efter alla ord inom ett visst antal skillnader.
GroupDocs.Search-biblioteket har många andra luddiga matchningsalternativ. Du kan till exempel ange antalet skillnader mellan ord som en linjär funktion av ordlängd, eller till och med ange antalet skillnader individuellt för varje värde av ordlängd.
Du kan utföra suddig sökning i många filformat. Se hela listan nedan.