Fuzzy zoeken naar tekstuele informatie is het zoeken naar tekenreeksen die vergelijkbaar zijn met of dicht bij de zoekopdracht liggen.

Tegelijkertijd wordt de mate van vaagheid of gelijkenis van tekstreeksen meestal beoordeeld met behulp van de bewerkingsafstand (Levenshtein-afstand). En de bewerkingsafstand van twee tekenreeksen is het minimale aantal tekenvervangings-, invoeg- en verwijderingsbewerkingen dat nodig is om de ene tekenreeks in de andere om te zetten. Een omzetting van twee aangrenzende tekens kan ook worden beschouwd als een geldige bewerking (Damerau-Levenshtein-afstand).

Een vaag zoekvoorbeeld voor een bepaalde vaagheidswaarde van 2 bewerkingen is de zoekopdracht "trees" en het zoekresultaat "deze". Hier wordt het teken "r" vervangen door "h" en worden de tekens "e" en "s" getransponeerd. Dat wil zeggen, de Damerau-Levenshtein afstand voor deze twee woorden is 2 in dit vage zoekvoorbeeld.

De volgende methoden worden meestal gebruikt om fuzzy search te implementeren:

Wagner-Fischer (MySQL fuzzy zoeken).
N-gram (MongoDB fuzzy search).
Sampling extensions (Elasticsearch fuzziness, Lucene fuzzy search).
Hashing van handtekeningen.

De webapplicatie Fuzzy search in document is gebouwd op basis van de GroupDocs.Search full-text zoekmachine. De implementatie van fuzzy matching in deze bibliotheek heeft de beste kenmerken van de vermelde methoden:

Nauwkeurigheid. Alle woorden met een bepaald aantal fouten (bewerkingsafstand) worden gevonden, in tegenstelling tot N-grams en signature hashing-methoden.
Voorstelling. In dit geval wordt de zoekopdracht veel sneller uitgevoerd dan in de Wagner-Fischer- en sampling-uitbreidingsmethoden, zelfs met een groot aantal fouten.

Als u in deze toepassing een vage overeenkomst van woorden in een document wilt krijgen, moet u het vereiste aantal fouten (vaagheidswaarde) opgeven van 1 tot 9 tekens. U kunt ook de optie instellen om te zoeken naar woorden met slechts een minimum aantal verschillen of om te zoeken naar alle woorden binnen een bepaald aantal verschillen.

De GroupDocs.Search-bibliotheek heeft veel andere fuzzy matching-opties. U kunt bijvoorbeeld het aantal verschillen tussen woorden instellen als een lineaire functie van de woordlengte, of zelfs het aantal verschillen afzonderlijk instellen voor elke waarde van de woordlengte.

Hoe een vage overeenkomst van tekst in document te vinden

Klik in het gebied voor het neerzetten van bestanden om een bestand te uploaden of sleep een bestand.
Zodra het uploaden is voltooid, kunt u zoeken in uw bestand.
Voer uw zoekopdracht in die bestaat uit een of meer woorden gescheiden door spaties.
Selecteer het zoektype: woordgroep, alle woorden, elk woord.
Stel het aantal toegestane fouten in een woord in van 1 tot 9; stel indien nodig de vlag in om alleen de beste resultaten te verkrijgen.
Krijg resultaten door op de knop "Zoeken" te klikken.
Voeg meer bestanden toe met de knop "Bestanden toevoegen".
Selecteer toegevoegde bestanden om ze in de index op te nemen en zoekopdrachten uit te voeren.

Veelgestelde vragen

Hoe werkt de online app Fuzzy Search in Document?

De zoekopdracht wordt in twee fasen uitgevoerd. Eerst worden documenten toegevoegd aan een index. En pas dan wordt de zoekopdracht uitgevoerd in de index.
Hoe zit het met privacy, is het veilig om de online app Fuzzy Search in Document te gebruiken?

Toegang tot uw map met geüploade en geïndexeerde bestanden is alleen beschikbaar voor iemand die een koppeling heeft. Alle geüploade bestanden worden na 24 uur van de servers verwijderd.
Is een internetverbinding vereist om de online app Fuzzy Search in Document te gebruiken?

Deze applicatie is client-server. Als u uw internetverbinding verliest tijdens het gebruik van de app, kunt u geen zoekresultaten meer krijgen.
Kan ik zoeken op Linux, Mac OS Android?

U kunt zoeken vanaf elk apparaat, ongeacht het besturingssysteem, dat een moderne browser en een internetverbinding heeft.

Fuzzy zoeken in document

Fuzzy zoeken naar meer dan 80 documenttypen.

Hoe een vage overeenkomst van tekst in document te vinden

Veelgestelde vragen

Hoe werkt de online app Fuzzy Search in Document?

Hoe zit het met privacy, is het veilig om de online app Fuzzy Search in Document te gebruiken?

Is een internetverbinding vereist om de online app Fuzzy Search in Document te gebruiken?

Kan ik zoeken op Linux, Mac OS Android?

Bestandsindelingen die worden ondersteund door de Fuzzy-zoekapp