La cerca difusa d'informació textual és la cerca de cadenes semblants o properes a la consulta de cerca.

Al mateix temps, el grau de confusió o similitud de les cadenes de text s'avalua amb més freqüència mitjançant la distància d'edició (distància de Levenshtein). I la distància d'edició de dues cadenes és el nombre mínim d'operacions de substitució, inserció i supressió de caràcters necessàries per transformar una cadena en una altra. Una transposició de dos caràcters adjacents també es pot considerar com una operació d'edició vàlida (distància Damerau-Levenshtein).

Un exemple de cerca difusa per a un valor de borrositat determinat de 2 edicions és la consulta de cerca "arbres" i el resultat de la cerca "aquests". Aquí el caràcter "r" es substitueix per "h" i es transposen els caràcters "e" i "s". És a dir, la distància Damerau-Levenshtein per a aquestes dues paraules és 2 en aquest exemple de cerca difusa.

Els mètodes següents s'utilitzen més sovint per implementar la cerca difusa:

L'aplicació web Cerca difusa al document es basa en el motor de cerca de text complet GroupDocs.Search. La implementació de la concordança difusa en aquesta biblioteca té les millors característiques dels mètodes enumerats:

En aquesta aplicació, per obtenir una concordança difusa de paraules en un document, heu d'especificar el nombre d'errors necessari (valor de borrositat) d'1 a 9 caràcters. També podeu configurar l'opció de cercar paraules amb només un nombre mínim de diferències o de cercar totes les paraules dins d'un nombre determinat de diferències.

La biblioteca GroupDocs.Search té moltes altres opcions de concordança difuses. Per exemple, podeu establir el nombre de diferències entre paraules com a funció lineal de la longitud de la paraula, o fins i tot establir el nombre de diferències individualment per a cada valor de longitud de paraula.

Com trobar una coincidència difusa de text al document

  • Feu clic dins de l'àrea de llançament de fitxers per carregar un fitxer o arrossegueu i deixeu anar un fitxer.
  • Un cop finalitzada la càrrega, podreu fer una cerca al vostre fitxer.
  • Introduïu la vostra consulta de cerca que consta d'una o més paraules separades per espais.
  • Seleccioneu el tipus de cerca: frase, totes les paraules, qualsevol paraula.
  • Estableix el nombre d'errors permesos en una paraula d'1 a 9; si cal, establiu la bandera per obtenir només els millors resultats.
  • Obteniu resultats fent clic al botó "Cercar".
  • Afegiu més fitxers amb el botó "Afegeix fitxers".
  • Seleccioneu els fitxers afegits per incloure'ls a l'índex i feu cerques.

Preguntes freqüents

  • Com funciona l'aplicació en línia Fuzzy Search in Document?

    La cerca es realitza en dues etapes. En primer lloc, els documents s'afegeixen a un índex. I només llavors la cerca es realitza a l'índex.
  • Què passa amb la privadesa, és segur utilitzar l'aplicació en línia Fuzzy Search in Document?

    L'accés a la carpeta amb els fitxers penjats i indexats només està disponible per a algú que tingui un enllaç. Tots els fitxers carregats s'eliminen dels servidors al cap de 24 hores.
  • És necessària una connexió a Internet per utilitzar l'aplicació en línia Fuzzy Search in Document?

    Aquesta aplicació és client-servidor. Si perdeu la connexió a Internet mentre utilitzeu l'aplicació, no podreu obtenir resultats de la cerca.
  • Puc cercar a Linux, Mac OS, Android?

    Podeu cercar des de qualsevol dispositiu, independentment del sistema operatiu, que tingui un navegador modern i una connexió a Internet.

Formats de fitxer compatibles amb l'aplicació de cerca difusa

Podeu realitzar una cerca difusa en molts formats de fitxer. Si us plau, consulteu la llista completa a continuació.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner