La recherche floue d’informations textuelles est la recherche de chaînes similaires ou proches de la requête de recherche.

Dans le même temps, le degré de flou ou de similitude des chaînes de texte est le plus souvent évalué à l’aide de la distance d’édition (distance de Levenshtein). Et la distance d’édition de deux chaînes est le nombre minimum d’opérations de substitution, d’insertion et de suppression de caractères nécessaires pour transformer une chaîne en une autre. Une transposition de deux caractères adjacents peut également être considérée comme une opération d’édition valide (distance Damerau-Levenshtein).

Un exemple de recherche floue pour une valeur de flou donnée de 2 modifications est la requête de recherche « arbres » et le résultat de recherche « ceux-ci ». Ici, le caractère « r » est remplacé par « h » et les caractères « e » et « s » sont transposés. C’est-à-dire que la distance de Damerau-Levenshtein pour ces deux mots est de 2 dans cet exemple de recherche floue.

Les méthodes suivantes sont le plus souvent utilisées pour implémenter la recherche floue :

L’application web Fuzzy search in document est construite sur la base du moteur de recherche en texte intégral GroupDocs.Search. L’implémentation de la correspondance floue dans cette bibliothèque présente les meilleures caractéristiques des méthodes répertoriées :

Dans cette application, pour obtenir une correspondance floue de mots dans un document, vous devez spécifier le nombre requis d’erreurs (valeur de flou) de 1 à 9 caractères. Vous pouvez également définir l’option pour rechercher des mots avec seulement un nombre minimum de différences, ou pour rechercher tous les mots dans un nombre donné de différences.

La bibliothèque GroupDocs.Search dispose de nombreuses autres options de correspondance floue. Par exemple, vous pouvez définir le nombre de différences entre les mots en fonction linéaire de la longueur des mots, ou même définir le nombre de différences individuellement pour chaque valeur de longueur de mot.

Comment trouver une correspondance floue de texte dans le document

  • Cliquez à l’intérieur de la zone de dépôt de fichier pour télécharger un fichier ou glisser-déposer un fichier.
  • Une fois le téléchargement terminé, vous pourrez effectuer une recherche dans votre fichier.
  • Entrez votre requête de recherche composée d’un ou plusieurs mots séparés par des espaces.
  • Sélectionnez le type de recherche : phrase, tous les mots, n’importe quel mot.
  • Définissez le nombre d’erreurs autorisées dans un mot de 1 à 9 ; si nécessaire, définissez le drapeau pour obtenir uniquement les meilleurs résultats.
  • Obtenez des résultats en cliquant sur le bouton « Rechercher ».
  • Ajoutez plus de fichiers avec le bouton « Ajouter des fichiers ».
  • Sélectionnez les fichiers ajoutés pour les inclure dans l’index et effectuez des recherches.

Foire aux questions

  • Comment fonctionne l’application en ligne Fuzzy Search in Document ?

    La recherche est effectuée en deux étapes. Tout d’abord, les documents sont ajoutés à un index. Et ce n’est qu’alors que la recherche est effectuée dans l’index.
  • Qu’en est-il de la confidentialité, est-il sûr d’utiliser l’application en ligne Fuzzy Search in Document?

    L’accès à votre dossier contenant les fichiers téléchargés et indexés n’est disponible que pour les personnes disposant d’un lien. Tous les fichiers téléchargés sont supprimés des serveurs après 24 heures.
  • Une connexion Internet est-elle nécessaire pour utiliser l’application en ligne Fuzzy Search in Document ?

    Cette application est client-serveur. Si vous perdez votre connexion Internet lors de l’utilisation de l’application, vous ne pourrez pas obtenir de résultats de recherche.
  • Puis-je effectuer une recherche sur Linux, Mac OS Android ?

    Vous pouvez effectuer une recherche à partir de n’importe quel appareil, quel que soit le système d’exploitation, doté d’un navigateur moderne et d’une connexion Internet.

Formats de fichiers pris en charge par l’application de recherche Fuzzy

Vous pouvez effectuer une recherche floue dans de nombreux formats de fichiers. Veuillez consulter la liste complète ci-dessous.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner