Pesquisa difusa de informações textuais é a busca por strings semelhantes ou próximas à consulta de pesquisa.

Ao mesmo tempo, o grau de difusão ou semelhança das cadeias de texto é mais frequentemente avaliado usando a distância de edição (distância levenshtein). E a distância de edição de duas strings é o número mínimo de operações de substituição, inserção e exclusão de caracteres necessárias para transformar uma sequência em outra. Uma transposição de dois caracteres adjacentes também pode ser considerada como uma operação de edição válida (distância Damerau-Levenshtein).

Um exemplo de pesquisa difusa para um determinado valor de fuzziness de 2 edições é a consulta de pesquisa "árvores" e o resultado da pesquisa "estes". Aqui o personagem "r" é substituído por "h" e os caracteres "e" e "s" são transpostos. Ou seja, a distância Damerau-Levenshtein para essas duas palavras é 2 neste exemplo de pesquisa difusa.

Os seguintes métodos são mais usados para implementar a pesquisa embaçada:

O aplicativo da Web Fuzzy search in document é construído na base do mecanismo de pesquisa de texto completo GroupDocs.Search. A implementação de correspondência difusa nesta biblioteca tem as melhores características dos métodos listados:

Neste aplicativo, para obter uma combinação difusa de palavras em um documento, você precisa especificar o número necessário de erros (valor de fuzziness) de 1 a 9 caracteres. Você também pode definir a opção de procurar palavras com apenas um número mínimo de diferenças, ou procurar por todas as palavras dentro de um determinado número de diferenças.

A biblioteca GroupDocs.Search tem muitas outras opções de correspondência difusa. Por exemplo, você pode definir o número de diferenças entre as palavras como uma função linear do comprimento da palavra, ou até mesmo definir o número de diferenças individualmente para cada valor do comprimento da palavra.

Como encontrar uma combinação difusa de texto no documento

  • Clique dentro da área de queda de arquivo para carregar um arquivo ou arrastar e soltar um arquivo.
  • Uma vez que o upload seja concluído, você poderá realizar a pesquisa em seu arquivo.
  • Digite sua consulta de pesquisa consistindo em uma ou mais palavras separadas por espaços.
  • Selecione o tipo de pesquisa: frase, todas as palavras, qualquer palavra.
  • Definir o número de erros permitidos em uma palavra de 1 a 9; se necessário, defina a bandeira para obter apenas os melhores resultados.
  • Obtenha resultados clicando no botão "Pesquisar".
  • Adicione mais arquivos com o botão "Adicionar arquivos".
  • Selecione arquivos adicionados para incluí-los no índice e realizar pesquisas.

Perguntas frequentes

  • Como funciona o aplicativo online Fuzzy Search in Document?

    A busca é realizada em duas etapas. Primeiro, os documentos são adicionados a um índice. E só então a busca é realizada no índice.
  • E quanto à privacidade, é seguro usar o aplicativo online Fuzzy Search in Document?

    O acesso à sua pasta com arquivos carregados e indexados só está disponível para alguém que tenha um link. Todos os arquivos enviados são excluídos dos servidores após 24 horas.
  • É necessária uma conexão com a Internet para usar o aplicativo online Fuzzy Search in Document?

    Esta aplicação é cliente-servidor. Se você perder sua conexão com a Internet enquanto estiver usando o aplicativo, não poderá obter resultados de pesquisa.
  • Posso pesquisar em Linux, Mac OS Android?

    Você pode pesquisar de qualquer dispositivo, independentemente do sistema operacional, que tenha um navegador moderno e uma conexão com a internet.

Formatos de arquivo suportados pelo aplicativo de pesquisa Fuzzy

Você pode realizar pesquisa difusa em muitos formatos de arquivo. Veja a lista completa abaixo.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner