Η ασαφής αναζήτηση πληροφοριών κειμένου είναι η αναζήτηση συμβολοσειρών παρόμοιων ή κοντά στο ερώτημα αναζήτησης.

Ταυτόχρονα, ο βαθμός ασαφούς ή ομοιότητας των συμβολοσειρών κειμένου αξιολογείται συχνότερα χρησιμοποιώντας την απόσταση επεξεργασίας (απόσταση Levenshtein). Και η απόσταση επεξεργασίας δύο συμβολοσειρών είναι ο ελάχιστος αριθμός λειτουργιών αντικατάστασης χαρακτήρων, εισαγωγής και διαγραφής που απαιτούνται για τη μετατροπή μιας συμβολοσειράς σε μια άλλη. Η μεταφορά δύο γειτονικών χαρακτήρων μπορεί επίσης να θεωρηθεί έγκυρη πράξη επεξεργασίας (απόσταση Damerau-Levenshtein).

Ένα ασαφές παράδειγμα αναζήτησης για μια δεδομένη ασαφή τιμή 2 επεξεργασιών είναι το ερώτημα αναζήτησης "δέντρα" και το αποτέλεσμα αναζήτησης "αυτά". Εδώ ο χαρακτήρας "r" αντικαθίσταται από το "h" και οι χαρακτήρες "e" και "s" μεταφέρονται στο εθνικό τους δίκαιο. Δηλαδή, η απόσταση Damerau-Levenshtein για αυτές τις δύο λέξεις είναι 2 σε αυτό το ασαφές παράδειγμα αναζήτησης.

Οι ακόλουθες μέθοδοι χρησιμοποιούνται συχνότερα για την εφαρμογή ασαφούς αναζήτησης:

Η εφαρμογή Web Ασαφής αναζήτηση στο έγγραφο είναι χτισμένη στη βάση της μηχανής αναζήτησης πλήρους κειμένου GroupDocs.Search. Η εφαρμογή της ασαφούς αντιστοίχισης σε αυτήν τη βιβλιοθήκη έχει τα καλύτερα χαρακτηριστικά των αναφερόμενων μεθόδων:

Σε αυτήν την εφαρμογή, για να πάρετε μια ασαφή αντιστοίχιση λέξεων σε ένα έγγραφο, πρέπει να καθορίσετε τον απαιτούμενο αριθμό λαθών (τιμή ασαφούς) από 1 έως 9 χαρακτήρες. Μπορείτε επίσης να ορίσετε την επιλογή αναζήτησης λέξεων με ελάχιστο αριθμό διαφορών ή να αναζητήσετε όλες τις λέξεις μέσα σε έναν δεδομένο αριθμό διαφορών.

Η βιβλιοθήκη GroupDocs.Search έχει πολλές άλλες ασαφείς επιλογές αντιστοίχισης. Για παράδειγμα, μπορείτε να ορίσετε τον αριθμό των διαφορών μεταξύ των λέξεων ως γραμμική συνάρτηση του μήκους λέξεων ή ακόμα και να ορίσετε τον αριθμό των διαφορών ξεχωριστά για κάθε τιμή μήκους λέξης.

Πώς να βρείτε μια ασαφή αντιστοίχιση κειμένου στο έγγραφο

  • Κάντε κλικ μέσα στην περιοχή απόθεσης αρχείων για να αποστείλετε ένα αρχείο ή να μεταφέρετε και να αποθέσετε ένα αρχείο.
  • Μόλις ολοκληρωθεί η μεταφόρτωση, θα μπορείτε να εκτελέσετε αναζήτηση στο αρχείο σας.
  • Εισαγάγετε το ερώτημα αναζήτησης που αποτελείται από μία ή περισσότερες λέξεις διαχωρισμένες με διαστήματα.
  • Επιλέξτε τον τύπο αναζήτησης: φράση, όλες οι λέξεις, οποιαδήποτε λέξη.
  • Ορίστε τον αριθμό των επιτρεπόμενων λαθών σε μια λέξη από το 1 έως το 9. Εάν είναι απαραίτητο, ορίστε τη σημαία για να λάβετε μόνο τα καλύτερα αποτελέσματα.
  • Λάβετε αποτελέσματα κάνοντας κλικ στο κουμπί "Αναζήτηση".
  • Προσθέστε περισσότερα αρχεία με το κουμπί "Προσθήκη αρχείων".
  • Επιλέξτε πρόσθετα αρχεία για να τα συμπεριλάβετε στο ευρετήριο και να εκτελέσετε αναζητήσεις.

Συχνές ερωτήσεις

  • Πώς λειτουργεί η διαδικτυακή εφαρμογή Fuzzy Search in Document;

    Η αναζήτηση πραγματοποιείται σε δύο στάδια. Πρώτον, τα έγγραφα προστίθενται σε ένα ευρετήριο. Και μόνο τότε η αναζήτηση εκτελείται στο ευρετήριο.
  • Τι γίνεται με το απόρρητο, είναι ασφαλές να χρησιμοποιήσετε την ηλεκτρονική εφαρμογή Fuzzy Search in Document;

    Η πρόσβαση στον φάκελό σας με μεταφορτωμένα και ευρετηριασμένα αρχεία είναι διαθέσιμη μόνο σε κάποιον που έχει σύνδεσμο. Όλα τα μεταφορτωμένα αρχεία διαγράφονται από τους διακομιστές μετά από 24 ώρες.
  • Απαιτείται σύνδεση στο διαδίκτυο για τη χρήση της διαδικτυακής εφαρμογής Fuzzy Search in Document;

    Αυτή η εφαρμογή είναι client-server. Εάν χάσετε τη σύνδεσή σας στο διαδίκτυο ενώ χρησιμοποιείτε την εφαρμογή, δεν θα μπορείτε να λάβετε αποτελέσματα αναζήτησης.
  • Μπορώ να κάνω αναζήτηση σε Linux, Mac OS, Android;

    Μπορείτε να κάνετε αναζήτηση από οποιαδήποτε συσκευή, ανεξάρτητα από το λειτουργικό σύστημα, που διαθέτει σύγχρονο πρόγραμμα περιήγησης και σύνδεση στο διαδίκτυο.

Μορφές αρχείων που υποστηρίζονται από την εφαρμογή αναζήτησης Fuzzy

Μπορείτε να εκτελέσετε ασαφή αναζήτηση σε πολλές μορφές αρχείων. Δείτε την πλήρη λίστα παρακάτω.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner