Η ασαφής αναζήτηση πληροφοριών κειμένου είναι η αναζήτηση συμβολοσειρών παρόμοιων ή κοντά στο ερώτημα αναζήτησης.
Ταυτόχρονα, ο βαθμός ασαφούς ή ομοιότητας των συμβολοσειρών κειμένου αξιολογείται συχνότερα χρησιμοποιώντας την απόσταση επεξεργασίας (απόσταση Levenshtein). Και η απόσταση επεξεργασίας δύο συμβολοσειρών είναι ο ελάχιστος αριθμός λειτουργιών αντικατάστασης χαρακτήρων, εισαγωγής και διαγραφής που απαιτούνται για τη μετατροπή μιας συμβολοσειράς σε μια άλλη. Η μεταφορά δύο γειτονικών χαρακτήρων μπορεί επίσης να θεωρηθεί έγκυρη πράξη επεξεργασίας (απόσταση Damerau-Levenshtein).
Μια ασαφής αναζήτηση στο παράδειγμα DOCX για μια δεδομένη τιμή ασαφούς 2 επεξεργασιών είναι το ερώτημα αναζήτησης "δέντρα" και το αποτέλεσμα αναζήτησης "αυτά". Εδώ ο χαρακτήρας "r" αντικαθίσταται από το "h" και οι χαρακτήρες "e" και "s" μεταφέρονται στο εθνικό τους δίκαιο. Δηλαδή, η απόσταση Damerau-Levenshtein για αυτές τις δύο λέξεις είναι 2 σε αυτό το ασαφές παράδειγμα αναζήτησης στο παράδειγμα DOCX.
Οι ακόλουθες μέθοδοι χρησιμοποιούνται συχνότερα για την εφαρμογή ασαφούς αναζήτησης:
Σε αυτήν την εφαρμογή, για να πάρετε μια ασαφή αντιστοίχιση λέξεων στο DOCX, πρέπει να καθορίσετε τον απαιτούμενο αριθμό λαθών (τιμή ασαφούς) από 1 έως 9 χαρακτήρες. Μπορείτε επίσης να ορίσετε την επιλογή αναζήτησης λέξεων με ελάχιστο αριθμό διαφορών ή να αναζητήσετε όλες τις λέξεις μέσα σε έναν δεδομένο αριθμό διαφορών.
Η βιβλιοθήκη GroupDocs.Search έχει πολλές άλλες ασαφείς επιλογές αντιστοίχισης. Για παράδειγμα, μπορείτε να ορίσετε τον αριθμό των διαφορών μεταξύ των λέξεων ως γραμμική συνάρτηση του μήκους λέξεων ή ακόμα και να ορίσετε τον αριθμό των διαφορών ξεχωριστά για κάθε τιμή μήκους λέξης.
Μπορείτε επίσης να εκτελέσετε ασαφή αναζήτηση σε πολλές άλλες μορφές αρχείων. Δείτε την πλήρη λίστα παρακάτω.