Neizrazito pretraživanje tekstualnih informacija je traženje nizova sličnih ili bliskih upitu za pretraživanje.

Istodobno, stupanj nejasnosti ili sličnosti tekstualnih nizova najčešće se procjenjuje pomoću udaljenosti uređivanja (Levenshteinova udaljenost). A udaljenost uređivanja dva niza minimalan je broj operacija zamjene znakova, umetanja i brisanja potrebnih za transformaciju jednog niza u drugi. Transpozicija dvaju susjednih znakova također se može smatrati valjanom operacijom uređivanja (Damerau-Levenshteinova udaljenost).

Nejasno pretraživanje u primjeru PDF za danu vrijednost nejasnoće od 2 uređivanja je upit za pretraživanje "stabla" i rezultat pretraživanja "ovi". Ovdje je znak "r" zamijenjen sa "h", a znakovi "e" i "s" su transponirani. To jest, udaljenost Damerau-Levenshtein za ove dvije riječi je 2 u ovom nejasnom pretraživanju u primjeru PDF.

Za implementaciju neizrazitog pretraživanja najčešće se koriste sljedeće metode:

Web aplikacija Fuzzy search in PDF izgrađena je na temelju tražilice cijelog teksta GroupDocs.Search. Implementacija neizrazitog podudaranja u ovoj biblioteci ima najbolje karakteristike od navedenih metoda:

U ovoj aplikaciji, da biste dobili nejasno podudaranje riječi u PDF, morate navesti potreban broj pogrešaka (vrijednost nejasnosti) od 1 do 9 znakova. Također možete postaviti opciju traženja riječi s minimalnim brojem razlika ili traženje svih riječi unutar određenog broja razlika.

Biblioteka GroupDocs.Search ima mnoge druge opcije nejasnog podudaranja. Na primjer, možete postaviti broj razlika između riječi kao linearnu funkciju duljine riječi ili čak postaviti broj razlika pojedinačno za svaku vrijednost duljine riječi.

Kako pronaći nejasno podudaranje teksta u PDF

  • Kliknite unutar područja ispuštanja datoteke za prijenos PDF datoteke ili povucite i ispustite PDF datoteku.
  • Kada se učitavanje završi, moći ćete izvršiti pretraživanje u svojoj datoteci PDF.
  • Unesite upit za pretraživanje koji se sastoji od jedne ili više riječi odvojenih razmacima.
  • Odaberite vrstu pretraživanja: izraz, sve riječi, bilo koja riječ.
  • Postavite broj dopuštenih pogrešaka u riječi od 1 do 9; ako je potrebno, postavite oznaku za dobivanje samo najboljih rezultata.
  • Dobijte rezultate klikom na gumb "Traži".
  • Dodajte još PDF datoteka pomoću gumba "Dodaj datoteke".
  • Odaberite dodane datoteke da biste ih uključili u indeks i izvršite pretraživanja.

Najčešća pitanja

  • Kako funkcionira internetska aplikacija Fuzzy Search u PDF?

    Pretraživanje se provodi u dvije faze. Prvo se dokumenti dodaju indeksu. I tek tada se pretraživanje vrši u indeksu.
  • Što je s privatnošću, je li sigurno koristiti internetsku aplikaciju Fuzzy Search u PDF?

    Pristup mapi s prenesenim i indeksiranim datotekama dostupan je samo nekome tko ima vezu. Sve prenesene datoteke brišu se s poslužitelja nakon 24 sata.
  • Je li za korištenje internetske aplikacije Fuzzy Search u PDF potrebna internetska veza?

    Ova aplikacija je klijent-poslužitelj. Ako tijekom korištenja aplikacije izgubite internetsku vezu, nećete moći dobiti rezultate pretraživanja.
  • Mogu li pretraživati Linux, Mac OS, Android?

    Možete pretraživati s bilo kojeg uređaja, bez obzira na operativni sustav, koji ima moderan preglednik i internetsku vezu.

Ostali formati datoteka koje podržava aplikacija Fuzzy search

Također možete izvršiti neizrazito pretraživanje u mnogim drugim formatima datoteka. Pogledajte cijeli popis u nastavku.

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner