Տեքստային տեղեկատվության մշուշոտ որոնումը որոնման հարցումին նման կամ մոտ տողերի որոնումն է:
Միևնույն ժամանակ, տեքստային տողերի անորոշության կամ նմանության աստիճանը ամենից հաճախ գնահատվում է խմբագրման հեռավորության միջոցով (Լևենշտեյնի հեռավորություն): Եվ երկու տողերի խմբագրման հեռավորությունը նիշերի փոխարինման, տեղադրման և ջնջման գործողությունների նվազագույն քանակն է, որն անհրաժեշտ է մի տողը մյուսի փոխակերպելու համար: Երկու հարակից նիշերի փոխադրումը կարող է նաև դիտարկվել որպես վավեր խմբագրման գործողություն (Դամերաու-Լևենշտեյն հեռավորություն):
2 խմբագրման տրված մշուշոտության արժեքի մշուշոտ որոնման օրինակ է «ծառերը» որոնման հարցումը և «սրանք» որոնման արդյունքը։ Այստեղ «r» նշանը փոխարինվում է «h»-ով, իսկ «e» և «s» նիշերը փոխադրվում են: Այսինքն, այս երկու բառերի համար Դամերաու-Լևենշտեյն հեռավորությունը 2 է այս անորոշ որոնման օրինակում:
Հետևյալ մեթոդները առավել հաճախ օգտագործվում են անորոշ որոնման իրականացման համար.
Այս հավելվածում փաստաթղթում բառերի անորոշ համընկնում ստանալու համար անհրաժեշտ է նշել սխալների անհրաժեշտ քանակությունը (անորոշության արժեքը) 1-ից 9 նիշ: Կարող եք նաև սահմանել տարբերակ՝ բառեր որոնելու միայն նվազագույն թվով տարբերություններով, կամ որոնելու բոլոր բառերը որոշակի թվով տարբերությունների մեջ:
GroupDocs.Search գրադարանն ունի բազմաթիվ այլ անհասկանալի համապատասխանող տարբերակներ: Օրինակ, դուք կարող եք սահմանել բառերի միջև եղած տարբերությունների թիվը որպես բառի երկարության գծային ֆունկցիա, կամ նույնիսկ առանձին-առանձին սահմանել տարբերությունների քանակը բառի երկարության յուրաքանչյուր արժեքի համար:
Դուք կարող եք մշուշոտ որոնում կատարել բազմաթիվ ֆայլերի ձևաչափերով: Խնդրում ենք տեսնել ստորև ներկայացված ամբողջական ցանկը: