Tekstituvastusprogrammid

Tekstituvastusprogrammid

Reeglina, kui tegemist on skannitud teksti tuvastamise programmidega (OCR, sümbolite optiline äratundmine), tuletab enamik kasutajaid meelde ainsat toodet - Abbyy FineReader, mis on kahtlemata Venemaa sellise tarkvara ja ühe juhid ühes juhtives. maailm.

Sellegipoolest pole FineReader ainus selline lahendus: on olemas tasuta programme teksti äratundmiseks, veebiteenused samadel eesmärkidel ja pealegi on selliseid funktsioone ka mõnes teie teada olevas programmis, mis võis juba teie arvutisse installitud. Püüan sellest kõigest kirjutada selles artiklis. Kõik programmid kaaluti tööd Windows 7, 8 ja XP -s.

Teksti äratundmise juht - Abbyy FineReader programm

FineReaderi kohta (hääldatakse tuletõrjelugejana), ilmselt on enamik teist kuulnud. See programm on parim või üks parimatest vene keeles kõrgekvaliteedilise teksti äratundmiseks. Programmi makstakse ja koduseks kasutamiseks mõeldud litsentsi hind on pisut vähem kui 2000 rubla. Samuti on võimalik Abbyy Fine Readeris veebis alla laadida FineDeri prooviversioon või kasutada veebitegevuse veebis äratundmist (siis saate mitu lehte tasuta ära tunda - tasu eest). Kõik see on saadaval arendaja ametlikul veebisaidil http: // www.Abbyy.ru.

FineReaderi prooviversiooni installimine ei põhjustanud probleeme. Po saab integreerida Microsoft Office'i ja Windowsi dirigendiga, et muuta see mugavamaks äratundmise käivitamiseks. Tasuta prooviversiooni piirangutest - 15 -päevane kasutamine ja võime ära tunda mitte rohkem kui 50 lehekülge.

Schold tunnustusprogrammide testimiseks

Kuna mul pole skannerit, kasutasin kinnitamiseks halva kvaliteediga telefonikaamera pilti, milles mul oli natuke redigeeritud kontrasti. Kvaliteet pole hea, vaatame, kes saab hakkama.

FineReader programmimenüü

FineReader saab teksti graafilise pildi otse skannerist, graafilistest failidest või kaamerast. Minu puhul piisas pildifaili avamisest. Tulemus oli rahul - ainult paar viga. Pean kohe ütlema, et see on kõigi tõestatud programmide parim tulemus selle valimiga töötades - sarnane tunnustuse kvaliteet oli ainult tasuta veebiteenuse tasuta veebis OCR (kuid selles arvustuses räägime ainult tarkvarast, mitte ainult veebipõhine äratundmine).

Teksti äratundmise tulemus FineReaderis

Ausalt. Programmi eelised ei ole mitte ainult teksti äratundmise kvaliteet, vaid ka lai funktsionaalsus, vormindamise tugi, pädev eksport mitmesse vormingusse, sealhulgas Word Docx, PDF ja muud võimalused. Seega, kui OCR -i ülesanded on pidevalt kokku puutunud, siis ärge kahetsege suhteliselt väikest rahasummat ja see tasub täielikult ära: säästate tohutult palju aega, saades kiiresti kvalitatiivse tulemuse, kui FineReader. Muide, ma ei reklaami midagi - ma tõesti arvan, et need, kes peavad ära tundma rohkem kui tosinat lehte.

CUNEEFORM - tasuta teksti tuvastamise programm

Minu hinnangul on Venemaal kõige populaarsem OCR -i programm tasuta Cuear, mille saab alla laadida ametlikust veebisaidilt http: // cognitiivforms.ru/tooted/cuneeform/.

Programmi installimine on samuti väga lihtne, see ei ürita installida kolmandat -osalist tarkvara (nagu palju tasuta tarkvara). Liides on lühike ja arusaadav. Mõnel juhul on kõige lihtsam viis meistri kasutamiseks, mille jaoks esimene menüü ikoonidest on ette nähtud.

Näidisega, mida ma FineReaderis kasutasin, ei saanud programm hakkama ega täpsemalt välja andnud midagi halvasti lugemist ja sõnavõsasid. Teine katse tehti teksti ekraanipildiga selle programmi enda saidilt, mida aga tuli suurendada (see vajab skaneerimist eraldusvõimega 200dpi ja kõrgemal, ei loe ta ekraanipilte, millel on 1 paksus 1. -2 piksli fondijooned). Siin sai ta hästi hakkama (osa tekstist ei tunnustatud, kuna valiti ainult vene keel).

Teksti äratundmine CUNEEFORMis

Seega võib eeldada, et CUNEEFORM on see, mida peaksite proovima, eriti kui teil on kvalitatiivselt skannitud lehti ja soovite neid tasuta ära tunda.

Microsoft OneNote - programm, mis teil võib juba olla

Microsoft Office'i kompositsioonil, alustades versioonist 2007 ja lõppedes praeguse 2013. aastaga, on märkmete pidamise programm - OneNote. See sisaldab ka teksti äratundmisfunktsioone. Selle kasutamiseks sisestage lihtsalt skannitud või muu teksti pilt noodisse, klõpsake selle paremal hiireklahvi ja kasutage kontekstimenüüd. Pange tähele, et vaikimisi on inglise keel äratunmiseks seatud.

Tunnustus Microsoft OneNote'is

Ma ei saa öelda, et tekst on ideaalselt tunnustatud, kuid niipalju kui ma oskan hinnata, on see mõnevõrra parem isegi kui cuneform. Programmi pluss, nagu juba mainitud, on see, et märkimisväärse tõenäosusega on see juba teie arvutisse installitud. Ehkki muidugi, kui see on vajalik töötada suure hulga skannitud dokumentidega, on see tõenäoliselt mugav, pigem sobib see visiitkaartide kiireks äratundmiseks.

Omnipage Ultimate, Omnipage 18 - seal peab olema midagi väga lahedat

Ma ei tea, kui hea programm Omnipage'i tekstide äratundmiseks: prooviversioone pole, ma ei taha kuskilt alla laadida. Kuid kui selle hind on õigustatud ja see maksab versioonis individuaalseks kasutamiseks umbes 5000 rubla, siis mitte ülim, siis peaks see olema midagi muljetavaldavat. Programmi leht: http: // www.Nüanss.Com/individuaalid/kõrvalsaadus/omnipage/indeks.Htm

Kõikvõimalus

Kui tutvute omaduste ja arvustustega, sealhulgas ka vene keelt kõnelevates väljaannetes, märgib ta, et Omnipage pakub tõesti kõrgekvaliteedilist ja täpset tunnustust, sealhulgas vene keeles, suhteliselt hõlpsalt eraldab kõrgeima kvaliteediga skaneeringuid ja pakub täiendavaid tööriistu. Eristataks puudustest, eriti kõige mugavamat, eriti algaja kasutaja jaoks. Ühel või teisel viisil on lääne turu omnipage otsene konkurent FineReaderile ja inglise keele osas -nad võitlevad omavahel ja seetõttu peaks see minu arvates programm olema vääriline.

See pole kaugeltki kõigist seda tüüpi programmidest, väikeste tasuta programmide jaoks on ka mitmesuguseid võimalusi, kuid nendega katsetades leidsin neile kaks peamist puudust: tsürilliks tähestiku toetuse puudumine või erinev, mitte liiga kasulik mõistete osas liiga kasulik installimise ja seetõttu otsustas neid siin mainida.