Hugbúnaður fyrir texta viðurkenningu

Pin
Send
Share
Send

Sem reglu, þegar kemur að forritum til að þekkja skannaðan texta (OCR, sjón stafræna viðurkenningu), muna flestir notendur eina vöruna - ABBYY FineReader, sem án efa er leiðandi meðal slíkra hugbúnaðar í Rússlandi og einn af leiðtogunum í heiminum.

Hins vegar er FineReader ekki eina slíka lausnin: það eru ókeypis forrit til að þekkja texta, netþjónustu í sama tilgangi og að auki eru slíkar aðgerðir einnig til staðar í sumum forritum sem þú veist að geta þegar verið sett upp á tölvunni þinni . Ég skal reyna að skrifa um allt þetta í þessari grein. Öll yfirfarin forrit virka í Windows 7, 8 og XP.

Texti viðurkenningarleiðari - ABBYY Finereader

Flest ykkar hafa sennilega heyrt um FineReader (borinn fram ágætur lesandi). Þetta forrit er það besta eða það besta fyrir vandaða viðurkenningu texta á rússnesku. Forritið er greitt og verð leyfis til heimanotkunar er aðeins minna en 2000 rúblur. Það er einnig mögulegt að hlaða niður prufuútgáfu af FineReader eða nota textameðferð á netinu í ABBYY Fine Reader Online (þú getur þekkt nokkrar síður ókeypis, þá gegn gjaldi). Allt er þetta aðgengilegt á opinberri vefsíðu framkvæmdaraðila //www.abbyy.ru.

Uppsetning prufuútgáfu af FineReader olli engum vandamálum. Hugbúnaðurinn getur samlagast Microsoft Office og Windows Explorer til að gera það auðveldara að keyra viðurkenningu. Af takmörkunum ókeypis prufuútgáfunnar - 15 daga notkun og hæfileikinn til að þekkja ekki meira en 50 blaðsíður.

Skyndimynd til að prófa viðurkenningarforrit

Þar sem ég er ekki með skanni notaði ég myndatöku úr myndavél í lágum gæðum símans til að athuga, þar sem ég breytti andstæðunni örlítið. Gæðin eru einskis virði, við skulum sjá hverjir geta séð um það.

FineReader valmynd

FineReader getur fengið grafíska mynd af textanum beint frá skannanum, myndskrám eða myndavélinni. Í mínu tilfelli var það nóg að opna myndskrána. Árangurinn ánægður - bara nokkur mistök. Ég verð að segja að þetta er besti árangur allra prófa forrita þegar unnið var með þetta sýnishorn - svipuð viðurkenningargæði voru aðeins á ókeypis netþjónustunni Free Online OCR (en í þessari umfjöllun erum við aðeins að tala um hugbúnaðartæki, ekki viðurkenningu á netinu).

Texti viðurkenning leiðir til FineReader

Í hreinskilni sagt hefur FineReader líklega enga keppinauta fyrir kyrillíska texta. Kostirnir við forritið eru ekki aðeins gæði textagreiningar, heldur einnig mikill virkni, sniðstuðningur, bær útflutningur á mörg snið, þar á meðal Word docx, pdf og aðrar aðgerðir. Þannig að ef OCR verkefni eru eitthvað sem þú stendur stöðugt frammi fyrir skaltu ekki hlífa tiltölulega litlu magni og það borgar sig: þú sparar mikinn tíma með því að fá fljótt hágæða niðurstöðu í FineReader. Við the vegur, ég auglýsi ekki neitt - mér finnst virkilega að þeir sem þurfa að þekkja meira en tugi síðna ættu að íhuga að kaupa slíkan hugbúnað.

CuneiForm - A Free Text Recognition Program

Að mínu mati er næst vinsælasta OCR forritið í Rússlandi ókeypis CuneiForm, sem hægt er að hala niður á opinberu vefsíðunni //cognitiveforms.ru/products/cuneiform/.

Uppsetning forritsins er líka mjög einföld, það reynir ekki að setja upp neinn hugbúnað frá þriðja aðila (eins og mikill frjáls hugbúnaður). Viðmótið er hnitmiðað og skýrt. Í sumum tilvikum er auðveldasta leiðin til að nota töframanninn, sem fyrsta táknið í valmyndinni.

Forritið sem ég tókst ekki á við sýnishornið sem ég notaði í FineReader, eða réttara sagt, framleiddi eitthvað illa læsilegt og útlistar orð. Önnur tilraunin var gerð með skjáskjá af textanum frá vefnum á þessu forriti sjálfu, sem þó þurfti að auka (hún þarf skannar með upplausn 200dpi og hærri, hún les ekki skjámyndir með leturlínuþykkt 1-2 pixla). Hér tókst henni vel (hluti textans var ekki viðurkenndur, þar sem aðeins rússneskur var valinn).

Texti viðurkenning í CuneiForm

Þannig getum við gengið út frá því að CuneiForm sé það sem þú ættir að prófa, sérstaklega ef þú ert með vandaðar skannaðar síður og þú vilt þekkja þær ókeypis.

Microsoft OneNote er forritið sem þú gætir nú þegar haft

Microsoft Office, frá útgáfu 2007 og endar með núverandi, 2013, hefur forrit til að taka minnispunkta - OneNote. Það hefur einnig textaþekkingu. Til að nota það skaltu einfaldlega setja skannaða eða aðra mynd af textanum í athugasemdina, hægrismella á hann og nota samhengisvalmyndina. Ég tek fram að sjálfgefið viðurkenningartungumál er stillt á ensku.

Viðurkenning í Microsoft OneNote

Ég get ekki sagt að textinn þekkist fullkomlega en að svo miklu leyti sem ég get sagt er hann nokkuð betri jafnvel en í CuneiForm. Plús forritsins, eins og áður segir, er að með töluverðum líkum er það þegar sett upp á tölvunni þinni. Þó að auðvitað sé ólíklegt að það sé þægilegt að nota það ef það er nauðsynlegt að vinna með miklum fjölda skannaðra skjala, þá er það heppilegra til fljótt að þekkja nafnspjöld.

OmniPage Ultimate, OmniPage 18 - Verður að vera eitthvað mjög flott

Ég veit ekki hversu gott forritið er fyrir OmniPage texta viðurkenningu: það eru engar prufuútgáfur, ég vil ekki sækja einhvers staðar. En ef verð þess er réttlætanlegt og það kostar um það bil 5.000 rúblur í útgáfunni til einstakra nota en ekki Ultimate, þá ætti þetta að vera eitthvað áhrifamikið. Dagskráarsíða: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

OmniPage hugbúnaðarverð

Ef þú kynnist einkennum og umsögnum, þar með talið í rússneskum útgáfum, er tekið fram í þeim að OmniPage veitir raunverulega vandaða og nákvæma viðurkenningu, þar á meðal á rússnesku, það ber saman tiltölulega lágum gæðum skannana tiltölulega auðveldlega og veitir safn viðbótartækja. Af göllunum er viðmótið ekki það þægilegasta, sérstaklega fyrir nýliða. Með einum eða öðrum hætti, á vestræna markaðnum er OmniPage bein keppandi við FineReader og í enskum einkunnum berjast þeir einmitt sín á milli og þess vegna held ég að forritið ætti að vera verðugt.

Þetta eru ekki öll forrit af þessu tagi, það eru líka ýmsar útgáfur af litlum ókeypis forritum, en meðan ég gerði tilraunir með þau fann ég tvo megin galla sem fylgja þeim: skortur á kyrillískum stuðningi, eða ýmsir, ekki mjög gagnlegur hugbúnaður í uppsetningarbúnaðinum, og ákvað því að nefna þá ekki hér.

Pin
Send
Share
Send