Viðurkenna texta í PDF skjali á netinu

Pin
Send
Share
Send


Það er langt frá því að vera alltaf hægt að draga texta úr PDF skjali með venjulegri afritun. Oft eru síður slíkra skjala skönnuð innihald pappírsútgáfna þeirra. Til að umbreyta slíkum skrám í að fullu ritstýrð textagögn eru sérstök forrit með Optical Character Recognition (OCR) aðgerð notuð.

Slíkar ákvarðanir eru mjög erfiðar í framkvæmd og kosta því mikla peninga. Ef þú þarft að þekkja texta úr PDF reglulega er alveg ráðlegt að kaupa viðeigandi forrit. Í mjög sjaldgæfum tilvikum er rökréttara að nota eina af tiltækum netþjónustum með svipuðum aðgerðum.

Hvernig á að þekkja texta úr PDF á netinu

Auðvitað er úrval af OCR netþjónustueiginleikum, í samanburði við fullbúnar skrifborðslausnir, takmarkaðra. En þú getur líka unnið með slík úrræði annaðhvort ókeypis eða gegn gjaldi. Aðalmálið er að með aðalverkefni þeirra, nefnilega með textaviðurkenningu, takast samsvarandi vefforrit alveg eins vel.

Aðferð 1: ABBYY FineReader á netinu

Þjónustuþróunarfyrirtækið er einn af leiðtogunum á sviði viðurkenningar á ljósaskjölum. ABBYY FineReader fyrir Windows og Mac er öflug lausn til að umbreyta PDF í texta og vinna frekar með það.

Vefur byggður á hliðstæðum forritinu, auðvitað, er óæðri því í virkni. Engu að síður getur þjónustan þekkt texta úr skannum og myndum á meira en 190 tungumálum. Umbreytt PDF skjölum í Word, Excel o.fl. skjöl eru studd.

ABBYY FineReader netþjónusta á netinu

  1. Áður en þú byrjar að vinna með tólið skaltu stofna reikning á síðunni eða skrá þig inn með Facebook, Google eða Microsoft reikningnum þínum.

    Smelltu á hnappinn til að fara í heimildargluggann „Inngangur“ í efstu valmyndastikunni.
  2. Eftir að hafa skráð þig inn skaltu flytja viðeigandi PDF skjal inn í FineReader með hnappinum „Senda skrár“.

    Smelltu síðan á „Veldu blaðsíðunúmer“ og tilgreindu æskilegt bil fyrir textagerð.
  3. Veldu næst tungumálin sem eru til staðar í skjalinu, snið þess skráar sem myndast og smelltu á hnappinn „Viðurkenna“.
  4. Eftir vinnslu, sem lengd fer algjörlega eftir magni skjalsins, getur þú halað niður fullunninni skrá með textagögnum einfaldlega með því að smella á nafn þess.

    Eða fluttu það út í eina af skýjuþjónustunum sem til eru.

Þjónustan er líklega aðgreind með nákvæmustu textaviðurkenningar reikniritum á myndum og PDF skrám. En því miður er ókeypis notkun þess takmörkuð við fimm síður unnar á mánuði. Til að vinna með umfangsmeiri skjölum verðurðu að kaupa ársáskrift.

Hins vegar, ef OCR er sjaldan þörf, er ABBYY FineReader Online frábær kostur til að draga texta úr litlum PDF skrám.

Aðferð 2: Ókeypis OCR á netinu

Einföld og þægileg þjónusta fyrir stafræna texta. Án skráningar gerir vefsíðan þér kleift að þekkja 15 fullar PDF síður á klukkustund. Free OCR á netinu vinnur fullkomlega með skjöl á 46 tungumálum og styður án leyfis þrjú snið fyrir útflutning texta - DOCX, XLSX og TXT.

Við skráningu fær notandinn tækifæri til að vinna úr skjölum með mörgum síðum en ókeypis fjöldi þessara sömu síðna er takmarkaður við 50 einingar.

Ókeypis þjónusta OCR á netinu

  1. Til að þekkja textann frá PDF sem „gest“ án leyfis fyrir vefsíðunni, notaðu viðeigandi eyðublað á aðalsíðu vefsins.

    Veldu skjalið sem þú vilt nota með hnappinum Skrá, tilgreindu aðaltungumál textans, framleiðsla sniðsins, bíddu síðan eftir að skráin hlaðist og smelltu á Umbreyta.
  2. Í lok digitaliserunarferlisins smellirðu á "Sæktu framleiðsluskrána" til að vista lokið skjali með texta í tölvunni.

Fyrir viðurkennda notendur er röð aðgerða nokkuð önnur.

  1. Notaðu hnappinn „Skráning“ eða „Inngangur“ í efsta valmyndarbarnum til að samsvara því að búa til ókeypis netkort fyrir OCR eða skrá þig inn á hann.
  2. Haltu takkanum inni eftir viðurkenningu á viðurkenningarborðinu CTRL, veldu allt að tvö tungumál frumskjalsins af meðfylgjandi lista.
  3. Tilgreindu frekari valkosti til að draga texta úr PDF og smelltu Veldu skrá til að hlaða skjali inn á þjónustuna.

    Smelltu síðan til að hefja viðurkenningu Umbreyta.
  4. Í lok vinnslu skjalsins skaltu smella á hlekkinn með nafni úttaksskrárinnar í samsvarandi dálki.

    Viðurkenningarniðurstaðan verður strax vistuð í minni tölvunnar.

Ef þú þarft að draga texta úr litlu PDF skjali geturðu örugglega gripið til þess að nota ofangreint tól. Til að vinna með umfangsmiklar skrár verður þú að kaupa fleiri stafi í Free Online OCR eða nota aðra lausn.

Aðferð 3: NewOCR

Alveg ókeypis OCR þjónusta sem gerir þér kleift að draga texta úr nánast hvaða grafísku og rafrænu skjali sem er eins og DjVu og PDF. Auðlindin setur ekki takmarkanir á stærð og fjölda viðurkenndra skráa, þarfnast ekki skráningar og býður upp á breitt úrval af skyldum aðgerðum.

NewOCR styður 106 tungumál og getur afgreitt jafnvel lítil gæði skjalaskanna. Það er hægt að velja svæðið til að bera kennsl á texta handvirkt á skráarsíðunni.

Netþjónusta NewOCR

  1. Svo þú getur byrjað að vinna með auðlind strax án þess að þurfa að framkvæma óþarfa aðgerðir.

    Rétt á aðalsíðunni er eyðublað til að flytja skjal inn á vefinn. Notaðu hnappinn til að hlaða upp skrá til NewOCR „Veldu skrá“ í hlutanum „Veldu skrána“. Síðan á sviði „Viðurkenningarmál (s)“ tilgreindu eitt eða fleiri tungumál frumheimildarinnar og smelltu síðan á „Hlaða upp + OCR“.
  2. Stilltu viðeigandi viðurkenningarstillingar, veldu síðuna sem þú vilt draga texta út úr og smelltu á hnappinn OCR.
  3. Skrunaðu aðeins niður á síðuna og finndu hnappinn „Halaðu niður“.

    Smelltu á það og í fellilistanum velurðu viðeigandi skjalasnið til að hlaða niður. Eftir það verður fullunnu skránni með útdregna textanum hlaðið niður á tölvuna þína.

Tólið er þægilegt og nokkuð hágæða þekkir alla persónurnar. Samt sem áður verður að hefja vinnslu hverrar síðu á innfluttu PDF skjali sjálfstætt og hún birtist í sérstakri skrá. Þú getur auðvitað strax afritað viðurkenningarniðurstöðurnar á klemmuspjaldið og sameinað þær með öðrum.

Engu að síður, miðað við litbrigðið sem lýst er hér að ofan, er það mjög erfitt að draga mikið magn af texta með því að nota NewOCR. Með litlum skrám bregst þjónustan við smell.

Aðferð 4: OCR.Space

Einföld og skiljanleg úrræði til að stafræna texta, það gerir þér kleift að þekkja PDF skjöl og senda niðurstöðuna í TXT skrá. Engin takmörk eru fyrir fjölda blaðsíðna. Eina takmörkunin er sú að stærð innsláttarskjalsins ætti ekki að fara yfir 5 megabæti.

OCR.Space netþjónusta

  1. Nýskráning til að vinna með tólið er ekki nauðsynleg.

    Fylgdu bara krækjunni hér að ofan og hlaðið PDF skjalinu inn á heimasíðuna úr tölvunni með hnappinum „Veldu skrá“ eða frá netinu - með tilvísun.
  2. Í fellilistanum „Veldu OCR tungumál“ Veldu tungumál innfluttu skjalsins.

    Byrjaðu síðan texta viðurkenningarferlið með því að smella á hnappinn "Byrjaðu OCR!".
  3. Í lok skjalavinnslu, lestu niðurstöðuna á þessu sviði Niðurstaða OCR og smelltu „Halaðu niður“til að hlaða niður lokið TXT skjali.

Ef þú þarft bara að draga textann út úr PDF skjölinu og á sama tíma er lokasnið hans alls ekki mikilvægt, OCR.Space er gott val. Það eina er að skjalið ætti að vera „einorður“ þar sem ekki er kveðið á um viðurkenningu á tveimur eða fleiri tungumálum á sama tíma í þjónustunni.

Sjá einnig: Ókeypis hliðstæður af FineReader

Með því að meta netverkfærin sem kynnt eru í greininni skal tekið fram að FineReader Online frá ABBYY annast OCR aðgerðina á sem nákvæmastan og skilvirkan hátt. Ef hámarks nákvæmni texta viðurkenningar er mikilvæg fyrir þig er best að skoða þennan valkost sérstaklega. En líklega verður þú líka að borga fyrir það.

Ef þú þarft að stafræna lítil skjöl og þú ert tilbúinn til að leiðrétta villur sjálfstætt við þjónustuna er ráðlegt að nota NewOCR, OCR.Space eða Free Online OCR.

Pin
Send
Share
Send