Iz običajne kopije ni mogoče izpisati besedila iz datoteke PDF. Pogosto so strani takšnih dokumentov skenirana vsebina njihovih različic papirja. Za pretvorbo takih datotek v popolnoma urejanje besedilnih podatkov se uporabljajo posebni programi z funkcijo prepoznavanja optičnih znakov (OCR).
Take rešitve je zelo težko izvajati in zato stanejo veliko denarja. Če morate redno prepoznavati besedilo s PDF-jem, je priporočljivo kupiti ustrezen program. Za redke primere bi bilo bolj logično uporabljati eno od razpoložljivih spletnih storitev s podobnimi funkcijami.
Vsebina
Seveda je nabor funkcij spletnih storitev OCR bolj omejen v primerjavi s polnimi namiznimi rešitvami. Vendar lahko s takšnimi sredstvi delate brezplačno ali za nominalno pristojbino. Glavna stvar je, da se ustrezne spletne aplikacije spopadajo z njihovo glavno nalogo, in sicer prepoznavanjem besedila.
Podjetje za razvoj storitev je eno od vodilnih na področju optičnega prepoznavanja dokumentov. ABBYY FineReader za Windows in Mac je močna rešitev za pretvorbo PDF v besedilo in nadaljnje delo z njim.
Spletna stran programa je seveda manj funkcionalna. Kljub temu lahko storitev prepozna besedilo iz skeniranja in fotografij v več kot 190 jezikih. Podpira pretvorbo datotek PDF v dokumente Beseda , Excel itd.
ABBYY FineReader Online spletna storitev
Storitev se razlikuje, verjetno z najbolj natančnimi algoritmi za prepoznavanje besedila na slikah in datotekah PDF. Ampak, na žalost je njegova prosta uporaba omejena na pet strani, ki se obdelujejo na mesec. Če želite delati z več obsežnimi dokumenti, morate kupiti enoletno naročnino.
Če pa je OCR funkcija zelo redko potrebna, je ABBYY FineReader Online odlična možnost za pridobivanje besedila iz majhnih datotek PDF.
Enostavna in priročna storitev za digitalizacijo besedila. Brez potrebe po registraciji vam vir omogoča prepoznavanje 15 celotnih PDF strani na uro. Brezplačni OCR v spletu deluje v celoti z dokumenti v 46 jezikih in brez dovoljenja podpira tri oblike izvoza besedila - DOCX, XLSX in TXT.
Pri registraciji lahko uporabnik obdeluje večstranske dokumente, vendar je brezplačno število teh strani omejeno na 50 enot.
Online storitve Brezplačni OCR OCR
Za pooblaščene uporabnike je zaporedje akcij nekoliko drugačno.
Če želite izvleči besedilo iz majhnega dokumenta PDF, lahko varno uporabite orodje, opisano zgoraj. Če želite delati z velikimi datotekami, boste morali kupiti dodatne simbole v Free OCR OCR ali uporabiti drugo rešitev.
Popolnoma brezplačno OCR-storitev, ki vam omogoča, da izvlečete besedilo iz skoraj vseh grafičnih in elektronskih dokumentov, kot so DjVu in PDF. Vir ne omejuje velikosti in števila prepoznavnih datotek, ne zahteva registracije in ponuja širok spekter povezanih funkcij.
NewOCR podpira 106 jezikov in je sposoben pravilno obdelovati celo slabe kakovosti dokumentov. Ročno je mogoče izbrati območje za prepoznavanje besedila na strani datoteke.
Orodje je priročno in prepozna vse znake v dovolj visoki kakovosti. Vendar pa je treba obdelavo vsake strani uvoženega dokumenta PDF zagnati neodvisno in prikazati v ločeni datoteki. Seveda lahko takoj kopirate rezultate prepoznavanja v odložišče in jih združite z drugimi.
Kljub temu je glede na zgornji odtenek zelo težko izpisati velike količine besedila z uporabo NewOCR. Storitev se spoprijema z majhnimi datotekami "s puščico."
Preprost in razumljiv vir za digitalizacijo besedila vam omogoča, da prepoznate dokumente PDF in rezultate pošljete v datoteko TXT. Število strani ni omejeno. Edina omejitev je, da velikost vhodnega dokumenta ne sme presegati 5 megabajtov.
Če boste morali izpisati besedilo iz datoteke PDF in končno oblikovanje sploh ni pomembno, je OCR.Space dobra izbira. Edini dokument mora biti "enojezičen", ker priznanje dveh ali več jezikov istočasno v službi ni zagotovljeno.
Glej tudi: Brezplačni analogi FineReader
Ocenitev spletnih orodij, predstavljenih v članku, je treba opozoriti, da ABBYY FineReader Online najbolj natančno in natančno obravnava funkcijo OCR. Če je največja natančnost prepoznavanja besedila pomembna za vas, je najbolje upoštevati to posebno možnost. Toda za plačilo za to, najverjetneje, tudi morali.
Če morate digitalizirati majhne dokumente in ste sami pripravljeni popraviti napake pri storitvi, je priporočljivo uporabiti NewOCR, OCR.Space ali OCR brezplačnega spletnega mesta.