5 måter til OCR dokumenter på din Mac

5 Vegene til OCR dokumenter på din Mac
Dette innlegget er en del av en serie som heter Going Paperless.How til OCR tekst i PDF og bildefiler i Adobe AcrobatQuick Tips: Del din Mac Skriver og skanner < p> Hvis du har blitt ansporet til å prøve og bevege seg mot et papirløst kontor så er du ikke alene! 2 013 er året for å gå papirløs og som ikke bare betyr å skanne de gamle kvitteringer og korrespondanse, er det fullt digitalisering dem også. I denne guiden viser vi deg fem forskjellige apps som kan konvertere dokumenter du har skannet inn fullt søkbare som bruker en teknologi som kalles OCR.



Hva er OCR?

OCR står for Optical Character Recognition
. Når du skanner et dokument, har skanneren selv ingen måte å vite hva forskjellen mellom tekst og et bilde er, så alt du skanne effektivt er et bilde. Dette gjelder også selv om du velger å lagre det som en PDF-fil som du ikke vil være i stand til (ennå) velge hvilken som helst tekst.

OCR-teknologi har eksistert en god stund, men det er en ofte undervurdert funksjon som vanligvis aldri selv sett over. Hvis du har kjøpt en skanner i de siste årene så sjansene er du allerede hatt noen ganske kjekk liten OCR-programvare på platen den kom med! Som Mac-brukere, vi noen ganger bortskjemt med det faktum at vi nesten aldri trenger å bekymre deg for å installere drivere så programvare på de samme platene blir ofte ignorert

. Tips: En PDF er bare en beholder for tekst og bilder slik at eventuelle kvitteringer eller korrespondanse som du har skannet og lagret som PDF ennå ikke er søkbare.

1. Prizmo

Prizmo er en dedikert OCR app. Den er ikke laget for å hjelpe deg med å beskjære eller rette dine skannede dokumenter, er det eneste formålet er å analysere teksten i eventuelle skanninger og konvertere den til søkbar tekst. Det er ikke bare begrenset til ren tekst dokumenter som kvitteringer og korrespondanse, Prizmo vil selv analysere gamle aviser og magasiner, bokomslag, er stort sett alt med noen form, størrelse og farge på teksten noe Prizmo vil konvertere.

Prizmo inkluderer muligheten til å fange skanner direkte fra Image Capture, OS X innebygde kamera og skanner import app, slik at du kan bruke det i forbindelse med noen eksisterende skanner. Du kan også importere eksisterende filer hvis du har vært å skanne dem allerede.

Trinn 1

Når du starter Prizmo det vil be deg om å enten lage et nytt dokument eller åpne en eksisterende. Før du fortsetter, dette refererer til en Prizmo dokument og ikke den du ønsker å analysere. Det kan være litt forvirrende, men Prizmo kan lagre skanninger du har gjort hvis du noen gang trenger å gå tilbake og endre teksten, for eksempel hvis du hadde skannet i en 200-siders PDF og la merke til noen sider ble ikke skikkelig analysert i midten og litt tekst manglet. Lagrer arbeidet i Prizmo betyr at du kan gå tilbake og gjøre endringer etter behov.
Prizmo skaper sine egne dokumenter, slik at du kan se tilbake på dem (og redigere dem) senere

Velg Nytt dokument ...
og du vil bli presentert med en ny Prizmo dokument å begynne å bruke.
Prizmo skaper sine egne dokumenter, slik at du kan se tilbake på dem (og redigere dem) senere

Vi kan enten dra og slippe en bildefil (JPG, PDF, TIFF, etc), importere fra vår scanner eller bla gjennom en bildebiblioteket.

Trinn 2

Ved anvendelsen av denne opplæringen, jeg bruker et eksisterende dokument som jeg hadde skannet inn med min planskanner. Det ble lagret direkte som PDF, og som du kan se, jeg kan ikke markere noe tekst.

Velg Åpne Image File ... Hotell og velge et bilde du vil bruke.

Trinn 3

Når du ser bildet lastet, vil du bli presentert med et kjent sideoppsett, komplett med sideminiatyrer på venstre side.

Prizmo har et utseende svært lik Apples Preview app

Vi har noen justeringsmuligheter på bunnen der vi kan justere rotasjonen, beskjære bildet og mer. Prizmo vil automatisk oppdage dokumentets krav og gjøre nødvendige innstillinger endres automatisk, men vi kan alltid justere dem når det er nødvendig.

Trinn 4

Jeg er fornøyd med standardinnstillingene, så bare klikk Gjenkjenn Hotell og Prizmo vil automatisk oppdage eventuelle tekstområder og analysere dem nesten umiddelbart.
Prizmo kan OCR dokumenter raskt og nøyaktig

På samme måte som du ville tegne et område for å skanne når du skanner et dokument, det samme kan gjøres for desse. Prizmo vil forsøke dette automatisk, men igjen, har du full kontroll.

analysert teksten vises deretter på høyre side av dokumentet. På dette stadiet, er ingenting lagret. Hvis OCR var ikke helt nøyaktig, kan du gå inn og gjøre noen endringer.

Trinn 5

Prizmo var 100% nøyaktig med min dokumentet så det er ingen endringer for meg å gjøre. Du kan eksportere dokumentet til en rekke nettskytjenester som Dropbox og Google Drive, eller feste dem til en ny e-postmelding.
Prizmo inkluderer støtte for en rekke nettskytjenester

Jeg kommer til å redde mitt dokument til skrivebordet mitt, så jeg skal velge File ...
< p> Prizmo er svært nyttig for alle som skanner dokumenter på en jevnlig basis med noen type skanner. De avanserte kontrollene du har tilgang til å bety at du kan finjustere hvordan OCR prosessen fungerer i stedet for å stole på helautomatiske innstillinger.

Les mer om Prizmo.

2. ABBYY Finereader Express

ABBYY Finereader Express er et annet spesialisert OCR verktøy utviklet spesielt for oppgaven, og det gjør det veldig bra. OCR prosessen er automatisert slik at den eneste brukermedvirkning forteller ABBYY Finereader Express som dokumentet å laste og til der OCR'd versjonen skal bli frelst.

I stedet for å opprette et nytt dokument eller åpne en eksisterende, har ABBYY Finereader Express en Quick Oppgaver panelet som åpnes på lanseringen. Det er en rask måte å OCR dokumenter med så få museklikk som mulig.

Du kan konvertere skannede dokumenter til en rekke ulike formater og et ess i ermet er evnen til OCR et regneark og utgang fullt søkbart - og redigerbare - en, noe som gjør det veldig fristende for forretningsbrukere.

Trinn 1

Som vi allerede har en PDF vi må OCR, starte ABBYY Finereader Express og velg Konverter til søkbar PDF Hotell og plukke dokumentet du vil OCR.
ABBYY Finereader Express har en rask Oppgaver panel for å gjøre OCR enkle
Trinn 2

Det er faktisk det! ABBYY Finereader Express vil be deg om å lagre den nye OCR'd dokumentet til en plassering av ditt valg. Merkelig, blir du bedt om å lagre dokumentet før forhåndsvisning laster så å se om ABBYY Finereader Express var i stand til OCR riktig dokumentet, må du avbryte
lagre dokumentet og lagre det fra menyen i stedet.
ABBYY er en av de enkleste programmene å bruke når det gjelder OCR

Les mer om ABBYY Finereader Express.

3. Doxie

Vi har dekket Doxie skanneren og programvaren i vår forrige guide " Gå Papirløs Med Doxie
", men det er verdt å nevne dens innebygde OCR har igjen.

Doxie har innebygd OCR i sin import app slik at eventuelle dokumenter du skanner vil ha muligheten til å bli analysert. Imidlertid ikke Doxie ikke inneholder mange kontroller og automatiserer meste av prosessen.
Doxie har færre kontroller enn en app som Prizmo
Trinn 1

Skann et dokument du vil OCR og deretter starte Doxie app, noe som gjør at din Doxie skanneren er tilkoblet.

Trinn 2

Når du har importert skannede dokumenter kan du velge hvor og hvordan du ønsker å eksportere den. I dette tilfellet, skal jeg velge PDF med OCR (svart og hvit)
. Det er bedre å velge hvilken type dokument som det kan sørge for å bruke et format som tar mindre plass.
Doxie inkluderer muligheten til å eksportere som PDF eller med OCR lagt

Tips: Du finner ofte at mange bedrifter sende korrespondanse bokstaver som er i en bestemt farge for å holde med sin merkevarebygging - Jeg d anbefaler bare å lagre dem som svart og hvitt for å holde filstørrelsen så lav som mulig.

Trinn 3

Når du velger hvor du vil lagre PDF-filen, vil Doxie OCR dokumentet og eksportere den . Teksten er helt søkbar og erstatter ikke teksten av skanningen, i stedet den bruker en smart funksjon i PDF-filer som kalles tekst overlegg. Dokumentet kan se det samme som det gjorde før, men det er en god ting. I stedet er teksten plassert transparent over teksten, noe som gjør det søkbart og highlightable.
Doxie holder fortsatt utseendet på PDF, men overlegg tekst som kan bli markert

Mens Doxie prosessen er veldig grei, det er ikke så mange alternativer som en dedikert OCR app som Prizmo . Men det betyr hvis du allerede er en Doxie bruker eller bare gjøre lett scanning kan da disse funksjonene ikke være av stor nytte for deg.

Doxie skannere starter fra $ 119 og er tilgjengelig fra Getdoxie.com.

4. PDFPen

PDFPen er litt annerledes enn Prizmo som det er ikke bare en OCR verktøyet. Det er en alt-i-ett-verktøy utviklet for å fylle ut, redigere og endre PDF-filer. En av funksjonene er at det kan oppdage skannede dokumenter og utføre OCR i ett trinn.

Trinn 1

Start PDFPen og den vil automatisk be deg om å velge en PDF for å åpne. Velg et skannet dokument og klikk Åpne
.

Trinn 2

Når PDFPen åpner dokumentet og oppdager den ble skannet (snarere enn ned eller datagenerert), det vil be Hvis du ønsker å analysere den og digitalisere teksten. Du har muligheten til å bare kjøre OCR verktøyet på gjeldende side eller hele dokumentet.
PDFPen er en annen app laget for å automatisere det meste av OCR prosessen

Angi språket som kreves, og velg den aktuelle knappen -. i dette tilfellet jeg bare valgt OCR Document


Trinn 3

Når den er ferdig, lagre PDF-filen. I motsetning Doxie eller Prizmo, trenger du ikke opprette en ny kopi umiddelbart. PDFPen modifiserer eksisterende PDF-filer slik at du bare lagre endringene, eliminerer ulempene ved å administrere en ekstra fil.

Les mer om PDFPen.

5. Evernote

Evernote er et svært populært notat-synkronisering tjeneste som fungerer mer som en hybrid mellom en utklippsbok og en bærbar PC. Tenk på det som å ha et arkivskap full av biter av informasjon som alltid er tilgjengelig og alltid lett å søke.

Vi har dekket Evernote mye før her på Mactuts + og jeg oppfordrer alle som bruker Evernote (eller er interessert i å bruke det mer) for å lese vår artikkel " Taming the Elephant: Awesome Evernote Tips og triks
"for å lære mer om det.

En funksjon av Evernote som ofte blir oversett og aldri virkelig vist til brukeren er deres automatisk OCR-tjenesten. Jepp, er et bilde du legge til Evernote skannet for tekst og lagt til notatet. Det er utført server-side så legger et dokument til Evernote er ikke umiddelbart konvertert. På grunn av antallet av Evernote brukere, er det heller ikke øyeblikkelig. For å forhindre serverproblemer, er alle dokumenter som krever OCR kø. Det er ingen måte å vite når det blir skannet, men det er vanligvis innen 24-48 timer. Hvis du er en Premium-medlem, er det raskere.

Trinn 1

Hvis du vil ha et dokument som er skannet, ganske enkelt dra den og legge den til en ny eller eksisterende notat, og pass på å synkronisere Evernote så snart du har gjort det. Det er alt som skal til.
Evernote støtter vedlegg for notater og eventuelle bilder vil automatisk bli OCR'd av deres servere
Trinn 2

Til slutt vil Evernote skanne dokumentet og utføre OCR. Når det skjer, vil dokumentet da bli oppdatert og synkronisert tilbake
til Evernote på enheten. Det tok ca ti minutter for Evernote til OCR dokumentet jeg har lagt (jeg er en Evernote Premium abonnent så Tidene vil variere).

OCR er vanligvis svært nøyaktig, men det er ingen kontroll over hvordan OCR fungerer. Det er gjort automatisk uten at brukeren eller innstillinger.

Trinn 3

Du kan da søke etter tekst, og som du kan se, tekst høydepunkter som du søker. Etter å ha sett gjennom notatet, synes det å ha vært 100% nøyaktig.
Når dokumentet har blitt OCR'd av Evernote-servere, vil det være søkbare innenfor Evernote, og du har muligheten til å eksportere dokumentet som en søkbar PDF samt
Trinn 4 ( valgfritt)

Hvis du ønsker å holde en søkbar PDF-versjon utsiden av Evernote, kan du høyreklikke og velge Lagre Søkbar PDF As ...

Det er ikke ideelt som Evernote wraps hvert ord med en grønn boks slik du skriver det kan ikke være slik en god idé, men det fungerer.

Mens funksjonene er ganske grunnleggende, bruker Evernote som et sentralt knutepunkt for papirløse kontoret blir enda mer populær, så hvis du ønsker å gjøre det samme så du kan kutte ut noen OCR prosessen og bare slippe skanner direkte inn i Evernote. Det vil ta vare på OCR for deg og siden de fleste elementene kommer til å være kvitteringer og korrespondanse da vil du sannsynligvis har nesten ingen problem med Evernote OCR service.

Evernote er gratis, med premium kontoer på $ 5 per måned, eller $ 35 per år.

innpakning opp

Det finnes en rekke måter du kan digitalisere de skannede dokumenter for å gjøre dem tekst-søkbar og kostnadene ved å bruke en OCR verktøyet har falt dramatisk. Borte er de dagene der du sitter fast til hva app skanneren kom med, du er nå fri til å bruke stort sett alle OCR app du ønsker.

Hvis du kommer til å finne deg selv ved hjelp av ikke bare OCR verktøy, men ønsker en måte å manipulere PDF-filer så PDFPen er det beste valget. For alle som bare ønsker en måte å OCR så jeg vil anbefale Prizmo. Selv om du har en Doxie, gir Prizmo deg mer kontroll over hvordan OCR prosessen fungerer.

For alle som ønsker å en sjelden gang OCR noe så får en gratis Evernote-konto er den mest økonomiske alternativet.

Har du prøvd å gå papirløs? Har du bry deg med OCR eller er alt søkbart i det digitale kontoret? Vi vil gjerne høre fra deg så, som alltid, diskutere temaet videre i kommentarfeltet.