Kako djeluje slika u tekst (aka Optičko prepoznavanje znakova)

  • Owen Little
  • 0
  • 3338
  • 190
Oglas

Izvlačenje teksta iz slika nikada nije bilo lakše nego danas zahvaljujući tehnologiji optičkog prepoznavanja znakova (OCR).

OCR nam omogućuje da radimo sve vrste korisnih stvari, poput pretraživanja slika pomoću tekstualnih upita, reprodukcije dokumenata bez da ih ručno upišete, pa čak i pretvaranja rukom pisanog teksta u digitalni tekst Kako pretvoriti sliku rukom u tekst u OCR Kako pretvoriti Slika s rukopisom u tekst pomoću OCR-a Da biste sliku rukopisnog teksta pretvorili u digitalni tekst koji možete uređivati ​​i pretraživati, potreban vam je OCR (optički prepoznavanje znakova). Isprobajte jedan od ovih OCR alata za digitalizaciju rukopisa. .

Ali što je optičko prepoznavanje znakova? Kako to zapravo djeluje? Možda vam se čini kao crna magija, ali do kraja ovog članka imat ćete čvrsto razumijevanje kako računala mogu prepoznati slova i riječi.

Kako djeluje optičko prepoznavanje znakova

Da bismo razumjeli kako se tekst izvlači iz slike, prvo moramo razumjeti što su slike i kako se pohranjuju na računalima.

piksela je jedna točkica određene boje. slika u osnovi je zbirka piksela. Što je više piksela na slici, to je i veća razlučivost. Računalo ne zna da je slika putokaza zaista putokaz - samo zna da je prvi piksel ove boje, a drugi piksel je te boje i prikazuje sve svoje piksele koje možete vidjeti.

To znači da se tekst i netekst ne razlikuju od računala i zato je optičko prepoznavanje znakova toliko teško. Imajući to na umu, evo kako to funkcionira.

1. korak: prethodna obrada slike

Prije nego što se tekst može izvući, sliku je potrebno masirati na određene načine kako bi vađenje bilo lakše i vjerojatnije da će uspjeti. To se naziva predobrada, a različita softverska rješenja koriste različite kombinacije tehnika.

Češće tehnike prethodne obrade uključuju:

Binarization
Svaki pojedinačni piksel na slici pretvara se u crni ili bijeli. Cilj je razjasniti koji pikseli pripadaju tekstu, a koji pikseli pripadaju pozadini, što ubrzava stvarni OCR proces.

deskew
Budući da se dokumenti rijetko skeniraju savršenim poravnanjem, znakovi mogu završiti nagnuto ili čak naopako. Ovdje je cilj prepoznati vodoravne crte teksta, a zatim rotirati sliku tako da su te linije zapravo horizontalne.

despeckle
Bez obzira na to je li slika binarna ili ne, može doći do šuma koji može ometati prepoznavanje znakova. Očaj se riješi te buke i pokušava izgladiti sliku.

Uklanjanje linija
Identificira sve linije i oznake koje vjerojatno nisu znakovi, a zatim ih uklanja kako se stvarni OCR postupak ne bi zbunio. Posebno je važno prilikom skeniranja dokumenata tablicama i kutijama.

zoniranje
Razdvaja sliku na različite dijelove teksta, kao što je prepoznavanje stupaca u dokumentima s više stupaca.

Kreditna slika: WayneRay / Wikimedia

Korak 2: Obrada slike

Prvo, OCR postupak pokušava uspostaviti osnovnu liniju za svaki redak teksta na slici (ili ako je to zona zona prethodno obrađena, raditi će po svakoj zoni jednu po jednu). Svaki identificirani redak znakova obrađuje se jedan po jedan.

Za svaki redak znakova OCR softver identificira razmak između znakova tražeći vertikalne crte netekstualnih piksela (što bi trebalo biti očito pravilnom binarnošću). Svaki komad piksela između ovih ne tekstualnih linija označen je kao “žeton” koji predstavlja jedan lik. Stoga se zove ovaj korak tokenization.

Nakon što se svi potencijalni znakovi na slici tokeniziraju, OCR softver može pomoću dvije različite tehnike prepoznati koji su zapravo ti znakovi:

Prepoznavanje uzorka
Svaki se token uspoređuje od piksela do piksela s čitavim nizom poznatih glifova - uključujući brojeve, interpunkcijske znakove i druge posebne simbole - i odabire se najbliže podudaranje. Ova tehnika je poznata i kao podudaranje s matricama.

Ovdje postoji nekoliko nedostataka. Prvo, tokeni i glifovi trebaju biti slične veličine, inače se niti jedan od njih neće podudarati. Drugo, tokeni moraju biti sličnog fonta kao i glifovi, što isključuje rukopis. Ali ako je poznat znak tokena, prepoznavanje uzorka može biti brzo i točno.

Izdvajanje značajki
Svaki se token uspoređuje s različitim pravilima koja opisuju kakav lik može biti. Na primjer, dvije vertikalne linije jednake visine povezane jednom horizontalnom linijom vjerojatno su velika slova H.

Ova je tehnika korisna jer nije ograničena na određene fontove ili veličine. Također može biti nijansirana u prepoznavanju suptilnih razlika između velikog I, maloga slova L i broja 1. Loša strana? Programiranje pravila puno je složenije od jednostavne usporedbe piksela u znaku i piksela u glifu.

Korak 3: Post-obrada slike

Kad se sve podudaranje tokena završi, OCR softver može ga samo nazvati dan i predstaviti vam rezultate. Ali obično treba napraviti malo više frizure kako bi bili sigurni da ne klikate očima na glupostima.

Leksičko ograničenje
Sve se riječi uspoređuju s leksikonom odobrenih riječi, a sve koje ne odgovaraju zamjenjuju se najbližom prikladnom riječju. Rječnik je jedan primjer leksikona. Ovo može pomoći u ispravljanju riječi s pogrešnim znakovima, poput “trn” umjesto “th0rn”.

Optimizacije za aplikacije
Kad se OCR koristi u nišnim postavkama, poput medicinskih ili pravnih dokumenata, može se koristiti posebna vrsta OCR koja je posebno dizajnirana za tu postavku. U tim slučajevima OCR softver može tražiti matematičke jednadžbe, pojmove specifične za industriju, itd.

Prirodni jezik
Ova napredna tehnika ispravlja rečenice pomoću jezičnog modela koji opisuje koliko je vjerojatno da će određene riječi biti praćene drugim riječima. Slično je s tehnologijom koja predviđa koju riječ želite sljedeće upisati na mobilnoj tipkovnici.

Ako se radi dobro, to može rezultirati čitljivim tekstom.

Preporučeni alati za optičko prepoznavanje znakova

Sada kada znate kako funkcionira OCR, trebalo bi biti lako vidjeti da nisu svi OCR alati jednaki. Točnost rezultata će uvelike ovisiti o tome koliko dobro softver implementira razne OCR tehnike raspravljene u ovom članku.

Za ovo toplo preporučujemo OneNote, što je samo jedan od razloga zašto Evernote pobijedi za uzimanje Evernotea u odnosu na OneNote: Koji program za bilježenje bilježi baš za vas? Evernote vs. OneNote: Koja je aplikacija za uzimanje bilješki prava za vas? Evernote i OneNote nevjerojatne su aplikacije za bilješke. Teško je izabrati između njih dvoje. Usporedili smo sve, od sučelja do organizacije bilježaka kako bismo vam pomogli u odabiru. Što vam najbolje odgovara? , Ako želite platiti premium rješenje, razmislite o OmniPageu. Pogledajte našu usporedbu programa OneNote i OmniPage za OCR Free sa plaćenim OCR softverom: Microsoft OneNote i Nuance OmniPage Usporedni besplatni vs plaćeni OCR softver: Microsoft OneNote i Nuance OmniPage Upoređeni softver za skeniranje OCR omogućuje pretvaranje teksta u slike ili PDF u tekst koji se može uređivati. dokumenti. Je li besplatan OCR alat poput OneNote dovoljno dobar? Hajde da vidimo! , Za mobilne dokumente provjerite ove OCR aplikacije za Android uređaje. 6 Najbolje Android OCR aplikacije za izdvajanje teksta sa slika 6 Najbolje Android OCR aplikacije za izdvajanje teksta sa slika Trebate li digitalizirati bilo koji tiskani tekst da biste mogli održavati mekani primjerak? Ako je to slučaj, sve što trebate je alat za optičko prepoznavanje znakova (OCR). .

Kako se koristi OCR? Imate li neke omiljene OCR alate koje nismo spomenuli? Javite nam u komentarima u nastavku!




Još ne komentari

O modernoj tehnologiji, jednostavnoj i pristupačnoj.
Vaš vodič u svijetu moderne tehnologije. Naučite kako koristiti tehnologije i uređaje koji nas okružuju svaki dan i naučite kako otkriti zanimljivosti na Internetu.