Kako deluje OCR? Pojasnjeno na preprost in razumljiv način
V tem članku pojasnjujemo, kako deluje OCR. OCR pomeni „optično prepoznavanje znakov“, v nemščini pa ga preprosto imenujemo kot prepoznavanje besedila. To pomeni, da računalnik lahko prek OCR prepozna besedilo na skenirani sliki in ga nato pretvori v preprost dokument z besedilom.
Tako deluje OCR
Predstavljajte si, da ste od kolega prejeli predstavitev na papirju. Zdaj jih želite urediti v računalniku, ker ne marate posameznih prehodov. Zato ga skenirajte in pojdite na program OCR. Zdaj se zgodi naslednje:
- Programska oprema najprej opravi tako imenovano analizo postavitve. V ta namen si ogleda postavitev strani in loči slike od besedila. Zabeleži tudi njihov položaj na strani. Nato se šteje število odstavkov in shranijo posamezni elementi, kot so številke strani.
- Zdaj je naporen del. Programska oprema pregleda posamezne besedilne bloke in jih razdeli na stavke. Stavke nato razdelimo na posamezne besede, besede pa v črke.
- Programska oprema OCR vsebuje vzorce črk in znakov. Program zdaj skenirane črke primerja s temi vzorci. Če sta si 99% podobna, algoritem odloči, da mora biti verjetno ta črka. Je zelo natančen, saj lahko v kratkem času primerja veliko vzorcev. Na ta način uspešno loči med "8" in "B".
- Tako se črke in znaki postopoma prepoznajo. Nato jih spet združimo kot besede in jih postavimo na svoje mesto v stavku. Takoj, ko je programska oprema končana, se celotna stvar shrani v običajen dokument, ki ga lahko nato uredite. Končano!
Ali želite preizkusiti svoje znanje programske opreme? Sodelujte v našem velikem programskem kvizu!