34
VISOKO HEMIJSKO TEHNOLOŠKA ŠKOLA KRUŠEVAC Mentor: Doc. Dr. Bratislav Blagojević Student: Nikola Tomić Broj indeksa: 78/2012 SEMINARSKI RAD SKENERI 1

Seminarski Rad Skeneri.docx

Embed Size (px)

DESCRIPTION

Osnove skenera, podela, tehnologija i namena.Opticko prepoznavanje teksta i ccd...

Citation preview

Page 1: Seminarski Rad Skeneri.docx

VISOKO HEMIJSKO TEHNOLOŠKA ŠKOLA KRUŠEVAC

Mentor: Doc. Dr. Bratislav Blagojević

Student: Nikola Tomić

Broj indeksa: 78/2012

SEMINARSKI RAD

SKENERI

KRUŠEVAC

Novembar, 2013

1

Page 2: Seminarski Rad Skeneri.docx

SADRŽAJ

UVOD....................................................................................................................................................3

1.0 SKENER.........................................................................................................................................3

1.1 VRSTE SKENERA....................................................................................................................4

1.2 REZOLUCIJA SKENERA........................................................................................................7

1.3 BROJ BITA PO BOJI................................................................................................................9

2.0 DINAMIČKI RASPON SKENERA............................................................................................11

2.1 BRZINA SKENIRANJA..........................................................................................................12

2.2 BROJ PROLAZA SKENIRANJA..........................................................................................12

2.3 PRIKLJUČIVANJE SKENERA.............................................................................................13

3.0 UPRAVLJAČKI PROGRAM SKENERA.................................................................................13

3.1 POSTUPAK SKENIRANJA....................................................................................................13

3.2 PREGLED MODELA SKENIRANJA...................................................................................14

3.3 PARAMETRI SKENIRANJA.................................................................................................14

3.4 BROJ BITA..............................................................................................................................15

4.0 HISTOGRAM...............................................................................................................................15

4.1 IZBOR CRNE I BELE TAČKE..............................................................................................16

4.2 GAMA-FAKTOR.....................................................................................................................18

4.3 OSTALI PARAMETRI...........................................................................................................19

4.4 PRAKTIČNI SAVETI.............................................................................................................19

5.0 PRINCIP RADA I CCD...............................................................................................................20

5.1 KVALITET SKENIRANJA....................................................................................................21

5.2 VEZA SA RAČUNAROM I PRATEĆI SOFTVER..............................................................22

5.3 OPTIČKO PREPOZNAVANJE ZNAKOVA........................................................................23

5.4 TRENUTNO STANJE OCR TEHNOLOGIJE.....................................................................24

5.5 NAČIN RADA..........................................................................................................................25

LITERATURA...................................................................................................................................27

2

Page 3: Seminarski Rad Skeneri.docx

UVOD

Skener (engl.scanner) je uređaj koji služi za digitalizaciju fotografija, crteža i transparentnih medija (npr. Negativ filma, dijapozitiv, prozirnica itd.). Skeniranje je postupak kojim se slika pretvara u oblik pogodan za obradu, čuvanje i prenos pomoću računara. Obično je reč o slikama na papiru koje treba uneti u računar. Digitalizovana slika se upotrebljava u dizajnu ili raspoznavanju teksta (engl.optical character recognition OCR).

1.0 SKENER

Na početku da kažemo nešto o skeneru i procesu skeniranja. Na svom najosnovnijem nivou, skener je samo još jedan od uređaja za ulaz, slično tastaturi ili mišu, izuzev što je taj njegov ulaz u grafičkom obliku. Te slike mogu biti fotografije za retuširanje, popravku ili upotrebu u stonom izdavaštvu. One mogu biti i rukom crtani logotipi koji su potrebni za zaglavlja dokumenata. One čak mogu biti i stranice teksta koje bi pogodan softver mogao da pročita i memoriše kao datoteku teksta za dalje uređivanje. Spisak primena skenera je gotovo beskrajan i rezultovao je u proizvode za zadovoljavanje posebnih zahteva:

• vrhunski skeneri sa dobošem, koji mogu da skeniraju i refleksno umetnost i prozirno, od slajdova od 35 mm do materijala dimenzija 16 stopa x 20 inča, pri rezolucijama većim od 10000 dpi (tačaka po inču);

•  kompaktni skeneri za dokumenta, projektovani isključivo za optičko prepoznavanje znakova (OCR - optical character recognition) i upravljanje dokumentima;

• namenski fotoskeneri, koji rade tako što pomeraju fotografiju preko stacionarnog izvora svetlosti;

• skeneri za slajdove/folije, koji rade tako što propuštaju svetlost kroz sliku, a ne da reflektuju svetlo sa nje;

• ručni skeneri, za tržište široke potrošnje, ili za korisnike koji nemaju mnogo raspoloživeradne površine.

Medjutim, najšire primenljiv i najpopularniji oblik su skeneri sa ravnom podlogom. Oni moguda snimaju slike u boji, dokumenta, stranice iz knjiga i časopisa i, sa odgovarajućom priključnom opremom, čak da skeniraju prozirni fotografski film. 

Na svom najprostijem nivou, skener je uređaj koji pretvara svetlost (koju vidimo kada nešto gledamo) u jedinice i nule (što je format koji može da pročita računar). Drugim rečima, skeneri pretvaraju analogne u digitalne podatke. Svi skeneri rade na istom principu reflektanse ili transmisije. Slika se postavlja ispred valjka koji se sastoji od izvora svetlosti i senzora, u

3

Page 4: Seminarski Rad Skeneri.docx

slučaju digitalne kamere, gde izvor svetlosti može biti sunce ili veštačko svetlo. Kada su stoni skeneri bili prvi put uvedeni, mnogi proizvodjači su koristili fluorescentne cevi kao izvore svetla. Mada su dovoljno dobre za mnoge svrhe, fluorescentne cevi imaju dve izrazite slabosti: one retko zrače postojanu belu svetlost u dužem vremenu i, dok su uključene, one zrače toplotu koja može da deformiše druge optičke sastavne delove. Iz tih razloga, većina proizvođača je prešla na cevi sa hladnom katodom.One se razlikuju od standardnih fluorescentnih cevi po tome što nemaju zagrevno vlakno. Onezato rade na mnogo nižim temperaturama i, shodno tome, pouzdanije. Standardne fluorescentne cevi se danas uglavnom nalaze na jeftinim uređajima i starijim modelima.

1.1 VRSTE SKENERA

Tri osnovne vrste skenera su: ručni, ravni i rotacijski. Ručni postoje u nekoliko oblika: mali skeneri slični olovci za skeniranje teksta ili crtičkog koda (engl. Bar code) i uređaji malo veći od miša. Značaj ručnih skenera su niska cena i relativno nizak kvalitet. Postoje crno-beli i u boji, razlučivosti do najviše 400 tačaka po inču (engl. Dots per inch, dpi), a obično imaju najviše osam bita po boji. Ručni skeneri se danas koriste uglavnom kao čitači crtičnog koda (engl. Bar code), dok se za digitalizaciju slika više ne koriste. Ravni skeneri (engl. Flatbed scanner) su najpopularniji, a zbog činjenice da se drže na stolu pored računara zovu se i stoni skeneri. Sa gornje strane imaju staklenu ploču na koju se stavlja preložak. Skener ima izvor svetlosti (ako se radi o reflektovanom modelu sa donje, a ako je reč o transparentnom modelu sa gornje strane) i optički sastav koji dovodi rezultujuće A4 ili ređe A3. Rezolucija stonih skenera jedno 1200 dpi, a rabe najčešće 12 bita po boji. Stoni skeneri danas su najrasprostranjenija vrsta skenera. Rotacijski su skeneri skupi, a rezolucije su od 2400 do 9600 dpi. Model se lepi na prozirni šuplji valjak (bubanj) koji rotira i pomiče se u smeru osi rotacije. Na rotacijskom skeneru mogu se skenirati samo savitljivi modeli. Rotacijski skeneri koriste se za profesionalnu primenu gde je potreban vrhunski kvalitet skeniranja.

Slika 1. Rotacioni skener

4

Page 5: Seminarski Rad Skeneri.docx

Slika 2. Ravni skener

Slika 3. Ručni skener

Slika 4. Osnovni delovi skenera - Lampa- Ogledalo- Sočivo- Filter- CCD skener

5

Page 6: Seminarski Rad Skeneri.docx

Slika 5. Skener u rasklopu

Format skenera govori o tome koliko se veliki model može odjednom skenirati. Format ravnih A4 ili A3 i veći.

1.2 REZOLUCIJA SKENERA

Rezolucija (engl. Resolution) najvažnija karakteristika skenera. Izražava se brojem tačaka po inču (engl. Dots per inch, dpi). Kod stonog skenera horizontalna rezolucija određena je brojem tačaka na fotoosetljivom elementu. Vertikalna rezolucija zavisi od preciznosti kojom skener može pomicati glavu uzduž modela. To znači da stoni skener može imati različitu rezoluciju u horizontalnom i vertikalnom smeru. Kod rotacijskog skenera ne postoji fizičko ogranilenje rezolucije koje bi bilo analogno sa ograničenjem koje postavljaju fotoosetljivi elementi kod stonih skenera. Rezolucija zavisi samo o preciznosti mehanizma za pomicanje valjka. Horizontalna rezolucija (rezolucija oko valjka) zavisno brzini rotacije, a vertikalna rezolucija zavisi od preciznosti pomicanja valjka u smeru ose rotacije. Proizvođači često ističu dve različite rezolucije: interpoliranu i optičku. Interpolirana rezolucija je ona koju skener ili upravljački program postiže interpoliranjem odnosno umetanjem dodatnih tačaka između skeniranih tačaka, tako da se njihova boja izračunava pomoću osnovnih susednih tačaka. Reč je dakle o poboljšanju rezultata skeniranja koji se temelji na proceni, što može ali i ne mora poboljšati rezultat. Optička rezolucija je stvarna rezulucija skenera i jedina je bitna za kvalitet skenera. Zato pri proceni kvaliteta skenera treb najpre obratiti pažnju na optičku rezoluciju. Sledeća slika prikazuje različite rezolucije iste fotografije. Što je rezolucija veća to je rezultat skeniranja bolji.

6

Page 7: Seminarski Rad Skeneri.docx

Slika 6. Prikaz iste fotografije skenirane različitim rezolucijama

Skenira se uglavnom iz dva razloga: da bi se slika gledala na zaslonu monitora ili da bi se otisnula na papiru. Pri skeniranju može se izabrati rezolucijas kojom se želi skenirati. Pri tome se često postavlja pitanje s kojom rezolucijom je pogodno skenirati za pojedinu namenu. Formula za izračunavanje veličine skenirane slike na monitoru je:

Xm = rs ∙X

25.4 odnosno ym = rs ∙Y

25.4

Gde je: X širina modela u mm, Y visina modela u mm, r s rezolucija skenera u dpi, Xm širina slike na zaslonu monitora u zaslonskim tačkama i y m visina slike na zaslonu monitora u zaslonskim tačama. U tablici 1. prikazane su veličine modela u mm, rezolucije (razlučivosti) skeniranja u dpi i veličina slike na zaslonu monitora u zaslonskim tačama za neke karakteristične forme.

Tabela br 1. Veličina modela, rezolucija skeniranja i veličina slike na monitoru

7

Page 8: Seminarski Rad Skeneri.docx

Ako je poznata veličina modela i unapred se zada željena veličina slike na monitoru moguće je izračunati sa kolikom je rezolucijom potrebno skenirati fotografiju. Formula za izračunavanje rezolucije skeniranja je:

rs = 25.4 ∙ xm

X odnosno rs =

25.4 ∙ ym

Z

gde je: X širina modela u mm, Y visina modela u mm, r s rezolucija skeniranja u dpi, xm širina slike na zaslonu monitora u zaslonskim tačkama i y m visina slike na zaslonu monitora u zaslonskim tačama. Ako je npr. Veličina modela na papiru 6.5x3.4 cm, a želi se veličina slike na zaslonu monitora u vodoravnom smeru od 640 tačaka onda je potrebno tu sliku skenirati sa rezolucijom 250 dpi s tim da će veličina slike u uspravnom smeru biti određena sa rezolucijom skeniranja i u ovom slučaju iznosi 335 tačaka. Ako je npr. Veličina modela na papiru 5.2x8.6 cm, a želi se veličina slike na zaslonu monitora u uspravnom smeru od 768 tačaka onda je potrebno tu sliku skenirati sa rezolucijom 227 dpi s tim da će veličina slike u vodoravnom smeru biti određena sa rezolucijom skeniranja i u ovom slučaju iznosi 463 tačaka. Potrebno je napomenuti da se računanjem potrebne rezolucije skeniranja dobivaju vrednosti koje većina skenera nema. U svom izboru upravljački program skeniranja najčešće nudi nekoliko osnovnih rezolucija a ne mogućnost izbora kontinualne rezolucije. Najčešće rezolucije koje upravljački program skenera nudi korisniku su: 100, 150, 200, 225, 300, 400, 600 i 1200 dpi. Znači da je prilikom izbora rezolucije skenera prema izračunatoj vrednosti rezolucije potrebno odabrati najbližu rezoluciju koju upravljački program skenera nudi korisniku. Ako se fotografija želi ispisati na pisaču onda je potrebno još uključiti u formulu i rezoluciju PISAČA. Formula za izračunavanje širine i visine slike na pisaču je:

xp = rs ∙ X

r pi yp =

rs ∙Y

r p

gde je: X širina modela u mm, Y visina modela u mm, r s rezolucija skeniranja u dpi, rp rezolucija ispisa na pisaču u dpi, x p širina slike ispisana na pisaču u mm i yp visina slike ispisana na pisaču u mm. Npr. Ako se modela dimenzija 16.26x12.19 cm skenira sa rezolucijom 100 dpi njena veličina na monitoru će biti 640x480 tačaka. Ako se nakon toga ta ista slika ispiše na pisaču rezolucijom 300 dpi njena veličina će biti 5.42x4.06 cm.

1.3 BROJ BITA PO BOJI

Računar može obrađivati samo digitalne podatke ili jednostavnije rečeno računar može raditi samo sa brojevima. Zato je sliku na neki način potrebno pretvoriti u brojeve. To se radi u dva korama. U prvom se koraku slika podeli na tačke (broj tačaka zavisi od rezolucije skenera). Svaka se tačka osvetli i odbijeno svetlo

8

Page 9: Seminarski Rad Skeneri.docx

dovodi do osećaja koje svetlost pretvara u električnu struju (ili napon). Što je svetlost jača, to je struja veća. Drugi korak je pretvaranje iznosa struje u broj. Taj se postupak zove digitalizacija. Računar radi sa binarnim brojevima, pa se iznos struje pretvara u binarni broj. A/D konvertor konvertuje analogni električni signal u rasponu od Vmin do Vmax u brojeve od 0 do 2 n-1 gde je n broj bita. Npr. 4-bitni A/D konvertor pretvara ulazni napon od 0 do 1 V u brojeve od 0 do 15. To znači da će se celokupni raspon svetlosti od crnog do belog prikazati sa 16 nijanski. Ljudsko oko može razlikovati mnogo više nijansi. Npr. zamislimo da se skenira slika koja je na jednom kraju potpuno crna, a prema drugom kraju postaje sve svetlija da bi na kraju postala belija. Ako se ta slika opisanim postupkom pretvori u 16 nijansi sivoga, ljudsko oko će primetiti stepenasti prelaz sivih tonova. Zato je povoljnije pretvoriti raspon svetlosti u binarni broj sa što više bita. Sledeća slika prikazuje sliku sa postupnim prelazom od crne do bele boje prikazanu sa različitim brojem bita. Što je broj bita veći, to je rezultat skeniranja bolji.

Slika 7. Prikaz slike sa postupnim prelazom od crne do bele boje sa različitim brojem bita (sa leva na desno 1 bit, 2 bita, 3 bita, 4 bita i 8 bita)

8-bitni A/D konvertor konvertuje taj isti raspon u brojeve od 0 do 255, 10-bitni A/D konvertor od 0 do 1023, 12-bitni A/D konvertor od 0 do 4095 itd. A/D konvertor sa više bita preciznije će podeliti isti ulazni raspon, tako da će se na njegovom izlazku dobiti preciznija digitalna informacija o stvarnom intenzitetu svetla. Pri skeniranju slike u boji za svaku tačku slike postoje tri fotoosetljivosti: za crvenu, za zelenu i plavu boju. Zato je za svaku boju potrebno imati po jedan takav podatak. Broj bita koje skener koristi i broj boja povezani su na sledeći način: gde je: n broj bita, a c broj boja. U tablici 2. prikazan je broj bita i odgovarajući broj boja.

9

Page 10: Seminarski Rad Skeneri.docx

Tabela br 2. Broj bita i broj boja Zavisno od rezolucije i broju boja (odnosno broju bita) veličina slike zauzimaće različitu količinu memorije. Formula za izračunavanje veličine slike u memoriji u KB je:

v = xm ∙ ym n

8192 ;

gde je xm veličina slike u zaslonskim tačkama na monitoru u vodoravnom smeru, ym veličina slike u zaslonskim tačkama na monitoru u uspravnom smeru, a n broj bita. U tabeli 3. prikazane su neke karakteristične veličine slika na monitoru, broj bita i broj boja te veličine slike u memoriji.

Tabela br 3. Veličine slika na monitoru, broj bita (broj boja) i veličina slike u memoriji

U tabeli 4. prikazane su veličine slika u zavisnosti od širine i visine modela u mm, broju bita (broju boja) i rezoluciji skeniranja u dpi. Formula za izračunavanje veličine slike u KB je:

v = X

25.4 ∙ Y

25.4 ∙ r s2 ∙

n8192

gde X predstavlja veličinu modela u horizontalnom smeru u mm, Z predstavlja veličinu modela u vertikalnom smeru u mm, rs je rezolucija skeniranja u dpi, a n je broj bita.

10

Page 11: Seminarski Rad Skeneri.docx

Tabela br 4. Veličina slike u zavisnosti od širine i visine modela, broju bita (broju boja) i rezoluciji skeniranja

Po t r ebno j e napomenu t i da su u t abe l i b r 4 . p r i kazane ve l i č i ne s l i ka bez s až iman j a . P r i   ob rad i z ap i s s e može s aže t i da z auzme man je memor i j e . Za to s e može dogod i t i da konačni rezultat, polje na disku, zauzima manje memorije nego što je to navedeno u tabeli.  Nek i od t i h g r a f i čk ih fo rma ta ima ju u s eb i uk l j učeno s až iman j e poda t aka t ako da s e ve l i č i na s l i ke na np r . t v rdom d i sku može r az l i kova t i od ve l i č i ne s l i ke u memor i j i .  Načelno se može reći da je povoljnije sliku skenirati sa što više bita po boji, ali se time povećava količina memorije potrebna za obradu slike. Zato treba proceniti koja je namena slike i prema tome izabrati broj bita.

2.0 DINAMIČKI RASPON SKENERA

Čovekovo oko je vrlo osetljivo, tj. u stanju je videti svetlost vrlo niskog intenziteta. Osim te osetljivosti, čovek je u stanju videti veliki raspon intenziteta svetlosti. Razlika između intenziteta kontura koje čovek vidi u noći bez meseca i podnevnog sunčevog sjaja je velika. Niti jedan uređaj nije u stanju registrovati ni reprodukovati tolikiraspon. Od skenera se to ni ne očekuje. Od njega se očekuje što vernija reprodukcija koja se zabeležila na npr. emulziji filma, fotopapiru ili nekom drugom mediju koji je već zbog svojih ograničenja redukovao mogući tonski raspon. Dve su vrste mogućih modela pogodnih za skeniranje: prozirni npr. dijapozitivi i neprozirni npr. fotografija na papiru. Svaki model ima svoje optičke karakteristike. Svetlost koja dolazi na prozirni model delomično se odbija, delomično prolazi i delomično absorbuje. Suma tih triju komponenti uvek je jednaka ulaznoj svjetlosti. Dinamički raspon skenera je logaritam mera između maksimalne svetlosti koju fotoosjetljivi elementi detektuju i minimalne svetlosti (tame) koju fotoosjetljivi elementi detektuju. Što se skeniranjem može dobiti više sivih nijansi ili boja to je dinamički raspon skenera veći. Dinamički raspon se računa kao 20·log(2 n) gde n predstavlja broj bita po boji. U tabeli br 5. prikazani su broj bita po boji, broj tonova po boji, ukupni broj boja, teoretski dinamički raspon i tonski raspon za neke karakteristične vrednosti kod skenera.

11

Page 12: Seminarski Rad Skeneri.docx

Tabela br 5. broj bita po boji, broj tonova po boji, ukupni broj bita i boja i dinamičke rasponi

2.1 BRZINA SKENIRANJA

Većina proizvođača navodi brzinu skeniranja u cm/s. Radi se o brzini pomeranjaglave kod skeniranja. Taj podatak u većini slučajeva nema nikakvo značenje, jer je prolazglave preko modela samo jedna od komponenti koje utiču na stvarnu brzinu skeniranja. Na nju mnogo više utiču broj prolaza skenera, brzina prenosa podataka, brzina obrade podataka u skeneru te brzina i praktičnost upravljačkog programa koji dolazi sa skenerom.

2.2 BROJ PROLAZA SKENIRANJA

Prvi skeneri koji su se pojavili mogli su skenirati samo crno-belu sliku. Korak prema skeniranju u boji je skeniranje slike tri puta: kroz crveni, zeleni i plavi filter. To zahteva tri skeniranja, pa je tri puta sporije. Troprolazni su skeneri danas vrlo retki te se najčešće susreću jednoprolazni, koji sve tri boje skeniraju u jednom prolazu.

2.3 PRIKLJUČIVANJE SKENERA

Skeneri su uređaji koji se spajaju na računar posredstvom sklopovske veze ili priključkom na spoljnu sabirnicu. Postoji više načina da se to ostvari: SCSI veza, dvosmerna paralelna vrata, vlastite kartice koje dolaze sa skenerom i USB veza. Danas se skeneri najčešće spajaju na računar preko USB veze.

12

Page 13: Seminarski Rad Skeneri.docx

3.0 UPRAVLJAČKI PROGRAM SKENERA

Skener je vrlo važan u postupku skeniranja, ali to je tek pola procesa za skeniranje. Druga polovina je upravljački program. Dobar skener i loš upravljački program dati će mnogo lošiji rezultat nego lošiji skener i odlični upravljački program.Svaki skener dolazi sa svojim upravljačkim programom. U načelu s upravljačkim programom koji dolazi uz jedan skener nije moguće skenirati na skeneru drugog proizvođača. Većina skenera namenjena je radu na IBM PC računarima i Mekintoš računarima. Kvalitet upravljačkog programa utiče ne samo na kvalitetu postignutog krajnjeg rezultata, nego i na brzinu rada. Od upravljačkog programa očekujese da podržava sve posebnosti skenera, da omogućava brzo i jednostavno skeniranje i potpuni nadzor nad svim parametrima skeniranja.

 

3.1 POSTUPAK SKENIRANJA

U postupku skeniranja osim kvaliteta skenera i upravljačkih programa odgovornost za konačne rezultate snosi i osoba koja skenira. Razlog tome je relativna brojnost parametara skeniranja koji mogu potpuno izmeniti izgled skenirane slike. Stoga je za uspešan rad neophodno razumevanje uticaja svakog od parametara na rezultat skeniranja. Postupak skeniranja započinje otvaranjem programa za obradu slika (npr.Adobe Photoshop, PaintShopPro, Corel PhotoPaint i sl.). U izborniku svakog od tih programa postoji izbor za skeniranje. Nakon što se klikne na taj izbor pokrene se upravljački program za skeniranje. U tom se programu skeniranje najčešće odvija na sledeći način:

13

Page 14: Seminarski Rad Skeneri.docx

Slika 8. Dijagram toka postupka skeniranja

3.2 PREGLED MODELA SKENIRANJA

Pregled (engl.preview) je postupak kojim se na zaslonu monitora prikaže pojednostavljena slika modela koji će se skenirati. To služi da bi korisnik mogao izabrati koji deo slike želi skenirati. Iako se na preglednom prikazu modela skeniranjamože u grubo proceniti rezultat skeniranja (boje, svetlina i dr.) pregled služi uglavnom izboru dela modela koji se želi skenirati. Na preglednom prikazu modela mogu se uokviriti područja koja se žele skenirati.

3.3 PARAMETRI SKENIRANJA

Ovde će biti prikazani i objašnjeni neki od važnijih parametara skeniranja.

3.4 BROJ BITA

Upravljački programi obično nude line-art, grayscale i full color način skeniranja. Line-art se koristi za skeniranje crno-belih modela najčešće crteža nastalih olovkom i koristi 1 bit za svaku tačku slike. Takvi su modeli su primera radi tehnički nacrti. Line-art način skeniranja treba primeniti ako se skenira tekst koji će se zatim raspoznavati programom za raspoznavanje teksta (engl. OCR).

14

Page 15: Seminarski Rad Skeneri.docx

Grayscale se koristi za crteže i fotografije koje u sebi sadrže crno-bele tonove i koristi 8 bita za svaku tačku slike. Pogodan je za skeniranje crno-belih fotografija i crno-belih crteža koji sadrže nijanse sive boje. Full color (true color) način skeniranja predstavlja skeniranje u boji i koristi se za crteže i fotografije u boji i koristi 24 bita za svaku tačku slike. Neki skeneri ili tsčnije njihovi upravljački programi nude i varijantu skeniranja u boji s ograničenom paletom od 256 boja.

4.0 HISTOGRAM

Histogram je dijagram o zastupljenosti pojedinih nijansi sive skale (kod pregleda u boji – obojena u pojedinim kanalima za svaku boju) na izabranom području slike. Taj je dijagram važan pri izboru crne i bele tačke (engl. black spot, BS i white spot, WS), gama faktora te kao osnova za korekciju tonskih krivulja.

Slika 9. Histogram za sliku u sivoj skali

Slika 10. Histogrami za istu sliku u boji po kanalima (crvenom, zelenom i plavom)

15

Page 16: Seminarski Rad Skeneri.docx

4.1 IZBOR CRNE I BELE TAČKE

Fotoosjetljivi elementi, intenzitet svetlosti s modela pretvaraju u numeričku vrednost u rasponu koji je određen brojem bita po kanalu. O parametrima koji su zadani skeneru zavisi koje će vrednosti sivoj skali (od 0% do 100% zacrnjenja) biti prideljene pojedinim numeričkim vrednostima dobivenim u postupku skeniranja. Budući da modeli često jako variraju u svom kvalitetu nužno je skeneru na neki način ukazati na tonsko područje kojem treba dati najviše pažnje i osetljivosti. Zato pre skeniranja treba odrediti tzv. crnu i belu tačku, tj. granične stepena zacrnjenja. Neka se npr. koristi skener kojim će se skenirati slika u sivoj skali s 8 bita za svaku tačku slike (nijanse sivoga označene su vrednostima od 0 do 255). Opredeli li se crnoj tački vrednost 15, a belojvrednost 232 (obično veći broj označava slabije zacrnjenje) onda će skener sve tačke kojima tokom skeniranja interno prideli nijansu manju ili jednaku 15 računaru poslati kao potpuno crne (vrednost 0), a one koje imaju nijansu veću ili jednaku 232 kao potpuno bele (vrednost 255). U upravljačkim programima nekih skenera crna i bela tačka posredno se regulišu kroz veličine nazvane svetlina i kontrast (engl. Brightness i contrast). Iako su ti nazivi bliži svakodnevnom govoru, njihov smisao u skeniranju je upitan i rezultati nastali njihovim promena obično su teže predvidljivi.

Slika 11.a. originalna slika u sivoj skali;

b. slika s BS=15 i WS=130; c. slika s BS=100 i WS=225

16

Page 17: Seminarski Rad Skeneri.docx

Slika 12.a. slika sa svetlinom +30; b. slika sa svetlinom -30;c. slika s kontrastom +50;d. slika s kontrastom -50

4.2 GAMA-FAKTOR

Podešavanje gama-faktora obično je usko vezano za izbor crne i bele tačke.Vrednost gama-faktora (broj između 0,10 i 9,99) vezana je obično za srednji ton (engl. midtone) ali to zavisi o upravljačkom programu. Normalna (nekorigovana) vrednost gama-faktora je 1,00 što znači da numerička nijansa koja odgovara zacrnjenju od 50% predstavlja tačnu aritmetičku sredinu crne i bele tačke. Numerički gledano, pomak srednjeg tona prema crnoj tački uvećava gama-faktor, a pomak prema beloj tački ga smanjuje. Uticaj gama-faktora na samu sliku utiče na raspodelu tonova koji se nalaze u srednjem području, tj.

17

Page 18: Seminarski Rad Skeneri.docx

relativno daleko od crne i bele tačke. Pomak srednjeg tona prema crnoj tački (povećanje gama faktora) dovodi do toga da cela slika postaje svetlija. Kadase srednji ton pomiče prema beloj tački (smanjenje gama faktora) slika postaje tamnija. Kod slika u boji uticaj gama-faktora može se prikazati tablicom:

Tablica 6 . Uticaj gama-faktora na pojedine kanale

Slika 13. a. slika s gama-faktorom 0,4; b. slika s gama-faktorom 2,0

4.3 OSTALI PARAMETRI

Postoji još parametara koji se mogu menjati kako bi se dobio željeni rezultat skeniranja, ali su oni previše složeni da bi se objasnili u ovom kratkom tekstu. O uticaju i značenju tih parametara moguće je saznati iz pomoći programa za skeniranje (engl. Help) ili literature.

18

Page 19: Seminarski Rad Skeneri.docx

4.4 PRAKTIČNI SAVETI

U tablicama koje slede prikazani su saveti vezani uz vrste modela i način skeniranja te postupke o korekcijama skenirane slike s nekim parametrima objašnjenim pre. Tablica 7. prikazuje vrste modela i kojim načinom je potrebno skenirati modela. Tablica 8. prikazuje na koji način je moguće napraviti korekcije modela s prethodno objašnjenim parametrima.

Tablica 7. Vrste modela i način skeniranja modela

Tablica 8. Načini korekcije slike

Proizvođači skenera su: Canon, Heidelberg, Agfa, Microtek, Umax, HP, Mustek...

19

Page 20: Seminarski Rad Skeneri.docx

5.0 PRINCIP RADA I CCD

Savremeni stoni skeneri se sastoje iz više delova. Najkarakterističniji deo je stakleni panel ispod kog se nalazi izvor svetlosti. Izvor svetlosti osvetljava stranu papira postavljenu licem okrenutim na dole na staklenoj podlozi iznad mehanizma za skeniranje. Prazne ili bele površine odbijaju više svetlosti od slova ili slika. Motor pomera glavu skenera koja hvata svetlost koja se odbija od skeniranog dokumenta. Odbijena svetlost prolazi kroz sistem ogledala koja je usmeravaju ka sočivu. Sočiva fokusiraju svetlosne zrake na svetlosno osetljive diode koje svetlost prevode u električnu struju. Što je veća količina svetlosti koja padne na diode utoliko je veći napon struje. Ako skener radi sa slikama u boji, odbijena svetlost se usmerava prema posebnim diodama kroz crvene, zelene i plave filtere. Na kraju, analogno-digitalni konvertor (engl. analog to digital converter, ADC) prevodi svaku analognu vrednost napona u digitalni piksel koji predstavlja jačinu svetlosti za tačku duž linije koja sadrži broj piksela po inču srazmerno deklarisanoj mogućnosti određenog skenera.

Svetlosno osetljive diode, odnosno optički senzori mogu biti izrađeni u više tehnologija kao: CCD (engl. charge coupled device), CIS (engl. contact image sensors) ili CMOS (engl. complementary metal–oxide–semiconductor). Svi ovi tipovi senzora imaju isti zadatak da svetost prevedu u elektronske signale. CCD senzori su analogni uređaji. Kod ovih uređaja prikaz objekta se smanjuje u sočivu pre nego što ga uhvati CCD senzor jer je CCD matrica mnogo manja od površine za skeniranje. Kada svetlost padne na fotoreceptor ona proizvede mali električni naboj u svakom foto senzoru koji se prevodi u vrednost napona za određeni piksel. CCD i fotoreceptor mere upadno svetlo i konvertuju intenzitet u analogni napon. CCD snima osvetljenost kao intenzitet srazmerno broju fotona uhvaćenih u određenom vremenskom periodu. Crno je najmanjeg a belo najvećeg intenziteta. CMOS senzori su novija tehnologija koja radi na principu poluprovodnika koja je jednostavnija za proizvodnju, efikasnija u potrošnji struje ali sa približno istim kvalitetom skeniranja kao i CCD. CIS senzori su relativno nova tehnološka inovacija na polju položenih skenera koja ubrzano potiskuje CCD u proizvodnji manjih, prenosnih uređaja. Kao što i ime kaže, CIS senzor je u bliskom kontaktu sa objektom skeniranja i ne koristi ogledala za usmeravanje svetlosti na statični senzor kao kod konvencionalnih CCD skenera. Pikseli kod CIS su iste veličine kao skenirani pikseli na strani. Ovi skeneri koriste LED (engl. light-emitting diode) za osvetljavanje što ih čini visoko efikasnim uređajima u pogledu potrošnje struje tako da se mogu napajati i preko USB konektora. Ovi uređaji su manji i lakši od uređaja sa CCD senzorima ali je i kvalitet skeniranog materijala lošiji zbog neefikasnih sočiva, loše dubine skeniranja tako da papir mora da bude savršeno ravan i ograničena je preciznost boja.

Uređaji se razlikuju i po načinu rada sa papirom. Papir nije uvek nepomičan kad se skenira kao kod ručnih i položenih skenera. Skeneri više klase uvlače listove papira iznad glave skenera koja se ne pomera. Kao transport koristi se sistem valjaka, kaiševa, doboša ili vakuumskih cevi.

20

Page 21: Seminarski Rad Skeneri.docx

5.1 KVALITET SKENIRANJA

Savremeni skeneri obično snimaju u RGB paleti boja. Analogno-digitalni konvertor šalje skenirane podatke kompjuterskom procesoru preko ulazno/izlaznog interfejsa koji može biti SCSI ili dvosmerni paralelni port kod skenera proizvedenih pre pojave USB-a. Dubina boja zavisi od karakteristika samog uređaja, obično je najmanje 24-bitna dok je kod kvalitetnijih modela 48-bitna ili veća. Važan parametar kod skenera je njegova rezolucija, merena pikselima po inču (ppi), ali ponekad preciznije određena kao uzorcima tj. semplovima po inču (engl. samples per inch). Umesto isticanja optičke rezolucije kao jedinog bitnog parametra, proizvođači obično deklarišu interpoliranu rezoluciju uređaja, koja je mnogo veća usled softverske interpolacije. Godine 2004. kvalitetniji stoni skener je imao optičku rezoluciju od 1600 do 3200 ppi, vrhunski položeni skeneri do 5400 ppi, a dobar doboš rotacioni skener je imao optičku rezoluciju od 8000 do 14000 ppi. Proizvod skeniranja je obično nekompresovani RGB prikaz koji preko veze skenera i računara dalje obrađuju grafičke aplikacije, među kojima je najpoznatiji Adobe Photoshop. Obrađene slike se obično čuvaju na hard-disku računara u određenom formatu. To može biti nekompresovana bitmap slika, kompresovani TIFF ili PNG, -[[[GIF]]}- ili JPEG. Dokumente je najbolje čuvati u TIFF ili PDF formatu. Adobe PDF format (format za opis strane, eng. Page Description Format) pruža kvalitetnu komprimovanu prezentaciju kompleksnih strana uz dostupan besplatan softver za čitanje. GIF odnosno u prevodu format za razmenu grafike je format dosta korišćen za internet prezentacije. Ovaj format koristi kompresiju bez gubitka ali samo u 256 boja. JPEG format je dobar za postavljanje slika na internet strane jer ga preprepoznaju veb pretraživači, ali nije dobar izbor za tekstualne dokumente jer se dobija mutan tekst u blokovima. JPEG datoteke koriste kompresiju sa gubitkom usled čega su skenirane slike lošijeg kvaliteta. Međutim, u poređenju sa GIF formatom, JPEG može da čuva 24-bita informacije o boji po pikselu, što znači preko 16 miliona boja. Kupci skenera treba da obrate pažnju u tom smislu da bez obzira na deklarisanu vrednost rezolucije i širine bitova, neki uređaji nisu u stanju da kvalitetno skeniraju u višim rezolucijama. Pošto kupac ne može biti potpuno siguran da li je deklarisana vrednost optička ili interpolirana rezolucija najbolje je pri kupovini orijentisati se ka poznatijim proizvođačima kao što su Epson, Hewlett-Packard  ili Canon. Ipak, za uobičajenu kućnu i kancelarijsku upotrebu dovoljan je 24-bitni skener koji može da skenira u 300 ppi. Sa druge strane 48-bitni skener koji može da snima u 600 ppi mnogo je prikladniji za kvalitetne fotografije, negative ili 35-milimetarske slajdove. Kvalitet određenog skenera zavisi od više parametara ali najviše od: rezolucije, skaliranja, šuma slike, tonske precoznosti, vernosti boja i brzine rada.

5.2 VEZA SA RAČUNAROM I PRATEĆI SOFTVER

Skeniranje dokumenta je samo deo procesa. Da bi skenirani dokument bio upotrebljiv, on mora biti prebačen sa skenera do aplikacije na računaru, kojom će se dalje obraditi. Postoje dva osnovna vida veze:

način na koji je skener fizički vezan za računar, i

21

Page 22: Seminarski Rad Skeneri.docx

kako softverska aplikacija prima podatke od skenera

Količina podataka generisana na računaru može biti veoma velika. Tako skenirani dokument u rezoluciji 600 ppi i 24-bitnoj dubini boja formata A4 može zauzimati i 100 MB podataka koje treba prebaciti i uskladištiti. Skeneri koriste četiri tipa veze sa računarom.

1. Paralelni port (engl. parallel port) – ovo je najsporiji metod prenosa i zastupljen je kod starijih modela. On prenosi podatke brzinom od 100 do 800 kilobajta po sekundi.

2. Small Computer System Interface (SCSI) – u prevodu, interfejs malih računarskih sistema. Podržan od većine kompjutera samo preko posebnog SCSI adaptera. Neki modeli se isporučuju sa kartom mada može biti korišćen bilo koji SCSI kontroler. Tokom razvoja SCSI standarda brzina transfera se povećavala, ali je ovaj standard danas uglavnom prevaziđen u korist USB i FireWire koji su brži, direktno podržani od strane računara i jednostavniji za podešavanje. Brzina je 1,2 MB u sekundi.

3. Universal Serial Bus (USB) – ovaj standard koji se pojavio 1997. godine može da prebacuje podatke brzo, jednostavniji je i jeftiniji od SCSI uređaja. Raniji USB 1.1 standard je mogao prebacivati podatke brzinom od 1,5 MB u sekundi što je sporije od SCSI, ali noviji standard 2.0 teoretski prebacuje podatke brzinom od 60 MB u sekundi.

1. 1394 ili FireWire je interfejs koji se pojavio 1998. godine i koji je mnogo brži od USB 1.1 ali približno isti kao USB 2.0. Brzine prenosa su od 25 do 800 MB u sekundi pod uslovom da ih konektovani uređaji podržavaju.

Aplikacije koje se koriste za grafičku obradu kao što je recimo Adobe Photoshop ili GIMP moraju da komuniciraju sa skenerom. Razni tipovi skenera koriste različite protokole. U cilju pojednostavljenja rada sa njima razvijeni su aplikacioni programski interfejsi (API). Oni predstavljaju zajednički način za vezu programskih aplikacija i uređaja. To znači da programska aplikacija ne mora da ima informacije o specifičnim karakteristikama skenera da bi mu pristupila. Na primeru, Adobe Photoshop podržava TWAIN standard, i u idealnom slučaju on će prihvatiti svaku sliku od skenera koji takođe podržava ovaj standard. U praksi se ipak javljaju problemi jer nemaju svi skeneri dobru implementaciju ovog standarda. Ipak TWAIN i OLE su najzastupljeniji API kog jeftinijih kućnih i poslovnih modela skenera. Manje prisutni su ISIS, SANE i WIA.

Softverski paket koji se dobija uz skener obično se sastoji iz:

softvera za skener (odnosno upravljački program, engl. device driver) softver za obradu slika OCR (engl. Optical Character recognition) softver softver za kopiranje (koji omogućava korišćenje skenera i štampača u sprezi kao fotokopir

mašine)

5.3 OPTIČKO PREPOZNAVANJE ZNAKOVA

22

Page 23: Seminarski Rad Skeneri.docx

Optičko prepoznavanje teksta (Optical character recognition, OCR), je postupak mehaničkog ili elektroničkog prebacivanja rukom pisanog, mašinski ispisanog ili štampanog teksta koristeći skener u oblik koji računar prepoznaje i može ga izmenjivati.

OCR spada pod grupu istraživanja kao što je prepoznavanje uzoraka, veštačka inteligencija i mašinski vid.

Termin OCR danas obuhvata i tehnike digitalnog procesuiranja slika. Rane sisteme je bilo potrebno naučiti (dati im znani primerak svakog od znakova) kako čitati pojedini font. Trenutno su dostupni "inteligentni" sistemi sa velikim stepenom tačnosti za veliku većinu fontova.

Program za optičko prepoznavanje znakova (Optical Character Recognition, OCR) skenira i prepoznaje tekst te ga zatim konvertuje u datoteku programa za obradu dokumenata ili teksta (word procesora) u kojem se dalje može obrađivati.

OCR software taj postupak čini na 3 glavna načina: prepoznavanje uzoraka (Pattern Matching), ekstrakcija posebnosti (Feature Extraction) i provera pravopisa (Spell Checking).

Najbolji programi za optičko prepoznavanje znakova koriste više od jedne ovde navedenih metoda kako bi odredili o kojem se skeniranom znaku radi. Kombinovanjem ove različite metode tačnost i preciznost drastično porastu.

5.4 TRENUTNO STANJE OCR TEHNOLOGIJE

Tačno prepoznavanje odštampane latinice i ćirilice se smatra uglavnom rešenim problemom. Tipičan postotak tačnosti prepoznavanja prekoračuje 99% . Tačnost ili preciznost može biti merena na nekoliko načina o kojima jako zavisi krajnji rezultat i postotak tačnosti. Bez korištenja rečnika za ispravljanje grešaka pri čitanju 1% greška (99% tačnost) se moze pretvoriti u 5% grešku (95% tačnost).

OCR je tip off-line prepoznavanja znakova, gde sustav prepoznaje fiksne i statičke oblike znakova.

On-line prepoznavanje znakova prepoznaje dinamičke pokrete tokom pisanja rukom.

On-line prepoznavanje znakova se ponekad naziva i dinamičko prepoznavanje znakova (dynamic character recognition), prepoznavanje znakova u realnom vremenu (real-time character recognition) i inteligentno prepoznavanje znakova (Intelligent Character Recognition, ICR).

Intelligent Character Recognition (ICR)

On-line sistemi za prepoznavanje rukom ispisanog teksta u realnom vremenu (DCR, ICR) su sve češći komercijalni proizvodi zadnjih godina. Primeri takvih proizvoda su uređaji poput digitalnih osobnih asistenata koji koriste Palm OS.

Prepoznavanje kurziva je aktivno područje istraživanja s postotkom tačnosti prepoznavanje još manjom od onog prepoznavanja rukom pisanog teksta.

23

Page 24: Seminarski Rad Skeneri.docx

OCR je osnovna tehnologija koja se koristi u naprednim aplikacijama za skeniranje. Zbog toga napredno tehnološko rešenje koje koristi OCR može biti jedinstveno i može se patentirati te ne sme kopirati iako koristi osnovnu OCR tehnologiju.

Za kompleksnije probleme pri prepoznavanju koriste se inteligentni sistemi za prepoznavanje znakova poput neuronskih mreža.

OCR Programi

ABBYY FineReader OCR – Lokalizovan i sposoban za rad sa raznim jezicima

Top Image Systems – Specijalizovan za pravne dokumente

CuneiForm – Profesionalni sistem za firme

InstantOCR – Online sistem za prepoznavanje

Tesseract – OCR projekat koji razvija Google

5.5 NAČIN RADA

Software za optičko prepoznavanje znakova (Optical Character Recognition, OCR) skenira i prepoznaje tekst te ga zatim konvertuje u datoteku word procesora za dalju obradu. OCR program taj postupak čini na 3 glavna načina: prepoznavanje uzoraka (Pattern Matching), ekstrakcija posebnosti (Feature Extraction) i provera pravopisa (Spell Checking). Najbolji programi za optičko prepoznavanje znakova koriste više od jedne ovde navedenih metoda kako bi odredili o kojem se skeniranom znaku radi.

Prepoznavanje uzoraka (Pattern Matching)

Uspoređujući snimljene slike koje dolaze sa OCR programom s onima skeniranih znakova program pokušava prepoznati slova.

Ekstrakcija posebnosti (Feature Extraction)

Ova metoda pokušava prepoznati slova tako što ih rastavlja na osnovne posebnosti ili sastavne delove koji se zatim uspoređuju s listom posebnosti ili sastavnih delova koji se nalaze u programskom kodu.

Na primjer slovo "a" je sačinjeno od kruga, linije na desnoj strani i luka na sredini. Taj luk nije obavezan sastavni deo slova. Dakle, ako skenirano slovo ima te "posebnosti" OCR program bi ga tačno prepoznao kao slovo "a".

Provera pravopisa (Spelling Check)

Neprepoznati znakovi često mogu biti određeni gledajući susedne znakove. Na primer, ako OCR program nije mogao prepoznati slovo “i” u reči “nj~hovo” proverom pravopisa program može utvrditi da je slovo koje nedostaje slovo “i”.

24

Page 25: Seminarski Rad Skeneri.docx

Slika 14. Procedura kod skeniranja dokumenta

1. Aplikacija za obradu dokumenata (poput Microsoft Word-a) pozove TWAIN kompatibilnu aplikaciju kao što je npr. TextBridge. Interfejt za skener odnosno aplikacija.

2. Po potrebi se nameštaju razne opcije i postavke u OCR aplikaciji te se zatim poziva TWAIN modul.

3. TWAIN modul preuzima kontrolu nad skenerom i omogućava korisniku odabir kvaliteta i raznih načina skeniranja.

4. Nakon što je pokrenuto skeniranje, skener počinje slati sliku TWAIN modulu.5. TWAIN modul zatim šalje sliku OCR programu koji ga je u početku i pozvao. OCR

program zatim koristi jednu ili više gore opisanih metoda kako bi konvertirao snimljenu sliku u znakove.

6. OCR program šalje prepoznate znakove programu za obradu dokumenta. Ako OCR program nije mogao prepoznati neki znak, on postavlja simbol ~ na mjesto neprepoznatog znaka. Ponekad OCR programi pogrešno prepoznaju znakove. Tome je gotovo uvek uzrok loš kvalitet originalnih dokumenata.

25

Page 26: Seminarski Rad Skeneri.docx

LITERATURA

Časopis Digital! magazin 09 tema broja SKENERI

Informacione Tehnologije  Živadin Micić

Marjana Mladenovic i Željko Novaković, Personalni Kompjuteri, Beograd,2001.

Internet

26