Multimedijalni Sistemi Crna Gora

Embed Size (px)

Citation preview

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    1/29

    Univerzitet Crne GoreElektrotehniki fakultet

    Prof. dr Srdjan Stankovi

    MULTIMEDIJALNI SISTEMI

    -Draft verzija skripte-

    Podgorica, 2005

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    2/29

    1. Uvod

    Multimedija je jedna od intenzivnije upotrebljavanih rijei tokomzadnjih 10-tak godina i uglavnom je vezana za korienje raunara za

    predstavljanje informacije sadrane u vie medija (slika, tekst, grafika,video,...). U svakom sluaju treba praviti razliku kod pojmaMultimedija u pojedinim disciplinama, kada se kombinacijomrazliitih medija dobija sveobuhvatniji pristup odredjenoj oblasti, odsamog inenjerskog pristupa, kada se Multimedijima bavimo u smislu

    pronalaenja to sveobuhvatnijih algoritama za objedinjavanje ovakosloenih informacija u cilju njihove obrade, prenosa i prikaza.

    Multimedia potie od latinske rijei multi, koja predstavlja mnoinuneega i od rijei medium, ije znaenje je centar. Dakle, multimedia

    znai vie centara i asocira na to da se raunar koristi u ciljuobjedinjavanja i kombinovanja vie razliitih tipova informacija(slike, zvuka, teksta, videa,...) u jedinstven doivljaj.

    Osnovu u prouavanju multimedija prestavljaju najznaajniji tipovimultimedijalnih informacija:

    Tekst

    GrafikaSlikaAnimacijeVideoZvuk

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    3/29

    Primjetimo da je jedna multimedijalna informacija zapravokombinacija dva ili vie navedenih tipova informacija.Takodje, treba naglasiti da su Multimediji interdisciplinarni i danas

    predstavljaju presjek sljedeih oblasti:

    Digitalne obrade signala

    Arhitekture raunara

    Raunarskih mrea

    Telekomunikacija

    Generalno, multimedijalne informcije se mogu podijeliti u dvijegrupe:

    I) Vremenski zavisni (zvuk, video i animacije)

    II) Prostorno zavisne (slika, tekst i grafika)

    Primijetimo da su animacije, tekst i grafika sintetizovani pomoukompujtera.

    Pretvaranje analognog signala u digitalni

    Obzirom da se u Multimedijima bavimo digitalnim zapisima signala,to je u sluajevima analognog zapisa originalnog signala (to je estsluaj) neophodno izvriti njihovu digitalizaciju. Postupakdigitalizacije se moe predstaviti sljedeom procedurom:

    Analogni signalOdabiranjeKvantizacijaDigitalizacija

    Odabiranje ili uzimanje uzoraka analognog signala se dovija poTeoremi o odabiranju, to nam omoguava potpunu rekonstrukcijusignala iz njegove diskretne forme. Teoremom o odabiranju jedefinisan najvei korak izmedju dva odbirka signala:

    max12

    Tf

    gdjefmax predstavlja maksimalnu frekvenciju signala koji se odbira. Izprethoden veze izmedju koraka odabiranja i maksimalne frekvecnijese vidi da poveanje koraka odabiranja znai srazmjerno smanjenjemaksimalne frekvencije signala (to se moe iskoristiti za jednostavnafiltriranja signala).

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    4/29

    Odbirci analognog signala, u skladu sa njegovom prirodom mogupoprimiti sve vrijednosti izmedju minimalne i maksimalne definisaneza dati signal. To znai da bi trebalo koristiti ogroman broj bita da bise odbirci signala mogli tano prikazati u digitalnoj formi. Jasno je daovaj zahtjev nije mogue ispuniti u praksi, pa se svi odbirci moraju

    predstaviti preko konanog broja bita, kojim je definisan i brojkvantizacionih nivoa, ije vrijednosti mora poprimiti odbirak signala.Dakle, ukoliko je vrijednost odbirka u oblasti izmedju dvakvantizaciona nivoa, on e poprmiti vrijednost bliega. Ovo znai dase originalna vrijednost signala promijenila, to moe biti shvaenokao uticaj uma, koji se naziva um kvantizacije. Ukoliko se signal

    predstavlja sa n bita u digitalnom obliku onda e on imati 2n

    kvantizacionih nivoa. Radi ilustracije navedimo primjere 8 bitnog i 16bitnog signala; prvi je predstavljen sa 256, a drugi sa 65536

    kvantizacionih nivoa, odnosno moguih vrijednosti.

    Iz ove kratke analize jasno je da digitalni predstavljenj ima odredjenenedostatke. To je razlog da navedemo prednosti i mane digitalnog

    predstavljanja signala.

    Prednosti:

    Univerzalnost prezentacije

    Robustnost na umoveSkladitenje razliitih tipova informacija na istom uredjajuPrenos raznih tipova informacija preko istog kanalaObrada i manipulacije raznih signala kompjuterskim programima

    Manje vie sve navedene prednosti su oigledne, osim ove koja seodnosi na robustnost na umove. Naime, kod digitalnog signala 0 ili 1zapravo znae visok naponski nivo (esto 5V) i nizak naposnki nivo(esto 0V). Najee se kao prag izmedju 0 i 1 uzima polovinaraspona od napona logike nule do napona logike jedinice (unavedenim sluajevima 2,5V). Digitalni signal je prilikom prenosatakodje izloe uticaju uma, ali oigledno je da ovaj uticaj nemaefekta dokle god njime nije toliko promijenjena vrijednost napona dasa nivoa logike jedinice predje na nivo logike nule i obratno.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    5/29

    Nedostaci

    umovi kvantizacijeAliasingPotreba za velikim kapicitetom medija za skladitenjePotreba za kompresijama

    Pored navedenih klasifikacija multimedijalnih informacija,interesantno je i dati podjelu s aspekta interaktivnosti. U tom sluaju

    postoje dva tipa sistema:

    -Pasivni ili linerani kod koga korisnik nema kontrolu nadinformacijom (TV program, Film, Emitovanje)

    -Interaktivni ili nelinearni kod koga korisnik ima kontrolu nadformom prezentacije, brzinom i vremenu.

    U svim navedenim podjelama ne treba zaboraviti da Mutlimedijalnisistem mora biti kompjuterom kontrolisan sistem, odnosnokompjuter mora biti ukljuen makar za prezentaciju infromacije.

    Na samom poetku smo rekli da multimediji u sebi ukljuuju viedisciplina, zato je vano i napraviti neki sistematski pristup ovojoblasti kroz razliite podoblasti koje sainjavaju odredjenu logikucjelinu i omoguavaju laki pristup u prouavanju ove kompeksneoblasti. Svakako da u prvu grupu podoblasti treba svrstati izuavanjesljedeih tipova informacija: Audio, Video, animacije, Grafika i slika.Kroz izuavanje ovih informacija stalno se proimaju algoritmi zakompresije podataka i kompjuterske arhitekture za njihovu brzuobradu.Druga grupa podoblasti bi bila sainjena od: Optikih medija zasmjetanje podataka, Quality of service, Mrea, Komunikacija,

    Programiranja, ...Trea grupa: Analiza sadraja, Zatita sistema, Sinhronizacije,Grupne komunikacije,...etvrta grupa je vezana za korisnike i predstavlja razne aplikacijekojim se neemo baviti tokom ovog kursa.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    6/29

    Primijetimo da su telekomunikacione mree i prenos signala veomavani u multimedijima. Razlog za ovo je priroda multimedijalnih

    podataka, sa sluajevima periodinog, slabo periodinog iaperiodinog toka podataka.Takodje kao rezultat kompresije moe da se javi variranje koliine

    podataka u datom paketu

    Primjeri multimedijalnih podataka

    Neki prosti primjeri dobro poznatih podataka i njihova zahtijevnostprilikom prenosa ili skladitenja bie ovdje prezentirani.Tekst

    Neformatirani tekst 1 byte/karakteruFormatirani tekst (vie fontova, veliina) 2 byte/karakteruJedan primjer za formatirani tekst

    64 linije/strani80 karaktera/ liniji80x64x2x8=84 Kb

    prenos preko modema 14.4K traje 5.7s

    Kolor slika

    Dimenzija 1024x768 piksela (slika je sainjena od piksela)RGB 8 bita/boji, 24 bita/pikselu

    1024x768x24=18.8 MbPreko modema:14.4 kb/s potrebno 21 min28.8 kb/s potrebno 10 min

    Primjer prenosa glasa preko telefona

    8KHz potrebno je 8000x8bita= 64 Kb/s

    Primjer prenosa video signala640x480x24=27.7 MB/s (true color)640x480 rezolucija slike (frame-a)

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    7/29

    Osnovne transformacije

    Predstavljanje signala (bilo jednodimenzionih audio, dvodimenzionihslika i trodimenzionog video signala) u transformacionim domenimaigra krucijalnu ulogu u raznim obradama, kao na primjerkompresijama i filtriranjima. Od posebne vanosti je Fourierovatransformacija, koja ini osnovu i za niz drugih transformacijadefinisanih u obradi signala. Ukaimo na potrebu i znaaj Fourierovetransformacije preko jednog jednostavnog primjera. Naime,

    posmatrajmo jedan sinusoidalni signal.

    Slika 1.1 Predstavljanje signala: a) vremenski domen b) frekventni domen

    Vidimo da je ovaj signal u potunosti definisan frekvencijom iamplitudom. Ova dva parametra se mogu dobiti preko Fourierovetransformacije signala. Dakle, prikaz ovog signala u frekventnomdomenu je dat na Slici 1.1b.Posmatrajmo sada signal oblika prikazanog na Slici 1.2. U ovomsluaju je oiglednija efikasnost predstavljanja u frekventnomdomenu.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    8/29

    Slika 1.2 Prikaz sloenog signala a) vremenski domen b) frekventni domen

    Iz frekventnog prikaza je jasno da je signal zapravo sastavljen oddvije sinusoide razliite frekvencije i amplitude.Signal naroito biva neitljiv ako je zahvaen umom u

    vremenskom domenu, Slika 1.3a. Prelazei u frekventni domen,Sloika 1.3b, vidimo svu prednost ovakvog predstavljanja signala.

    Prethodni prikaz signala u frekventnom domenu moe biti ostvarenpreko Fourierove transformacije. Na Slici 1.1a sinusoida jepredstavljena preko dva pika u frekventnom domenu. Razlog za to semoe nai u samoj prirodi Foureirove transformacije, kod koje se usluaju realnih signala javljaju i negativne frekvencije koje nemajufiziki smisao. To je razlog da se prije obrade signal transformie unjegovu analitiku formu ili da se koriste transfromacije poputdiskretne kosinusne.Fourierova transformacija signalaf(t)je definisana sa:

    ( ) ( ) j tF f t e dt

    = Obzirom da se u Multimedijima bavimo diskretnim signalima, to jeneophodno definisati diskretnu Fourierovu transformaciju:

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    9/29

    21

    0

    ( ) ( )N j nk

    N

    n

    DTF k f n e

    =

    =

    Iz definicije je lako izvesti da je Fourierova transformacija diskretnih

    signala, periodina po frekvenciji sa periodom 2. Da biizraunavanje Fourierove transformacije bilo efikasnije (krae)razvijeni su algoritmi za njeno brzo raunanje. Osnovni algoritam jetzv. FFT algoritam (Fast Fourier Transform).Dobijanje signala iz njegove Fourierove transformacije se vri prekoinverzne Fourierove transformacije:

    1( ) ( )

    2

    j tf t F e d

    =

    U diskretnom domenu inverzna Fourierova transformacija je data sa:21

    0

    1( ) ( )

    N j nkN

    k

    f n DFT k eN

    =

    =

    Radi sticanja rutine pri radu sa Fourierovom transformacijom daemoprimjer predstavljanja jednostavnog signala u frekvencijskom domenukorienjem programskog jezika Matlab.

    Prikazati signal sin(150 ) ( 1,1)y t za t= u Fourierovom domenu.Uzeti korak odabiranja T=1/1000. t=-1:1/1000:1;y=sin(150*pi*t);F=fft(y);F=fftshift(F);plot(abs(F))

    Naredba fft je koriena za raunanje Fourierove transformacije, a

    fftshift da bi negativne frekvencije prilikom prikaza bile

    pozicionirane sa lijeve strane nulte frekvencije koja predstavlja

    srednju taku niza (algoritam FFT rauna Fourierovu transformacijutako to negativne frekvencije pozicionira od srednje take na desno,

    to nije prirodan nain prikaza negativnog i pozitivnog dijela ose.

    Primjetimo da je maksimalna frekvencija definisana korakom

    odabiranja i iznosi fmax=1/(2T)=500Hz, dok se frekvencija signala f

    dobija 2 150 75ft t f Hz = = , to zadovoljava uslov ffmax.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    10/29

    Filtriranje u Fourierovom domenu

    Pored toga to omoguava efikasno predstavljanje signala, frekventnidomen je veoma pogodan za filtriranja signala. Jednostavna filtriranja

    u frekventnom domenu se mogu obaviti pomou filtara:niskopropusnika, visokopropusnik i prpusnika opsega.Navedeni filtri imaju sljedee oblike:Filtar niskopropusnik

    1( )

    0

    gzaH

    za ostalo

    =

    Propusnik opsega1

    ( )0

    d gzaH

    za ostalo

    <

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    11/29

    %duina signala je 44000 odbiraka,a maksimalna frekvecnija11025Hz

    F=fft(y);F=fftshift(F);H=[zeros(1,x/2-2200) ones(1,4400) zeros(1,x-2200)];

    %Vidimo da su pozitivne frekvencije od 22000-tog do 44000-togodbirka. Dakle 22000 odbiraka predstavlja 11025 Hz odnosno 2200

    odbiraka predstavlja 1102,5Hz. Isto vai i za negativne frekvencije.

    Dakle 4400 odbiraka sa jedne centrrianih oko nulte frekvencije

    (sredina taka vektora F) predstavljaju frekvencije ispod 1102,5 Hz.

    Ffilt=F.*H;

    Ffilt=fftshift(Ffilt);yfilt=ifft(Ffilt);soundsc(real(yfilt),x)

    Naredba soundsc se koristi za reprodukciju filtriranog signala preko

    zvunika. Ukoliko se u ovoj naedbi zaboravi x, onda e reprodukcija

    biti vrena po difoltnoj vrijednosti 8184 i dobie se u ovom sluaju

    neprirodan zvuk, odnosno jako usporen jer je brzina reprodukcije

    podeena za frekvenciju odabiranje 8184, to znaida e toliki broj

    odbiraka u sekundi biti poslat na zvunik.

    2. DIGITALNI AUDIO

    2.1 Priroda zvukaZvuk je posljedica vibracije materijala. Ove vibracije izazivajutalasne fluktuacije oko materijala koji vibrira. Zvuk se dosta lako

    prenosi kroz gasove jer su oni zapravo najvee energetsko stanjematerije, to je i razlog velike pokretljivosti gasova u odnosu na

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    12/29

    tenosti. Brzina zvuka iznosi 344 m/s (na temperaturi od 20 stepeniCelzijusa)Vana karakteristika zvunog talasa je frekvencija.U multimedijalnim aplikacijama posebna panja se posveuje govorui muzici, njihovim karakteristikama, prenosu i reprodukciji.Zvuk koji ima prepoznatljivu periodinost je karakterisan kao muzikisignal.Veoma vano je znati frekvecijske spektre muzike i govora. Naimefrekvencijski spektar muzike je od 20 Hz do 20 kHz, dok je kodgovora od 50 Hz do 10 kHz. Medjutim, najznaajnije komponentegovornog signala se nalaze izmedju 700 Hz i 6600Hz.Posmatrajmo ta utie na percepciju zvuka kod ovjekovog slunogsistema. Zapazimo da do slunog sistema stiu dva tipa talasa: direktnii reflektovani. Na osnovu odnosa direktnih i reflektovanih talasa

    stvaramo predstavu o distanci sa koje se emituje zvuk. Kanjenjareflektovanih talasa nam daju informaciju o geometriji prostorije ukojoj se emituje zvuk.

    Slika 1.1 Primjer prostiranja zvuka unutar zatvorene prostorije

    Obzirom da je na sluni sistem stereo, na osnovu kanjenja direktnogtalasa detektovanog izmedju lijevog i desnog uha, stvaramo predstavuo poziciji izvora zvuka unutar neke prostorije.Vremensko kanjenje od jednog do drugog uha iznosi oko 0.7 ms.Interesantno je zapaziti da ako neki zvuni signal zakasnimo sa jednogod zvunika za 15-tak ms, ak i u sluaju iste amplitude imaemo

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    13/29

    utisak de je slabija amplituda zvuka sa strane zvunika kod koga jeizazvano kanjenje, te da utisak moemo promijeniti ako poveavamoamplitudu. Ukoliko kanjenje predje 50 ms ue se dva razliitazvuka.Veoma vana veliina, kada se govor o zvuku je nivo zvunog pritiskaSPL (Sound Preasure Level). Ova veliina govori koliki je odnoszvunog pritiska u odnosu na refrentni nivo zvunog pritiska Po=20Pa, koji je zapravo prag ujnosti, odnosno najmanji nivo zvunog

    pritiska koji se moe registrovati naim slunim sistemom ubeumnojokolini. Nivo zvunog pritiska se dobija iz:

    0

    20 log [ ]P

    SPL dBP

    =

    Nezaobilazna u audio tehnici je familija krivih koja definiefrekvencijsku zavisnost osjetljivosti, u funkciji razliitih zvunih

    prirtisaka. Ovo je tzv. Fletcherova kriva i data je na Slici 1.2

    Slika 2.2 Fletcherova kriva

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    14/29

    2.2 Razvoj sistema za smjetanja ireprodukciju audio zapisa

    Prvi zapis i reprodukcija audio signala je uradjena 1877 godine

    (Edisonov phonograph). Prvi gramofon potie iz 1893 godine, dok je1925. godine poela relizacija elektrinih sistema koji zamjenjujumehanike. Emitovanje AM audio signala poinje 1930. godine. Od1948. godine u upotrebi je LP sistem sa vremenom reprodukcije odoko 25 minuta. Kada se uporede navedeni rezultati moe se doi dozakljuka da je ve i do tada postojao znaajan napredak u audioindustriji. Naime prvi gramofoni su imali vrijeme reprodukcije od oko2 minuta sa 78 obrtaja u minuti, sa frekvencijskim opsegom 200Hz-3kHz i dinamikim opsegom od 18 dB, dok su ovi posljedni imali

    frekvencijski opseg 30Hz -15 kHz i dinamiki opseg od 65 dB.Napori da se poboljaju performanse audio uredjaja doveli su dokorienja kasetofona i traka za kasetofone tokom 60 tih i 70 tihgodina.

    Razvoj kompakt diska poinje 70 tih godina prolog vijeka, kada jeintenzivno radjeno na razvoju optikog video diska. Tako 1977.godine Mitsubishi, Sony i Hitachi demonstriraju njihov digitalni audiodisk DAD. Ovaj disk je bio dimenzija kao LP ploa, odnosno 30 cm

    prenika. Philips i Sony nastavljaju da rade zajedno na ovom sistemu ikao rezultat toga proizveden je disk prenika 12 cm, kapaciteta 74minuta (to je jednako trajanju devete Beethoven-ove simfonije).

    Uporedo sa razvojem digitalnih audio uredjaja rasla je potreba i zarazvojem sistema za emitovanje digitalnih audio signala (DigitalAudio Broadcasing DAB). Tako je 1987 godine poeo Evropski

    projekat Eureka 147 u okviru kojeg ja poeo rad na razvoju DAB.irina opsega je 1.54 MHz, signal je kodiran standardom MPEG layer

    II i ukljuuje mogunosti frekvencija odabiranja od 48 kHz i 24 kHz.Broj frekvencijskih blokova za opseg 87-108 MHz je 12, dok je zaVHF (174-240 MHz) predvidjeno 38 blokova, a za L opseg (1.452-1.492 GHz) predvidjena su 23 bloka.Blok ema DAB sistema je data na slici 1.3.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    15/29

    Slika 2.3 Blok ema DAB sistema

    Pored pomenutih medija tokom ovog kursa emo se upoznati i saMini diskom, SACD diskom (Super Audio CD) kao i DVD audiodiskom.

    2.3 Uticaj odabiranja i kvantizacije na kvalitet audiosignala

    Ve smo pomenuli da je odabiranje prvi korak u dobijanju digitalnogsignala iz analognog. Prisjetimo se da diskretizacija u vremenskomdomenu izaziva periodino produenje u frekvencijskom. Ukoliko jediskretizacija izvrena po toeremi o odabiranju onda se, teorijski,osnovna komponenta spektra nee preklapati sa periodino

    produenim. Medjutim, ukoliko je korak odabiranja vei onda dolazido preklapanja odnosno aliasinga.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    16/29

    Slika 2.4 Ilustracija efekta aliasinga

    Sasvim je oigledno da se izdvajanje osnovnog spektra signala odperiodino produenih komponenti mora obaviti pomou filtra. Zaovu svrhu treba upotrijebiti veoma strm antialiasing filtar (fuunkciaj

    prenosa data na slici 1.5), koji je veoma skup.

    Slika 2.5 Primjer funkcija prenosa filtra sa strmim prelazom

    U velikom broju realnih aplikacija potrebno je dobiti eljeni rezultatsa ekonominijim varijantama antialiasing filtara. Tada je neophodno

    izvriti odabiranje sa manjim korakom od onog koji je definisanteoremom o odabiranju. Tako na primjer kod CD-a vrimo odabiranjesa 44100 Hz iako je maksimalna frekvencija signala koji elimoreprodukovati 20 kHz.Odabiranje signala moe se izvriti sa kolom datim na slici:

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    17/29

    Slika 2.6 Kolo za odabiranje

    Vidimo da je upotrijebljen jedan FET tranzistor, kao prekidakielement i njime se upravlja preko signala Fs kojim je definisanafrekvencija odabiranja. Jedinini pojaava realizovan prekooprecionog pojaavaa obezbjedjuje veliku otpornost, a time i velikuvremensku konstantu pranjenja kondenzatora C. Dakle napon nakondenzatoru se nee mijenjati izmedju dva upravljaka impulsa Fs.

    Nakon odabiranja potrebno je izvriti kvantizaciju. Brojkvantizacionih nivoa je ogranien, a sami signal moe imati

    beskonano razliitih vrijednosti, to uzrokuje da signal nakonkvantizacije moe zadovoljiti samo odredjen stepen tanosti koji jedefinisan brojem kvantizacionih nivoa. Drugim rijeima

    kvantizacijom se unosi odredjeni um, nazvan kvantizacioni um.Veoma korisno je izvesti relaciju koja e dati vezu odnosa signal umS/N i broja bita kojim je uslovljen broj kvantizacionih nivoa.Posmatrajmo kvantizacionu greku za dati bit n ilistrovanu na slici.

    Slika 2.6 Vjerovatnoa greke kvantizacije

    Oznaimo sa N broj intervala kod n bitnog sistema tj. N=2n. Ako jeamplituda signala V tada je kvantizacioni interval dat sa

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    18/29

    Q=V/(N-1) Kako je kvantizacioni um distribuiran ravnomjernoizmedju Q/2 (-Q/2

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    19/29

    Kada smo do sada govorili o kvantizaciji podrazumijevali smolinearnu kvantizaciju kod koje su intervali Q identini, medjutim akoto nije sluaj onda se govori o nelinearnoj kvantizaciji. U tom sluajuse kvantizacioni nivoi podeavaju prema amplitudi ulaznog signala.Signal male amplitude e imati manje kvantizacione intervale iobratno. Formula koja se koristi kod nelinearne kvantizacije je tzv. A-

    pravilo koje je dualno sa -pravilom u analognom domenu. A-praviloje opisano sljedeom formulom:

    /1 log 0 /( )

    log( / ) /1 log /

    Ax A za x V aF x

    V V Ax V A za V a x V

    + <

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    20/29

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    21/29

    Slika 2.9 S/N za signale predstavljene eksponentom i mantisom

    Treba primijetiti da iako je dinamiki opseg ovog sistema isti kao kod11 bitnog sistema odnos signal um je izmedju 42 i 48 dB odnosnonjegova maksimalna vrijednost je definisana mantisom.

    Blok floating point konvezija

    Ovo je specijalan sluaj floating point konverzije, kod koga nije svaki

    odbirak skaliran eksponentom, ve je to uradjeno nad odredjenimblokom odbiraka. Na ovaj nain je omoguena prilina uteda uprotoku podataka. Ova tehnika se esto naziva i kodiranje bliskihtrenutnih vrijednosti.

    Diferencijalna impuslno kodna modulacija (PCM)

    Kod dosadanjih konverzija posmatrali smo svaki odbirak posebno ipripremali ga za prenos. Diferencijalna impulsno kodna modulacija,medjutim, razmatra mogunosti prenosa razlike medju susjednimodbircima.Ova modulacija je jedan vid prediktivnog kodiranja kod koga je

    predikcija za tekui odbirak obavljena na osnovu vrijednostiprethodnog. Vano je naglasiti da je ovaj vid kodiranja veomaefikasan za sluajeve kada je odabiranje izvreno sa veoma malim

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    22/29

    korakom odabiranja, odnosno kada imamo veliki broj odbiraka, jer suu tom sluaju razlike izmedju susjednih odbiraka veoma male i mogu

    biti reda promjene za 1 bit. Za ovaj vid konverzije koriste se sigmadelta konvertori.Obzirom da je serijski tok bita nepraktian, uvijek se koristi digitalnifiltar (decimation filter) kojim se konvertuje serijski tok u multi bitformat (u sluaju CD sistema 16 bitni). Jednobitni A/D konvertor dat

    je na Slici 1.10.

    Slika 2.10 Jednobitni A/D Konvertor

    Super bit mapiranje

    Kod CD tehnologije koriste se 16 bita za kodiranje audio signala.Medjutim, u profesionalnim audio studijim koristi se kodiranje do 20

    bita. Obzirom da 20 bitni signal treba smjestiti na 16 bitni medij,koristi se super bit mapiranje, kod koga se etiri bita koriste za

    poveavanje tanosti bita najmanje teine, pri emu omoguavajusmanjenje uticaja uma i time poveanje kvaliteta zvuka.

    DSD (Direct Stream Digital)

    Koristi jednobitnu konverziju tj. sigma delta konvertore uz veomavisoku frekvenciju od 2,8224 MHz. Ovaj format omoguavareprodukovanje zvuka do granice od 100 kHz. Postavlja se pitanje ta

    znai ova granica od 100 kHz, ako smo konstatovali da je maksimalnafrekvencija audio signala (koji na sluni sistem registruje) do 20kHz.Maksimalna frekvencija od 20kHz uglavnom zadovoljava veliki brojzahtjeva, ali u profesionalnoj audio industriji ti zahtjevi stalno rastu.

    Naime, neki vii harmonici muzikih instrumenata koji se nalaze vanopsega od 20 kHz imaju uticaj na originalne zvuke unutar ovog

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    23/29

    opsega. Da bi bili sposobni da reprodukujemo i ovaj uticaj razvijamosisteme sa boljim performansama.

    Poredjenjem CD i DSD obrade uoavamo:Prva ima 16 bitnu a druga 1-bitnu konverziju, frekvencija odabiranja

    prvog je 44,1 kHz a drugog 2.8224 MHz. Kod DSD je znatnosmanjena potreba za preciznim D/A konvertorima, digitalnimfilterima i interpolacijiom.Medutim, treba napomenuti da za 74 minuta audio zapisa CD treba650 MB memorijskog prostora, dok DSD za istu minutau zahtijeva3.5 GB.

    Na Slici 1.11 su ilustrovani sistemi za snimanje i reprodukcijupodataka.

    Slika 2.11 Sistem za snimanje i reprodukciju

    2.4 Govorni signalSistem za obrazovanje govornog signala se moe iliustrovati kao naSlici 1.12. Sa slike se vidi da plua inicijalizuju kretanje vazduha pod

    pritiskom preko dunika i grkljanj u usnu upljinu. Na usnama seformira longitudinalni talas koji se dalje prostire kroz vazduh.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    24/29

    Slika 2.12 Ilustracija sistema za obrazovanje govornog signala

    Primijetimo da se prolaskom kroz grkljan, preko glasnih ica vrimodulacija vazdune struje. Dakle, glasne ice generiu talase koji sedalje oblikuju prolazei kroz usnu i nosnu upljinu.

    Posmatrani sistem za stvranje glasa moe se posmatrati preko dvapodsistema koji se nazivaju glotalni i vokalni trakt. U glotalnomtraktu (koji predstavlja dio sistema do ulaza u drijelo) se generiutalasi pod uticajem glasnih ica, dok vokalni trakt funcionie kao skuprezonatora i filtara, koji taj talas moduliu i oblikuju stvarajui

    odredjene glasove.

    Obzirom da glasove moemo podijeliti na samoglasnike i suglasnike,vano je opisati kako navedeni sistem proizvodi jedne i druge. Kodsamoglasnika glasne ice osciluju proizvodee kavziperiodineimpulse koji se dalje oblikuju u vokalnom traktu, gdje usna upljinadjeluje kao rezonator, tako to pojedine frekvencije slabi, a druge

    pojaava. Kod spektra samoglasnika mogu se uoiti pojediniharmonici koji dominiraju u odnose na ostale. Takvi harmonici senazivaju formantima. Formanti zapravo predstavljaju rezonantneuestanosti vokalnog trakta. U analizama govornog signala se

    posmatraju etiri formanta, od kojih prva dva imaju poseban znaaj.Frekvencijska oblast najaih formanata za samoglasnikA je od 700 do1000Hz, za samoglasnik I 200-400 i 2200-3200 Hz, dok je za O 400do 800 Hz.Suglasnike moemo podijeliti na bezzvune i zune.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    25/29

    Kod zvunih suglasnika glasne ice proizvode um, koji se daljemodulie u vokalnom traktu. Iako je spektar uma kontinualan i ovdjese mogu uoiti djelovi spektra koji predstavljaju formante. Bezvunisuglasnici nastaju samo u usnoj upljini, kada glasne ice nisu aktivne.Poto je formant veoma vana karakteristika glasa bitno je definisatineke njegove najznaajnije parametre. Frekvencija formanta jemaksimalna frekvencija unutar frekvencijske oblasti pokrivenojformantom. irina formanta je rastojanje izmedju taaka u kojma jemaksimalna vrijednost smanjena za 3 dB. Sasvim je jasno da jespektar fonema razliit za razliite govornike.Imajui u vidu prirodu sistema za obrazovanje govora jasno se uoavada govorni signal moe imati beskonano razliitih vrijednosti,odnosno moe se mijenjati kontinulano. Iako je to tako, sa perceptivetake gledita razlikuje se konaan broj razliitih glasova koje je

    mogue proizvesti prethodno opisanim sistemom. Ta konanost jeuslovljena ogranienim skupom smislenih informacija sadranih ugovornim signalima. Na ovaj nain posmatraju se samo funkcionalne

    jednice koje odgovaraju naem govoru, a koje se nazivaju fonemi.Primijetimo da se jedan isti fonem moe predstaviti u razliitimvarijantama, koje nemaju uticaja na njegovo znaenje. Drugaijereeno jaina glasa, boja itd nee uticati na razumijevanje fonema inee promijeniti njegovu funkcionalnu vrijednost.Imajui u vidu prethodna razmatranje moemo modelirati sistem zaobrazovanje govora.

    Slika 2.13 Model sistrema za obrazovanje govora

    Prenosne funcije glotalnog i vokalnog trakta, kao i funkcija prenosausana, oznaene su sa G(z), V(z) i L(z). Sa e(n) je oznaen ulazni

    ekscitacioni signal, koji se moe modelovati povorkom dirakovihimpulsa ili Gausovim umom (zavisno od sluaja samoglasnika ilisuglasnika). Imajui u vidu sliku moemo pisati:

    )()()()()( zLzVzGzEzS =

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    26/29

    Ako uvedemo:

    )()()(

    1)(

    zLzVzGzA =

    imamo:

    )()()( zSzAzE =

    Uzimajui funkciju filtra u obliku:

    dobijamo tzv.autoregresioni model

    reda p:

    =

    =+p

    ii neinsans

    1

    )()()(

    Obzirom da je pokazano da na svakih 700 Hz treba uzeti po jedan parpolova,moemo zakljuiti da e u opsegu do 3400 Hz trebati p=10.Posmatrajmo sada uticaj glotalnog trakta i usana, koji su od posebnogznaaja u sluaju pobude umom.Glotalni trakt se moe modelovati karakteristikom:

    21)1(

    1)(

    =

    qzzHg

    tj. karakteristikom sa padom od 12 dB/oct. q 1.Uticaj zraenja sa usana se aproksimira sa:

    11)( = zzL

    Imajui u vidu:)1()()()1()( 1

    ' == nununuznu gggg

    dobija se:

    )()()()()()('''' nuzVnsnuzVns gg ==

    Uzimajui da je:

    1 1

    ( ) 1p

    i

    iA z a z

    =

    = +

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    27/29

    =

    +

    ==p

    i

    ii

    pza

    zAzV

    1

    1

    1

    )(

    1)(

    dobija se autoregresioni model za pobudu tipa Gausovog bijeloguma:

    =

    =+=p

    igip nuinsanszAns

    1

    ''''')()()()()(

    2.4 Psihoakustiki efekti

    Ve ranije smo napomenuli da uho nije podjednako osjetljivo narazliite frekvencije. Funkcija osjetljivosti izvedena jeeksperimentalno i izgleda:

    dBf

    ef

    fTf 43)3.31000/(6.08.0

    )1000(105.6)

    1000(64.3)(

    2 +=

    Oblik ove funkcije je ve ranije prikazan.Izvrimo sada analizu ovjekovog slunog sistema. On je sastavljenod spoljanjeg uha (una koljka), srednjeg uha i unutranjeg uha,Slika 2.14. Na sluni sistem do unutranjeg uha predstavljakombinaciju roga i otvorene cijevi.

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    28/29

    Slika 2.14 Ilustracija ovjekovog slunog sistema

    Zvuni talasi se prikupljaju unom koljkom i prosljedjuju prekoslunog kanala ka bubnoj opni. U unutranjem uhu se nalazi Hortijevorgan koji se sastoji od niza vlakana razliite duine i razliiterezonantne uestanosti. Ova vlakna su vezana za nerv preko kojeg seinformacija o zvunom nadraaju prenosi do mozga. Pod uticajemzvunog talasa vlakna osciluju, ali obzirom na razliitu rezonantnuuestanost informaciju e prenosti vlakna koja najintenzivnije

    osciluju. Sluni sistem radi praktino kao banka filtara, i to je razlogto smo u stanju da ujemo vie razliitih zvukova odjednom, a panju

    posveujemo odredjenom zvuku tek nakon obrade u dijelu mozgazaduenom za to.

    Maskiranje

    Ve smo napomenuli da postoji prag ispod kojeg nismo u stanju daujemo zvuni signal, Slika 2.15. Interesantno je naglasiti da pojedini

    tonovi jaeg inteneziteta utiu da susjedne nieg intenziteta slabijeujemo. Ova pojava se naziva audio maskiranje. Dakle, ukoliko jepoznat uticaj pojedinih frekvencija odnosno ako je poznata vrijednostpraga ispod kojeg su susjedne frekvencije neaudibilne, mogue je svefrekvencije ispod tog praga zanemariti u svim analizama (bez uticajana kvalitet obradjenog zvunog signala). Ova osobina je veoma

  • 7/30/2019 Multimedijalni Sistemi Crna Gora

    29/29

    znaajna u nizu aplikacija, posebno u kompresijama o kojima e bitirijei kasnije.

    Slika 2.16 Audio maskiranje

    Vano je takodje napomenuti da postoje pojedini opsezi unutar kojihje nae uho podjednako osjetljivo. Ovi opsezi se nazivaju kritinimopsezima. Osjetljivost se dakle razlikuje od jednog do drugogkritinog opsega, kojih ima 24. Napomenimo da irina kritinihopsega varira od 100-nak Hz na niim do nekoliko kHz na viimfrekvencijama.Ilustracija maskiranja unutar jednog opsega data je na Slici 1.16.