Mpeg Norme

OPĆENITO O KOMPRESIJI Svaki programski materijal (audio i videosignal) je na neki način ograničene kvalitete, što zbog samog nastanka, što zbog prijenosnog kanala kojim taj signal mora proći. U slučaju analognog signala, ograničenja predstavljaju širina pojasa i odnos signal-šum; kod digitalnog signala ograničenja proizlaze iz frekvencije uzorkovanja i broja bita po uzorku signala, tj. iz njihovog umnoška (brzine prijenosa). Zbog svih tih ograničenja pribjegava se kompresiji signala kao tehnici koja omogućava da kvaliteta signala poslanog kroz kanal ili snimljenog npr. na magnetsku vrpcu bude veća nego što taj kanal sam po sebi omogućava bez kompresije. Na odašiljačkoj strani se signal komprimira prije slanja kroz kanal, dok se na prijemnoj strani taj komprimirani signal mora vratiti u izvorno stanje postupkom dekompresije (slika 1.).

Slika 1. Prijenosni sustav

Pojam kompresije može imati dvojako značenje: u analognoj tehnici može značiti i namjerno smanjivanje dinamičkog opsega signala, bez naknadnog vraćanja u izvorno stanje (npr. radio-prijenosi).U daljnjem razmatranju, takav oblik kompresije neće se razmatrati, već će biti riječ isključivo o digitalnim sustavima kompresije i dekompresije, koji na odašiljačkoj strani smanjuju potrebnu brzinu prijenosa signala, i koji na prijemnoj strani vraćaju komprimirani signal u izvorno stanje.Odnos između brzine prijenosa izvornog signala i brzine prijenosa komprimiranog signala naziva se stupanj kompresije.

PRIMJENE KOMPRESIJE Uz neku zadanu kvalitetu signala, primjenom kompresije postižu se manje brzine prijenosa (redukcija brzine prijenosa, BRR = bit-rate reduction).

U radiodifuziji, manja brzina prijenosa znači manju širinu kanala, manju potrebnu snagu odašiljača ili oboje, što donosi uštedu. Uz sve veću zauzetost frekvencijskog spektra, daljnje povećanje broja raznovrsnih usluga nije moguće bez primjene nekog oblika kompresije signala. S druge strane, na primjer, u kabelskim distribucijskim sustavima sniženje brzine prijenosa snižava cijenu sustava.Pri snimanju signala, upotreba kompresije smanjuje potrebni kapacitet medija za pohranu, direktno proporcionalno omjeru kompresije. Za arhivske potrebe, to znatno smanjuje potreban prostor i cijenu same arhive. U elektroničkom novinarstvu (ENG = electronic news gathering), upotreba kompresije smanjuje veličinu i težinu uređaja za snimanje (npr. MiniDisc (audio); MiniDV, MicroMV... (video)). U serverima za video na zahtjev (VOD = video on demand) primjena kompresije omogućava ublažavanje mehaničkih zahtjeva na čvrste diskove, te manju potrebu za održavanjem.Iz svega do sada rečenog, može se zaključiti da je upotreba kompresije signala svuda prisutna, te da je gotovo nemoguće zamisliti suvremene suvremene digitalne sustave bez primjene barem nekog od sustava za kompresiju.

RAZLOZI ZA PRIMJENU KOMPRESIJE Da bi se stekao dojam zbog čega je nužno koristiti kompresiju digitalnog videosignala, potrebno je reći nekoliko riječi o postupku analogno-digitalne pretvorbe videosignala. Frekvencije uzorkovanja za komponente videosignala definirane su ITU-R preporukom BT.601 i iznose 13,5 MHz za sustav s omjerom stranica 4:3, odnosno 18 MHz za sustav s omjerom stranica 16:9.Ove frekvencije se primjenjuju i na sustav 625/50 i na sustav 525/60. Najčešće korištene strukture uzorkovanja prikazane su na slici 2.Horizontalni redovi na slici predstavljaju linijsku strukturu slike.

Slika 2. Strukture uzorkovanja videosignala

Osim struktura prikazanih na slici, postoji i struktura 4:4:4, koja se koristi za uzorkovanje komponentnog videosignala, pri čemu se uzorkuju R, G i B komponente, a ne signal luminancije i signali razlika boja. Primjenjuje se kvantizacija sa 8 ili 10 bitova po uzorku.Uz najčešće korištenu strukturu uzorkovanja 4:2:2 dobivaju se slijedeće brzine prijenosa (brzina prijenosa = broj bitova po uzorku × frekvencija uzorkovanja):

uz 8 bitova po uzorku: 216 Mbit/s;uz 10 bitova po uzorku: 270 Mbit/s.

Ovako velike brzine veoma je teško prenositi standardnim prijenosnim kanalima, a osim toga, za pohranu nekomprimiranog videosignala bili bi potrebni ogromni kapaciteti medija. Stoga je kompresija neophodna u gotovo svim područjima primjene digitalnog videosignala.

OSNOVE POSTUPAKA KOMPRESIJE

OPĆENITI PRINCIP KOMPRESIJE Kako se provodi kompresija? Za odgovor na to pitanje potrebno je znati da su u svim konvencionalnim digitalnim sustavima ograničeni i broj bitova po uzorku, kao i brzina prijenosa. Brzina prijenosa ograničava količinu podataka koja se

može prenijeti u nekom vremenskom intervalu, no za većinu primjena, odnosno većinu programskog materijala, ta se granica ne dostiže.Prema Shannonovom teoremu, signal koji se ne mijenja, ne sadrži informaciju. Uzmimo za primjer sinusni valni oblik: svaki period signala jednak je slijedećem, dakle, sinusni signal ne nosi nikakvu informaciju zbog činjenice da nema širinu pojasa. U slučaju videosignala, prisutnost prepoznatljivih objekata u slici rezultira skupom elemenata slike sličnih karakteristika. Ti elementi slike daju kao rezultat frekvenciju signala koja je daleko ispod maksimalne koju je moguće prenijeti sustavom. Na primjer, u slučaju stacionarne slike, svaka slika je jednaka prethodnoj, tako da, u stvari, ne treba prenositi nove podatke jednom kad je prva slika već poslana. Cilj sustava za kompresiju jest prepoznati i odašiljati samo korisni, promjenjivi dio ulaznog signala. Taj korisni dio signala naziva se entropija. Preostali, nepromjenjivi dio ulaznog signala naziva se redundancija (slika 3.).

Slika 3. Entropija i redundancija

U principu, redundanciju nije uopće potrebno prenositi. Međutim, u realnim uvjetima prijenosa dio redundancije se prenosi kako bi se omogućila rekonstrukcija informacija koje su se izgubile u prijenosu, tj. signal je otporniji na smetnje ako redundancija ipak postoji. Slika 4. a) pokazuje slučaj idealne kompresije: ako koder pošalje svu entropiju, a u prijenosu ne dođe do gubitka, primljeni signal se ne može razlikovati od originala. Ukoliko dođe do bilo kakvih smetnji u prijenosu, dio informacije se gubi, i dekodirani signal će biti slabije kvalitete u odnosu na original. Druga stvar na koju treba obratiti pažnju jest stupanj kompresije. U slučaju prevelikog stupnja kompresije, dolazio do oštećenja entropije, jer je već sva redundancija u potpunosti uklonjena (slika 4. b)). Stoga se postavlja zahtjev da se stupanj kompresije mora prilagoditi sadržaju slike.

Slika 4. Problem odabira stupnja kompresije

Pošto je entropija funkcija ulaznog signala, potrebna brzina prijenosa u slučaju idealne kompresije će biti promjenjiva. Nije uvijek moguće imati prijenosni kanal promjenjive brzine prijenosa, tako da mnogi uređaji za kompresiju imaju memorijske spremnike na oba kraja lanca. To usrednjuje brzinu prijenosa, no uzrokuje i kašnjenja. Takva kašnjenja mogu biti neprihvatljiva u nekim slučajevima (npr. videokonferencije) pa se koristi kanal sa stalnom brzinom prijenosa, čime se izbjegava potreba za memorijskim spremnicima. Takav sustav ima manja kašnjenja signala.

IDEALNI I REALNI SUSTAV KOMPRESIJE Sve do sada, razmatranja su se zasnivala na idealnom koderu, koji je uvijek sposoban razlučiti entropiju od redundancije. Nažalost, takav koder nije moguć, jer bi bio beskonačno složen i imao bi beskonačno kašnjenje. Stoga smo u praksi prisiljeni posegnuti za realnim koderom, koji će uvijek odstupati od idealnog, bez obzira na primjenu. Ta činjenica znači da ćemo uvijek morati odabrati manji stupanj kompresije od idealnog (najvećeg mogućeg), jer koder nije u stanju točno razlikovati entropiju od redundancije. Slika 4. c) pokazuje slučaj realnog kodera: uz entropiju se prenosi još dio informacije koji može, ali i ne mora biti redundantan. Što je koder jednostavniji, taj dio informacije je veći. Dekoder, međutim, mora moći obraditi signal u bilo kojem slučaju. Zbog toga, sve odluke o načinu i stupnju kompresije donose se na razini kodera, a dekoder samo mora dekodirati primljeni signal što je bolje moguće. Takav sustav je dakle asimetričan: koder je najčešće složen, a dekoder je znatno jednostavniji. Iz svega do sada navedenog, može se zaključiti da je složenost kodera, za neku traženu kvalitetu, to veća što je zahtijevana brzina prijenosa manja. Zbog toga se u primjeni nalazi velik broj različitih kodera.

REDUNDANCIJE U VIDEOSIGNALU Osnovne vrste redundancije koje se pojavljuju u videosignalu su:

a) a) statistička redundancija:prostorna (unutar svake pojedine slike);vremenska (između slika);

b) b) subjektivna redundancija (vezana za svojstva ljudskog vizualnog

sustava).

NAČELA KOMPRESIJE VIDEOSIGNALA Kompresija videosignala zasniva se na uklanjanju redundancije iz toka podataka koji je potrebno poslati kroz kanal. Drugim riječima, iskorištavaju se dvije pretpostavke koje definiraju redundanciju u nekom videosignalu.

Prva pretpostavka odnosi se na svojstvo ljudskog vizualnog sustava da je osjetljivost na šum u slici ovisna o frekvenciji, tj. oko slabije zapaža sitne detalje (visoke frekvencije).Druga pretpostavka je da u nizu pokretnih slika uvijek postoji znatna sličnost između trenutne i slijedeće slike.

Slika 5. Ovisnost prostorne frekvencije o veličini objekta u slici

Slika 6. Osjetljivost oka na detalje

Iz slika 5. i 6. vidljivo je da se zbog karakteristika ljudskog oka mogu iz slike pri kompresiji ukloniti sitni detalji, budući da daju kao rezultat više frekvencije, koje oko manje zapaža. Kompresija u načelu radi tako da reducira broj bitova digitalne riječi. To dovodi do smanjenja rezolucije i povećanja šuma, tako da se postupak mora provoditi pazeći da šum ne postane vidljiv, tj. pazeći na prostornu frekvenciju (frekvenciju generiranu sadržajem slike). Videokoderi zbog toga moraju provoditi analizu frekvencija koje se pojavljuju u ulaznom signalu, te obrađivati svaku frekvenciju

posebno. Ako neke frekvencije u ulaznom signalu nema, neće biti prenesen nikakav podatak.Dekoder se izvodi kao potpuno inverzni sklop u odnosu na koder (slika 7.)

Slika 7. Kompresija i dekompresija (osnovno načelo)

Postupak prikazan na ovoj slici tretira svaku pojedinu sliku zasebno i naziva se kodiranje unutar slike (intra-frame coding). Na taj način rade sustavi za kompresiju mirnih slika npr. JPEG (Joint Photographic Experts Group). Pri kodiranju videosignala, osim kodiranja unutar slike, primjenjuje se i postupak kodiranja između slika (inter-frame coding), koji iskorištava vremensku redundanciju koja se pojavljuje između dviju slika u nizu. Na taj način mogu se postići veći stupnjevi kompresije. Slika 8. prikazuje jednostavan sustav za kodiranje između slika. Počevši sa slikom kodiranom postupkom kodiranja unutar slike, sve slijedeće slike opisane su samo razlikama o odnosu na trenutnu sliku. Dekoder zbraja razliku slika s trenutnom slikom i na taj način stvara slijedeću sliku. Slika koja predstavlja razliku dobiva se oduzimanjem vrijednosti elementa slike u jednoj slici i vrijednosti istog elementa slike u drugoj slici. Ta slika se može, kao i svaka druga slika, komprimirati postupkom kodiranja unutar slike. Postoje mnogi problemi koji sprečavaju ovakvu jednostavnu izvedbu. Na primjer, bilo koja pogreška koja se pojavi u toku prijenosa u samo jednoj slici, bit će vidljiva u svim slijedećim slikama (propagacija pogrešaka). Osim toga, nije moguće dekodirati signal ako se on ne prati od početka emitiranja, tj. nije moguće mijenjanje kanala. To sve dovodi do potrebe da se povremeno prenose i slike dobivene samo kodiranjem unutar slike (I-slike). Ovaj način prijenosa otežava i naknadnu obradu videosignala jer točke rezova moraju biti tako odabrane da svaki isječak počinje I-slikom.

Slika 8. Kodiranje između slika

Sustav kodiranja između slika nije pogodan za prijenos videosignala u kojem postoje velike razlike između pojedinih slika (npr. nagli pokreti) jer su razlike prevelike da bi ih se moglo učinkovito kodirati. To dovodi do potrebe za uvođenjem nadomještanja pokreta (motion compensation). Nadomještanje pokreta provodi se tako da se na strani kodera uspoređuju prethodna i trenutna slika, te se mjeri pomak područja slike za dobivanje vektora pomaka. Koder modelira objekt na novom položaju pomicanjem elemenata prethodne slike pomoću vektora pomaka. Odstupanja od stvarne situacije korigiraju se usporedbom modelirane i stvarne slike (slika 9.). Koder šalje vektore pomaka i signal razlike slika. Dekoder pomiče objekt iz prethodne slike pomoću vektora pomaka i dodaje signal razlike da bi dobio slijedeću sliku. Nadomještanje pokreta omogućava veći stupanj kompresije, uz veću složenost samog sustava.

Slika 9. Kodiranje s nadomještanjem pokreta

MPEG NORME

UVODNI POJMOVI

Prostorna i vremenska redundancija Kompresija videosignala zahtijeva postupak identifikacije redundancije u programskom materijalu koji se prenosi. Taj postupak obično se provodi u dva koraka:1. 1. pronalaženje i uklanjanje prostorne redundancije – vrši se unutar svake

pojedinačne slike, bez referenci na prethodne ili slijedeće slike;2. 2. vremenska redundancija pronalazi se i uklanja pomoću usporedbe

trenutne i prethodne slike.

Diskretna kosinusna transformacija Prostorna redundancija postoji u svim realnim programskim materijalima. Ako u slici postoji neki prepoznatljivi objekt, tada će svi elementi slike koji ga predstavljaju imati sličnu vrijednost amplitude. Veličina objekata u slici određuje prostornu frekvenciju koja će se pojaviti u signalu. U realnim situacijama prevladavaju niže frekvencije, a osim toga, u signalu se najčešće ne pojavljuje cijeli spektar frekvencija. Nužno je dakle provesti frekvencijsku analizu. U tu svrhu koristi se diskretna kosinusna transformacija (DCT = Discrete Cosine Transform) da bi se vrijednosti elemenata slike pretvorile u koeficijente koji se dalje lakše mogu podvrgnuti postupku kompresije. Izvorna slika najprije se dijeli u blokove veličine 8×8 elemenata slike. Na svaki blok se primjenjuje dvodimenzijska DCT koja daje 64 DCT koeficijenta:

16

)12(cos

16

)12(cos),(

4

)()(),(

7

0

7

0

vkujkjf

vCuCvuF

j k

,2

1)( uC

za u = 0, C(u) = 1, za u = 1, 2, ... , 7;

,2

1)( vC

za v = 0, C(v) = 1, za v = 1, 2, ... , 7.

U gornjoj formuli F(u,v) su DCT koeficijenti, a f(j,k) izvorne vrijednosti amplitude elemenata slike.F(0,0) naziva se istosmjerni (DC) koeficijent i najčešće se računa prema formuli:

7

0

7

0

),(8

1)0,0(

j k

kjfF

Ova formula govori nam da je DC koeficijent zapravo jednak osmerostrukoj srednjoj vrijednosti elemenata slike u bloku.

Slika 10. Prikaz bloka DCT koeficijenata

Na slici 10. gornji lijevi kut predstavlja DC koeficijent, a spuštajući se dolje i desno dolazi se do koeficijenata koji predstavljaju visoke prostorne frekvencije signala nastalog iz izvorne slike. Pomak prema desno predstavlja porast horizontalne prostorne frekvencije, a pomak prema dolje predstavlja porast vertikalne prostorne frekvencije. Na strani dekodera vrijednosti elemenata slike mogu se rekonstruirati pomoću inverzne diskretne kosinusne transformacije (IDCT):

16

)12(cos

16

)12(cos),(

4

)()(),(

7

0

7

0

vkujvuF

vCuCkjf

u v

Diskretnom kosinusnom transformacijom ne provodi se kompresija. Pomoću te transformacije samo se izvorni elementi slike pretvaraju u oblik iz kojega je moguće jasno odrediti redundanciju. Pošto sve prostorne frekvencije nisu istodobno prisutne u signalu, DCT će dati skup koeficijenata od kojih će neki biti jednaki ili vrlo bliski nuli. Koeficijente koji su jednaki nuli ne treba uopće prenositi, a koliko će se koeficijenata bliskih nuli odbaciti, ovisi o željenoj kvaliteti slike i stupnju kompresije koji se želi postići. Ukoliko se neki koeficijent ne može odbaciti, moguće ga je, u cilju postizanja većeg stupnja kompresije, prenijeti s manjim brojem bita, čime se manje narušava kvaliteta slike nego potpunim odbacivanjem.

Kvantizacija Vidljivost prostornih frekvencija u signalu znatno varira u cijelom rasponu. Ljudsko oko može tolerirati mnogo veću količinu šuma na visokim frekvencijama nego na niskim. Zbog toga se rabi kvantizacija, kako bi se sav eventualno nastali šum koncentrirao u području visokih frekvencija, gdje je slabo uočljiv. DCT koeficijenti se dijele faktorom koji je funkcija položaja koeficijenta u bloku (faktor dijeljenja se povećava pri kretanju prema desno i prema dolje u tablici koeficijenata). Istosmjerni (DC) koeficijent se ne kvantizira. Na strani dekodera visokofrekvencijski koeficijenti se množe najvećim faktorom, tako da je utjecaj šuma prebačen najvećim dijelom u to područje, koje je oku najmanje vidljivo.Nakon kvantizacije, vrijednosti koeficijenata bit će još manje, tako da će većina njih biti vrlo bliska nuli. U tipičnom programskom materijalu, većina velikih koeficijenata se nalazi u gornjem lijevom kutu bloka. Zbog takvog rasporeda koeficijenata prikladno je koeficijente očitavati metodom cik-cak analiziranja (slika 11.), počevši od gornjeg lijevog kuta tablice.

Slika 11. Cik-cak analiziranje

Pritom se dobiva niz koeficijenata koji na početku sadrži koeficijente različite od nule, dok su koeficijenti jednaki nuli koncentrirani na kraju niza. Takav oblik

omogućava da se umjesto krajnjih koeficijanata (koji su ionako jednaki nuli) u daljnji tok signala šalje samo oznaka koja predstavlja te koeficijente.

Kodiranje s promjenjivom dužinom niza U nizu podataka dobivenom nakon cik-cak analiziranja koeficijenti manje vrijednosti imaju ispred sebe više nula nego koeficijenti veće vrijednosti. Zbog toga je pogodno koristiti algoritam kodiranja koji će takvu raspodjelu znati iskoristiti. Huffmanov način kodiranja dodjeljuje kraći kod onim vrijednostima koje se češće pojavljuju, a duži kod onim vrijednostima koje se pojavljuju rijetko. Time se postiže veća učinkovitost pri prijenosu većine realnih informacija. Pri upotrebi diskretne kosinusne transformacije čest je slučaj da mnogi koeficijenti imaju vrijednost jednaku nuli, te je učinkovito takav niz kodirati pomoću kodiranja dužine niza. Na taj način koder jednostavno šalje podatak koliko je koeficijenata zaredom jednako nuli.

Kodiranje unutar slike (intra-kodiranje) Slika 12. Kodiranje unutar slike

Slika 12. prikazuje potpunu blok-shemu kodiranja unutar slike. Kodiranjem unutar slike nastaju tzv. I-slike (Intra-coded pictures) Ulazna slika se dijeli u blokove veličine 8×8 elemenata. Na svaki blok se primjenjuje DCT, čime se dobiva tablica koeficijenata koji se potom kvantiziraju. Cik-cak analizom se iz tablice dobiva niz koji se šalje na kodiranje dužine niza i rezultat se šalje u prijenosni kanal. U dekoderu se izvorni signal ponovno rekonstruira postupkom koji je potpuno inverzan postupku pri kodiranju.

Kodiranje između slika (inter-kodiranje) Sustav prikazan na slici 11. uklanja samo prostornu redundanciju sadržanu unutar pojedine slike. Kodiranje unutar slike ne iskorištava postojanje redundancije između dviju slika u nizu. Kako iskoristiti i tu (vremensku redundanciju? Rješenje leži u diferencijalnom kodiranju (slika 13.)

Slika 13. Dobivanje razlike slika

Da bi se mogla dobiti razlika između dvije slike, nužno je imati kašnjenje realizirano u sklopu kodera. Vrijednost svakog elementa prethodne slike se oduzima od odgovarajućeg elementa u trenutnoj slici, čime se dobiva razlika slika, koja je također dvodimenzijska slika, i može se podvrgnuti postupku kompresije unutar slike primjenom diskretne kosinusne transformacije. U dekoderu se također koristi kašnjenje prethodne slike, s kojom se potom zbraja razlika slika da bi se dobila trenutna slika. Ta trenutna slika zatim ponovno ulazi u krug kašnjenja da bi se dobila slijedeća slika. Pri ovakvom postupku kodiranja između slika nužno je spriječiti gomilanje sitnih pogrešaka zbog opasnosti da se one akumuliraju tijekom procesa kompresije izvornog videosignala. Najznačajniji uzrok pojave pogrešaka je kompresija razlike slika. Radi uklanjanja pogrešaka koje bi uzrokovale potpun gubitak informacije nakon nekog vremena, nužno je da koder i dekoder imaju identični dekoder razlike slika. U trenutku kada dekoder oduzima ptrethodnu sliku od trenutne, on u stvari oduzima lokalno dekodiranu sliku, identičnu onoj koju će dobiti stvarni dekoder na drugoj strani prijenosnog puta. Na taj način će biti uklonjene sve pogreške uzrokovane prethodnom kompresijom razlike slika. Sustav je prikazan na slici 14.

Slika 14. Uklanjanje kumulativne pogreške pri kodiranju između slika

Nadomještanje pokreta; P-slike Diferencijalno kodiranje prikazano na slici 14. daje dobre rezultate ukoliko izvorni videosignal ne sadrži znatan broj pokretnih objekata u slici. Ukoliko to nije slučaj, razlika slika će sadržavati gotovo istu količinu podataka kao da se uopće nije koristilo kodiranje između slika. Najbolji primjer za to je pomak kamere u jednom smjeru. Pri takvom pomaku vrijednosti većine elemenata slike se ne mijenjaju, nego samo dolazi do njihovog pomaka na drugo mjesto. Da bi se i takav videosignal mogao uspješno komprimirati, nužno je uvesti nadomještanje (kompenzaciju) pokreta. Pri upotrebi kodera koji omogućava nadomještanje pokreta, uspoređuju se područja dvaju susjednih slika u nizu, kako bi se ustanovio smjer i veličina relativnog pomaka između slika. Tako se dobivaju podaci u obliku dvodimenzijskog vektora pomaka (slika 15.).

Slika 15. Kodiranje uz nadomještanje pokreta

(1) Mjerenje pomaka između slika A i B(2) Pomicanje slike A pomoću vektora pomaka(3) Oduzimanje slike A od slike B(4) Odašiljanje vektora i podataka razlike slika u prijenosni kanal

Koder rabi vektore pomaka za pomicanje elemenata prethodne slike i stvaranje predviđene slike (P-slike, Predicted Frames) prije nego što njihove vijednosti oduzme od vrijednosti elemenata trenutne slike. Ukoliko je pocjene pokreta bila točna, proces pomaka će dovesti objekte u predviđenoj slici na isto mjesto na kojem se nalaze u stvarnoj slici, te će preostati samo mala količina podataka o razlikama između slika. Pošto se vektori pomaka šalju zajedno s podacima razlike slika, dekoder na prijemnoj strani ih može upotrijebiti za jednaki pomak prethodne slike čime dobiva odgovarajuću P-sliku. Zbrajanjem signala razlike dobiva se dekodirana trenutna slika. Za potrebe nadomještanja pokreta slika je razbijena u pravokutna područja koja se nazivaju makroblokovi. Svaki makroblok ima vlastiti vektor pomaka koji se primjenjuje na cijeli blok. U ovisnosti o položaju objekata, neki makroblokovi se pomiču, a neki ne. Zato nije uvijek nužno koristiti nadomještanje pokreta, već se koder treba ''odlučiti'' da li

takav postupak daje manju potrebnu brzinu prijenosa ili je bolje raditi bez nadomještanja pokreta, prenoseći samo razlike slika. Zbog činjenice da je kretanje nekog objekta u realnom programskom materijalu relativno konstantno u trajanju od nekoliko slika, vektori pomaka se odašilju diferencijalno, tj. ukoliko nema promjene u načinu pomaka, vrijednost parametra vektora pomaka jednaka je nuli, te se vektori jednostavno kopiraju iz prethodne slike. Ako kretanje mijenja brzinu ili smjer, tada se šalju razlike vektora pomaka.

Dvosmjerno predviđanje; B-slike U svrhu dodatnog smanjenja zahtjeva na brzinu prijenosa, odnosno za postizanje još većeg stupnja kompresije, uvodi se koncept dvosmjernog kodiranja (slika 16.), čime se dobivaju B-slike (Bidirectionally Coded Frames). Slika 16. Dvosmjerno kodiranje

Trenutna slika se uspoređuje i sa prethodnom i sa budućom slikom; izvode se dvosmjerni vektori pomaka. Područje označeno kvadratićem na trenutnoj slici dobiva se tako iz buduće slike. Dvosmjerno predviđanje zahtijeva promjenu rasporeda slika pri prijenosu jer do dekodera moraju prvo stići buduće slike potrebne u procesu predviđanja, a zatim trenutna slika. Najčešće grupe slika (uz mnogo ostalih rasporeda):

IIII...IPIP...IBPIBP... (prijenosni raspored IPBIPB...)IBIB...

Razlozi za prijenos I-slika U praksi nije moguće koristiti čisto diferencijalno kodiranje, budući da dekoder može primati signal samo od njegovog početka. Osim toga, svaka pogreška u prijenosu samo jedne slike prenosi se na sve slijedeće slike. Zbog toga je nužno povremeno u prijenosni tok ubaciti slike koje su kodiranje isključivo metodom kodiranja unutar slike, bez predviđanja (I-slike), tako da se dobiva struktura toka podataka kao na slici 17.

Slika 17. Primjer strukture prijenosnog toka podataka

U nizu slika nije apsolutno nužno da se I-slike pojavljuju u strogo određenom rasporedu, budući da svaka slika ima oznaku koja govori dekoderu kako je treba obraditi. Uređivanje i naknadna obrada ovakvog signala moguća je samo u trenucima u kojima se pojavljuju I-slike. Zbog toga, u slučaju kad je potrebna naknadna obrada videosignala, I-slike se moraju koristiti u znatnijoj mjeri, te nisu mogući veliki omjeri kompresije.

OPĆENITO O MPEG NORMAMA MPEG (Moving Pictures Experts Group) je radna grupa unutar ISO/IEC (International Standardization Organisation / International Electrotechnical Committee), zadužena za razvoj međunarodnih standarda za kompresiju, dekompresiju, obradu i prezentaciju pokretnih slika i pratećih audio sadržaja.Do sada su donešene slijedeće norme:

MPEG-1 – kodiranje pokretnih slika i pratećih audiosignala za digitalno pohranjivanje pri brzinama do 1,5 Mbit/s (1992. godine);

MPEG-2 – generičko kodiranje pokretnih slika i pratećih audiosignala (1995.);

MPEG-4 – kodiranje audio-vizualnih objekata (verzija 1: 1998., verzija 2: 1999.);

MPEG-7 – sučelje za opis multimedijskih sadržaja (2001.);MPEG-21 – multimedijski sustav.

MPEG norme same po sebi se ne mogu jednostavno definirati. U svojoj biti, MPEG je skup standardnih alata, precizno definiranih algoritama i načina na koji se oni mogu kombinirati kako bi se napravio stvarni sustav za kompresiju signala. Suprotno očekivanju, MPEG norme ne propisuju egzaktni način na koji se kompresija mora provesti. Umjesto toga, MPEG precizno propisuje način na koji dekoder mora obraditi skup različitih komprimiranih tokova podataka. MPEG ne propisuje kako treba prenositi sam signal, jer će to biti određeno karakteristikom sustava u primjeni. Razlog za takav pristup je omogućavanje velike fleksibilnosti, uz istovremeneo zadržavanje kompatibilnosti među sustavima. Razni proizvođači opreme mogu razvijati različite algoritme kompresije, ali izlazni komprimirani videosignal mora biti sukladan MPEG standardu. To omogućava da se sami algoritmi kompresije neprekidno usavršavaju, a da istovremeno komprimirani signal ostane kompatibilan sa svim postojećim dekoderima. Primjena kompresije videosignala na zadržava se samo na televizijskim sustavima; kompresija se koristi za niz primjena, počevši od prikaza videosignala na monitorima računala, pa sve do raznih prezentacijskih primjena. Zahtjevi za kvalitetom variraju od vrlo malih (npr. videotelefoni, videonadzor, ...) do vrlo velikih (transparentnost potrebna u TV produkciji). U različitim primjenama tako se može dopustiti različit stupanj složenosti kodera i dekodera, što je dovelo do potrebe za slojevitom strukturom kodiranja.

MPEG-1 (ISO/IEC IS 11172)

Formati slike ITU-R preporuka BT.601:

određuje frekvencije uzorkovanja za komponente videosignala u 525/60 i 625/50 standardima uz omjer stranica 4:3 i 16:9

definira formate uzorkovanja 4:4:4 (frekvencija uzorkovanja za sve komponente signala iznosi 13,5 MHz (4:3), odnosno 18 MHz (16:9)) i 4:2:2 (frekvencija uzorkovanja 13,5/18 Mhz za luminantnu komponentu i 6,75/9 MHz za svaku od krominantnih komponenti)

576 linija u aktivnom dijelu slike za 625/50 sustav i 480 linija u aktivnom dijelu slike za 525/60 sustav

svaka digitalna linija u aktivnom intervalu sadrži 720 luminantnih uzoraka, te 720 (4:4:4) ili 360 (4:2:2) uzoraka krominantnih komponenti

Osim formata 4:4:4 i 4:2:2 u upotrebi su i formati 4:1:1 i 4:2:0 (nije dio preporuke BT.601, ali se koristi u MPEG normi). Kao polazišni format pri kompresiji prema MPEG-1 normi, upotrebljava se SIF (Source Input Format), izveden iz ITU-R preporuke BT.601.

Tablica 1. SIF i BT.601 formati slike

Vertikalna frekvencija 25 Hz 30 Hz

Luminantna komponenta:ITU-R BT.601SIF

720 × 576360 × 288

720 × 480360 × 240

Krominantna komponenta:ITU-R BT.601SIF

360 × 576180 × 144

360 × 480180 × 120

Iz tablice je vidljivo kako je rezolucija slike koja se koristi u postupku MPEG-1 kodiranja smanjena na polovicu, u odnosu na rezoluciju slike propisanu preporukom BT.601. Slika 18. Postupak dobivanja SIF formata iz BT.601 oblika

Brojke u zagradama na slici se odnose na 525/60 sustav, a izvan zagrada na sustav 625/50. Postupkom prikazanim na slici 18. dobiva se SIF format (strukture uzorkovanja 4:2:0), koji ipak nije još uvijek moguće direktno upotrijebiti za kompresiju, jer horizontalna rezolucija od 360 elemenata slike nije djeljiva sa 16, što je nužno zbog podjele slike na makroblokove. Prilagođenje se izvodi odbacivanjem krajnjih lijevih i krajnjih desnih elemenata slike, čime se dobiva format 352 × 288 (za 625/50 sustav) ili 352 × 240 (za 525/60 sustav).

Hijerarhijska struktura kodiranja Kodiranje po MPEG normi organizirano je u šest slojeva (slika 19.):

Blok – najmanja jedinica koja se podvrgava kodiranju; veličine 8×8 elemenata slike

Makroblok – osnovna jedinica za kodiranje s nadomještanjem pokreta; veličine 16×16 elemenata slike

Isječak slike (slice) – horizontalni niz makroblokovaSlika – osnovna jedinica u MPEG kodiranju; četiri vrste:

I-slike – slike kodirane samostalno unutarnjim kodiranjem P-slike – kodirane s predviđanjem uz nadomještanje pokreta B-slike – kodirane s predviđanjem uz nadomještanje pokreta, pri čemu se

predviđanje vrši iz prethodnih i iz budućih slika D-slike – slike dobivene kodiranjem samo istosmjernog (DC) koeficijenta;

koriste se izuzetno rijetko

Grupa slika (GOP = Group of pictures) – niz od jedne ili više slika pri kodiranju i/ili prijenosu

Sekvenca – niz od određenog broja grupa slika

Slika 19. Hijerarhijska struktura kodiranja

U grupi slika pojedine slike su raspoređene prema slijedećem rasporedu:

I1 B1 B2 P1 B3 B4 P2 B5 B6 P3 B7 B8 I2

Za rekonstrukciju B-slika nužno je imati i prethodne i buduće I i P-slike, te se prijenosni raspored mora tome prilagoditi (slika 20.):

I1 P1 B1 B2 P2 B3 B4 P3 B5 B6 I2 B7 B8

Slika 20. Raspored slika pri kodiranju i pri prijenosu

Postupak kodiranja Postupak MPEG kodiranja provodi se u više faza (blok-shema je prikazana na slici 21.):

1. Slika se dijeli u blokove veličine 8 × 8 elemenata slike. 2. Provodi se diskretna kosinusna transformacija (uklanjanje prostorne redundancije)

koriste se 64 koeficijenta transformacijeprovodi se kvantizacija DCT koeficijenata

3. Provodi se kodiranje s predviđanjem uz nadomještanje pokreta (uklanjanje vremenske redundancije) DCT koeficijenti se inverzno kvantiziraju, transformiraju i pohranjujuizvorna slika se uspoređuje s prethodnom I ili P-slikomu sklopu za predviđanje pokreta proračunavaju se vektori pokretavektori pokreta se primjenjuju na prethodnu slikumakroblok iz prethodne slike pomaknut vektorom pokreta postaje prediktor

(osnova za daljnje predviđanje)pogreška predviđanja (razlika slika) kodira se primjenom DCTprovodi se kvantizacija DCT koeficijenata (korak kvantizacije za sve koeficijente

je 16)

Slika 21. Blok-shema MPEG kodera:

Značenje kratica na slici:

Q = kvantizacija,DCT = diskretna kosinusna transformacija,VLC = kodiranje s promjenjivom dužinom riječi,Q-1 = inverzna kvantizacija,DCT-1 = inverzna DCT.

Osnovna namjena MPEG-1 norme: kodiranje pokretnih slika i pratećih audiosignala za digitalno pohranjivanje pri brzinama do 1,5 Mbit/s. Koristi se isključivo progresivno analiziranje.


Opća svojstva MPEG-2 norme MPEG-2 je norma za generičko (aplikacijski neovisno) kodiranje videosignala i pratećih audio sadržaja. Algoritam koji se primjenjuje za kodiranje sličan je algoritmu u MPEG-1 normi. Osnovna razlika između MPEG-1 i MPEG-2 normi:

MPEG-1 je prilagođen videosignalu s progresivnim analiziranjem, osnovna namjena mu je bila snimanje videosignala na CD, brzina prijenosa do 1,5 Mbit/s.

MPEG-2 je opći standard namijenjen i videosignalima s progresivnim analiziranjem i videosignalima koji koriste analiziranje s proredom (slika se dijeli na dvije poluslike);

MPEG-2 nudi slojevitu strukturu profila (podskup sintakse toka podataka) i razina (određuje parametre koji su dopušteni unutar odabranog profila.

Struktura MPEG-2 kodiranja MPEG-2 norma sadrži slijedeće profile i razine:

1. 1. Profili:

osnovni (SP = Simple Profile) – daje najnižu kvalitetu signala, ne podržava slojevito kodiranje, ne uključuje dvosmjerno predviđanje, format slike je 4:2:0;

glavni (MP = Main Profile) – ne podržava slojevito kodiranje, ali postoji dvosmjerno predviđanje; format slike je također 4:2:0;

4:2:2 (4:2:2P) – format slike je 4:2:2, omogućeno je korištenje većih brzina prijenosa nego u glavnom profilu;

profil sa slojevitošću u odnosu na omjer signal/šum (SNR) – omogućava različite kvalitete slike s obzirom na odnos signala i šuma;

profil s prostornom slojevitošću (Spatial) – podržava različite prostorne rezolucije slike;

vršni profil (HP = High Profile) – podržava potpunu slojevitost i najvišu kvalitetu slike. 2. Razine:

niska (LL = Low Level) – SIF format slikeglavna (ML = Main Level) – standardni formati TV slikevisoka 1440 (High-1440) – videosignal sa 1440 uzoraka po linijivisoka (HL = High Level) – videosignal sa 1920 uzoraka po liniji

Tablica 2. Profili i razine u MPEG-2 normi

Razina Profil

Osnovni Glavni 4:2:2 SNR Prostorni Vršni

Visoka

Uzoraka/linijiLinija/sliciFormatVrste slikaMbit/s

192011524:2:0I, P, B80

192011524:2:2I, P, B80

192011524:2:2,4:2:0I, P, B100

Visoka1440


144011524:2:0I, P, B60

144011524:2:0I, P, B60

144011524:2:0,4:2:2I, P, B80

Glavna


7205764:2:0I, P15

7205764:2:0I, P, B15

7205764:2:2I, P, B50

7205764:2:0I, P, B15

7205764:2:0,4:2:2I, P, B20

Niska


3522884:2:0I, P, B4

3522884:2:0I, P, B4

MPEG koder – dobivanje I, P i B slika Na slikama 22a, 22b i 22c prikazana je tipična izvedba MPEG kodera, koja sadrži dvosmjerno nadomještanje pokreta. Digitalni videosignal ulazi kroz seriju sklopova za kašnjenje, koje je moguće zaobići, ovisno o željenom rasporedu slika. Signal zatim ulazi u sklop za oduzimanje i u sklop za procjenu pomaka. Ukoliko se želi dobiti I-slika, ulazno kašnjenje je uključeno u tok signala, a sklop za oduzimanje je isključen, tako da signal direktno prolazi do sklopa za prostorno kodiranje (kodiranje unutar slike). Signal se zatim šalje u slikovnu memoriju, gdje se pohranjuje nastala I-slika (slika 22a).

Slika 22a. MPEG koder – dobivanje I-slike

Slijedeći korak pri kodiranju videosignala je dobivanje P-slike (slika 22b). U tu svrhu, ulazni sklopovi za kašnjenje se isključuju, kako bi se odabrala buduća slika, što je potrebno zbog strukture grupe slika pri prijenosu. Sklop za procjenu pomaka uspoređuje I-sliku (koja se nalazi u izlaznoj memoriji) sa P-slikom u ulaznoj memoriji, kako bi se dobili vektori pomaka. Pomoću tih vektora pomaka pomiče se I-slika čime se dobiva predviđena P-slika. Predviđena P-slika se oduzima od stvarne P-slike radi dobivanja iznosa pogreške predviđanja. Pogreška predviđanja se prostorno kodira i šalje zajedno s vektorima pomaka. Osim toga, pogreška predviđanja se dodaje predviđenoj P-slici, čime se dobiva lokalno dekodirana P-slika koja se pohranjuje u izlaznoj memoriji. Izlazna memorija sada sadrži I-sliku i P-sliku, tako da se može prijeći na kodiranje B-slika.

Slika 22b. MPEG koder – dobivanje P-slike

Nakon kodiranja I i P-slike, u ulazni memorijski spremnik dolazi B-slika. Sklop za nadomještanje pokreta uspoređuje B-sliku s prethodnom I-slikom i budućom P-slikom (koje su pohranjene u izlaznoj memoriji), čime se dobivaju dvosmjerni vektori pomaka (slika 22c). Postupkom nadomještanja pokreta provedenim u oba smjera dobivaju se dvije predviđene B-slike, koje se oduzimaju od trenutne B-slike. Na razini makroblokova odabire se pomak prema naprijed ili prema natrag, ovisno o tome koji daje najmanju razliku. Razlike se potom prostorno kodiraju i šalju zajedno s vektorima pomaka. Nakon što se kodiraju sve B-slike, prelazi se na stvaranje nove P-slike iz prethodno pohranjene P-slike. Postupak se zatim nastavlja.

Slika 22c. MPEG koder – dobivanje B-slike

Kvaliteta slike; primjene MPEG-2 norme Cilj koji se želi postići pri prijenosu videosignala jest visoka kvaliteta uz što je moguće manju brzinu prijenosa. Pritom neizbježno dolazi do problema i različitih načina pristupa rješenju. Smanjenjem brzine prijenosa konstantnu kvalitetu slike moguće je postići promjenom strukture grupe slika. Grupa slika koja se sastoji samo od I-slika zahtijeva najveću brzinu prijenosa, što znači da je pri smanjivanju brzine prijenosa nužno ubacivati B i P-slike. Visoku kvalitetu pri brzinama prijenosa nižim od 20 Mbit/s moguće je ostvariti jedino uz primjenu B i P-slika (slika 23).

Slika 23. Krivulja konstantne kvalitete

U normi MPEG-2 primjenjuje se slojevito kodiranje – podaci se u koderu dijele na dva ili više tokova s različitim informacijama o videosignalu. Time je omogućen rad kodera i dekodera različitih kvaliteta. Slojevito kodiranje jedna je od najznačajnijih osobina MPEG-2 norme. Poseban značaj slojevito kodiranje ima pri prijenosu videosignala putem računalne mreže, jer se postupak kodiranja može prilagoditi ovisno o trenutnom prometu u mreži, odnosno o raspoloživoj brzini prijenosa i kašnjenju paketa uzrokovanom prilikama u mreži. Dekoder može dekodirati samo dio podataka iz ukupnog toka podataka, ukoliko je dovoljna niža kvaliteta slike.Podaci se u koderu dijele po kriteriju koji može biti odnos signal/šum, prostorna ili vremenska rezolucija. Takvu slojevitost podržavaju SNR profil, profil s prostornom slojevitošću i vršni profil. Kvaliteta slike je određena brzinom prijenosa i rasporedom slika u grupi slika, što se određuje ovisno o primjeni. Ukoliko je potrebno naknadno obrađivati videosignal, koriste se kratke grupe slika (IBIB...) uz brzine prijenosa 30-50 Mbit/s, a ukoliko se radi samo ograničen broj generacija snimke, tada se može upotrijebiti i grupa slika IBBP... uz brzinu prijenosa od približno 20 Mbit/s. Primjene 4:2:2P@ML (4:2:2 profil, glavna razina):

terenska snimanja i vijesti (18 Mbit/s, struktura grupe slika IB)primarna distribucija (20 Mbit/s, struktura IBBP)pohranjivanje (30 Mbit/s, struktura IP)postprodukcija (50 Mbit/s, samo I slike).

Primjena MP@ML (glavni profil, glavna razina): distribucija do krajnjih korisnika (TV gledatelja) putem zemaljskih,

kabelskih i satelitskih distribucijskih sustava uz brzine prijenosa 4-9 Mbit/s. Uz manje brzine prijenosa (manje od 15 Mbit/s), 4:2.2 profil daje lošije rezultate nego glavni profil (slika 23.), a razlog za to jest veći broj krominantnih uzoraka u 4:2:2 profilu, koji zahtijeva veći stupanj kompresije da bi se postigla ista brzina prijenosa nego glavni profil (4:2:0).

Slika 24. Ovisnost kvalitete o brzini prijenosa i strukturi grupe slika

Iz slike je vidljivo da struktura grupe slika znatno utječe na kvalitetu slike. Također je vidljivo da, čak ni uz visoke brzine prijenosa, nije moguće postići visoku kvalitetu slike bez upotrebe predviđanja pokreta.

Prijenos i pohranjivanje MPEG-2 signala Da bi se pristupilo prijenosu ili pohranjivanju MPEG-2 signala, tokovi podataka (videosignal, audiosignal) moraju se multipleksirati. Multipleksiranjem se dobiva:

Prijenosni tok podataka (TS = Transport Stream) – namijenjen prijenosu signala zemaljskim, kabelskim ili satelitskim vezama

Programski tok podataka (PS = Program Stream) – namijenjen pohranjivanju podataka na digitalni medij (DVD, magnetska vrpca, ...)

Multipleksiranje audio i videosignala potrebno je kako bi se omogućio njihov zajednički prijenos, te ispravno dekodiranje i prikazivanje. U programskom toku podataka se multipleksira videosignal s pratećim audiosignalima (višekanalni zvuk) i podacima, pri čemu ti svi signali pripadaju jednom programu. U prijenosnom toku moguće je multipleksiranje audiosignala, videosignala i podataka koji pripadaju različitim programima. Hijerarhija multipleksiranja određena MPEG-2 normom sastoji se od tri vrste tokova podataka:

osnovni tok podataka (ES = Elementary Stream)paketizirani osnovni tok podataka (PES = Packetized Elementary Stream)prijenosni (TS) ili programski (PS) tok podataka (slika 25.).

Slika 25. Dobivanje programskog i prijenosnog toka podataka

Programski tok dobiven multipleksiranjem sadrži pakete nastale iz jednog ili više osnovnih tokova podataka koji pripadaju jednom programu; može sadržavati jedan tok podataka videosignala i više tokova podataka audiosignala.

Paketi programskog toka imaju promjenjivu duljinu što uzrokuje poteškoće budući da dekoder mora prepoznati točan početak i kraj paketa. Da bi se to omogućilo, u zaglavlju paketa se nalaze podaci o duljini paketa. Primjer programskog toka prikazan je na slici 26.

Slika 26. Paketi programskog toka podataka

Za razliku od programskog toka podataka, prijenosni tok može sadržavati jedan ili više različitih programa, tj. on može nastati multipleksiranjem više programskih tokova podataka ili multipleksiranjem PES paketa koji pripadaju različitim programima. Osim toga, prijenosni tok je namijenjen prijenosu MPEG signala kroz mrežu, tako da mora biti oblikovan tako da bude što manje osjetljiv na smetnje i pogreške u prijenosu. Zbog toga se koriste paketi fiksne duljine koji se mogu brzo komutirati u širokopojasnim mrežama. Paketi programskog toka podataka imaju konstantnu duljinu od 188 bajta, od čega zaglavlje sadržava 4 bajta, a ostalih 184 bajta je podijeljeno na adaptacijsko područje i područje podataka (slika 27.)

Slika 27. Paket prijenosnog toka podataka

Paket prijenosnog toka (188 bajta)

Zaglavlje (4 bajta) Adaptacijsko područje Podaci

Adaptacijsko područje sadrži vremenske oznake i reference kao i informacije koje omogućuju dohvat podataka; definira izgled ostalih dijelova paketa i sadrži informaciju o vrsti signala koji se prenosi u paketu.

Primjena MPEG-2 norme u radiodifuziji digitalnog TV signala Prijenos digitalnog TV signala definiran je u okviru DVB (Digital Video Broadcasting) projekta. Kao rezultat DVB projekta nastale su europske ETSI norme za satelitsku, kabelsku i zemaljsku radiodifuziju digtalnog TV signala.Opća blok-shema sustava za radiodifuziju digitalnog TV signala prikazana je na slici 28.

Slika 28. Sustav za prijenos digitalnog TV signala

Izvorno kodiranje obuhvaća postupke smanjenja količine podataka i brzine prijenosa. Prenose se tri vrste podataka: videosignali, audiosignali i prateće informacije (vremenske, sigurnosne, identifikacijske...). Kao rezultat izvornog kodiranja dobivaju se osnovni tokovi podataka (ES = Elementary Stream). MPEG-2 normom definiran je postupak uključivanja osnovnih tokova podataka u prijenosnu mrežu. Podaci se paketiziraju, pri čemu se paketi prijenosnog toka (TS) šalju na kanalno kodiranje, čime se osigurava zaštita od pogreške, i priprema signal za modulaciju VF nosioca. U svim zemaljskim, kabelskim i satelitskim sustavima za radiodifuziju digitalnog TV signala za izvorno kodiranje rabi se MPEG-2 norma, dok se kanalno kodiranje i modulacijski postupak razlikuju, ovisno o prijenosnom mediju:

za satelitsku radiodifuziju rabi se modulacijski postupak QPSK (Quadrature Phase Shift Keying)

glavna karakteristika tog modulacijskog postupaka je djelotvornost po snazi, što je važno zbog male snage odašiljača na satelitu i velikog gušenja signala pri prolasku kroz atmosferu;

za kabelsku distribuciju digitalnih TV signala rabi se QAM (Quadrature Amplitude Modulation – kvadraturna amplitudna modulacija) sa 16, 32 ili 64 diskretna stanja;

glavna osobina QAM postupka jest spektralna djelotvornost, koja omogućava prijenos signala kanalom čija je širina ograničena na 8 MHz;

za zemaljsku radiodifuziju rabi se OFDM (Orthogonal Frequency Division Multiplex) – frekvencijski multipleks ortogonalnih podnosilaca;

OFDM postupak koristi veliki broj frekvencijski vrlo bliskih podnosilaca, pri čemu je moguće pojedine podnosioce modulirati različitim modulacijskim postupcima.

MPEG kodiranje – test Test kvalitete slike kodirane primjenom MPEG normi obavljen je pomoću programa VcDemo, koji omogućava definiranje svih neophodnih parametara kodiranja (brzina prijenosa, vrsta grupe slika, odabir MPEG-1 ili MPEG-2 norme). Cilj ovog testa je dati uvid u ovisnost kvalitete slike o brzini prijenosa te strukturi grupe slika, a kao parametar kvalitete uzima se vršni odnos signal-šum u komprimiranom signalu (PSNR = Peak Signal to Noise Ratio). Ispitne sekvence koje se koriste u ovom testu dobivene su uz sam program. PSNR se temelji na razlici izvorne i dekodirane slike, prema slijedećoj formuli:

MSEPSNR

n )12(log10

, pri čemu je n broj bitova korištenih za kodiranje uzorka slike, a MSE parametar definiran formulom:

2

1 1,, )'(

1

M

j

N

kkjkj xx

MNMSE

Značenje oznaka u formuli: M, N – dimenzije slike,

xj,k – uzorak izvorne slike, x'j,k – uzorak dekodirane slike.

Rezultat testa je prikazan na slikama 29a i 29b. Na x-osi se nalaze vrste grupe slika, a na y-osi vrijednosti PSNR izražene u decibelima.

Slika 29a. Rezultat kodiranja ispitne sekvence ''Suzie''

30

35

40

45

50

55

I IBB IPP IBB3(PBB)

Grupa slika

PS

NR

[d

B]

MPEG-1, 0,128 Mbit/s



MPEG-1, 1,15 Mbit/s

MPEG-1, 2,0 Mbit/s

MPEG-1, 3,5 Mbit/s

MPEG-1, 5,0 Mbit/s

MPEG-1, 8,0 Mbit/s

30

35

40

45

50

55

I IBB IPP IBB3(PBB)

Grupa slika

PS

NR

[d

B]




MPEG-2, 1,15 Mbit/s

MPEG-2, 2,0 Mbit/s

MPEG-2, 3,5 Mbit/s

MPEG-2, 5,0 Mbit/s

MPEG-2, 8,0 Mbit/s

Slika 29b. Rezultat kodiranja ispitne sekvence ''Car phone''

25

30

35

40

45

50

I IBB IPP IBB3(PBB)

Grupa slika

PS

NR

[d

B]




MPEG-1, 1,15 Mbit/s

MPEG-1, 2,0 Mbit/s

MPEG-1, 3,5 Mbit/s

MPEG-1, 5,0 Mbit/s

MPEG-1, 8,0 Mbit/s

25

30

35

40

45

50

I IBB IPP IBB3(PBB)

Grupa slika

PS

NR

[d

B]




MPEG-2, 1,15 Mbit/s

MPEG-2, 2,0 Mbit/s

MPEG-2, 3,5 Mbit/s

MPEG-2, 5,0 Mbit/s

MPEG-2, 8,0 Mbit/s

Iz dobivenih rezultata može se zaključiti slijedeće:

najveći utjecaj na kvalitetu slike (predstavljenu vršnim odnosom signal-šum) ima brzina prijenosa koju je moguće ostvariti u nekom prijenosnom kanalu;

utjecaj strukture grupe slika je jasno vidljiv: uz dodavanje P i B-slika u grupu slika, kvaliteta se poboljšava, što je naročito važno pri malim brzinama prijenosa;

vrsta kodiranja (MPEG-1 ili MPEG-2) ne utječe vidljivo na kvalitetu slike (u testiranim uvjetima);

sadržaj slike utječe na kvalitetu slike (uz inače jednake uvjete kodiranja). Dobiveni rezultati jasno govore da je poželjno, kad god je to moguće, koristiti veće grupe slika, uz primjenu i P-slika i B-slika. Nedostatak takve strukture pokazuje se jedino u slučaju da je videosignal potrebno naknadno obrađivati. U tom slučaju poželjno je (zbog uvjeta da rez mora započeti I-slikom) da grupe slika budu što kraće, odnosno da se koriste samo I-slike. Takav sustav zahtijeva velike brzine prijenosa.

OSNOVE POSTUPAKA KOMPRESIJE

OPĆENITI PRINCIP KOMPRESIJE Kako se provodi kompresija? Za odgovor na to pitanje potrebno je znati da su u svim konvencionalnim digitalnim sustavima ograničeni i broj bitova po uzorku, kao i brzina prijenosa. Brzina prijenosa ograničava količinu podataka koja se može prenijeti u nekom vremenskom intervalu, no za većinu primjena, odnosno većinu programskog materijala, ta se granica ne dostiže.Prema Shannonovom teoremu, signal koji se ne mijenja, ne sadrži informaciju. Uzmimo za primjer sinusni valni oblik: svaki period signala jednak je slijedećem, dakle, sinusni signal ne nosi nikakvu informaciju zbog činjenice da nema širinu pojasa. U slučaju videosignala, prisutnost prepoznatljivih objekata u slici rezultira skupom elemenata slike sličnih karakteristika. Ti elementi slike daju kao rezultat frekvenciju signala koja je daleko ispod maksimalne koju je moguće prenijeti sustavom. Na primjer, u slučaju stacionarne slike, svaka slika je jednaka prethodnoj, tako da, u stvari, ne treba prenositi nove podatke jednom kad je prva slika već poslana.

Cilj sustava za kompresiju jest prepoznati i odašiljati samo korisni, promjenjivi dio ulaznog signala. Taj korisni dio signala naziva se entropija. Preostali, nepromjenjivi dio ulaznog signala naziva se redundancija (slika 3.).

Slika 3. Entropija i redundancija

U principu, redundanciju nije uopće potrebno prenositi. Međutim, u realnim uvjetima prijenosa dio redundancije se prenosi kako bi se omogućila rekonstrukcija informacija koje su se izgubile u prijenosu, tj. signal je otporniji na smetnje ako redundancija ipak postoji. Slika 4. a) pokazuje slučaj idealne kompresije: ako koder pošalje svu entropiju, a u prijenosu ne dođe do gubitka, primljeni signal se ne može razlikovati od originala. Ukoliko dođe do bilo kakvih smetnji u prijenosu, dio informacije se gubi, i dekodirani signal će biti slabije kvalitete u odnosu na original. Druga stvar na koju treba obratiti pažnju jest stupanj kompresije. U slučaju prevelikog stupnja kompresije, dolazio do oštećenja entropije, jer je već sva redundancija u potpunosti uklonjena (slika 4. b)). Stoga se postavlja zahtjev da se stupanj kompresije mora prilagoditi sadržaju slike.

Slika 4. Problem odabira stupnja kompresije

Pošto je entropija funkcija ulaznog signala, potrebna brzina prijenosa u slučaju idealne kompresije će biti promjenjiva. Nije uvijek moguće imati prijenosni kanal promjenjive brzine prijenosa, tako da mnogi uređaji za kompresiju imaju memorijske spremnike na oba kraja lanca. To usrednjuje brzinu prijenosa, no uzrokuje i kašnjenja. Takva kašnjenja mogu biti neprihvatljiva u nekim slučajevima (npr. videokonferencije) pa se koristi kanal sa stalnom brzinom prijenosa, čime se izbjegava potreba za memorijskim spremnicima. Takav sustav ima manja kašnjenja signala.

IDEALNI I REALNI SUSTAV KOMPRESIJE Sve do sada, razmatranja su se zasnivala na idealnom koderu, koji je uvijek sposoban razlučiti entropiju od redundancije. Nažalost, takav koder nije moguć, jer bi bio beskonačno složen i imao bi beskonačno kašnjenje. Stoga smo u praksi prisiljeni posegnuti za realnim koderom, koji će uvijek odstupati od idealnog, bez obzira na primjenu. Ta činjenica znači da ćemo uvijek morati odabrati manji stupanj kompresije od idealnog (najvećeg mogućeg), jer koder nije u stanju točno razlikovati entropiju od redundancije. Slika 4. c) pokazuje slučaj realnog kodera: uz entropiju se prenosi još dio informacije koji može, ali i ne mora biti redundantan. Što je koder jednostavniji, taj dio informacije je veći. Dekoder, međutim, mora moći obraditi signal u bilo kojem slučaju. Zbog toga, sve odluke o načinu i stupnju kompresije donose se na razini kodera, a dekoder samo mora dekodirati primljeni signal što je bolje moguće. Takav sustav je dakle asimetričan: koder je najčešće složen, a dekoder je znatno jednostavniji. Iz svega do sada navedenog, može se zaključiti da je složenost kodera, za neku traženu kvalitetu, to veća što je zahtijevana brzina prijenosa manja. Zbog toga se u primjeni nalazi velik broj različitih kodera.

REDUNDANCIJE U VIDEOSIGNALU Osnovne vrste redundancije koje se pojavljuju u videosignalu su:

c) a) statistička redundancija:prostorna (unutar svake pojedine slike);vremenska (između slika);

d) b) subjektivna redundancija (vezana za svojstva ljudskog vizualnog

sustava).

NAČELA KOMPRESIJE VIDEOSIGNALA Kompresija videosignala zasniva se na uklanjanju redundancije iz toka podataka koji je potrebno poslati kroz kanal. Drugim riječima, iskorištavaju se dvije pretpostavke koje definiraju redundanciju u nekom videosignalu.

Prva pretpostavka odnosi se na svojstvo ljudskog vizualnog sustava da je osjetljivost na šum u slici ovisna o frekvenciji, tj. oko slabije zapaža sitne detalje (visoke frekvencije).Druga pretpostavka je da u nizu pokretnih slika uvijek postoji znatna sličnost između trenutne i slijedeće slike.

Slika 5. Ovisnost prostorne frekvencije o veličini objekta u slici

Slika 6. Osjetljivost oka na detalje

Iz slika 5. i 6. vidljivo je da se zbog karakteristika ljudskog oka mogu iz slike pri kompresiji ukloniti sitni detalji, budući da daju kao rezultat više frekvencije, koje oko manje zapaža. Kompresija u načelu radi tako da reducira broj bitova digitalne riječi. To dovodi do smanjenja rezolucije i povećanja šuma, tako da se postupak mora provoditi pazeći da šum ne postane vidljiv, tj. pazeći na prostornu frekvenciju (frekvenciju generiranu sadržajem slike). Videokoderi zbog toga moraju provoditi analizu frekvencija koje se pojavljuju u ulaznom signalu, te obrađivati svaku frekvenciju

posebno. Ako neke frekvencije u ulaznom signalu nema, neće biti prenesen nikakav podatak.Dekoder se izvodi kao potpuno inverzni sklop u odnosu na koder (slika 7.)

Slika 7. Kompresija i dekompresija (osnovno načelo)

Postupak prikazan na ovoj slici tretira svaku pojedinu sliku zasebno i naziva se kodiranje unutar slike (intra-frame coding). Na taj način rade sustavi za kompresiju mirnih slika npr. JPEG (Joint Photographic Experts Group). Pri kodiranju videosignala, osim kodiranja unutar slike, primjenjuje se i postupak kodiranja između slika (inter-frame coding), koji iskorištava vremensku redundanciju koja se pojavljuje između dviju slika u nizu. Na taj način mogu se postići veći stupnjevi kompresije. Slika 8. prikazuje jednostavan sustav za kodiranje između slika. Počevši sa slikom kodiranom postupkom kodiranja unutar slike, sve slijedeće slike opisane su samo razlikama o odnosu na trenutnu sliku. Dekoder zbraja razliku slika s trenutnom slikom i na taj način stvara slijedeću sliku. Slika koja predstavlja razliku dobiva se oduzimanjem vrijednosti elementa slike u jednoj slici i vrijednosti istog elementa slike u drugoj slici. Ta slika se može, kao i svaka druga slika, komprimirati postupkom kodiranja unutar slike. Postoje mnogi problemi koji sprečavaju ovakvu jednostavnu izvedbu. Na primjer, bilo koja pogreška koja se pojavi u toku prijenosa u samo jednoj slici, bit će vidljiva u svim slijedećim slikama (propagacija pogrešaka). Osim toga, nije moguće dekodirati signal ako se on ne prati od početka emitiranja, tj. nije moguće mijenjanje kanala. To sve dovodi do potrebe da se povremeno prenose i slike dobivene samo kodiranjem unutar slike (I-slike). Ovaj način prijenosa otežava i naknadnu obradu videosignala jer točke rezova moraju biti tako odabrane da svaki isječak počinje I-slikom.

Slika 8. Kodiranje između slika

Sustav kodiranja između slika nije pogodan za prijenos videosignala u kojem postoje velike razlike između pojedinih slika (npr. nagli pokreti) jer su razlike prevelike da bi ih se moglo učinkovito kodirati. To dovodi do potrebe za uvođenjem nadomještanja pokreta (motion compensation). Nadomještanje pokreta provodi se tako da se na strani kodera uspoređuju prethodna i trenutna slika, te se mjeri pomak područja slike za dobivanje vektora pomaka. Koder modelira objekt na novom položaju pomicanjem elemenata prethodne slike pomoću vektora pomaka. Odstupanja od stvarne situacije korigiraju se usporedbom modelirane i stvarne slike (slika 9.). Koder šalje vektore pomaka i signal razlike slika. Dekoder pomiče objekt iz prethodne slike pomoću vektora pomaka i dodaje signal razlike da bi dobio slijedeću sliku. Nadomještanje pokreta omogućava veći stupanj kompresije, uz veću složenost samog sustava.

Slika 9. Kodiranje s nadomještanjem pokreta

MPEG NORME

UVODNI POJMOVI

Prostorna i vremenska redundancija

Kompresija videosignala zahtijeva postupak identifikacije redundancije u programskom materijalu koji se prenosi. Taj postupak obično se provodi u dva koraka:3. 1. pronalaženje i uklanjanje prostorne redundancije – vrši se unutar svake

pojedinačne slike, bez referenci na prethodne ili slijedeće slike;4. 2. vremenska redundancija pronalazi se i uklanja pomoću usporedbe

trenutne i prethodne slike.

Diskretna kosinusna transformacija Prostorna redundancija postoji u svim realnim programskim materijalima. Ako u slici postoji neki prepoznatljivi objekt, tada će svi elementi slike koji ga predstavljaju imati sličnu vrijednost amplitude. Veličina objekata u slici određuje prostornu frekvenciju koja će se pojaviti u signalu. U realnim situacijama prevladavaju niže frekvencije, a osim toga, u signalu se najčešće ne pojavljuje cijeli spektar frekvencija. Nužno je dakle provesti frekvencijsku analizu. U tu svrhu koristi se diskretna kosinusna transformacija (DCT = Discrete Cosine Transform) da bi se vrijednosti elemenata slike pretvorile u koeficijente koji se dalje lakše mogu podvrgnuti postupku kompresije. Izvorna slika najprije se dijeli u blokove veličine 8×8 elemenata slike. Na svaki blok se primjenjuje dvodimenzijska DCT koja daje 64 DCT koeficijenta:

16

)12(cos

16

)12(cos),(

4

)()(),(

7

0

7

0

vkujkjf

vCuCvuF

j k

,2

1)( uC

za u = 0, C(u) = 1, za u = 1, 2, ... , 7;

,2

1)( vC

za v = 0, C(v) = 1, za v = 1, 2, ... , 7. U gornjoj formuli F(u,v) su DCT koeficijenti, a f(j,k) izvorne vrijednosti amplitude elemenata slike.F(0,0) naziva se istosmjerni (DC) koeficijent i najčešće se računa prema formuli:

7

0

7

0

),(8

1)0,0(

j k

kjfF

Ova formula govori nam da je DC koeficijent zapravo jednak osmerostrukoj srednjoj vrijednosti elemenata slike u bloku.

Slika 10. Prikaz bloka DCT koeficijenata

Na slici 10. gornji lijevi kut predstavlja DC koeficijent, a spuštajući se dolje i desno dolazi se do koeficijenata koji predstavljaju visoke prostorne frekvencije signala nastalog iz izvorne slike. Pomak prema desno predstavlja porast horizontalne prostorne frekvencije, a pomak prema dolje predstavlja porast vertikalne prostorne frekvencije. Na strani dekodera vrijednosti elemenata slike mogu se rekonstruirati pomoću inverzne diskretne kosinusne transformacije (IDCT):

16

)12(cos

16

)12(cos),(

4

)()(),(

7

0

7

0

vkujvuF

vCuCkjf

u v

Diskretnom kosinusnom transformacijom ne provodi se kompresija. Pomoću te transformacije samo se izvorni elementi slike pretvaraju u oblik iz kojega je moguće jasno odrediti redundanciju. Pošto sve prostorne frekvencije nisu istodobno prisutne u signalu, DCT će dati skup koeficijenata od kojih će neki biti jednaki ili vrlo bliski nuli. Koeficijente koji su jednaki nuli ne treba uopće prenositi, a koliko će se koeficijenata bliskih nuli odbaciti, ovisi o željenoj kvaliteti slike i stupnju kompresije koji se želi postići. Ukoliko se neki koeficijent ne može odbaciti, moguće ga je, u cilju postizanja većeg stupnja kompresije, prenijeti s

manjim brojem bita, čime se manje narušava kvaliteta slike nego potpunim odbacivanjem.

Kvantizacija Vidljivost prostornih frekvencija u signalu znatno varira u cijelom rasponu. Ljudsko oko može tolerirati mnogo veću količinu šuma na visokim frekvencijama nego na niskim. Zbog toga se rabi kvantizacija, kako bi se sav eventualno nastali šum koncentrirao u području visokih frekvencija, gdje je slabo uočljiv. DCT koeficijenti se dijele faktorom koji je funkcija položaja koeficijenta u bloku (faktor dijeljenja se povećava pri kretanju prema desno i prema dolje u tablici koeficijenata). Istosmjerni (DC) koeficijent se ne kvantizira. Na strani dekodera visokofrekvencijski koeficijenti se množe najvećim faktorom, tako da je utjecaj šuma prebačen najvećim dijelom u to područje, koje je oku najmanje vidljivo.Nakon kvantizacije, vrijednosti koeficijenata bit će još manje, tako da će većina njih biti vrlo bliska nuli. U tipičnom programskom materijalu, većina velikih koeficijenata se nalazi u gornjem lijevom kutu bloka. Zbog takvog rasporeda koeficijenata prikladno je koeficijente očitavati metodom cik-cak analiziranja (slika 11.), počevši od gornjeg lijevog kuta tablice.

Slika 11. Cik-cak analiziranje

Pritom se dobiva niz koeficijenata koji na početku sadrži koeficijente različite od nule, dok su koeficijenti jednaki nuli koncentrirani na kraju niza. Takav oblik omogućava da se umjesto krajnjih koeficijanata (koji su ionako jednaki nuli) u daljnji tok signala šalje samo oznaka koja predstavlja te koeficijente.

Kodiranje s promjenjivom dužinom niza U nizu podataka dobivenom nakon cik-cak analiziranja koeficijenti manje vrijednosti imaju ispred sebe više nula nego koeficijenti veće vrijednosti. Zbog toga je pogodno koristiti algoritam kodiranja koji će takvu raspodjelu znati iskoristiti. Huffmanov način kodiranja dodjeljuje kraći kod onim vrijednostima koje se češće pojavljuju, a duži kod onim vrijednostima koje se pojavljuju rijetko. Time se postiže veća učinkovitost pri prijenosu većine realnih informacija. Pri upotrebi diskretne kosinusne transformacije čest je slučaj da mnogi koeficijenti imaju vrijednost jednaku nuli, te je učinkovito takav niz kodirati pomoću kodiranja dužine niza. Na taj način koder jednostavno šalje podatak koliko je koeficijenata zaredom jednako nuli.

Kodiranje unutar slike (intra-kodiranje) Slika 12. Kodiranje unutar slike

Slika 12. prikazuje potpunu blok-shemu kodiranja unutar slike. Kodiranjem unutar slike nastaju tzv. I-slike (Intra-coded pictures) Ulazna slika se dijeli u blokove veličine 8×8 elemenata. Na svaki blok se primjenjuje DCT, čime se dobiva tablica koeficijenata koji se potom kvantiziraju. Cik-cak analizom se iz tablice dobiva niz koji se šalje na kodiranje dužine niza i rezultat se šalje u prijenosni kanal. U dekoderu se izvorni signal ponovno rekonstruira postupkom koji je potpuno inverzan postupku pri kodiranju.

Kodiranje između slika (inter-kodiranje) Sustav prikazan na slici 11. uklanja samo prostornu redundanciju sadržanu unutar pojedine slike. Kodiranje unutar slike ne iskorištava postojanje redundancije između dviju slika u nizu. Kako iskoristiti i tu (vremensku redundanciju? Rješenje leži u diferencijalnom kodiranju (slika 13.)

Slika 13. Dobivanje razlike slika

Da bi se mogla dobiti razlika između dvije slike, nužno je imati kašnjenje realizirano u sklopu kodera. Vrijednost svakog elementa prethodne slike se oduzima od odgovarajućeg elementa u trenutnoj slici, čime se dobiva razlika slika, koja je također dvodimenzijska slika, i može se podvrgnuti postupku kompresije unutar slike primjenom diskretne kosinusne transformacije. U dekoderu se također koristi kašnjenje prethodne slike, s kojom se potom zbraja razlika slika da bi se dobila trenutna slika. Ta trenutna slika zatim ponovno ulazi u krug kašnjenja da bi se dobila slijedeća slika. Pri ovakvom postupku kodiranja između slika nužno je spriječiti gomilanje sitnih pogrešaka zbog opasnosti da se one akumuliraju tijekom procesa kompresije izvornog videosignala. Najznačajniji uzrok pojave pogrešaka je kompresija razlike slika. Radi uklanjanja pogrešaka koje bi uzrokovale potpun gubitak informacije nakon nekog vremena, nužno je da koder i dekoder imaju identični dekoder razlike slika. U trenutku kada dekoder oduzima ptrethodnu sliku od trenutne, on u stvari oduzima lokalno dekodiranu sliku, identičnu onoj koju će dobiti stvarni dekoder na drugoj strani prijenosnog puta. Na taj način će biti uklonjene sve pogreške uzrokovane prethodnom kompresijom razlike slika. Sustav je prikazan na slici 14.

Slika 14. Uklanjanje kumulativne pogreške pri kodiranju između slika

Nadomještanje pokreta; P-slike Diferencijalno kodiranje prikazano na slici 14. daje dobre rezultate ukoliko izvorni videosignal ne sadrži znatan broj pokretnih objekata u slici. Ukoliko to nije slučaj, razlika slika će sadržavati gotovo istu količinu podataka kao da se uopće nije koristilo kodiranje između slika. Najbolji primjer za to je pomak kamere u jednom smjeru. Pri takvom pomaku vrijednosti većine elemenata slike se ne mijenjaju, nego samo dolazi do njihovog pomaka na drugo mjesto. Da bi se i takav videosignal mogao uspješno komprimirati, nužno je uvesti nadomještanje (kompenzaciju) pokreta. Pri upotrebi kodera koji omogućava nadomještanje pokreta, uspoređuju se područja dvaju susjednih slika u nizu, kako bi se ustanovio smjer i veličina relativnog pomaka između slika. Tako se dobivaju podaci u obliku dvodimenzijskog vektora pomaka (slika 15.).

Slika 15. Kodiranje uz nadomještanje pokreta

(1) Mjerenje pomaka između slika A i B(2) Pomicanje slike A pomoću vektora pomaka(3) Oduzimanje slike A od slike B(4) Odašiljanje vektora i podataka razlike slika u prijenosni kanal

Koder rabi vektore pomaka za pomicanje elemenata prethodne slike i stvaranje predviđene slike (P-slike, Predicted Frames) prije nego što njihove vijednosti oduzme od vrijednosti elemenata trenutne slike. Ukoliko je pocjene pokreta bila točna, proces pomaka će dovesti objekte u predviđenoj slici na isto mjesto na kojem se nalaze u stvarnoj slici, te će preostati samo mala količina podataka o razlikama između slika. Pošto se vektori pomaka šalju zajedno s podacima razlike slika, dekoder na prijemnoj strani ih može upotrijebiti za jednaki pomak prethodne slike čime dobiva odgovarajuću P-sliku. Zbrajanjem signala razlike dobiva se dekodirana trenutna slika. Za potrebe nadomještanja pokreta slika je razbijena u pravokutna područja koja se nazivaju makroblokovi. Svaki makroblok ima vlastiti vektor pomaka koji se primjenjuje na cijeli blok. U ovisnosti o položaju objekata, neki makroblokovi se pomiču, a neki ne. Zato nije uvijek nužno koristiti nadomještanje pokreta, već se koder treba ''odlučiti'' da li

takav postupak daje manju potrebnu brzinu prijenosa ili je bolje raditi bez nadomještanja pokreta, prenoseći samo razlike slika. Zbog činjenice da je kretanje nekog objekta u realnom programskom materijalu relativno konstantno u trajanju od nekoliko slika, vektori pomaka se odašilju diferencijalno, tj. ukoliko nema promjene u načinu pomaka, vrijednost parametra vektora pomaka jednaka je nuli, te se vektori jednostavno kopiraju iz prethodne slike. Ako kretanje mijenja brzinu ili smjer, tada se šalju razlike vektora pomaka.

Dvosmjerno predviđanje; B-slike U svrhu dodatnog smanjenja zahtjeva na brzinu prijenosa, odnosno za postizanje još većeg stupnja kompresije, uvodi se koncept dvosmjernog kodiranja (slika 16.), čime se dobivaju B-slike (Bidirectionally Coded Frames). Slika 16. Dvosmjerno kodiranje

Trenutna slika se uspoređuje i sa prethodnom i sa budućom slikom; izvode se dvosmjerni vektori pomaka. Područje označeno kvadratićem na trenutnoj slici dobiva se tako iz buduće slike. Dvosmjerno predviđanje zahtijeva promjenu rasporeda slika pri prijenosu jer do dekodera moraju prvo stići buduće slike potrebne u procesu predviđanja, a zatim trenutna slika. Najčešće grupe slika (uz mnogo ostalih rasporeda):

IIII...IPIP...IBPIBP... (prijenosni raspored IPBIPB...)IBIB...

Razlozi za prijenos I-slika U praksi nije moguće koristiti čisto diferencijalno kodiranje, budući da dekoder može primati signal samo od njegovog početka. Osim toga, svaka pogreška u prijenosu samo jedne slike prenosi se na sve slijedeće slike. Zbog toga je nužno povremeno u prijenosni tok ubaciti slike koje su kodiranje isključivo metodom kodiranja unutar slike, bez predviđanja (I-slike), tako da se dobiva struktura toka podataka kao na slici 17.

Slika 17. Primjer strukture prijenosnog toka podataka

U nizu slika nije apsolutno nužno da se I-slike pojavljuju u strogo određenom rasporedu, budući da svaka slika ima oznaku koja govori dekoderu kako je treba obraditi. Uređivanje i naknadna obrada ovakvog signala moguća je samo u trenucima u kojima se pojavljuju I-slike. Zbog toga, u slučaju kad je potrebna naknadna obrada videosignala, I-slike se moraju koristiti u znatnijoj mjeri, te nisu mogući veliki omjeri kompresije.

OPĆENITO O MPEG NORMAMA MPEG (Moving Pictures Experts Group) je radna grupa unutar ISO/IEC (International Standardization Organisation / International Electrotechnical Committee), zadužena za razvoj međunarodnih standarda za kompresiju, dekompresiju, obradu i prezentaciju pokretnih slika i pratećih audio sadržaja.Do sada su donešene slijedeće norme:

MPEG-1 – kodiranje pokretnih slika i pratećih audiosignala za digitalno pohranjivanje pri brzinama do 1,5 Mbit/s (1992. godine);

MPEG-2 – generičko kodiranje pokretnih slika i pratećih audiosignala (1995.);

MPEG-4 – kodiranje audio-vizualnih objekata (verzija 1: 1998., verzija 2: 1999.);

MPEG-7 – sučelje za opis multimedijskih sadržaja (2001.);MPEG-21 – multimedijski sustav.

MPEG norme same po sebi se ne mogu jednostavno definirati. U svojoj biti, MPEG je skup standardnih alata, precizno definiranih algoritama i načina na koji se oni mogu kombinirati kako bi se napravio stvarni sustav za kompresiju signala. Suprotno očekivanju, MPEG norme ne propisuju egzaktni način na koji se kompresija mora provesti. Umjesto toga, MPEG precizno propisuje način na koji dekoder mora obraditi skup različitih komprimiranih tokova podataka. MPEG ne propisuje kako treba prenositi sam signal, jer će to biti određeno karakteristikom sustava u primjeni. Razlog za takav pristup je omogućavanje velike fleksibilnosti, uz istovremeneo zadržavanje kompatibilnosti među sustavima. Razni proizvođači opreme mogu razvijati različite algoritme kompresije, ali izlazni komprimirani videosignal mora biti sukladan MPEG standardu. To omogućava da se sami algoritmi kompresije neprekidno usavršavaju, a da istovremeno komprimirani signal ostane kompatibilan sa svim postojećim dekoderima. Primjena kompresije videosignala na zadržava se samo na televizijskim sustavima; kompresija se koristi za niz primjena, počevši od prikaza videosignala na monitorima računala, pa sve do raznih prezentacijskih primjena. Zahtjevi za kvalitetom variraju od vrlo malih (npr. videotelefoni, videonadzor, ...) do vrlo velikih (transparentnost potrebna u TV produkciji). U različitim primjenama tako se može dopustiti različit stupanj složenosti kodera i dekodera, što je dovelo do potrebe za slojevitom strukturom kodiranja.


Formati slike ITU-R preporuka BT.601:

određuje frekvencije uzorkovanja za komponente videosignala u 525/60 i 625/50 standardima uz omjer stranica 4:3 i 16:9

definira formate uzorkovanja 4:4:4 (frekvencija uzorkovanja za sve komponente signala iznosi 13,5 MHz (4:3), odnosno 18 MHz (16:9)) i 4:2:2 (frekvencija uzorkovanja 13,5/18 Mhz za luminantnu komponentu i 6,75/9 MHz za svaku od krominantnih komponenti)

576 linija u aktivnom dijelu slike za 625/50 sustav i 480 linija u aktivnom dijelu slike za 525/60 sustav

svaka digitalna linija u aktivnom intervalu sadrži 720 luminantnih uzoraka, te 720 (4:4:4) ili 360 (4:2:2) uzoraka krominantnih komponenti

Osim formata 4:4:4 i 4:2:2 u upotrebi su i formati 4:1:1 i 4:2:0 (nije dio preporuke BT.601, ali se koristi u MPEG normi). Kao polazišni format pri kompresiji prema MPEG-1 normi, upotrebljava se SIF (Source Input Format), izveden iz ITU-R preporuke BT.601.

Tablica 1. SIF i BT.601 formati slike

Vertikalna frekvencija 25 Hz 30 Hz

Luminantna komponenta:ITU-R BT.601SIF

720 × 576360 × 288

720 × 480360 × 240

Krominantna komponenta:ITU-R BT.601SIF

360 × 576180 × 144

360 × 480180 × 120

Iz tablice je vidljivo kako je rezolucija slike koja se koristi u postupku MPEG-1 kodiranja smanjena na polovicu, u odnosu na rezoluciju slike propisanu preporukom BT.601. Slika 18. Postupak dobivanja SIF formata iz BT.601 oblika

Brojke u zagradama na slici se odnose na 525/60 sustav, a izvan zagrada na sustav 625/50. Postupkom prikazanim na slici 18. dobiva se SIF format (strukture uzorkovanja 4:2:0), koji ipak nije još uvijek moguće direktno upotrijebiti za kompresiju, jer horizontalna rezolucija od 360 elemenata slike nije djeljiva sa 16, što je nužno zbog podjele slike na makroblokove. Prilagođenje se izvodi odbacivanjem krajnjih lijevih i krajnjih desnih elemenata slike, čime se dobiva format 352 × 288 (za 625/50 sustav) ili 352 × 240 (za 525/60 sustav).

Hijerarhijska struktura kodiranja Kodiranje po MPEG normi organizirano je u šest slojeva (slika 19.):

Blok – najmanja jedinica koja se podvrgava kodiranju; veličine 8×8 elemenata slike

Makroblok – osnovna jedinica za kodiranje s nadomještanjem pokreta; veličine 16×16 elemenata slike

Isječak slike (slice) – horizontalni niz makroblokovaSlika – osnovna jedinica u MPEG kodiranju; četiri vrste:

I-slike – slike kodirane samostalno unutarnjim kodiranjem P-slike – kodirane s predviđanjem uz nadomještanje pokreta B-slike – kodirane s predviđanjem uz nadomještanje pokreta, pri čemu se

predviđanje vrši iz prethodnih i iz budućih slika D-slike – slike dobivene kodiranjem samo istosmjernog (DC) koeficijenta;

koriste se izuzetno rijetko

Grupa slika (GOP = Group of pictures) – niz od jedne ili više slika pri kodiranju i/ili prijenosu

Sekvenca – niz od određenog broja grupa slika

Slika 19. Hijerarhijska struktura kodiranja

U grupi slika pojedine slike su raspoređene prema slijedećem rasporedu:

I1 B1 B2 P1 B3 B4 P2 B5 B6 P3 B7 B8 I2

Za rekonstrukciju B-slika nužno je imati i prethodne i buduće I i P-slike, te se prijenosni raspored mora tome prilagoditi (slika 20.):

I1 P1 B1 B2 P2 B3 B4 P3 B5 B6 I2 B7 B8

Slika 20. Raspored slika pri kodiranju i pri prijenosu

Postupak kodiranja Postupak MPEG kodiranja provodi se u više faza (blok-shema je prikazana na slici 21.):

4. Slika se dijeli u blokove veličine 8 × 8 elemenata slike. 5. Provodi se diskretna kosinusna transformacija (uklanjanje prostorne redundancije)

koriste se 64 koeficijenta transformacijeprovodi se kvantizacija DCT koeficijenata

6. Provodi se kodiranje s predviđanjem uz nadomještanje pokreta (uklanjanje vremenske redundancije) DCT koeficijenti se inverzno kvantiziraju, transformiraju i pohranjujuizvorna slika se uspoređuje s prethodnom I ili P-slikomu sklopu za predviđanje pokreta proračunavaju se vektori pokretavektori pokreta se primjenjuju na prethodnu slikumakroblok iz prethodne slike pomaknut vektorom pokreta postaje prediktor

(osnova za daljnje predviđanje)pogreška predviđanja (razlika slika) kodira se primjenom DCTprovodi se kvantizacija DCT koeficijenata (korak kvantizacije za sve koeficijente

je 16)

Slika 21. Blok-shema MPEG kodera:

Značenje kratica na slici:

Q = kvantizacija,DCT = diskretna kosinusna transformacija,VLC = kodiranje s promjenjivom dužinom riječi,Q-1 = inverzna kvantizacija,DCT-1 = inverzna DCT.

Osnovna namjena MPEG-1 norme: kodiranje pokretnih slika i pratećih audiosignala za digitalno pohranjivanje pri brzinama do 1,5 Mbit/s. Koristi se isključivo progresivno analiziranje.


Opća svojstva MPEG-2 norme MPEG-2 je norma za generičko (aplikacijski neovisno) kodiranje videosignala i pratećih audio sadržaja. Algoritam koji se primjenjuje za kodiranje sličan je algoritmu u MPEG-1 normi. Osnovna razlika između MPEG-1 i MPEG-2 normi:

MPEG-1 je prilagođen videosignalu s progresivnim analiziranjem, osnovna namjena mu je bila snimanje videosignala na CD, brzina prijenosa do 1,5 Mbit/s.

MPEG-2 je opći standard namijenjen i videosignalima s progresivnim analiziranjem i videosignalima koji koriste analiziranje s proredom (slika se dijeli na dvije poluslike);

MPEG-2 nudi slojevitu strukturu profila (podskup sintakse toka podataka) i razina (određuje parametre koji su dopušteni unutar odabranog profila.

Struktura MPEG-2 kodiranja MPEG-2 norma sadrži slijedeće profile i razine:

3. 1. Profili:

osnovni (SP = Simple Profile) – daje najnižu kvalitetu signala, ne podržava slojevito kodiranje, ne uključuje dvosmjerno predviđanje, format slike je 4:2:0;

glavni (MP = Main Profile) – ne podržava slojevito kodiranje, ali postoji dvosmjerno predviđanje; format slike je također 4:2:0;

4:2:2 (4:2:2P) – format slike je 4:2:2, omogućeno je korištenje većih brzina prijenosa nego u glavnom profilu;

profil sa slojevitošću u odnosu na omjer signal/šum (SNR) – omogućava različite kvalitete slike s obzirom na odnos signala i šuma;

profil s prostornom slojevitošću (Spatial) – podržava različite prostorne rezolucije slike;

vršni profil (HP = High Profile) – podržava potpunu slojevitost i najvišu kvalitetu slike. 4. Razine:

niska (LL = Low Level) – SIF format slikeglavna (ML = Main Level) – standardni formati TV slikevisoka 1440 (High-1440) – videosignal sa 1440 uzoraka po linijivisoka (HL = High Level) – videosignal sa 1920 uzoraka po liniji

Tablica 2. Profili i razine u MPEG-2 normi

Razina Profil

Osnovni Glavni 4:2:2 SNR Prostorni Vršni

Visoka


192011524:2:0I, P, B80

192011524:2:2I, P, B80

192011524:2:2,4:2:0I, P, B100

Visoka1440


144011524:2:0I, P, B60

144011524:2:0I, P, B60

144011524:2:0,4:2:2I, P, B80

Glavna


7205764:2:0I, P15

7205764:2:0I, P, B15

7205764:2:2I, P, B50

7205764:2:0I, P, B15

7205764:2:0,4:2:2I, P, B20

Niska


3522884:2:0I, P, B4

3522884:2:0I, P, B4

MPEG koder – dobivanje I, P i B slika Na slikama 22a, 22b i 22c prikazana je tipična izvedba MPEG kodera, koja sadrži dvosmjerno nadomještanje pokreta. Digitalni videosignal ulazi kroz seriju sklopova za kašnjenje, koje je moguće zaobići, ovisno o željenom rasporedu slika. Signal zatim ulazi u sklop za oduzimanje i u sklop za procjenu pomaka. Ukoliko se želi dobiti I-slika, ulazno kašnjenje je uključeno u tok signala, a sklop za oduzimanje je isključen, tako da signal direktno prolazi do sklopa za prostorno kodiranje (kodiranje unutar slike). Signal se zatim šalje u slikovnu memoriju, gdje se pohranjuje nastala I-slika (slika 22a).

Slika 22a. MPEG koder – dobivanje I-slike

Slijedeći korak pri kodiranju videosignala je dobivanje P-slike (slika 22b). U tu svrhu, ulazni sklopovi za kašnjenje se isključuju, kako bi se odabrala buduća slika, što je potrebno zbog strukture grupe slika pri prijenosu. Sklop za procjenu pomaka uspoređuje I-sliku (koja se nalazi u izlaznoj memoriji) sa P-slikom u ulaznoj memoriji, kako bi se dobili vektori pomaka. Pomoću tih vektora pomaka pomiče se I-slika čime se dobiva predviđena P-slika. Predviđena P-slika se oduzima od stvarne P-slike radi dobivanja iznosa pogreške predviđanja. Pogreška predviđanja se prostorno kodira i šalje zajedno s vektorima pomaka. Osim toga, pogreška predviđanja se dodaje predviđenoj P-slici, čime se dobiva lokalno dekodirana P-slika koja se pohranjuje u izlaznoj memoriji. Izlazna memorija sada sadrži I-sliku i P-sliku, tako da se može prijeći na kodiranje B-slika.

Slika 22b. MPEG koder – dobivanje P-slike

Nakon kodiranja I i P-slike, u ulazni memorijski spremnik dolazi B-slika. Sklop za nadomještanje pokreta uspoređuje B-sliku s prethodnom I-slikom i budućom P-slikom (koje su pohranjene u izlaznoj memoriji), čime se dobivaju dvosmjerni vektori pomaka (slika 22c). Postupkom nadomještanja pokreta provedenim u oba smjera dobivaju se dvije predviđene B-slike, koje se oduzimaju od trenutne B-slike. Na razini makroblokova odabire se pomak prema naprijed ili prema natrag, ovisno o tome koji daje najmanju razliku. Razlike se potom prostorno kodiraju i šalju zajedno s vektorima pomaka. Nakon što se kodiraju sve B-slike, prelazi se na stvaranje nove P-slike iz prethodno pohranjene P-slike. Postupak se zatim nastavlja.

Slika 22c. MPEG koder – dobivanje B-slike

Kvaliteta slike; primjene MPEG-2 norme Cilj koji se želi postići pri prijenosu videosignala jest visoka kvaliteta uz što je moguće manju brzinu prijenosa. Pritom neizbježno dolazi do problema i različitih načina pristupa rješenju. Smanjenjem brzine prijenosa konstantnu kvalitetu slike moguće je postići promjenom strukture grupe slika. Grupa slika koja se sastoji samo od I-slika zahtijeva najveću brzinu prijenosa, što znači da je pri smanjivanju brzine prijenosa nužno ubacivati B i P-slike. Visoku kvalitetu pri brzinama prijenosa nižim od 20 Mbit/s moguće je ostvariti jedino uz primjenu B i P-slika (slika 23).

Slika 23. Krivulja konstantne kvalitete

U normi MPEG-2 primjenjuje se slojevito kodiranje – podaci se u koderu dijele na dva ili više tokova s različitim informacijama o videosignalu. Time je omogućen rad kodera i dekodera različitih kvaliteta. Slojevito kodiranje jedna je od najznačajnijih osobina MPEG-2 norme. Poseban značaj slojevito kodiranje ima pri prijenosu videosignala putem računalne mreže, jer se postupak kodiranja može prilagoditi ovisno o trenutnom prometu u mreži, odnosno o raspoloživoj brzini prijenosa i kašnjenju paketa uzrokovanom prilikama u mreži. Dekoder može dekodirati samo dio podataka iz ukupnog toka podataka, ukoliko je dovoljna niža kvaliteta slike.Podaci se u koderu dijele po kriteriju koji može biti odnos signal/šum, prostorna ili vremenska rezolucija. Takvu slojevitost podržavaju SNR profil, profil s prostornom slojevitošću i vršni profil. Kvaliteta slike je određena brzinom prijenosa i rasporedom slika u grupi slika, što se određuje ovisno o primjeni. Ukoliko je potrebno naknadno obrađivati videosignal, koriste se kratke grupe slika (IBIB...) uz brzine prijenosa 30-50 Mbit/s, a ukoliko se radi samo ograničen broj generacija snimke, tada se može upotrijebiti i grupa slika IBBP... uz brzinu prijenosa od približno 20 Mbit/s. Primjene 4:2:2P@ML (4:2:2 profil, glavna razina):

terenska snimanja i vijesti (18 Mbit/s, struktura grupe slika IB)primarna distribucija (20 Mbit/s, struktura IBBP)pohranjivanje (30 Mbit/s, struktura IP)postprodukcija (50 Mbit/s, samo I slike).

Primjena MP@ML (glavni profil, glavna razina): distribucija do krajnjih korisnika (TV gledatelja) putem zemaljskih,

kabelskih i satelitskih distribucijskih sustava uz brzine prijenosa 4-9 Mbit/s. Uz manje brzine prijenosa (manje od 15 Mbit/s), 4:2.2 profil daje lošije rezultate nego glavni profil (slika 23.), a razlog za to jest veći broj krominantnih uzoraka u 4:2:2 profilu, koji zahtijeva veći stupanj kompresije da bi se postigla ista brzina prijenosa nego glavni profil (4:2:0).

Slika 24. Ovisnost kvalitete o brzini prijenosa i strukturi grupe slika

Iz slike je vidljivo da struktura grupe slika znatno utječe na kvalitetu slike. Također je vidljivo da, čak ni uz visoke brzine prijenosa, nije moguće postići visoku kvalitetu slike bez upotrebe predviđanja pokreta.

Prijenos i pohranjivanje MPEG-2 signala Da bi se pristupilo prijenosu ili pohranjivanju MPEG-2 signala, tokovi podataka (videosignal, audiosignal) moraju se multipleksirati. Multipleksiranjem se dobiva:

Prijenosni tok podataka (TS = Transport Stream) – namijenjen prijenosu signala zemaljskim, kabelskim ili satelitskim vezama

Programski tok podataka (PS = Program Stream) – namijenjen pohranjivanju podataka na digitalni medij (DVD, magnetska vrpca, ...)

Multipleksiranje audio i videosignala potrebno je kako bi se omogućio njihov zajednički prijenos, te ispravno dekodiranje i prikazivanje. U programskom toku podataka se multipleksira videosignal s pratećim audiosignalima (višekanalni zvuk) i podacima, pri čemu ti svi signali pripadaju jednom programu. U prijenosnom toku moguće je multipleksiranje audiosignala, videosignala i podataka koji pripadaju različitim programima. Hijerarhija multipleksiranja određena MPEG-2 normom sastoji se od tri vrste tokova podataka:

osnovni tok podataka (ES = Elementary Stream)paketizirani osnovni tok podataka (PES = Packetized Elementary Stream)prijenosni (TS) ili programski (PS) tok podataka (slika 25.).

Slika 25. Dobivanje programskog i prijenosnog toka podataka

Programski tok dobiven multipleksiranjem sadrži pakete nastale iz jednog ili više osnovnih tokova podataka koji pripadaju jednom programu; može sadržavati jedan tok podataka videosignala i više tokova podataka audiosignala.

Paketi programskog toka imaju promjenjivu duljinu što uzrokuje poteškoće budući da dekoder mora prepoznati točan početak i kraj paketa. Da bi se to omogućilo, u zaglavlju paketa se nalaze podaci o duljini paketa. Primjer programskog toka prikazan je na slici 26.

Slika 26. Paketi programskog toka podataka

Za razliku od programskog toka podataka, prijenosni tok može sadržavati jedan ili više različitih programa, tj. on može nastati multipleksiranjem više programskih tokova podataka ili multipleksiranjem PES paketa koji pripadaju različitim programima. Osim toga, prijenosni tok je namijenjen prijenosu MPEG signala kroz mrežu, tako da mora biti oblikovan tako da bude što manje osjetljiv na smetnje i pogreške u prijenosu. Zbog toga se koriste paketi fiksne duljine koji se mogu brzo komutirati u širokopojasnim mrežama. Paketi programskog toka podataka imaju konstantnu duljinu od 188 bajta, od čega zaglavlje sadržava 4 bajta, a ostalih 184 bajta je podijeljeno na adaptacijsko područje i područje podataka (slika 27.)

Slika 27. Paket prijenosnog toka podataka

Paket prijenosnog toka (188 bajta)

Zaglavlje (4 bajta) Adaptacijsko područje Podaci

Adaptacijsko područje sadrži vremenske oznake i reference kao i informacije koje omogućuju dohvat podataka; definira izgled ostalih dijelova paketa i sadrži informaciju o vrsti signala koji se prenosi u paketu.

Primjena MPEG-2 norme u radiodifuziji digitalnog TV signala Prijenos digitalnog TV signala definiran je u okviru DVB (Digital Video Broadcasting) projekta. Kao rezultat DVB projekta nastale su europske ETSI norme za satelitsku, kabelsku i zemaljsku radiodifuziju digtalnog TV signala.Opća blok-shema sustava za radiodifuziju digitalnog TV signala prikazana je na slici 28.

Slika 28. Sustav za prijenos digitalnog TV signala

Izvorno kodiranje obuhvaća postupke smanjenja količine podataka i brzine prijenosa. Prenose se tri vrste podataka: videosignali, audiosignali i prateće informacije (vremenske, sigurnosne, identifikacijske...). Kao rezultat izvornog kodiranja dobivaju se osnovni tokovi podataka (ES = Elementary Stream). MPEG-2 normom definiran je postupak uključivanja osnovnih tokova podataka u prijenosnu mrežu. Podaci se paketiziraju, pri čemu se paketi prijenosnog toka (TS) šalju na kanalno kodiranje, čime se osigurava zaštita od pogreške, i priprema signal za modulaciju VF nosioca. U svim zemaljskim, kabelskim i satelitskim sustavima za radiodifuziju digitalnog TV signala za izvorno kodiranje rabi se MPEG-2 norma, dok se kanalno kodiranje i modulacijski postupak razlikuju, ovisno o prijenosnom mediju:

za satelitsku radiodifuziju rabi se modulacijski postupak QPSK (Quadrature Phase Shift Keying)

glavna karakteristika tog modulacijskog postupaka je djelotvornost po snazi, što je važno zbog male snage odašiljača na satelitu i velikog gušenja signala pri prolasku kroz atmosferu;

za kabelsku distribuciju digitalnih TV signala rabi se QAM (Quadrature Amplitude Modulation – kvadraturna amplitudna modulacija) sa 16, 32 ili 64 diskretna stanja;

glavna osobina QAM postupka jest spektralna djelotvornost, koja omogućava prijenos signala kanalom čija je širina ograničena na 8 MHz;

za zemaljsku radiodifuziju rabi se OFDM (Orthogonal Frequency Division Multiplex) – frekvencijski multipleks ortogonalnih podnosilaca;

OFDM postupak koristi veliki broj frekvencijski vrlo bliskih podnosilaca, pri čemu je moguće pojedine podnosioce modulirati različitim modulacijskim postupcima.

MPEG kodiranje – test Test kvalitete slike kodirane primjenom MPEG normi obavljen je pomoću programa VcDemo, koji omogućava definiranje svih neophodnih parametara kodiranja (brzina prijenosa, vrsta grupe slika, odabir MPEG-1 ili MPEG-2 norme). Cilj ovog testa je dati uvid u ovisnost kvalitete slike o brzini prijenosa te strukturi grupe slika, a kao parametar kvalitete uzima se vršni odnos signal-šum u komprimiranom signalu (PSNR = Peak Signal to Noise Ratio). Ispitne sekvence koje se koriste u ovom testu dobivene su uz sam program. PSNR se temelji na razlici izvorne i dekodirane slike, prema slijedećoj formuli:

MSEPSNR

n )12(log10

, pri čemu je n broj bitova korištenih za kodiranje uzorka slike, a MSE parametar definiran formulom:

2

1 1,, )'(

1

M

j

N

kkjkj xx

MNMSE

Značenje oznaka u formuli: M, N – dimenzije slike,

xj,k – uzorak izvorne slike, x'j,k – uzorak dekodirane slike.

Rezultat testa je prikazan na slikama 29a i 29b. Na x-osi se nalaze vrste grupe slika, a na y-osi vrijednosti PSNR izražene u decibelima.

Slika 29a. Rezultat kodiranja ispitne sekvence ''Suzie''

30

35

40

45

50

55

I IBB IPP IBB3(PBB)

Grupa slika

PS

NR

[d

B]




MPEG-1, 1,15 Mbit/s

MPEG-1, 2,0 Mbit/s

MPEG-1, 3,5 Mbit/s

MPEG-1, 5,0 Mbit/s

MPEG-1, 8,0 Mbit/s

30

35

40

45

50

55

I IBB IPP IBB3(PBB)

Grupa slika

PS

NR

[d

B]




MPEG-2, 1,15 Mbit/s

MPEG-2, 2,0 Mbit/s

MPEG-2, 3,5 Mbit/s

MPEG-2, 5,0 Mbit/s

MPEG-2, 8,0 Mbit/s

Slika 29b. Rezultat kodiranja ispitne sekvence ''Car phone''

25

30

35

40

45

50

I IBB IPP IBB3(PBB)

Grupa slika

PS

NR

[d

B]




MPEG-1, 1,15 Mbit/s

MPEG-1, 2,0 Mbit/s

MPEG-1, 3,5 Mbit/s

MPEG-1, 5,0 Mbit/s

MPEG-1, 8,0 Mbit/s

25

30

35

40

45

50

I IBB IPP IBB3(PBB)

Grupa slika

PS

NR

[d

B]




MPEG-2, 1,15 Mbit/s

MPEG-2, 2,0 Mbit/s

MPEG-2, 3,5 Mbit/s

MPEG-2, 5,0 Mbit/s

MPEG-2, 8,0 Mbit/s

Iz dobivenih rezultata može se zaključiti slijedeće:

najveći utjecaj na kvalitetu slike (predstavljenu vršnim odnosom signal-šum) ima brzina prijenosa koju je moguće ostvariti u nekom prijenosnom kanalu;

utjecaj strukture grupe slika je jasno vidljiv: uz dodavanje P i B-slika u grupu slika, kvaliteta se poboljšava, što je naročito važno pri malim brzinama prijenosa;

vrsta kodiranja (MPEG-1 ili MPEG-2) ne utječe vidljivo na kvalitetu slike (u testiranim uvjetima);

sadržaj slike utječe na kvalitetu slike (uz inače jednake uvjete kodiranja). Dobiveni rezultati jasno govore da je poželjno, kad god je to moguće, koristiti veće grupe slika, uz primjenu i P-slika i B-slika. Nedostatak takve strukture pokazuje se jedino u slučaju da je videosignal potrebno naknadno obrađivati. U tom slučaju poželjno je (zbog uvjeta da rez mora započeti I-slikom) da grupe slika budu što kraće, odnosno da se koriste samo I-slike. Takav sustav zahtijeva velike brzine prijenosa.

Documents

Mpeg Norme