69

EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,
Page 2: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

EFEKTÍVNE KÓDOVANIE OBRAZOV

Prof. Ing. Ján Mihalík, PhD.

Laboratórium číslicového spracovania obrazov a videokomunikácií Katedra elektroniky a multimediálnych telekomunikácií

Fakulta elektrotechniky a informatiky Technická univerzita v Košiciach

Page 3: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

OBSAH 1. ÚVOD............................................................................................................. 1 2. PREHĽAD METÓD KÓDOVANIA OBRAZU............................................ 3 3. PREDIKČNÉ KÓDOVANIE OBRAZU....................................................... 6 3.1. Vnútrosnímkové predikčné kódovanie obrazu...................................... 8 3.2. Medzisnímkové predikčné kódovanie obrazu...................................... 11 3.3. Zhodnotenie účinnosti a vlastnosti metód predikčného kódovania obrazu............................................................................... 13 4. TRANSFORMAČNÉ KÓDOVANIE OBRAZU......................................... 15 4.1. Vnútrosnímkové transformačné kódovanie obrazu............................. 18 4.2. Medzisnímkové transformačné kódovanie obrazu.............................. 24 4.3. Zhodnotenie účinnosti a vlastností metód transformačného kódovania obrazu............................................................................... 26 5. HYBRIDNÉ KÓDOVANIE OBRAZU....................................................... 27 5.1. Vnútrosnímkové hybridné kódovanie obrazu...................................... 31 5.2. Medzisnímkové hybridné kódovanie obrazu....................................... 35 5.3. Zhodnotenie účinnosti a vlastností metód hybridného kódovania obrazu............................................................................... 41 6. INTERPOLAČNÉ A EXTRAPOLAČNÉ KÓDOVANIE OBRAZU......... 42 7. KÓDOVANIE OBRAZU S POUŽITÍM JEHO HIERARCHICKÝCH REPREZENTÁCIÍ..................................................................................... 46 8. KÓDOVANIE OBRAZU POMOCOU VEKTOROVÉHO KVANTOVANIA...................................................................................... 48 9. OBRYSOVÉ KÓDOVANIE OBRAZU...................................................... 51 10. MODELOVÉ KÓDOVANIE OBRAZU................................................... 53 11. ŠTATISTICKÉ A INÉ METÓDY KÓDOVANIA OBRAZU.................. 54 12. ZÁVER....................................................................................................... 56 LITERATÚRA ................................................................................................ 58

Page 4: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

1. ÚVOD Priemyselný charakter sveta sa v súčasnosti postupne mení na informačný. V súvislosti s tým sa formuje a intenzívne rozvíja nový vedný odbor informatiky, ktorého obsahom je vytváranie, spracovanie, prenos, záznam a využívanie informácií. Pretože človek najviac informácií prijíma cez svoj zrakový orgán, prioritnou informáciou sa stáva obraz. S prudkým rozvojom technológie integrovaných obvodov VLSI, výpočtovej techniky, mikroelektroniky aj optoelektroniky sa uprednostňuje číslicové spracovanie, prenos a záznam obrazov [1,2,3]. Tak ako číslicové systémy spracovania obrazov [4] aj číslicové obrazové komunikačné systémy [5,6] vo všeobecnosti obsahujú na svojom vstupe a výstupe kódovacie a dekódovacie systémy (kodeky). Techniky efektívneho (úsporného) kódovania obrazu [7] umožňujú značne redukovať bitovú rýchlosť na výstupe kodekov, pri zachovaní kvality kódovaného obrazu. Týmto sa znižuje požadovaná kapacita prenosového kanála na jeho prenos, čím sa dosahuje vysoká efektívnosť videokomunikácií, ale zároveň sa zmenšujú aj požiadavky na jeho záznam. Z tohto vyplýva aktuálnosť kódovania obrazu, pričom pri výbere jeho metód sa sleduje predovšetkým maximálna kompresia údajov, možnosť technickej realizácie s kódovaním v reálnom čase a odolnosť voči poruchám. Tieto metódy súčasne majú používať také algoritmy číslicového spracovania, ktoré sú vhodné aj pre iné úlohy, čo vedie k ich modulárnym štruktúram. Trvalo niekoľko desaťročí pokiaľ techniky kódovania obrazu prešli z čisto akademickej pôdy do komerčnej oblasti. Dostupné technológie efektívneho kódovania obrazu s vysokou kompresiou údajov umožňovali nové aplikácie vo videokomunikáciach ako sú : videotelefónia, videokonferencie, video na požiadanie, číslicové TV a HDTV vysielanie, multimediálne služby (video) atď. Tieto technológie bezprostredne ovplyvňujú produktivitu práce, pretože umožňujú realizáciu flexibilných, mobilných a interoperabilných obrazových komunikačných systémov, ktoré zabezpečujú videokomunikáciu každého s každým na akomkoľvek mieste a v ľubovoľnom čase. Preto narastala požiadavka medzinárodnej štandardizácie obrazových (video) kodekov. Ich štandardizácia umožní ľahkú výmenu kompresovaného videa pomocou pamäťových médií napr. CD-ROM, DVD alebo telekomunikačných sietí napr. ISDN, ATM a to na národnej aj medzinárodnej úrovni čím sa otvára veľký trh pre videokomunikačné zariadenia. Predkladaná monografia vznikla v Laboratóriu číslicového spracovania obrazov a videokomunikácií, Katedry elektroniky a multimediálnych telekomunikácií, FEI TU v Košiciach na základe dlhodobej vedeckej a pedagogickej činnosti autora v danej oblasti. Jej obsah je orientovaný najmä na techniky kódovania obrazu vhodné pre štandardné videokodeky, ktoré umožňujú realizáciu uvedených druhov videokomunikácií v homogennom aj heterogennom prostredí a zabezpečujú kompatibilitu komerčných zariadení pre tieto aplikácie od rôznych výrobcov.

1

Page 5: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

V 2.kap. sa uvádza prehľad metód kódovania obrazu a tieto sú hlbšie analyzované v kap.3 až 11. V nich sa pojednáva o princípoch, teórii a rôznych modifikáciach predikčných, transformačných, hybridných, interpolačných a extrapolačných metód kódovania obrazu ako aj metód s použitím hierarchických reprezentácií (pyramídovej, subpásmovej, waveletovej) alebo vektorového kvantovania obrazu, nakoniec aj obrysových, modelových, štatistických a iných metód kódovania obrazu. V záverečnej kap.12 sa vykonal chronologický (časový) vývoj jednotlivých metód kódovania obrazu a ich vyustenie do medzinárodných štandardných videokodekov. V zozname literatúry po jednotlivých kapitolách sa uvádzajú im zodpovedajúce referencie. Predkladaná monografia je určená pre študentov graduálneho (inžinierského aj bakalárskeho) a postgraduálneho (doktorandského) štúdia hlavne v odboroch telekomunikácií a elektroniky, ale aj iných príbuzných odboroch využívajúce informačné technológie. Okrem toho je určená vedeckým a odborným pracovníkom z odboru informatiky, ktorí sa zaoberajú dannou oblasťou, ale aj širokej odbornej verejnosti pracujúcej všeobecne v odbore číslicového spracovania a telekomunikácií vzhľadom na univerzálny charakter niektorých techník kódovania obrazu aplikovateľných aj pre iné signály.

2

Page 6: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

2. PREHĽAD METÓD KÓDOVANIA OBRAZU Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné, hybridné, interpolačné, extrapolačné, pyramídové, subpásmové, waveletové, s použitím vektorového kvantovania, štatistické a iné metódy. Ďalej sú možné rôzne kombinácie ( hybridizácie ) a modifikácie týchto metód [1 až 6]. Medzi najjednoduchšie metódy patrí PCM ( pulzná kódová modulácia ) [7]. Je reprezentovaná operáciami diskretizácie, kvantovania a kódovania. Môže byť navrhnutá s nemennými alebo premennými parametrami ( adaptívna PCM ). Jej nevýhodou je, že nevyužíva redundanciu obrazu. Dosahuje malú účinnosť kódovania, ale je značne odolná voči kanálovým poruchám. Preto sa často používa na primárne kódovanie ( digitalizáciu ) obrazu, po ktorom nasleduje úsporné kódovanie s vysokou účinnosťou Predikčné metódy [8,9], známe ako metódy diferenčnej pulznej kódovej modulácie ( DPCM ), využívajú koreláciu op. Realizujú sa ako nemenné a adaptívne. Adaptácia sa predovšetkým vzťahuje na predikciu a kvantovanie. Metódy podmieneného doplňovania op a oneskoreného kódovania sú neparametrické adaptívne metódy. Sú technicky jednoduché a dostatočne účinné. Ich nevýhodou je, že sú málo odolné voči rušeniu. Transformačné metódy [10,11] dosahujú vysokú účinnosť kódovania. Využívajú diskrétne ortogonálne transformácie. Môžu byť nemenné a adaptívne. Adaptácia sa uskutočňuje zmenou druhu transformácie alebo kritéria pre výber a kvantovanie spektrálnych koeficientov. Sú značne odolné voči rušeniu a ich nevýhodou je, že sú technicky zložité. Kombináciou predchádzajúcich dvoch metód dostávame tzv. hybridné metódy [12,13]. Využívajú jednoduchosť predikčných metód a vysoká účinnosť transformačných metód. Tým sa získa metóda, ktorá je vysoko účinná, odolná voči rušeniu a technicky relatívne jednoduchá. Jej rôzne modifikácie sú odvodené od modifikácií predikčných a transformačných metód. Ďalšie sú metódy interpolačné a extrapolačné [14], pri ktorých sa kódujú iba určité op a všetky ostatné sa získavajú buď interpoláciou alebo extrapoláciou dekódovaných op. Adaptácia sa uskutočňuje zmenou kritéria pre výber op alebo zmenou spôsobu (algoritmu ) interpolácie, resp. extrapolácie. Ich účinnosť je približne rovnaká ako pri predikčných, ale menšia ako pri transformačných a hybridných metódach. Sú pomalé a technicky zložité. Používajú sa tam, kde nie je možné kódovať každý op. Pyramídové kódovanie obrazu [15] predpokladá pyramídovú reprezentáciu obrazu, t.j. postupnosť pásmovo filtrovaných obrazov, ktorých diskretizácia sa vykonáva postupne s nižšou frekvenciou. Najprv sa vysiela najvyšia úroveň pyramídy, t.j. obraz s najmenším počtom op, ktorý sa v dekódovacom systéme pomocou interpolácie rozšíri na obraz s väčším počtom op ku ktorému sa pripočíta vysielaný obraz z nasledujúcej nižšej úrovne pyramídy. Tento proces

3

Page 7: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

sa analogicky opakuje smerom k nižším úrovniam pyramídy, čím postupne narastá priestorové rozlíšenie dekódovaného obrazu. V pyramídovom kódovaní sa pásmovo filtrované obrazy získavajú interaktívne, ale tieto možno získať aj priamo pomocou pásmových filtrov a tak dostaneme subpásmové kódovanie obrazu [16]. Potom pásmovo filtrované subobrazy sú kódované nezávisle a dekódovaný obraz je súčtom jednotlivých dekódovaných pásmovo filtrovaných subobrazov. Pyramídové alebo subpásmové kódovanie predchádza vývoju metód kódovania obrazu pomocou waveletovej [17] alebo fraktalovej transformácie [18]. Náhradou skalárneho kvantovania vo všetkých predchádzajúcich metódach kódovania obrazu pomocou vektorového kvantovania možno zvýšiť ich účinnosť kódovania. Vektorové kvantovanie obrazu [19] možno považovať za vektorové zovšeobecnenie PCM, ktoré využíva koreláciu medzi op. V tejto modifikácii sa vysoká účinnosť kódovania dosahuje pomocou vektorového kvantovania s veľkým rozmerom čím narastá zložitosť jeho imlementácie. Tento rozmer možno zmenšovať kombináciou vektorového kvantovania s inými klasickými metódami kódovania obrazu. V predikčnom kódovaní obrazu s vektorovým kvantovaním [20] sa rozmer zmenšuje na základe redukcie dynamického rozsahu vektorov pomocou predikcie. V interpolačnom alebo extrapolačnom kódovaní obrazu s vektorovým kvantovaním [21] vynechávanie zložiek vektora vedie k zmenšeniu jeho rozmeru. V transformačnom kódovaní obrazu s vektorovým kvantovaním [22] sa tento rozmer zmenšuje pomocou zanedbania nepodstatných (irelevantných) spektrálnych koeficientov. Podobne je tomu pri subpásmovom, resp. pyramídovom kódovaní obrazu s vektorovým kvantovaním [23] kde sa zanedbávajú vyššie harmonické zložky. Medzibloková korelácia transformovaných blokov umožňuje aplikovať vektorové kvantovanie malého rozmeru v smere maximálnej korelácie spektrálnych koeficientov a tak vytvoriť podobné modifikácie s hybridným kódovaním obrazu. Priamou aplikáciou vektorového kvantovania v hybridnom kódovaní obrazu [24] vznikajú analogické možnosti ako pri transformačnom kódovaní obrazu s vektorovým kvantovaním. Kombináciou klasických metód kódovania obrazu s vektorovým kvantovaním možno zvýšiť účinnosť kódovania a súčasne zmenšiť rozmer vektorových kvantizátorov. Vzájomný vzťah medzi týmito kombináciami z hľadiska účinnosti a zložitosti imlementácie ako aj iných vlastností zostáva rovnaký ako pre klasické metódy kódovania obrazu. Štatistické metódy využívajú nelineárnosť rozdelenia pravdepodobnosti symbolov akými sú napr. kvantované op alebo vektory. Metóda Huffmana alebo Shannona – Fana [25] priraďuje k symbolom kódové slová s rôznou dĺžkou v závislosti od ich pravdepodobnosti výskytu. Môže byť nemenná, ak rozdelenie pravdepodobnosti sa uvažuje na nekonečnom intervale a adaptívna, ak sa uvažuje na krátkych intervaloch. Naopak aritmetické kódovanie [26] priraďuje jednú kódovú skupinu celej postupnosti týchto symbolov. Metóda Shannonova – Fanova môže vychádzať aj z entrópie celého obrazu. Potom

4

Page 8: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

priraďuje každej realizácii obrazu adresu podľa entropickej kódovacej mapy, pričom je veľmi nepraktická. Všetky štatistické metódy sa nepoužívajú samostatne, ale vždy spolu s inými metódami na zvýšenie ich účinnosti. K iným metódam patrí obrysové kódovanie [27], pri ktorom sa najprv z obrazu oddelí zložka reprezentujúca vysoko kontrastné obrysy. Táto sa kóduje napr. pomocou priebežného kódovania úsekov ( RLC – Run – Length Coding ) [28] a zvyšok sa kóduje napr. predikčnými, transformačnými, alebo hybridnými metódami. Priebežné kódovanie úsekov dvoj hodnotového ( binárneho ) obrazu sa môže rozšíriť na viac hodnotový ( šedý ) obraz kódovaním priebehov v niekoľkých bitových rovinách [29]. Segmentáciou obrazu sa priamo získa jeho efektívna reprezentácia pomocou obrysov a textúr, ktorá umožňuje kódovanie obrysov pomocou zreťazených a aritmetických kódov [30], ale aj s využitím parametrickej splajnovej interpolácie. Naopak textúry možno efektívne kódovať napr. pomocou tvarovo zovšeobecnených ortogonálnych transformácií [31]. Veľmi vysokú kompresiu údajov dosahujú metódy kódovania pomocou analýzy a syntézy objektov obrazu s využitím ich trojrozmerných modelov [32]. K tomu sú prispôsobené aj metódy estimácie pohybu týchto objektov v trojrozmernom priestore a tiež metódy extrakcie príznakov (výrazov), na základe ktorých sa model vhodne deformuje. Pri týchto metódach sa kódujú a vysielajú iba príznaky a pomocou nich a známeho modelu sa vykonáva syntéza objektov obrazu v dekodéri. Autoregresívne kódovanie obrazu [33], ktoré je analogické s metódami lineárnych predikčných vokodérov používa autoregresívne modely na základe ktorých sa obraz popisuje reflexnými koeficientami a tieto sa potom kódujú. Po ich dekódovaní možno pomocou nich vykonať syntézu obrazu. Nevýhodou všetkých týchto metód je, že sú pomalé a menej univerzálne, technicky veľmi zložité, pretože vyžadujú značný počet operácií. Metódy kódovania obrazu na báze neurónových sietí [34] s masívnou paralelnou a rozloženou architektúrou umožňujú zavádzať nové technológie do realizácie videokodekov. Výskum multivrstvových perceptrónov [35] sa robí za účelom implementácie nelineárnej skalárnej alebo vektorovej predikcie a interpolácie, ale aj estimácie pohybu v dvojrozmernom alebo trojrozmernom priestore. Iné sú neurónové siete [36] na výpočet vlastných vektorov Karhunenovej-Loéveovej transformácie, ktorá je optimálna zo známych diskrétnych ortogonálnych transformácií. Kohonenove neurónové siete [37] umožňujú rýchle generovanie kódových kníh vektorových kvantizátorov s topologickým usporiadaním kvantizačných vektorov, čo v mnohých aplikáciách redukuje zložitosť videokodekov s veľmi nízkou bitovou rýchlosťou.

5

Page 9: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

3. PREDIKČNÉ KÓDOVANIE OBRAZU Predikčné kódovanie [1,2] patrí medzi najviac rozpracované metódy úsporného kódovania obrazu. Zníženie bitovej rýchlosti, resp. kompresia údajov sa tu dosahuje predovšetkým pomocou redukcie štatistickej redundancie reprezentovanej koreláciou op v obraze. Typické vlastnosti predikčného kódovania sú: jednoduchá technická realizácia, veľmi malá odolnosť voči kanálovým poruchám a značná citlivosť na zmeny štatistických charakteristík vstupného obrazu. Rozoznávame vnútrosnímkové a medzisnímkové predikčné kódovanie obrazu, ktoré môžu byť nemenné alebo adaptívne [3,4]. Bloková schéma predikčného kódovacieho (PKS) a dekódovacieho (PDS) systému je na obr.3.1. Základné jednotky PKS sú: prediktor, kvantizátor, kodér a PDS: prediktor, dekodér. Na vstup PKS so skalárnym kvantizátorom sa privádza postupnosť op { diskrétneho obrazu. Hodnoty týchto op sú predpovedané prediktorom a potom s predikčnými op , ktoré vytvára prediktor, sa privádzajú do sčítačky. Z jej výstupu získavame postupnosť chybových op { , ktoré sa kvantujú v kvantizátore a kódujú v kodéri. Z výstupu kodéra kódované chybové op postupujú do kanála. Kvantované chybové op s predikčnými op sa ďalej privádzajú do sčítacej jednotky, aby sa získali obnovené op

}nX

nX

}nee&

ne~ nX

nX~ diskrétneho obrazu, ktoré postupujú na vstup prediktora. Tým sa zabezpečuje rovnaká predikcia v PKS aj PDS. Kódované

Obr.3.1. Bloková schéma predikčného kódovacieho a dekódovacieho systému. chybové op e sa po prenose kanálom dekódujú v dekodéri PDS na kvantované chybové op , ktoré sa s predikčnými op z výstupu prediktora PDS

&

ne~ 'nX

6

Page 10: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

privádzajú do sčítacej jednotky. Z jej výstupu takto získavame dekódované op 'nX~ diskrétneho obrazu. Za predpokladu bezporuchového prenosu kanálom sa

dekódované op 'nX~ v PDS rovnajú obnoveným op nX~ v PKS.

Ako vyplýva z obr.3.1 optimalizácia PKS pozostáva z optimalizácie prediktora, kvantizátora aj kodéra [5,6] a znamená minimalizáciu (S/Š je maximálny) pre zvolený počet bitov m

2qσ

PKS na op a pre daný vstupný obraz s príslušnými štatistickými charakteristikami. Systemový pomer S/Š (v nedecibelovom vyjadrení) na výstupe PKS vypočítame

2q

2xŠ/S

σσ

= (3.1)

Po rozšírení tejto rovnice o disperziu 2

eσ dostaneme

k2q

2e

2e

2x S/Š GŠ/S ===

σσ

σσ (3.2)

pričom G je predikčný zisk a S/Šk je pomer signál/kvantizačný šum na výstupe kvantizátora. Rov.(3.2) platí všeobecne pre ľubovoľné modifikácie PKS a z nej vyplýva, že systemový pomer S/Š bude tým väčší, čím je väčšie G a S/Šk. Optimalizáciou prediktora dosiahneme maximálne G. Optimalizáciou kvantizátora pre diskrétny chybový obraz a určité mPKS dostaneme maximálny pomer S/Šk. Ak predpokladáme rovnakú kvalitu kódovania toho istého obrazu aj v referenčnom kódovacom systéme PCM s počtom bitov mPCM, potom možno redukovanú redundanciu v PKS vypočítať takto

]op/bit[ Gln1mmR PKSPCM γ=−= (3.3)

a R bude tým väčšie, čím je väčší predikčný zisk G. Pre Laplaceove rozdelenie pravdepodobnosti, ktoré veľmi dobre aproximuje štatistické charakteristiky chybových op bude konštanta γ=0,5 ln 10. Za predpokladu nerovnomerného kódovania kvantizačných úrovni v PKS sa hodnota R ďalej zväčšuje. Z činnosti PKS vyplýva rad špecifických rušivých javov. Sú spôsobné nelinearitou prevodovej charakteristiky skalárneho kvantizátora a kanálovými poruchami. Skreslenie kvantizátora zapríčiňujú javy preťaženia prevodovej charakteristiky, jav zrnenia, javy korekcie a obrysové javy. Ich vplyv sa v dekódovanom obraze minimalizuje kompromisnou voľbou prevodovej charakteristiky skalárneho kvantizátora [7,8]. Preťaženie prevodovej

7

Page 11: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

charakteristiky vzniká pri veľkej strmosti prechodov signálu vstupného obrazu, čím sa zhoršuje časová odozva PKS (skreslenie strmých prechodov s vysokým kontrastom). Jav zrnenia vzniká v oblasti malých zmien jasu a je spôsobený kolísaním chybových op okolo nulovej hodnoty. Má charakter náhodného šumu pridaného k obrazu. Javy korekcie sú spôsobené lineárnymi zmenami vstupného signálu PKS, ktoré sa nemôžu sledovať s konštantnou kvantizačnou úrovňou a preto sú potrebné periodické korekcie pomocou vyššej kvantizačnej úrovne. Obrysové javy vznikajú na šikmých hranách obrazu a sú spôsobené rôznymi hodnotami dekódovaných op, ktorými sa aproximuje obrazový signál pozdĺž týchto hrán. Často sa pri návrhu prediktorov zanedbáva vplyv kanálových porúch na dekódované obrazy [9,10]. Veľkosť energie celkovej poruchy v dekódovanom obraze je úmerná predikčnému zisku G, t.j. vo všeobecnosti bude závislá od druhu prediktora. Preto pri jeho návrhu nemal by sa zanedbávať vplyv kanálových porúch na dekódovaný obraz. V súvislosti s 2RNVP je potrebné zdôrazniť, že kanálové poruchy sa pri dekódovaní obrazu rozšíria nielen pozdĺž jedného riadka ako pri 1RNVP, ale sa rozšíria aj na ostatné nasledujúce riadky. Okrem toho pre 3RNMP sa kanálové poruchy rozšíria aj do nasledujúcich snímok. Pri použíti adaptívnej predikcie môžu kanálové poruchy znehodnotiť značnú časť obrazu, ba dokonca celý dekódovaný obraz následkom toho, že sa naruší synchrónne nastavovanie algoritmu predikcie v PKS a PDS. Odolnosť predikčných kódovacích systémov voči kanálovým poruchám možno zvýšiť pomocou kanálového kódovania [9]. 3.1. Vnútrosnímkové predikčné kódovanie obrazu Charakteristickou vlastnosťou vnútrosnímkového predikčného kódovania obrazu [2,11] je, že používa na predikciu len op spracovávanej snímky. Z tohto vyplývajú jednorozmerné (1RPKS) aj dvojrozmerné (2RPKS) modifikácie PKS s vnútrosnímkovým predikčným kódovaním obrazu [12,13] v závislosti od rozmeru použitého prediktora. Nemenné 1RPKS alebo 2RPKS používajú nemenné kvantizátory aj prediktory a sú výhodné pre obraz predstavujúci stacionárny stochastický proces. Adaptívne PKS s vnútrosnímkovým predikčným kódovaním obrazu dosahujú vyššiu účinnosť kódovania, ak obraz je nestacionárnym stochastickým procesom. Adaptívny PKS sa realizuje pomocou adaptívneho kvantizátora alebo prediktora [14,15]. Nestacionárny vstupný obraz PKS s 1RNVP alebo 2RNVP vytvorí nestacionárny chybový obraz na vstupe skalárneho kvantizátora, ktorý sa takto môže dostávať do stavu saturácie, alebo častého výskytu najmenšej kvantizačnej úrovne. Týmto narastá skreslenie PKS, a preto je potrebné použiť adaptívny skalárny kvantizátor napr. s estimátorom disperzie chybových op. V iných modifikácie PKS [16] sa realizuje adaptívne skalárne kvantovanie nestacionárneho chybového obrazu pomocou niekoľkých ONSK (obr.3.2). Najprv sa blok M vstupných op zaznamená do blokovej pamäte. Potom sa vykoná skalárne kvantovanie každého chybového op

8

Page 12: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

v jednotlivých ONSK. Súčasne sa vypočíta skreslenie PKS pre daný blok vstupných op a každý ONSK. Z minimálneho skreslenia vyplynie najvhodnejší ONSK s príslušnou normalizačnou konštantou Ki. Nevýhodou tohto adaptívneho PKS je, že s kódovanými chybovými op sa musí do PDS vysielať aj informácia o normalizačnej konštante.

Obr.3.2.PKS s adaptívnym skalárnym kvantizátorom a jemu prisluchajúci PDS. Túto nevýhodu odstraňujú PKS s adaptívnym skalárnym kvantizátor, ktorého prevodová charakteristika sa mení v závislosti od toho, či sa obnovené (dekódované) op po určitú dobu menia s najväčšou alebo najmenšou kladnou , resp. zápornou kvantizačnou úrovňou. Pretože dekódované op sú v PDS, nie je potrebné vysielať z PKS prídavnú informáciu. Stacionárny chybový obraz v PKS možno získať pomocou adaptívnej vnútrosnímkovej predikcie. Preto ďalšie možné modifikácie adaptívnych PKS používajú nemenný ONSK a adaptívny vnútrosnímkový prediktor [17]. Vstupný obraz rozdelíme na jednorozmerné alebo dvojrozmerné bloky. Pre každý blok sa vykoná predikčná analýza, výsledkom ktorej sú optimálne predikčné koeficienty pre daný blok. Tieto sú parametrami adaptívneho vnútrosnímkového prediktora, ktorý sa prispôsobuje (optimalizuje) pre každý blok. Analogická realizácia adaptívneho vnútrosnímkového prediktora tohto druhu pozostáva z niekoľkých 1RNVP alebo 2RNVP prispôsobených určitým štatistickým charakteristikám obrazu. Potom pre určitý blok vstupného obrazu sa vyberie taký 1RNVP alebo 2RNVP, ktorý je najviac prispôsobený štatistickým charakteristikám tohto bloku. Nevýhodou PKS s uvedenými adaptívnymi vnútrosnímkovými prediktormi je, že

9

Page 13: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

sa musí vysielať prídavná informácia o predikčných koeficientoch alebo o zvolenom 1RNVP, resp. 2RNVP. Bloková schéma PKS, ktorý používa adaptívný vnútrosnímkový prediktor s určovaním obrysového smeru je na obr.3.3. Obnovené predchádzajúce op A,B,C,D sú zaznamenané do pamäte. Pomocou týchto op sa v procesore určí obrysový smer pre každý vstupný op. Kódové slovo (2 bity pre štyri obrysové smery) z výstupu procesora sa privádza do selektora predikcie. Výstupný signál tohto selektora ovláda prepínač, ktorý vyberie na výpočet predikčnej hodnoty predchádzajúci op z určeného obrysové smeru [18]. Tento adaptívny PKS nemusí vysielať do PDS žiadnú prídavnú informáciu.

Obr.3.3. Bloková schéma PKS a PDS, ktoré používajú adaptívny

vnútrosnímkový prediktor s určovaním obrysového smeru. Účinnosť kódovania nestacionárneho obrazu sa zvyšuje v PKS s adaptívnym vnútrosnímkovým prediktorom aj skalárnym kvantizátorom [19]. Možná štruktúra tohto adaptívneho PKS je na obr.3.4. Jednorozmerný alebo dvojrozmerný blok vstupného obrazu sa najprv zaznamená do blokovej pamäte. Potom sa vykoná v procesore jeho predikčná analýza, výsledkom ktorej sú optimálne predikčné koeficienty pi pre daný blok. Tie sú parametrami adaptívneho vnútrosnímkového prediktora, na vstup ktorého sa privádzajú obnovené op. Súčasne sa v predikčnom filtri vykoná filtrácia zaznamenaného bloku vstupného obrazu. Z jeho výstupu dostaneme blok chybových op, ktoré postupujú do estimátora disperzie 2

eσ tohto bloku. Úmerne s odmocninou eσ z vypočítanej disperzie sa mení prevodová charakteristika adaptívneho skalárneho kvantizátora. Do PDS sa vysiela súčasne s kódovanými chybovými op

prídavná informácia o aj ne& eσ { }ip pre každý blok. Iné modifikácie PKS s adaptívnym vnútrosnímkovým prediktorom aj kvantizátorom nepožadujú

10

Page 14: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

vysielanie prídavnej informácie, ak všetky parametre adaptívneho vnútrosnímkového prediktora aj skalárneho kvantizátora možno vypočítať pomocou predchádzajúcich obnovených op [20].

Obr.3.4. PKS s adaptívnym vnútrosnímkovým prediktorom aj skalárnym kvantizátorom a jemu zodpovedajúci PDS. 3.2. Medzisnímkové predikčné kódovanie obrazu Charakteristickou vlastnosťou medzisnímkového predikčného kódovania obrazu [21,22] je, že používa na predikciu op z predchádzajúcich snímok. Možno rozlišovať 1RPKS, 2RPKS aj trojrozmerné PKS (3RPKS) s medzisnímkovým predikčným kódovaním [23,24], pričom 2RPKS a 3RPKS používajú na predikciu aj op zo spracovávanej snímky. Pre dynamický obraz predstavujúci stacionárny stochastický proces má najvyššiu účinnosť kódovania 3RPKS. Vo všeobecnosti dynamický obraz obsahuje oblasti s pohybom alebo bez pohybu. Z toho vyplýva, že chybové op (medzisnímkové diferencie) v oblasti bez pohybu a s malým pohybom sú zanedbateľné a nemusia sa kódovať, resp. vysielať. Tohto princípu využíva medzisnímkové predikčné kódovanie s podmieneným doplňovaním op [25,26], ktoré v spracovávanej snímke kóduje iba op v oblastiach so značným pohybom, pričom dekódované op v iných oblastiach sú z predchádzajúcej snímky. Bloková schéma medzisnímkového PKS s podmieneným doplňovaním op je na obr.3.5. Predikcia vstupných op je priamo dana op s rovnakými priestorovými súradnicami v predchádzajúcej snímke, ktorá je zaznamenaná v snímkovej pamäti. Detektor kódovaných op v závislosti od veľkosti chybových op určí, ktorý vstupný op sa bude kódovať a vysielať. Ak chybový op je väčší ako zvolená prahová hodnota bude sa kvantovať aj kódovať a spolu

11

Page 15: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

s adresou vstupného op sa bude vysielať. V opačnom prípade sa nuluje, resp. nevysiela, t.j. prislúchajúci dekódovaný (obnovený) op je z predchádzajúcej snímky. Okamžitá bitová rýchlosť bude závislá od pohybu v jednotlivých oblastiach obrazu. Aby sa dosiahla konštantná bitová rýchlosť, je potrebné na výstup tohto PKS zapojiť vyrovnávaciu pamäť.

Obr.3.5. Medzisnímkový PKS s podmieneným doplňovaním op. Pohybujúce objekty v obraze za dobu medzi dvoma po sebe nasledujúcimi snímkami zmenia svoju polohu v závislosti od ich rýchlosti. Preto predikcia spracovávaného op pomocou op s rovnakými priestorovými súradnicami z predchádzajúcej snímky nie je presná. Túto nevýhodu medzisnímkového predikčného kódovania s podmieneným doplňovaním op odstraňuje medzisnímkové predikčné kódovanie s pohybovou kompenzáciou [27,28], ktorého bloková schéma je na obr.3.6. Spracovávaná snímka sa najprv rozdelí na malé ortogonálne bloky, ku ktorým sa nájde v estimátore vektora pohybu optimálna poloha týchto blokov v predchádzajúcej snímke. Táto je určená prislúchajúcim vektorom pohybu V , ktorý vykoná pohybovú kompenzáciu v snímkovej pamäti, resp. vyvolá obnovené op týchto blokov na predikciu. Potom chybové op sa kvantujú a vysielajú do kanála. Súčasne s nimi sa vysiela prídavná informácia o vektore pohybu V .

12

Page 16: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.3.6. Medzisnímkový PKS s pohybovou kompenzáciou. Iná modifikácia medzisnímkového PKS s pohybovou kompenzáciou používa estimátor vektora pohybu v spätnej väzbe [29]. Vtedy vektor pohybu sa estimuje z obnoveného (dekódovaného) obrazu, čo nevyžaduje vysielať prídavnú informáciu o tomto vektore. Pritom sa vychádza zo vzťahu medzi vnútrosnímkovou a medzisnímkovou diferenciou, pričom estimácia vektora pohybu sa vykoná pomocou rekurzívneho algoritmu [30]. Možno vytvoriť analogické modifikácie medzisnímkových PKS s adaptívnym kvantizátorom alebo prediktorom, ktoré boli navrhnuté pre vnútrosnímkové PKS. 3.3. Zhodnotenie účinnosti a vlastnosti metód predikčného kódovania obrazu Metódy predikčného kódovania využívajú koreláciu op v obraze na zníženie bitovej rýchlosti. Vnútrosnímkové predikčné kódovanie využíva iba priestorovú koreláciu, ale medzisnímkové predikčné kódovanie využíva aj časovú koreláciu op v obraze. Z toho vyplýva väčšia účinnosť medzisnímkového predikčného kódovania, ale aj zložitejšia technická realizácia oproti vnútrosnímkovému predikčnému kódovania obrazu. Zvlášť výhodná je kombinácia týchto metód, t.j. vnútro-medzisnímkové predikčné kódovanie, ktoré umožňuje zvýšiť účinnosť kódovania obrazu s premennou rýchlosťou v jeho jednotlivých oblastiach. Adaptívne modifikácie týchto metód sa realizujú pomocou adaptácie kvantovania alebo predikcie obrazu. Tým sa dosiahne ich lepšie prispôsobenie

13

Page 17: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

vlastnostiam obrazu a teda aj možnosť ďalšieho zvyšovania účinnosti jeho kódovania. Najjednoduchšia metóda predikčného kódovania je delta modulácia, ktorá je špeciálnym prípadom DPCM, pri ktorej sa používajú len 2 kvantizačné úrovne, čiže kódové slovo má len jeden bit. Z tohto vyplýva, že delta modulácia má veľmi jednoduchú technickú realizáciu, ale používa vysokú diskretizačnú frekvenciu. Zhodnotenie účinnosti pomocou priemerného počtu mPKS bitov na op jednotlivých metód predikčného kódovania obrazu so skalárnym kvantovaním a predikciou ako aj ich vlastností je v tab.3.1. Tabuľka 3.1

Metódy predikčného kódovania obrazu mPKS [bit/op] Zhodnotenie

vlastností

Delta modulácia 1 -Vysoká diskretizačná

frekvencia

Nemenné vnútrosním-kové predikčné kódovanie

2 - 3

Adaptívne vnútro- snímkové predikčné kódovanie

1 - 2

Medzisnímkové podmienené doplňovanie op

1 - 2

Nemenné medzisním- kové predikčné kódovanie

1 – 1,5

Adaptívne medzi- snímkové predikčné kódovanie

0,5 - 1

-Jednoduchá technic- ká realizácia

-Citlivé na zmeny štatistických charakteristík obrazu

-Malá odolnosť oproti kanálovým poruchám

-Zvýšenie účinnosti metód adaptívneho predikčného kódovania

14

Page 18: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

4. TRANSFORMAČNÉ KÓDOVANIE OBRAZU Väčšia kompresia údajov pri kódovaní obrazu sa dosahuje pomocou transformačného kódovania, [1,2], ktoré používa diskrétne ortogonálne transformácie. Vplyvom kompresie energie v transformovanom bloku obrazu sa stávajú spektrálne koeficienty s malou disperziou nepodstatné (irelevantné). Potláčaním týchto irelevantných spektrálnych koeficientov sa dosahuje kompresia údajov. Typické vlastnosti transformačného kódovania sú: vysoká účinnosť kódovania, zložitá technická realizácia, malá citlivosť na zmeny štatistických charakteristík obrazu a rozloženie kvantizačných aj kanálových chýb na celé bloky obrazu. Rozoznávame vnútrosnímkové a medzisnímkové transformačné kódovanie obrazu [3,4], ktoré môžu byť nemenné alebo adaptívne. Bloková schéma transformačného kódovacieho (TKS) a dekódovacieho (TDS) systému je na obr.4.1. Vektor (blok) op X postupuje do procesora priamej diskrétnej ortogonálnej transformácie, ktorej jadro v prípade 1RDOT je vyjadrené transformačnou maticou U . Na výstupe tohto procesora dostávame vektor spektrálnych koeficientov XUY = . Každá zložka (spektrálny koeficient) vektora Y , t.j. Yi (i=1,2,...,M), sa kvantuje, kóduje a prenáša číslicovým kanálom. Na výstupe dekodéra sa získava kvantovaný vektor Y

~′ , ktorý vo

všeobecnosti môže byť skreslený kanálovými poruchami. Tento sa ďalej transformuje v procesore spätnej diskrétnej ortogonálnej transformácie na vektor

Y~

UX~ 1 ′=′ − , ktorý je dekódovaným vektorom vstupného vektora X .

Obr.4.1.Bloková schéma transformačného kódovacieho a dekódovacieho systému.

15

Page 19: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Diskrétny obraz v transformovanom priestore je reprezentovaný poľom spektrálnych koeficientov, ktoré sú výsledkom diskrétnej ortogonálnej transformácie. Ďalšími operáciami v TKS sú kvantovanie a kódovanie spektrálnych koeficientov Yi (obr.4.1). Najjednoduchší spôsob kvantovania Yi je pomocou OLSK alebo ONSK s rovnakým počtom bitov, ktoré sú optimalizované vzhľadom na rozdelenie pravdepodobnosti jednotlivých Yi. Najčastejšie používanými modelmi rozdelenia pravdepodobnosti sú Gaussovo pre Y1 a Laplaceovo pre ostatné Yi. Tento spôsob kvantovania nedáva optimálne výsledky. Huang a Schultheiss [5,6] navrhli inú metódu kvantovania Yi, tzv. blokové kvantovanie, ktoré pre ľubovoľnú diskrétnu ortogonálnu transformáciu minimalizuje strednú kvadratickú chybu dekódovaného obrazu. Spočíva v nerovnomernom prideľovaní bitov jednotlivým kvantizátorom, pričom počet bitov nkm kvantizátora s ktorým kvantujeme spektrálny koeficient Ykm, za predpokladu použitia 2RDOT s rozmermi blokov M1xM2, sa vypočíta takto

)logMM1(log2

MMzn 2

y

M

1i

M

1j21

2y

21km ij

1 2

kmσ−σ−= ∑∑

= = (4.1)

kde z je celkový počet bitov potrebný na zakódovanie jedného bloku op a ,

resp. sú disperzie príslušných spektrálnych koeficientov. Po pridelení určitého počtu bitov sa jednotlivé kvantizátory optimalizujú pre uvedené modely rozdelenia pravdepodobnosti. Blokové kvantovanie spektrálnych koeficientov je podstatne účinnejšie ako ich kvantovanie s rovnakým počtom bitov pre každý kvantizátor. Pritom kódovanie kvantovaných spektrálnych koeficientov môže byť rovnomerné alebo nerovnomerné. Hayes a Bobilin [7] používajú jeden OLSK na kvantovanie všetkých spektrálnych koeficientov, pričom je optimalizovaný pre ich spoločné rozdelenie pravdepodobnosti. Kvantované spektrálne koeficienty sa kódujú pomocou Huffmanovho kódu. Táto metóda je podstatne lepšia ako blokové kvantovanie, ale jej veľkou nevýhodou je zložitosť Huffmanovho kódu.

2ykm

σ2yij

σ

Ak uvažujeme rovnakú kvalitu kódovania toho istého obrazu aj v referenčnom kódovacom systéme PCM s počtom bitov mPCM, t.j. (S/Š)PCM=(S/Š)TKS= , potom možno redukovanú redundanciu v TKS vypočítať takto

2q

2x /σσ

Gln1mmR TKSPCM γ=−= (4.2)

ktorá je tým väčšia, čím je väčší transformačný zisk G, resp. väčšia kompresia energie v bloku spektrálnych koeficientov. Pre Gaussovo alebo Laplaceovo rozdelenie pravdepodobnosti bude konštanta γ = 0,5 ln 10 a pre 2RDOT

16

Page 20: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

priemerný počet bitov na op mTKS=z/M1M2 a transformačný zisk v nedecibelovom vyjadrení

21

1 2

ij

MM/1M

1i

M

1j

2y

2x

G

⎟⎟⎠

⎞⎜⎜⎝

⎛σ

σ=

∏∏= =

(4.3)

Z rov.(4.3) vyplýva, že G závisí od rozloženia disperzií spektrálnych

koeficientov pri určitej strednej kvadratickej hodnote (disperzii) vstupného stacionárneho obrazu. Čím viac sa koncentruje energia bloku obrazu v transformovanom priestore do spektrálnych koeficientov s nižšími sekvenciami, tým bude G väčšie. Z tohto vyplýva, že najväčšiu hodnotu G dostaneme pre KLT a nasledne pre DCT. Účinnosť kódovania TKS určuje: druh a rozmer diskrétnej ortogonálnej transformácie, rozmery (tvar) bloku op, výber spektrálnych koeficientov a efektívnosť ich kvantovania aj kódovania. Na obr.4.2 sú závislosti normovanej strednej kvadratickej chyby kódovaného obrazu, ktorý bol modelovaný dvojrozmerným Gaussovým-Markovovým poľom s koeficientom korelácie v horizontálnom smere

2yij

σ

2xσ

2dσ

95,0h =ρ a vertikálnom smere , od rozmerov M×M matice op pre TKS s 2RKLT, 2RDFT, 2RDCT,

2RDST, 2RWHT, 2RST, 2RHT. Pritom priemerný počet bitov m95,0v =ρ

T=1,5 bit/op.

Obr.4.2. Závislosť normovanej strednej kvadratickej chyby kódovaného obrazu v TKS od rozmerov MxM matice op.

17

Page 21: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

V dôsledku nezávislého kódovania matíc op v TKS sa zanedbáva redundancia, reprezentovaná štatistickými závislosťami medzi jednotlivými maticami. Aby sa vylúčili tieto štatistické závislosti, je potrebné určiť čo najväčšie rozmery týchto matíc. Z obr.4.2 vyplýva, že pre určité m2

dσ T sa mení veľmi málo, ak rozmery matíc sú väčšie ako 16×16. Pre zjednodušenie technickej realizácie procesora diskrétnej ortogonálnej transformácie a lepšie využitie lokálnych (miestnych) zmien štatistických charakteristík obrazu je výhodnejšie meniť malé rozmery matíc. Jednou z výhod TKS je, že ich kvantizačné a kanálové chyby sa nerozširujú mimo bloku. To znamená, že ak dôjde k chybe určitého spektrálneho koeficienta nejakého bloku vplyvom kvantovania alebo prenosu kanálom, tak táto sa po dekódovaní rozloží na všetky op dekódovaného bloku [8]. Týmto sa dosiahne lepšie prispôsobenie TKS vlastnostiam ľudského zraku. Skreslenie dekódovaného obrazu vplyvom kvantizačných a kanálových chýb závisí od druhu použitej diskrétnej ortogonálnej transformácie a od chybných spektrálnych koeficientov. Chyby spektrálnych koeficientov s nízkymi sekvenciami sú pozorovateľnejšie ako chyby spektrálnych koeficientov s vysokými sekvenciami, pretože citlivosť ľudského zraku na chyby spektrálnych koeficientov klesá so sekvenciou. Súčasne pravdepodobnosť kanálových chýb spektrálnych koeficientov s nízkymi sekvenciami je väčšia vplyvom veľkého počtu bitov, ktoré sa používajú na ich kódovanie. V adaptívnych TKS sa môžu kanálové chyby, ktoré vznikajú v jednom dekódovanom bloku, rozšíriť aj na iné bloky [9]. K rozšíreniu dochádza preto, že určitá informácia aktuálneho kódovaného (dekódovaného) bloku sa využíva aj pri dekódovaní nasledujúcich blokov. V adaptívnych TKS, ktoré na adaptáciu využívajú iba informáciu aktuálneho kódovaného bloku, nedochádza k rozšíreniu kanálových chýb. 4.1. Vnútrosnímkové transformačné kódovanie obrazu Vnútrosnímkové transformačné kódovanie obrazu [10,11] používa diskrétne ortogonálne transformácie blokov op spracovávanej snímky. Z tohto vyplývajú jednorozmerné (1RTKS) aj dvojrozmerné (2RTKS) modifikácie TKS s vnútrosnímkovým transformačným kódovaním obrazu [12] v závislosti od rozmeru procesora diskrétnej ortogonálnej transformácie. Nemenné 1RKTS alebo 2RKTS používajú nemenné procesory diskrétnej ortogonálnej transformácie, kvantizátory ako aj nemenný výber spektrálnych koeficientov [13]. Sú výhodné pre kódovanie obrazu, ktorý možno považovať za stacionárny stochastický proces. Optimálne nemenné 1RTKS používajú 1RKLT a podobne - 2RTKS sú s 2RKLT. V adaptívnych TKS s vnútrosnímkovým transformačným kódovaním [14,15] sa menia parametre procesora diskrétnej ortogonálnej transformácie,

18

Page 22: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

selektora alebo kvantizátorov spektrálnych koeficientov v závislosti od zmien štatistických charakteristík nestacionárneho obrazu. Najväčšiu účinnosť kódovania budú mať také modifikácie adaptívnych TKS, ktoré umožňujú súčasnú zmenu parametrov uvedených jednotiek, ale ich technická realizácia bude veľmi zložitá. TKS s adaptívnym procesorom KLT používajú malé bloky op, pretože nestacionarita obrazu požaduje vlastnú transformačnú maticu KLT pre každý blok op. V súvislosti s tým sa vykoná estimácia kovariančnej matice bloku op, aby sa mohli vypočítať jej vlastné vektory, resp. transformačná matica priamej KLT pre tento blok op. Pritom narastá nepresnosť estimácie kovariančných momentov medzi vzdialenými op. Výhodnejšie je vykonať estimáciu disperzie op a koeficientov korelácie vo vertikálnom aj horizontálnom smere a z exponenciálneho modelu autokovariačnej funkcie daného bloku op určiť úplnú kovariačnú maticu. Prídavná informácia o tejto kovariačnej matici sa súčasne musí vysielať do TDS, kde sa z nej vypočítajú vlastné vektory, resp. transformačná matica spätnej KLT. Iné modifikácie TKS s adaptívnym procesorom KLT [16] nepožadujú vlastnú transformačnú maticu KLT pre každý blok op. Rozlišujú konečný počet tried blokov op, pričom pre každú triedu je určená jedna kovariačná, resp. transformačná matica KLT. Potom sa nepočítajú vlastné vektory kovariačnej matice bloku op, ale sa vykoná jeho klasifikácia, t.j. zatriedenie do jednej z možných tried na základe jeho štatistických charakteristík. Prídavná informácia vysielaná do TDS sa v týchto modifikáciách adaptívnych TKS redukuje len na rozlíšenie jednotlivých tried, napr. pre štyri triedy sú to 2 bity na jeden blok op. Čím väčší počet tried sa rozlišuje, tým vyššia účinnosť kódovania sa dosahuje, ale narastá zložitosť klasifikácie blokov op ako aj množstvo prídavnej informácie. Možno implementovať aj také adaptívne TKS, ktorých procesor mení druh diskrétnej ortogonálnej transformácie v závislosti od štruktúry bloku op. TKS s adaptívnym selektorom spektrálnych koeficientov vyberajú na kódovanie len niektoré spektrálne koeficienty transformovaného bloku. V závislosti od zvoleného kritéria výberu spektrálnych koeficientov rozlišujeme zonálnu a prahovú filtráciu (vzorkovanie) transformovaného bloku. Zonálna filtrácia (obr.4.3a) [17] vyberie spektrálne koeficienty napr. z pravouhlého okna s rozmermi tak, aby sa dosiahol zvolený prah energie xJJ′

Py

y

21 M

1m

2km

M

1k

J

1m

2km

J

1k ≤

∑∑

∑∑

==

=

= (4.4)

kde ykm sú možné hodnoty spektrálnych koeficientov a P≤1 je zvolený prah. V tomto prípade sa kódujú len spektrálne koeficienty z pravouhlého okna, pričom prídavná informácia vyjadruje rozmery J′ a J tohto okna. Pre zlepšenie

19

Page 23: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

subjektívnej kvality dekódovaného obrazu sa môže P meniť v závislosti od hodnoty spektrálneho koeficienta y11. Nevýhodou zonálnej filtrácie je, že sa kódujú aj spektrálne koeficienty, ktoré majú malú hodnotu. Naopak jej výhodou je malé množstvo prídavnej informácie. Prahová filtrácia (obr.4.3b) [18] vyberie len spektrálne koeficienty, ktoré majú hodnotu väčšiu ako zvolený prah. Kódujú sa tieto vybrané spektrálne koeficienty spolu s ich súradnicami, resp. adresami, ktoré predstavujú prídavnú informáciu. Pre zlepšenie subjektívnej kvality dekódovaného obrazu možno meniť prah v závislosti od hodnoty spektrálneho koeficienta y11. Výhodou prahovej filtrácie je, že sa kódujú len spektrálne koeficienty, ktoré majú veľkú hodnotu. Naopak jej nevýhodou je veľké množstvo prídavnej informácie. Zonálna filtrácia v TKS spôsobuje adaptáciu počtu spektrálnych koeficientov, resp. rozmerov J′ a J pravouhlého okna a prahová filtrácia spôsobuje adaptáciu nielen počtu, ale aj rozmiestnenia spektrálnych koeficientov v závislosti od hustoty detailov v bloku op.

a) b)

Obr.4.3. a) Zonálna, b) prahová filtrácia dvojrozmerného bloku spektrálnych koeficientov. Hustotu detailov v bloku op možno merať pomocou indexu aktivity. Tento je definovaný sumou kvadrátorov alebo absolútnych hodnôt spektrálnych koeficientov s nenulovou sekvenciou. Potom môže byť použitý na klasifikáciu každého bloku op do jednej z S možných tried. Preto požadujeme S-1 prahových hodnôt, ktoré sú experimentálne vybrané. Každá trieda používa rozdielnu selekciu spektrálnych koeficientov v transformovanom bloku ako aj postup kvantovania. Trieda s vysokým indexom aktivity má väčší počet bitov ako trieda s nízkym indexom aktivity. Gimlet [19] a Claire [20] rozlišujú pomocou indexu aktivity štyri možné triedy, pričom kombinujú zonálnu a prahovú filtráciu v priestore 2RWHT s rozmermi bloku 8x8. Na obr.4.4 sú znázornené jednotlivé zóny (oblasti) a rozloženie bitov v transformovanom bloku pre každú triedu. Čísla vyjadrujú počet bitov, ktorými sa kódujú spektrálne koeficienty v miestach

20

Page 24: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

týchto čísiel. Nula v zóne znamená, že sa kóduje z tejto zóny len spektrálny koeficient s najväčšou absolútnou hodnotou, pričom je potrebné vysielať aj jeho adresu. Viacej núl v zóne znamená, že sa kóduje z tejto zóny niekoľko spektrálnych koeficientov s najväčšími absolútnymi hodnotami. Prázdne miesta vyjadrujú, že im zodpovedajúce spektrálne koeficienty sa nekódujú a v TDS sú nahradené nulami. Sú možné aj iné modifikácie rozdelenia transformovaného bloku na zóny ako aj rozloženie bitov.

Obr.4.4. Zóny a rozloženie bitov v transformovanom bloku (8x8) štyroch tried pre 2RWHT. Namiesto sumy kvadrátorov alebo absolútnych hodnôt spektrálnych koeficientov možno použiť ich disperzie ako index aktivity, vhodný pre postupnú selekciu a kvantovanie spektrálnych koeficientov [21]. Po rozdelení obrazu na dvojrozmerné bloky, možno tieto preusporiadať na jednorozmerné

21

Page 25: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

bloky, resp. postupnosti spektrálnych koeficientov. Výhodné je také preusporiadanie (obr.4.5a), ktoré dáva vyhladenejšie (vyrovnanejšie) rozloženie veľkosti disperzií spektrálnych koeficientov v uvedenom preusporiadaní a pridelíme im počet bitov úmerný logaritmu estimovanej disperzie. Keď disperzia spracovávaného spektrálneho koeficienta je tak malá, že jemu pridelený počet bitov je menší ako 1 bit, tak procesor skončí prideľovanie bitov nasledujúcim spektrálnym koeficientom, ktoré sú v TDS nahradené nulami. Estimovanú disperziu n-tého spektrálneho koeficienta vypočítame pomocou rekurzívnej rovnice

2nσ

( ) 2

1n2

1n2n y~d1ˆdˆ −− −+σ=σ (4.5)

kde 2

1ny~ − je kvantovaný (n-1)-vý spektrálny koeficient a d<1 je estimačný koeficient. Z rov.(4.5) vyplýva možnosť rekurzívneho kvantovania spektrálnych koeficientov. Adaptívny TKS s rekurzívnym kvantizátorom používa viacej bitov na zakódovanie blokov s väčšími spektrálnymi koeficientami, pretože počet im pridelených bitov je úmerný logaritmu ich disperzií a súčasne pri postupnej selekcii sa vyberie na kódovanie viacej spektrálnych koeficientov. Naopak bloky s menšími spektrálnymi koeficientami z analogických dôvodov sa kódujú s menším počtom bitov. Z toho vyplýva nevyhnutnosť zapojenia vyrovnávacej pamäte na výstup tohto adaptívneho TKS pre dosiahnutie konštantnej bitovej rýchlosti.

a) b)

Obr.4.5. a) Preusporiadanie spektrálnych koeficientov b) prideľovanie počtu bitov v jednotlivých pásmach transformovaného bloku s rozmermi (8x8).

22

Page 26: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Adaptívny TKS [22], ktorý používa rovnaký počet bitov na kódovanie každého transformovaného bloku, nepožaduje vyrovnávaciu pamäť pre dosiahnutie konštantnej bitovej rýchlosti. Tento adaptívny TKS má nemenný počet kódovania spektrálnych koeficientov ako aj nemenný počet im priradených bitov pre každý blok. Mení sa však normalizačná konštanta, s ktorou sa normujú spektrálne koeficienty jedného bloku pred ich kvantovaním, pričom táto sa vysiela do TDS pre každý blok. Normalizačná konštanta je určená vypočítanou disperziou spektrálnych koeficientov jedného bloku. Modifikovaný adaptívny TKS s konštantnou bitovou rýchlosťou používa rôznu normalizačnú konštantu pre každé pásmo transformovaného bloku. Vtedy sa predpokladá, že všetky spektrálne koeficienty v tom istom pásme majú rovnakú disperziu a sú kódované s rovnakým počtom bitov, ako to vidno z obr.4.5b. V iných modifikáciách adaptívnych TKS [23] možno meniť počet pásiem v každom transformovanom bloku v závislosti od zvoleného prahu relatívnej energie pásma z celkovej energie bloku. Ak relatívna energia pásma je menšia ako zvolená prahová hodnota, tak spektrálne koeficienty z tohto pásma sa nekódujú a v TDS sú nahradené nulami. Bloková schéma adaptívneho TKS a TDS [15], ktoré využívajú klasifikáciu blokov pomocou indexu aktivity ako aj normovanie spektrálnych koeficientov je na obr.4.6. Bloky spektrálnych koeficientov sa klasifikujú pomocou indexu aktivity v klasifikátore. Index aktivity je daný striedavou energiou transformovaného bloku, t.j. súčtom kvadrátov spektrálnych koeficientov s nenulovou sekvenciou. Na základe štatistickej analýzy blokov diskrétneho obrazu možno získať distribučnú funkciu striedavej energie bloku. Rovnomerným rozdelením rozsahu jej funkčných hodnôt možno dostať intervaly striedavej energie s rovnakou pravdepodobnosťou, ktoré reprezentujú možné triedy blokov. Pomocou indexu aktivity a matice disperzií spektrálnych koeficientov transformovaného bloku určitej triedy procesor pridelí počet bitov kódovaným spektrálnym koeficientom v tomto bloku. Estimátor odhadne normalizačné konštanty, s ktorými sa normujú spektrálne koeficienty transformovaného bloku danej triedy. Normované spektrálne koeficienty sa kvantujú v ONSK, ktorého počet bitov sa mení pre každý spektrálny koeficient. Kvantované normované spektrálne koeficienty (Yi) sa kódujú v kodéri a súčasne s prídavnou informáciou o indexe aktivity (I) a normalizačných konštantách (Ki) sa vysielajú do TDS. Potom v dekodéri pomocou matice prideleného počtu bitov vyvolanej z pamäte indexom aktivity sa obnovujú kvantované normované spektrálne koeficienty. Tieto inverzným normovaním pomocou reciprokých normalizačných konštánt sa zmenia na reálne (nenormované) spektrálne koeficienty, ktoré sa po blokoch v spätnom transformačnom procesore transformujú na bloky op.

23

Page 27: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.4.6. Adaptívny transformačný kódovací a dekódovací systém.

V TKS adaptívne skalárne kvantizátory menia počet bitov v zmysle optimálneho blokového kvantovania. Súčasne môžu meniť prevodovú charakteristiku v závislosti od disperzie vstupných spektrálnych koeficientov, keď použijeme adaptívne lineárne alebo nelineárne skalárne kvantizátory. 4.2. Medzisnímkové transformačné kódovanie obrazu Medzisnímkové transformačné kódovanie obrazu [24,25] používa diskrétne ortogonálne transformácie blokov op spracovávanej snímky aj predchádzajúcich snímok. Rozlišujeme trojrozmerný TKS (3RTKS) s medzisnímkovým transformačným kódovaním, ktorý má trojrozmerný transformačný procesor. Nemenný 3RTKS [26] nemení parametre procesora trojrozmernej diskrétnej ortogonálnej transformácie, kvantizátorov ako aj selektorov spektrálnych koeficientov. Z nemenných 3RTKS najvyššiu účinnosť kódovania obrazu dosahuje 3RTKS s procesorom 3RKLT. Ak tieto nemenné 3RTKS budú používať deterministické diskrétne ortogonálne transformácie, tak najvyššia účinnosť kódovania obrazu sa dosiahne pre 3RDCT. Adaptívne medzisnímkové transformačné kódovanie [3,28] sa prispôsobuje nielen priestorovej, ale aj časovej nestacionarite obrazu. Mení svoje parametre v závislosti od množstva detailov v snímke, ale aj od rýchlosti pohybu v obraze medzi po sebe nasledujúcimi snímkami. Možno vytvoriť analogické modifikácie adaptívneho medzisnímkového transformačného kódovania s 3RKLT, trojrozmernou zonálnou alebo prahovou filtráciou atď., aké boli rozpracované pre adaptívne vnútrosnímkové transformačné kódovanie.

24

Page 28: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Striedavá energia trojrozmerného transformovaného bloku nie je vhodným indexom jeho aktivity, pretože zriedkavo má súčasne vysokú priestorovú aj časovú aktivitu. Z tohto dôvodu je výhodnejšie použiť súbor (vektor) spektrálnych koeficientov s nulovou časovou sekvenciou (p=0) na meranie priestorovej aktivity a súbor spektrálnych koeficientov s nulovými priestorovými sekvenciami (k=0,m=0) na meranie časovej aktivity. Pomocou týchto spektrálnych koeficientov sa vykonáva klasifikácia trojrozmerného transformovaného bloku podľa veľkosti priestorovej a (alebo) časovej aktivity, pričom prideľovanie počtu bitov jednotlivým spektrálnym koeficientom a ich kvantovanie v každej triede sa uskutočňuje vzhľadom na minimalizáciu subjektívneho skreslenia. Napr. tri spektrálne koeficienty najbližšie k spektrálnemu koeficientu s nulovou trojrozmernou sekvenciou (p=0, k=0, m=0) veľmi dobre vyjadrujú obrazovú aktivitu v priestore, t.j. v smere horizontálnej a vertikálnej súradnice, ale aj v čase, t.j. v smere časovej súradnice. Presnosť kvantovania týchto spektrálnych koeficientov korešpondujúcich s obrazovou aktivitou v smere horizontálnej, vertikálnej a časovej súradnice môže sa použiť v procese medzisnímkového transformačného kódovania obrazu na kontrolu rozlišovacej schopnosti v týchto smeroch. Knauer [29] využíva túto myšlienku na adaptívne medzisnímkové transformačné kódovanie obrazu s 3RWHT (4x4x4). Pomocou predpokladaných spektrálnych koeficientov definuje vhodné vektory pre určenie stupňa pohybu v každom trojrozmernom bloku. Pre rýchly pohyb sa zvyšuje časová a znižuje priestorová rozlišovacia schopnosť. Naopak pre pomalý pohyb sa zvyšuje priestorová a znižuje časová rozlišovacia schopnosť. Celkove sa zlepšuje subjektívna kvalita kódovaného obrazu, pretože ľudský zrak je veľmi málo citlivý na zníženie priestorovej rozlišovacej schopnosti pri rýchlom pohybe a naopak táto citlivosť sa zvyšuje pri pomalom pohybe v obraze. Gotze a Ocylok [30] rozpracovali adaptívne medzisnímkové transformačné kódovanie obrazu s 3RDCT (4x8x8), pričom adaptácia je riadená pomocou vektora aktivity ( t,v,ha ΔΔΔ )= . Zložky Δh a Δv sú maximálne absolútne hodnoty diferencií medzi susednými op v horizontálnom a vertikálnom smere. Zložka Δt je maximálna absolútna hodnota diferencie susedných op v smere časovej súradnice vo vnútri trojrozmerného bloku op. Ak Δt je menšie ako zvolená prahová hodnota, blok neobsahuje podstatné zmeny v smere časovej súradnice. V tomto prípade sa kódujú len spektrálne koeficienty Y0km(k,m=0,...,7), t.j. spektrálne koeficienty 0-tej matice trojrozmerného transformovaného bloku. V opačnom prípade, keď Δt je väčšie ako zvolená prahová hodnota, výrazné zmeny sú v smere časovej súradnice. Preto sa spektrálne koeficienty rozdelia do 14-tich tried v závislosti od Δh a Δv, pričom jednotlivým triedam zodpovedajú tabuľky pridelených počtov bitov.

25

Page 29: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

4.3. Zhodnotenie účinnosti a vlastností metód transformačného kódovania obrazu Metódy transformačného kódovania využívajú dekorelačné vlastnosti diskrétnych ortogonálnych transformácií, ktoré spôsobujú kompresiu energie v transformovaných blokoch. Vnútrosnímkové transformačné kódovanie obrazu používa jednorozmerné alebo dvojrozmerné diskrétne ortogonálne transformácie, ktoré dekorelujú obraz v priestore, t.j. v snímkach, čím sa dosahuje kompresia energie v priestore. Medzisnímkové transformačné kódovanie obrazu požíva trojrozmernú diskrétnu ortogonálnu transformáciu, ktorá dekoreluje obraz, resp. spôsobuje kompresiu energie v priestore aj v čase. Z toho vyplýva, že počet relevantných spektrálnych koeficientov je menší pre medzisnímkové transformačné kódovanie obrazu, ktoré takto dosahuje vyššiu účinnosť kódovania, ale má zložitejšiu technickú realizáciu. Adaptívne modifikácie vnútrosnímkového a medzisnímkového transformačného kódovania prispôsobujú svoje parametre lokálnym zmenám obrazu, čím sa zvyšuje účinnosť kódovania, ale adaptačné obvody zväčšujú zložitosť ich technickej realizácie. Vo všeobecnosti transformačné kódovanie obrazu dosahuje vysokú účinnosť kódovania a je dobre prispôsobené vlastnostiam ľudského zraku, ale vyznačuje sa zložitou technickou realizáciou, lebo používa transformačné procesory s veľkými rozmermi. Zhodnotenie účinnosti pomocou priemerného počtu mT bitov na op jednotlivých metód transformačného kódovania obrazu so skalárnym kvantovaním ako aj ich vlastností je v tab.4.1. Tabuľka 4.1

Metódy transformačného

kódovania obrazu

mT [ bit/op ]

Zhodnotenie vlastností

Vnútrosnímkové transformačné kódovannie

1- 1,5

Adaptívne vnútrosnímkové transformačné kódovanie

0,5 – 1

Medzisnímkové transformačné kódovanie

0,5 – 1

Adaptívne medzisnímkové transformačné kódovanie

0,1 – 0,5

Veľká účinnosť kódovania Malá citlivosť na zmeny štatistických charakteristík obrazu

Rozloženie kvantizačných a kanálových chýb na bloky op Zložitá technická realizácia Jednoduchosť ochrany oproti kanálovým poruchám

26

Page 30: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

5. HYBRIDNÉ KÓDOVANIE OBRAZU Hybridné kódovanie obrazu používa diskrétne ortogonálne transformácie na vnútroblokovú dekoreláciu op, pričom sa zachováva medzibloková korelácia. Z toho dôvodu je výhodne kódovať spektrálne koeficienty s rovnakou sekvenciou pomocou DPCM za účelom zmenšenia strednej kvadratickej chyby kódovaného obrazu, resp. zvýšenia účinnosti kódovania. Hybridné kódovanie dosahuje dobré vlastnosti bez ohraničení, ktorými sa vyznačujú transformačné a predikčné (DPCM) metódy, ako je napr. zložitosť technickej realizácie transformačného kódovania a veľmi malá odolnosť predikčného kódovania oproti kanálovým poruchám. Rozoznávame vnútrosnímkové a medzisnímkové hybridné kódovanie obrazu, ktoré môžu byť nemenné alebo adaptívne [1 až 4]. Bloková schéma hybridného kódovacieho (HKS) a dekódovacieho (HDS) systému je na obr.5.1. Vektor (blok) op X sa privádza do procesora priamej diskrétnej ortogonálnej transformácie (1RDOT). Z jeho výstupu dostaneme vektor spektralných koeficientov XUY = . Každá zložka vektora Y , t.j. Yk (k=1,2,...,M) sa kóduje pomocou príslušného kódovacieho systému DPCM a prenáša sa číslicovým kanálom. Z výstupu dekodéra sa získava kvantovaný chybový vektor e~′ , ktorý vo všeobecnosti môže byť skreslený kanálovými poruchami. Tento sa demoduluje v demodulátoroch DPCM na vektor Y

~′ , ktorý

sa ďalej transformuje v procesore spätnej diskrétnej ortogonálnej transformácie na vektor X

~′ .

Obr.5.1. Bloková schéma hybridného kódovacieho a dekódovacieho systému.

27

Page 31: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

HKS používajú 1RDOT alebo 2RDOT a v závislosti od toho rozoznávame jednorozmerné (1RHKS) a dvojrozmerné (2RHKS) hybridné kódovacie systémy [5,6]. Z výsledkov medziblokovej korelačnej analýzy obrazu v priestore 1RDOT vyplýva možnosť použiť 1RNVP vo vertikálnom smere pre všetky podpolia spektrálnych koeficientov s rovnakou sekvenciou, ale aj 2RNVP iba pre podpole s nulovou sekvenciou. Podobne z výsledkov medziblokovej korelačnej analýzy obrazu v priestore 2RDOT vyplýva možnosť predikovať podpolia spektrálnych koeficientov s nulovou vertikálnou sekvenciou pomocou 1RNVP vo vertikálnom smere alebo podpolia s nulovou horizontálnou sekvenciou zasa pomocou 1RNVP, ale v horizontálnom smere. Podpole spektrálnych koeficientov s nulovou vertikálnou aj horizontálnou sekvenciou možno predikovať aj pomocou 2RNVP. Čím účinnejšia bude predikcia obrazu v transformovanom priestore, tým budú disperzie chybových spektrálnych koeficientov menšie. Tiež sa zväčšuje hybridný (transformačno-predikčný) zisk G, ktorý pre 2RDOT sa vypočíta z formálne zhodnej rov.(4.3) v ktorej disperzie spektrálnych koeficientov sú nahradené disperziami chybových spektrálnych koeficientov. Z tejto rovnice vyplýva, že G závisí ako od veľkosti tak aj rozloženia disperzií chybových spektrálnych koeficientov. Čím viac sa koncentruje energia bloku obrazu v transformovanom priestore do spektrálnych koeficientov s nižšími sekvenciami a čím účinnejšia bude ich predikcia, tým bude hybridný zisk G väčší. Potom redukovaná redundancia R tohto HKS oproti referenčnému kódovaciemu systému PCM s rovnakou kvalitou kódovania obrazu (t.j. pomerom S/Š) sa vypočíta pomocou rov.(4.2) so zmenenou hodnotou zisku G. Blokové kvantovanie v 2RHKS možno vykonať s ONSK alebo OLSK, pričom ich počet bitov sa vypočíta z rov.(4.1) v ktorej dochádza k obdobnej zámene disperzií ako v rov.(4.3) pre výpočet G. Účinnosť kódovania HKS možno ovplyvňovať parametrami transformačného procesora, výberom spektrálnych koeficientov ako aj parametrami jednotlivých kódovacích systémov DPCM. Pre ilustráciu uvádzame niektoré výsledky pre 1RHKS aj 2RHKS s vnútrosnímkovou DPCM pre obraz s exponenciálnou autokorelačnou funkciou, ktorej dekrementy tlmenia

a 0545,0h =α 128,0v =α . Na obr.5.2 sú grafické závislosti priemerného počtu bitov m na op od pomeru S/Š pre 1RHKS s 1RKLT, 1RDFT, 1RDCT, 1RST a 1RWHT (M=16). Na obr.5.3 sú zasa grafické závislosti pomeru S/Š od rozmeru M vektora (jednorozmerného bloku) op pre 1RHKS s 1RKLT a 1RWHT pre rôzne hodnoty m. Z tohto obrázka vidno, že od hodnoty M=8 sa pomer S/Š zväčšuje veľmi málo, preto 1RHKS sú menej citlivé na rozmer M ako 1RTKS. Na obr.5.4 a 5.5 sú podobné grafické závislosti pre 2RHKS s 2RKLT, 2RWHT, 2RDFT (M×M=4×4), pričom na obr.5.4 je nakreslená pre porovnanie aj závislosť m od S/Š pre 1RHKS s 1RKLT. Z obr.5.4 vidno, že pre rovnaký počet (16) op v jednorozmernom aj dvojrozmernom bloku dosahuje 1RHKS vyššiu účinnosť kódovania ako 2RHKS.

28

Page 32: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.5.2.Závislosť priemerného počtu bitov m na op od pomeru S/Š pre 1RHKS.

Obr.5.3. Závislosť pomeru S/Š od rozmeru M pre 1RHKS. (Spojité krivky

patria 1RHKS s 1RKLT a čiarkované 1RHKS s 1RWHT).

29

Page 33: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.5.4.Závislosť priemerného počtu bitov m na op od pomeru S/Š pre 2RHKS.

Obr.5.5. Závislosť pomeru S/Š od rozmeru MxM pre 2RHKS. (Spojité krivky patria 2RHKS s 2RKLT a čiarkované 2RHKS s 2RWHT).

30

Page 34: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

5.1. Vnútrosnímkové hybridné kódovanie obrazu Nemenné a adaptívne modifikácie vnútrosnímkového hybridného kódovania obrazu [7,8,9] dostaneme z príslušných modifikácií vnútrosnímkového transformačného a predikčného kódovania. Z tohto vyplývajú 1RHKS aj 2RHKS s jednorozmernou alebo dvojrozmernou diskrétnou ortogonálnou transformáciou a vnútrosnímkovým predikčným kódovaním. Najviac rozpracované sú nemenné 1RHKS [10,11], ktoré používajú procesor 1RDOT na dekoreláciu op v horizontálnom smere, resp. v riadku a 1RPKS na kódovanie spektrálnych koeficientov s rovnakou sekvenciou vo vertikálnom smere, resp. pozdĺž stĺpca. To vyplýva z výsledkov medziblokovej korelačnej analýzy obrazu v priestore 1RDOT, t.j. všetky podpolia spektrálnych koeficientov s rovnakou sekvenciou sú najviac korelované vo vertikálnom smere. Nemenné 2RHKS [12,13] používajú procesor 2RDOT na dekoreláciu op v dvojrozmerných blokoch s malými rozmermi a 1RPKS alebo 2RPKS na kódovanie podpolí spektrálnych koeficientov s rovnakou sekvenciou v závislosti od výsledkov medziblokovej korelačnej analýzy v priestore 2RDOT. V adaptívnych HKS s vnútrosnímkovým hybridným kódovaním [14] sa menia parametre procesora diskrétnej ortogonálnej transformácie, selektora spektrálnych koeficientov a ich kódovacích systémov DPCM jednotlivo alebo súčasne. Metódy adaptácie procesora, selektora ako aj prideľovania počtu bitov jednotlivým kódovacím systémom DPCM sú analogické s metódami používanými v adaptívnych TKS s vnútrosnímkovým transformačným kódovaním (kap.4.1). Pretože kódovacie systémy DPCM používajú vnútrosnímkové predikčné kódovanie v transformovanom priestore , možno ich adaptívne modifikácie vytvoriť analogicky ako pre PKS s adaptívnym vnútrosnímkovým predikčným kódovaním v obrazovom priestore (kap.3.1). Adaptívne 1RHKS s vnútrosnímkovým hybridným kódovaním a nemennou bitovou rýchlosťou používajú výpočet štatistických charakteristík potrebných pre určenie parametrov jednotlivých kódovacích systémov DPCM pred alebo v dobe kódovania spektrálnych koeficientov . Predpokladajme kódovanie spektrálnych koeficientov 1RDOT po vertikálnych pásoch pomocou DPCM, pričom každý stĺpec týchto pásov obsahuje spektrálne koeficienty a rovnakou sekvenciou. Roese rozpracoval adaptívny algoritmus [15] kódovania týchto spektrálnych koeficientov, ktorý používa výsledky štatistickej analýzy jednotlivých stĺpcov každého pásu. Štatistická analýza stĺpcov sa vykonáva pred samotným kódovaním príslušného pásu spektrálnych koeficientov a jej výsledky sú: koeficienty korelácie a disperzie chybových spektrálnych koeficientov pri použití jednorozmernej optimálnej predikcie týchto stĺpcov. Z týchto výsledkov možno určiť optimálne rozdelenie počtu bitov na vektor spektrálnych koeficientov s rôznou sekvenciou (riadok pásu) pre jednotlivé kódovacie systémy DPCM a parametre ich prediktorov. Potom možno pomocou získaných kódovacích systémov DPCM

31

Page 35: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

kódovať prislúchajúce stĺpce spektrálnych koeficientov s rovnakou sekvenciou v danom páse. Z tohto vyplýva oneskorené kódovanie pásu spektrálnych koeficientov o dobu potrebnú pre štatistickú analýzu jeho stĺpcov a určenie adaptívnych parametrov kódovacích systémov DPCM. Vo všeobecnosti tieto parametre, t.j. optimálne počty bitov a predikčné koeficienty sa menia v každom páse, preto je potrebné vysielať prídavnú informáciu o týchto parametroch do 1RHDS. Výsledná bitová rýchlosť adaptívneho 1RHKS sa nemení, pretože v každom páse sa používa rovnaký počet bitov pre kódovanie každého vektora spektrálnych koeficientov s rôznou sekvenciou ako aj pre kódovanie prídavnej informácie.

Iný adaptívny algoritmus [16] kódovania spektrálnych koeficientov v jednotlivých stĺpcov spracovávaného pásu používa výsledky štatistickej analýzy kódovaných stĺpcov v predchádzajúcom páse, pričom tieto sa získali v dobe jeho kódovania. Z tohto vyplýva možnosť adaptácie parametrov jednotlivých kódovacích systémov DPCM pomocou spätnej väzby, pričom nedochádza k oneskoreniu kódovania pásu spektrálnych koeficientov a netreba vysielať prídavnú informáciu do 1RHDS. Pre tento adaptívny algoritmus kódovania sa predpokladá lokálna stacionarita obrazu, ale ak tento predpoklad nie je splnený, estimácia štatistických charakteristík spracovávaného pásu, pomocou kódovaných spektrálnych koeficientov z predchádzajúceho pásu, je veľmi nepresná. Naviac v tomto adaptívnom algoritme kódovania dochádza k znižovaniu presnosti estimácie štatistických charakteristík vplyvom používania kódovacích systémov DPCM s malým počtom bitov, pretože narastá skreslenie kódovaných spektrálnych koeficientov. Vzhľadom na štandardný rozklad obrazu po riadkoch je výhodnejší adaptívny 1RHKS s vnútrosnímkovým hybridným kódovaním a nemennou bitovou rýchlosťou, ktorý sa prispôsobuje štatistickým charakteristikám transformovaných riadkov obrazu [17]. Z tohto vyplýva možnosť adaptívneho skalárneho kvantovania chybových spektrálnych koeficientov s rovnakou sekvenciou eik(g) po riadkoch v príslušnom kódovacom systéme DPCM. Pred skalárnym kvantovaním týchto chybových spektrálnych koeficientov z jedného riadka zodpovedajúceho podpoľa sa vypočíta ich disperzia a pomocou jej

kvantovanej hodnoty

2ek

σ2ek

~σ sa menia parametre adaptívneho skalárneho kvantizátora (obr.5.6). V jeho štruktúre je použitý nemenný ONSK, ktorý je optimalizovaný pre Laplaceove rozdelenie pravdepodobnosti s jednotkovou disperziou. Adaptácia sa vykonáva normovaním chybových spektrálnych koeficientov s rovnakou sekvenciou z daného riadka pomocou odmocniny z kvantovanej disperzie

ke~σ čím sa dosiahne približne jednotková disperzia

normovaných chybových spektrálnych koeficientov na vstupe ONSK. Výstupné kvantované chybové spektrálne koeficienty )g(e~ik dostaneme násobením kvantizačných úrovní ONSK s

ke~σ .

32

Page 36: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.5.6. Adaptívny skalárny kvantizátor.

Na obr.5.7 je bloková schéma kódovacieho a dekódovacieho systému DPCM s adaptívnym skalárnym kvantizátorom (obr.5.6), ktoré sa používajú v 1RHKS pre kódovanie a dekódovanie podpolí spektrálnych koeficientov s rovnakou sekvenciou (k). Pamäť predikčných spektrálnych koeficientov obsahuje pre i-tý spracovávaný riadok podpoľa spektrálnych koeficientov so sekvenciou (k) ich predikčné hodnoty Y , g=1,2,...,L/M, kde L je počet op v riadku a M–v jednorozmernom bloku (vektore) obrazu. Potom pamäť chybových spektrálnych koeficientov obsahuje pre ten istý spracovávaný riadok daného podpoľa spektrálnych koeficientov chyby (diferencie) . Synchrónne so vstupom spektrálnych koeficientov z toho istého riadka spracovávaného podpoľa do kódovacieho systému DPCM sa číta obsah pamäte predikčných spektrálnych koeficientov a súčasne sa zaznamenáva do pamäte chybových spektrálnych koeficientov. Zaznamenané chybové spektrálne koeficienty sa privádzajú do estimátora disperzie . Táto sa kvantuje

v nemennom skalárnom kvantizátore na hodnotu

)g(Yik

)g(ˆik

)g(Y)g(Y)g(e ikikik −=

2ek

σ2ek

~σ , ktorá sa privádza do adaptívneho skalárneho kvantizátora a súčasne sa vysiela do dekódovacieho systému DPCM. Výstupné kvantizačné úrovne z ONSK, ktorý je súčasťou adaptívneho skalárneho kvantizátora sa kódujú v kodéri a kvantované chybové spektrálne koeficienty )g(e~

ik sa sčítavajú s predikčnými spektrálnymi

koeficientami v sčítačke, z výstupu ktorej dostaneme obnovené )g(Yik

33

Page 37: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

spektrálne koeficienty )g(Y~ik . V dekódovacom systéme DPCM je algoritmus získania dekódovaných spektrálnych koeficientov )g(Y~ik rovnaký, aký sa používal pri obnovovaní spektrálnych koeficientov v kódovacom systéme DPCM. Uvedený adaptívny 1RHKS umožňuje kódovanie obrazu v reálnom čase, pretože oneskorenie kódovania je len jeden riadok. Jeho adaptívne skalárne kvantizátory sa prispôsobujú štatistickým charakteristikám jednotlivých riadkov podpolí chybových spektrálnych koeficientov, pričom tieto obsahujú aj kvantizačný šum z predchádzajúcich riadkov. Z tohto dôvodu účinnosť adaptívnych skalárnych kvantizátorov je menej citlivá na zmeny ich počtu bitov, ktoré možno tiež adaptovať po riadkoch.

Obr.5.7. Kódovací a dekódovací systém DPCM spektrálnych koeficientov

s adaptívnym skalárnym kvantizátorom.

Adaptívny 1RHKS [16] s premennou bitovou rýchlosťou najprv vstupný vektor (blok) op klasifikuje v závislosti od indexu aktivity (kap.4.1). Potom je zatriedený do jednej z možných tried, ktorej zodpovedá určité rozdelenie počtu bitov pre jednotlivé kódovacie systémy DPCM, pričom dochádza k zmene celkového počtu bitov na vektor op. To spôsobuje zmenu bitovej rýchlosti na výstupe adaptívneho 1RHKS a preto je potrebné na jeho výstup zapojiť vyrovnávaciu pamäť. Tento adaptívny 1RHKS je dosť nepraktický, pretože používa 1RDOT, ktorá vyžaduje vysielanie veľkého počtu klasifikačných parametrov pri kódovaní obrazu. Preto bude výhodnejšie zovšeobecniť tento adaptívny algoritmus pre 2RHKS s vnútrosnímkovým hybridným kódovaním. Keď adaptívny 1RHKS značne mení svoju bitovú rýchlosť od bloku k bloku

34

Page 38: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

a prenos je potrebné vykonať s nízkou konštantnou bitovou rýchlosťou, zapojí sa na jeho výstup vyrovnávacia pamäť (obr.5.8). Vtedy je nutná kontrola adaptívneho kódovania spektrálnych koeficientov, aby nedošlo k vyprázdneniu alebo pretečeniu vyrovnávacej pamäte. Procesor kontroly adaptívneho kódovania [18] v závislosti od stavu vyrovnávacej pamäte určuje vo všeobecnosti presnosť a počet kvantovaných chybových spektrálnych koeficientov ako aj algoritmus ich kódovania napr. pomocou Huffmanovho kódu alebo priebežného kódovania úsekov vyplývajúcich z ich štatistických charakteristík.

Obr.5.8. Adaptívny 1RHKS a 1RHDS s procesorom kontroly adaptívneho

kódovania, resp. dekódovania. 5.2. Medzisnímkové hybridné kódovanie obrazu Medzisnímkové hybridné kódovanie obrazu kombinuje vnútrosnímkové transformačné kódovanie s medzisnímkovým predikčným kódovaním, pričom poradie ich aplikácie určuje dve možné modifikácie tohto kódovania obrazu [19,20]. Bloková schéma nemenného HKS [21,22] v ktorom sa najprv vykoná dvojrozmerná diskrétna ortogonálna transformácia a potom medzisnímkové predikčné kódovanie spektrálnych koeficientov je na obr.5.9. Po rozdelení snímok obrazu na dvojrozmerné bloky (matice) op (obr.5.10) sa tieto transformujú pomocou transformačného procesora na prislúchajúce bloky spektrálnych koeficientov. Touto dvojrozmernou diskrétnou ortogonálnou transformáciou sa dekorelujú spektrálne koeficienty vo vnútri blokov, ale zachováva za medzi nimi silná medzisnímková korelácia. Z tohto dôvodu je výhodné ich kódovať pomocou medzisnímkového predikčného kódovania ako to vidno na obr.5.9.

35

Page 39: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.5.9. Nemenný HKS s 2RDOT a medzisnímkovým predikčným kódovaním spektrálnych koeficientov.

Obr.5.10. Rozdelenie snímok obrazu na dvojrozmerné bloky op.

36

Page 40: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Medzisnímková predikcia spektrálnych koeficientov matice sY spracovávanej transformovanej snímky sa najjednoduchšie vykonáva pomocou spektrálnych koeficientov prislúchajúcej matice pY~ z predchádzajúcej obnovenej transformovanej snímky, ktorá je zaznamenaná v snímkovej pamäti. Potom matica chybových spektrálnych koeficientov pssss Y~YYYe −=−= (5.1) pričom jej prvky sa kvantujú so skalárnymi kvantizátormi (ONSK) a kódujú v kodéri. Spektrálne koeficienty s nenulovou sekvenciou matice sY závisia len od množstva priestorových detailov v snímke, t.j. priestorovej aktivity, ale chybové spektrálne koeficienty matice se budú závisieť ako od priestorovej aktivity tak aj od časových zmien v snímkach, t.j. časovej aktivity obrazu. Vtedy pre postupnosť snímok s malým počtom detailov mnoho spektrálnych koeficientov matice sY bude mať zanedbateľné hodnoty, ktoré dávajú v matici

se mnoho chybových spektrálnych koeficientov s hodnotami blízkymi nule. Ak v obraze nie je žiadny pohyb, potom všetky chybové spektrálne koeficienty matice se sú nulové nezávisle od množstva detailov v snímkach. V druhej modifikácii [23] nemenného HKS (obr.5.11) sa najprv vykoná medzisnímková predikcia a potom vnútrosnímkové transformačné kódovanie chybových op.

Obr.5.11. Nemenný HKS s medzisnímkovou predikciou a vnútrosnímkovým transformačným kódovaním chybových op.

37

Page 41: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Medzisnímková predikcia v obrazovom priestore sa najjednoduchšie vykonáva pomocou op predchádzajúcej obnovenej snímky, ktorá je zaznamenaná v snímkovej pamäti. Potom matica chybových op pssss X~XXXe −=−= (5.2) pričom jej prvky zostávajú silne korelované a preto sa kóduje s vnútrosnímkovým transformačným kódovaním. Z tohto dôvodu je potrebné použiť v spätnej väzbe tohto nemenného HKS spätný dvojrozmerný transformačný procesor za účelom obnovenia vstupnej snímky. Preto táto modifikácia HKS má zložitejšiu technickú realizáciu, ale môže lepšie využívať známe algoritmy predikcie v obrazovom priestore. Nemenné HKS s medzisnímkovým hybridným kódovaním dosahujú vysokú účinnosť kódovania obrazu s malým pohybom. S narastajúcim pohybom v obraze sa znižuje účinnosť nemenného medzisnímkového hybridného kódovania. Z tohto dôvodu pri adaptívnom medzisnímkovom hybridnom kódovaní [24] sa rozdelia dvojrozmerné bloky chybových spektrálnych koeficientov na niekoľko subblokov. Priestorová aktivita každého subbloku je určená pomocou disperzie jeho chybových spektrálnych koeficientov. Ak táto priestorová aktivita je väčšia ako zvolená prahová hodnota, potom sa používa viacej bitov pre kódovanie chybových spektrálnych koeficientov z tohto subbloku. Súčasne sa mení bitová rýchlosť a na jej vyrovnávanie sa používa vyrovnávacia pamäť. Chybový spektrálny koeficient s nulovou sekvenciou sa používa na určovanie časovej aktivity. Ak dvojrozmerný blok chybových spektrálnych koeficientov má vysokú časovú aktivitu, potom sa nepoužíva viacej bitov pre kódovanie subblokov týchto koeficientov s vyššími sekvenciami. Tento adaptívny algoritmus vyplýva z redukovanej schopnosti ľudského zraku rozlišovať detaily pri rýchlom pohybe v obraze. Iné modifikácie adaptívného medzisnímkového hybridného kódovania obrazu [25] prepínajú medzi rôznymi algoritmami medzisnímkovej predikcie v obrazovom priestore v závislosti od rýchlosti pohybu v obraze. Za predpokladu použitia štandardného rozkladu obrazu s prekladaným riadkovaním možno prepínať napr. medzi dvoma algoritmami znázornenými na obr.5.12. Výber jedného z týchto algoritmov medzisnímkovej predikcie sa vykonáva pre každý dvojrozmerný blok op na základe strednej kvadratickej predikčnej chyby. Medzisnímková predikcia sa používa pre bloky op bez pohybu a medzisnímková predikcia sa naopak používa pre bloky op s pohybom. Pritom je potrebné vysielať prídavnú informáciu o zvolenom algoritme medzisnímkovej predikcie.

AX =2/)CB(X +=

38

Page 42: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.5.12. Medzisnímková predikcia a) X=A, b) X=(B+C)/2. Účinnosť adaptívneho medzisnímkového hybridného kódovania dynamického obrazu možno podstatne zvýšiť pomocou medzisnímkovej predikcie s pohybovou kompenzáciou [26,27]. Pretože predpokladáme medzisnímkovú predikciu v obrazovou priestore, algoritmy pre pohybovú kompenzáciu zostávajú rovnaké ako pre adaptívne medzisnímkové predikčné kódovanie obrazu (kap.3.2). Bloková schéma adaptívneho HKS a HDS s medzisnímkovou predikciou a pohybovou kompenzáciou je na obr.5.13. Estimátor najprv určí vektor pohybu V vstupnej matice op sX v spracovávanej snímke. Pomocou tohto vektora V sa vyvolá zo snímkovej pamäte matica op

pX~ z predchádzajúcej obnovenej snímky, ktorá sa použije na medzisnímkovú

predikciu. Táto matica pX~ je najviac korelovaná so vstupnou maticou sX , pretože sa získala jej posunutím v smere vektora pohybu. Z toho dôvodu matica chybových op se bude mať prvky s veľmi malými hodnotami, čím sa zvýši presnosť medzisnímkovej predikcie. Potom matica se sa kóduje pomocou 2RTKS a v spätnej väzbe sa dekóduje pomocou 2RTDS za účelom získania obnovenej matice sX~ . Analogicky s procesom obnovenia snímky v HKS prebieha proces jej dekódovania v HDS, pričom vektor V je prídavnou informáciou [28].

39

Page 43: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.5.13. Adaptívny HKS a HDS s medzisnímkovou predikciou a pohybovou kompenzáciou. Pohybovú kompenzáciu možno používať aj pre medzisnímkovú predikciu v transformovanom priestore (obr.5.9), pričom estimácia vektora pohybu V sa vykonáva aj naďalej v obrazovom priestore [25]. Potom pomocou tohto vektora sa kompenzuje pohyb dvojrozmerného bloku spektrálnych koeficientov rovnakým spôsobom ako pre dvojrozmerný blok op, pretože vykonávajú rovnaký pohyb. Iné modifikácie adaptívneho medzisnímkového hybridného kódovania obrazu [29] možno odvodiť od rôznych modifikácii adaptívneho vnútrosímkového transformačného (kap.4.1) a medzisnímkového predikčného (kap.3.2) kódovania obrazu.

40

Page 44: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

5.3. Zhodnotenie účinnosti a vlastností metód hybridného kódovania obrazu Vo všeobecnosti hybridné kódovanie svojou účinnosťou a vlastnosťami je medzi transformačným a predikčným kódovaním. Je menej citlivé na kanálové poruchy ako predikčné kódovanie, ale dosahuje menšiu účinnosť ako transformačné kódovanie, pričom umožňuje kódovať obraz v reálnom čase. Technická realizácia hybridného kódovania obrazu je pomerne jednoduchá, pretože používa transformačný procesor s malými rozmermi. Z tohto dôvodu sa zmenšuje počet operácií aj kapacita pamäte HKS, ktorý sa ľahko adaptuje na lokálne zmeny štatistických charakteristík obrazu. Z porovnania 1RHKS a 2RHKS s vnútrosnímkovým hybridným kódovaním vyplýva, že 2RHKS dosahujú väčšiu účinnosť kódovania pre malé bitové rýchlosti a naopak 1RHKS má väčšiu účinnosť kódovania pre veľké bitové rýchlosti. Technické prostriedky 2RHKS sú zložitejšie oproti 1RHKS, pretože používajú dvojrozmerné transformačné procesory, pričom z globálneho hľadiska sú výhodnejšie 1RHKS. Medzisnímkové hybridné kódovanie svojou účinnosťou sa blíži k medzisnímkovému transformačnému kódovaniu, ale požaduje omnoho menšiu kapacitu pamäte. Medzisnímkové transformačné kódovanie požaduje kapacitu pamäte pre niekoľko snímok, zatiaľ čo medzisnímkové hybridné kódovanie len pre jednu snímku. Zo všetkých možných modifikácií adaptívného medzisnímkového hybridného kódovania obrazu má najvyššiu účinnosť tá modifikácia, ktorá používa pohybovú kompenzáciu. Zhodnotenie účinnosti pomocou priemerného počtu mH bitov na op jednotlivých metód hybridného kódovania obrazu so skalárnym kvantovaním, ako aj ich vlastnosti, je v tab.5.1.

Tabuľka 5.1

Metódy hybridného kódovania obrazu mH [bit/op] Zhodnotenie vlastností

Vnútrosnímkové hybridné kódovanie

1 – 2

Adaptívne vnútrosnímkové hybridné kódovanie

0,5 – 1,5

Medzisnímkové hybridné kódovanie 0,5 – 1

Adaptívne medzisnímkové hybridné kódovanie 0,25 – 0,5

-Účinnosť veľmi blízka k účinnosti transformač- ných metód kódovania.

-Zložitosťou technickej realizácie sú medzi transformačnými a pre- dikčnými metódami kó- dovania.

-Kvantizačné a kanálové chyby sú reprezentované v transformovanej oblasti.

-Ľahkosť prispôsobenia zmenám štatistických charakteristík obrazu.

41

Page 45: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

6. INTERPOLAČNÉ A EXTRAPOLAČNÉ KÓDOVANIE OBRAZU Pri interpolačnom a extrapolačnom kódovaní obrazu [1,2] sa kóduje iba podskupina vybraných op a vynechané op sa obnovujú pomocou extrapolácie alebo interpolácie. Extrapolácia sa vykonáva iba pomocou predchádzajúcich kódovaných op, ale interpolácia používa aj nasledujúce kódované op. Vybraná podskupina op sa môže kódovať pomocou niektorej z predtým uvedených metód kódovania ako napr. PCM, DPCM atď. Rozoznávame nemenné a adaptívne interpolačné a extrapolačné kódovanie obrazu. Nemenné interpolačné kódovanie obrazu [3,4] používa nemennú podskupinu vybraných op. Napr. možno kódovať každý druhý op, jeden zo štyroch op, každý druhý riadok alebo snímku (polsnímku). Kvalita kódovania obrazu závisí od počtu a druhu vybraných op a od algoritmu interpolácie. Na obr. 6.1 je ilustrovaný príklad interpolácie pri kódovaní každého druhého op pozdĺž riadkov so striedajúcou sa polohou prvého kódovaného op. Obnovený (interpolovaný) op A je daný pomocou aritmetického priemeru kódovaných op B,C,D,E. Namiesto aritmetického priemeru možno použiť zložitejšie algoritmy interpolácie využívajúce polynómy vyššieho stupňa alebo splajnové funkcie.

Obr.6.1. Príklad interpolácie vynechaných op. Za predpokladu použitia medzisnímkových metód kódovania obrazu a jeho rozkladu s prekladaným riadkovaním je možné kódovať iba každú druhú polsnímku, a tak redukovať priestorovú aj časovú rozlišovaciu schopnosť. Vynechané polsnímky sa získavajú interpoláciou, ako to vidno z obr.6.2. Každý op z vynechanej polsnímky je obnovený pomocou aritmetického priemeru štyroch op zo susedných kódovaných polsnímok, ktoré sú najbližšie v priestore aj čase. Túto metódu interpolácie možno tiež použiť pri medzisnímkovom kódovaní obrazu v dobe preťaženia vyrovnávacej pamäte na zníženie bitovej rýchlosti.

42

Page 46: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.6.2. Príklad interpolácie vynechaných polsnímok. Adaptívne metódy interpolácie [5,6] zvyšujú účinnosť kódovania obrazu. Napr. vynechané op na obr.6.1 možno interpolovať takto

⎪⎩

⎪⎨⎧ ≤+

+=E-B D-Cak ),DC( 5,0

inač E),(B 5,0A (6.1)

Táto adaptívna interpolácia prepína medzi aritmetickým priemerom v horizontálnom a vertikálnom smere v závislosti od veľkosti korelácie v týchto smeroch. Adaptívne interpolačné kódovanie má tri časti: 1. Výber vhodných op pre kódovanie. 2. Interpolácia vynechaných op. 3. Výpočet interpolačnej chyby. Ak je interpolačná chyba menšia ako zvolená prahová hodnota, vyberie sa menej op, ale ak je väčšia ako táto hodnota, tak sa vyberie viacej op pre kódovanie. Najmenší počet vybraných op, ktorý ešte dáva interpolačnú chybu menšiu než je prahová hodnota, predpokladá sa ako optimálny počet. Uvažujme obrazový signál pozdĺž riadka, ktorého priebeh je na obr.6.3. Potom je vhodné kódovať op A aj E a pomocou priamky interpolovať všetky op medzi nimi, t.j. B,C,D. Ak by sa kódovali iné dva op, napr. op A a F, presnosť interpolácie op B,C,D,E

43

Page 47: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

pomocou priamky by sa zmenšila. Najčastejšie používaným kritériom presnosti interpolácie je stredná kvadratická chyba, ale výhodnejšie sú také kritéria, ktoré sú lepšie prispôsobené ľudskému zraku. V súvislosti s tým sa najprv vykoná filtrácia chybového signálu ako aj násobenie s vhodnou maskovacou funkciou a až potom sa vypočíta stredná kvadratická chyba. Adaptívne interpolačné kódovanie obrazu vyžaduje prenos nielen kódovaných op, ale aj ich adresy.

Obr.6.3. Adaptívna interpolácia obrazového signálu.

Vysokú presnosť aproximácie vynechaných snímok pri medzisnímkovom kódovaní obrazu možno dosiahnuť pomocou adaptívnej interpolácie s pohybovou kompenzáciou (obr.6.4). Nemenná interpolácia obnovuje vynechanú snímku tak, že každý jej op je daný z nasledujúcich dvoch op s rovnakými priestorovými súradnicami v kódovanej predchádzajúcej a nasledujúcej snímke. Ak interpolovaný op je daný aritmetickým priemerom dvoch op, z ktorých jeden je na pohybujúcom sa objekte a druhý na pozadí, ako to vidno z obr.6.4, potom narastá jeho nepresnosť interpolácie. Z toho dôvodu je potrebné najprv vykonať pohybovú kompenzáciu a až potom interpoláciu. Výsledkom pohybovej kompenzácie je vektor pohybu, ktorý udáva premiestnenie pohybujúceho sa objektu z predchádzajúcej do nasledujúcej kódovanej snímky. Potom interpolovaný op je daný aritmetickým priemerom takých dvoch op z predchádzajúcej a nasledujúcej kódovanej snímky, ktorých súradnice sa odlišujú o zložky vektora pohybu. Najčastejšie sa estimácia vektora pohybu vykonáva po blokoch, v ktorých vo všeobecnosti sa menia op, ktoré sa používajú na interpoláciu, ale aj samotné interpolačné koeficienty. Za účelom jednoznačného dekódovania obrazu je nutné vysielať okrem hlavnej informácie o kódovaných op aj prídavnú informáciu o vektore pohybu a interpolačných koeficientov.

44

Page 48: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.6.4. Adaptívna interpolácia snímky s pohybovou kompenzáciou. Možno navrhnúť rôzne modifikácie interpolačného kódovania obrazu v závislosti od metódy kódovania vybraných op, algoritmu interpolácie ako aj kritéria jej presnosti. Vo všeobecnosti interpolačné kódovanie obrazu dosahuje vyššiu účinnosť oproti nemenným predikčným a transformačným metódam kódovania, ale je nižšia než účinnosť ich adaptívnym modifikácií. Extrapolačné kódovanie [7,8] je rýchlejšie než interpolačné kódovanie, nespôsobuje oneskorenie v procese kódovania (dekódovania), pretože kódované op, charakterizujúce aproximačnú krivku pri extrapolácii, sú známe už na začiatku aproximácie, zatiaľ čo pri interpolácii až na konci. Najjednoduchší algoritmus extrapolácie nultého rádu používa jeden kódovaný op na aproximáciu niekoľkých nasledujúcich vynechaných op, ktoré sa len málo líšia od kódovaného op. Potom okrem kódovaného op sa vysiela aj počet nasledujúcich vynechaných op, ktoré budú priamo aproximované týmto kódovaným op. Takýto proces extrapolačného kódovania môže prebiehať po riadkoch (jednorozmerný), alebo po oblastiach (dvojrozmerný, trojrozmerný). Jednotlivé riadky obrazu sa môžu kódovať nezávisle a tak pomocou ich paralelného spracovania sa podstatne zvyšuje rýchlosť extrapolačného kódovania. Rôzne modifikácie extrapolačného kódovania možno navrhnúť na základe analogického postupu návrhu jednotlivých modifikácií interpolačného kódovania. Vo všeobecnosti extrapolačné kódovanie dosahuje menšiu účinnosť ako interpolačné kódovanie, ale má jednoduchšiu technickú realizáciu.

45

Page 49: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

7. KÓDOVANIE OBRAZU S POUŽITÍM JEHO HIERARCHICKÝCH REPREZENTÁCIÍ Hierarchické reprezentácie (pyramídová, subpásmová, waveletová) obrazu umožňujú jeho nezávislé alebo závislé kódovanie v jednotlivých úrovniach tejto reprezentácie [1,3,6]. Bloková schéma systému tohto kódovania aj dekódovania obrazu je na obr.7.1 a pozostáva z blokov analýzy, kodekov a syntézy.

Systém

analýzy

K O D E K Y

Systém

syntézy

Obr.7.1. Systém kódovania a dekódovania obrazu s použitím jeho hierarchických reprezentácií. Návrh a optimalizácia celého systému pozostáva z návrhu a optimalizácie jednotlivých blokov. Efektívnosť hierarchickej reprezentácie obrazu na výstupe systému analýzy vyjadrujeme ziskom, ktorý formálne sa vypočíta rovnako ako zisk (rov.4.3) pre diskrétne ortogonálne transformácie obrazu. Rozdiel je iba v tom, že v menovateli tejto rovnice je geometrický priemer disperzií subobrazov na výstupe jednotlivých kanálov systému analýzy, resp. úrovní hierarchickej reprezentácie vstupného obrazu. Tento zisk, tak ako v iných kódovacích systémoch, ovplyvňuje veľkosť kompresie údajov uvažovaného systému kódovania obrazu oproti referenčnému systému PCM. Z tohto dôvodu sa systém analýzy a syntézy navrhuje nie len vzhľadom na perfektnú rekonštrukciu obrazu, ale aj na maximálny zisk dosahovaný jeho hierarchickou reprezentáciou na výstupe systému analýzy. Dôležitou súčasťou procesu optimalizácie systému kódovania a dekódovania obrazu na obr.7.1 je aj určenie rozloženia celkového počtu bitov do jednotlivých kanálov. Výpočet počtu bitov v týchto kanáloch možno vykonať pomocou opäť formálne zhodnej rov.(4.1) pre transformačný kódovací systém s analogickým významom príslušných veličín a s už vysvetleným významom disperzií subobrazov. Pretože disperzie (energie) subobrazov na vyšších úrovniach hierarchickej reprezentácie sú väčšie, potom z tejto rov.(4.1) vyplýva, že aj počet bitov im zodpovedajúcich kodekov je väčší. Tento exaktne vypočítaný počet bitov v jednotlivých kanáloch možno tiež

46

Page 50: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

ovplyvňovať pomocou vhodných váhovacích činiteľov, ktoré zohľadňujú citlivosť ľudského zraku v príslušných frekvenčných pásmach. Najviac citlivý je náš zrakový orgán v pásme nízkych a stredných frekvencií obrazu, ale je menej citlivý v pásme jeho vysokých frekvencií. Z tohto vyplýva, že počet bitov kodekov pre subobrazy na vyšších úrovniach hierarchickej reprezentácie sa takto môže korigovať smerom k väčším počtom a pre subobrazy na nižších úrovniach smerom k menším až nulovým počtom bitov. Pritom si treba uvedomiť, že príspevok väčšieho počtu bitov k celkovému priemernému počtu bitov na op je aj naďalej malý, lebo subobrazy kódované kodekmi s týmto väčším počtom bitov majú malé priestorové rozlíšenie (raster). Na druhej strane aj príspevky k tomuto priemernému počtu bitov od kodekov pre subobrazy s veľkým rastrom sú malé, lebo ich počty bitov sú blízke nule. Všeobecne dosahovaná bitová rýchlosť vyplývajúca z tohto priemerného počtu bitov bude veľmi nízka. Vo všeobecnosti kodeky realizujú niektoré klasické metódy kódovania obrazu ako sú PCM, predikčné, transformačné, hybridné, interpolačné alebo extrapolačné atď. Výber týchto metód závisí od štatistických charakteristík subobrazov na výstupe jednotlivých kanálov. Subobraz s nízkofrekvenčným spektrom na najvyššej úrovni hierarchickej reprezentácie si ponecháva koreláciu, preto je výhodné ho kódovať napr. pomocou predikčných metód. Naopak subobrazy s vysokofrekvenčným spektrom na nižších úrovniach tejto reprezentácie sa môžu jednoducho kódovať pomocou PCM. Pritom rozdelenie pravdepodobnosti hodnôt op nízkofrekvenčného subobrazu možno dobre modelovať s Gaussovým a vysokofrekvenčných subobrazov s Laplaceovým rozdelením pravdepodobnosti. Iné modifikácie kodekov [2,4,7] využívajú za účelom zvýšenia účinnosti ich kódovania aj existujúcu koreláciu medzi jednotlivými subobrazmi na rôznych úrovniach hierarchickej reprezentácie. Vtedy sa subobrazy v jednotlivých kanáloch nekódujú nezávisle, ale závisle jeden od iných vhodne vybraných a už kódovaných subobrazov. Vo všeobecnosti svojou účinnosťou sú metódy kódovania obrazu s použitím hierarchických reprezentácií porovnateľné s transformačnými metódami. Na rozdiel od transformačných metód však nespôsobujú blokové rušenie (efekt), čo je ich veľkou výhodou, lebo po dekódovaní obrazy majú lepšiu subjektívnu kvalitu. Tak ako sme rozoznávali vnútrosnímkové a medzisnímkové modifikácie klasických metód kódovania obrazu, tak aj kódovanie obrazu s použitím jeho hierarchických reprezentácií môže byť realizované v týchto modifikáciach [5,8]. Zatiaľčo vnútrosnímkové modifikácie týchto metód využívajú len priestorovú koreláciu jednotlivých subobrazov, tak medzisnímkové modifikácie využívajú aj ich časovú koreláciu. Pritom medzisnímkové modifikácie týchto metód, tak ako medzisnímkové hybridné metódy kódovania obrazu (kap.5.2) môžu byť realizované v dvoch základných zapojeniach. V prvom zapojení sa najprv získa hierarchická reprezentácia obrazu (videa) a následne jednotlivé subobrazy (subvidea) sa kódujú s klasickými medzisnímkovými metódami. Naopak

47

Page 51: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

v druhom zapojení najprv sa vykoná medzisnímková predikcia najčastejšie s pohybovou kompenzáciou a potom chybový obraz (video) sa kóduje metódami s jeho hierarchickými reprezentáciami. Najmä druhé zapojenie môže byť lepšou náhradou medzisníkového hybridného kódovania obrazu s obdobným zapojením. Veľkou výhodou kódovania obrazu s použitím jeho hierarchických reprezentácií je, že na jednotlivých úrovniach týchto reprezentácií máme subobrazy s klesajúcim priestorovým rozlíšením, ak v nich postupujeme od najnižšej k najvyššej úrovni. Z tohto vyplýva možnosť postupného (progresívneho) prenosu obrazu od najvyššej k najnižšej úrovni v závislosti od požadovanej kvality príjemcom obrazu. Hierarchické reprezentácie obrazu v týchto metódach umožňujú veľmi ľahko realizovať jeho kódovanie s priestorovým škálovaním. Tieto vlastnosti metód kódovania obrazu s použitím jeho hierarchických reprezentácií umožňujú ich aplikovať v multimediálnych videokomunikáciach v prostredí heterogénnych telekomunikačných sieti. 8. KÓDOVANIE OBRAZU POMOCOU VEKTOROVÉHO KVANTOVANIA Náhradou skalárneho kvantovania vo všetkých klasických metódach kódovania obrazu pomocou vektorového kvantovania možno zvýšiť ich účinnosť kódovania. Vektorové kvantovanie obrazu [1,2,3] možno považovať za vektorové zovšeobecnenie PCM, ktoré využíva koreláciu medzi op. Predikčné kódovanie obrazu s vektorovým kvantovaním [4] výhodnejšie používa vektorovú predikciu diskrétneho obrazu, ktorej výsledkom je postupnosť chybových vektorov. Bloková schéma PKS s vektorovým kvantizátorom aj prediktorom je na obr.8.1. Na vstup sa privádza postupnosť náhodných vektorov nX s rozmerom v, pričom zložky týchto vektorov sú za sebou

nasledujúce op. Tieto sú predpovedané predikčnými vektormi nX z výstupu vektorového prediktora a s nimi sa vedú do vektorovej odčítačky. Z jej výstupu dostávame postupnosť chybových vektorov ne , ktoré sa kvantujú vo vektorovom kvantizátore a kódujú v kodéri. Z výstupu kodéra postupujú kódové slová ne& do adresového registra, pričom tento určí adresu kvantizačného vektora

ib v pamäti ROM, ktorým bol kvantovaný vektor ne . Potom ib z výstupu ROM

spolu s nX� sa privádzajú do vektorovej sčítačky, aby sa získal obnovený vektor

nX~

. Tento sa vedie do vektorového posuvného registra, kde sa oneskorí o L/v (jednorozmerná optimálna vektorová vnútrosnímková predikcia vo vertikálnom smere prvého rádu), pričom uvažovaný rozmer diskrétneho obrazu je LxL.

48

Page 52: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Maticovým násobením optimálnej predikčnej matice P10 s oneskoreným vektorom

vLn

X~

− dostávame predikčný vektor nX .

Obr.8.1. Bloková schéma PKS s vektorovým kvantizátorom a prediktorom.

Analogické modifikácie vnútrosnímkového alebo medzisnímkovaného predikčného kódovania obrazu sa môžu realizovať s vektorovým kvantovaním aj predikciou [4,5]. Adaptívne modifikácie prispôsobujú svoje parametre lokálnym štatistickým charakteristikám obrazu. Adaptívne vektorové kvantizátory [6] používajú viacej reprodukčných abecied, pričom každá z nich je prispôsobená určitým štatistickým charakteristikám. Podobne adaptívne vektorové prediktory majú optimálne predikčné matice pre tieto charakteristiky. PKS s adaptívnym vektorovým kvantizátorom aj prediktorom dosahujú vysokú kompresiu údajov, ale narastá zložitosť ich technickej realizácie. Náhradou bloku skalárnych kvantizátorov v TKS vektorovým kvantizátorom, ako to vidno z obr.8.2, dostaneme takú modifikáciu TKS, v ktorom sa vykonáva vektorové kvantovanie relevantných spektrálnych koeficientov nezávisle od ich sekvencie. Z výstupu procesora jednorozmernej diskrétnej ortogonálnej transformácie dostávame priamo vektory Y spektrálnych koeficientov, ale pre mnohorozmerné diskrétne ortogonálne transformácie sa vektory získavajú preusporiadaním blokov relevantných spektrálnych koeficientov. Postupnosť týchto vektorov Y sa vedie do vektorového kvantizátora, kde sa kvantujú a potom kódujú v kodéri [7,8]. Diskrétnou ortogonálnou transformáciou sa obraz dekoreluje vo vnútri blokov, ale zachováva sa medzibloková korelácia. Z toho vyplýva možnosť vektorového kvantovania spektrálnych koeficientov závisle od ich sekvencie. Každé podpole spektrálnych koeficientov s rovnakou sekvenciou sa segmentuje

49

Page 53: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Obr.8.2. Bloková shéma TKS s vektorovým kvantovaním spektrálnych

koeficientov nezávislým od ich sekvencie. v smere najväčšej korelácie do postupnosti vektorov, ktoré sa potom kvantujú v príslušnom vektorovom kvantizátore [1]. Bloková schéma TKS s vektorovým kvantovaním spektrálnych koeficientov závislým od ich sekvencie je na obr.8.3. Po transformácii obrazu v procesore diskrétnej ortogonálnej transformácie sa pomocou segmentátorov zmenia podpolia spektrálnych koeficientov s rovnakou sekvenciou na postupnosť vektorov, ktoré sa vedú do príslušných vektorových kvantizátorov cez oddeľovacie pamäte a po ich kvantovaní sa kódujú v kodéri. Možno vytvoriť analogické modifikácie nemenného aj adaptívneho vnútrosnímkového a medzisnímkového transformačného kódovania obrazu s vektorovým kvantovaním, ktoré dosahujú vysokú kompresiu údajov, ale majú veľmi zložitú technickú realizáciu [9].

Obr.8.3. Blokvá schéma TKS s vektorovým kvantovaním spektrálnych

koeficientov závislým od ich sekvencie. V hybridných kódovacích systémoch možno aplikovať vektorové kvantovanie pri predikčnom kódovaní spektrálnych koeficientov [10,11]. Potom vektorové kvantovanie zvyšuje účinnosť predikčného kódovania nielen v obrazovom ale aj v transformovanom priestore a takto možno dosiahnuť väčšiu kompresiu údajov v hybridných kódovacích systémoch. Základná

50

Page 54: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

bloková schéma PKS s vektorovým kvantizátorom (obr.8.1), ako aj jeho rôzne modifikácie, sú analogické v obrazovom aj transformovanom priestore. Tieto modifikácie vyplývajú zo štatistických charakteristík podpolí spektrálnych koeficientov a môžu byť vnútrosnímkové alebo medzisnímkové. Pri interpolačnom alebo extrapolačnom kódovani obrazu možno použiť pre kódovanie vybranej podskupiny op niektorú z predtým uvedených metód kódovania na báze vektorového kvantovania [12]. Podobne ako pri transformačnom kódovaní obrazu s vektorovým kvantovaním je tomu pri pyramídovom, subpásmovom alebo waveletovom kódovaní obrazu s vektorovým kvantovaním [13 až 16] . 9. OBRYSOVÉ KÓDOVANIE OBRAZU Praktické skúsenosti dokazujú, že ľudský zrak je veľmi citlivý na zmeny obrysov v obraze. Z toho dôvodu je výhodné obrysové kódovanie [1 až 4], pri ktorom sa oddelí z obrazu vysokofrekvenčná časť reprezentujúca obrysy (hrany), ktorá sa kóduje samostatne. Túto časť obrazu možno kódovať metódami kódovania dvojúrovňových obrazov a zvyšnú ( nízkofrekvenčnú) časť kódujeme napr. pomocou transformačných metód. Týmto rozdelením obrazu na dve časti možno lepšie zakódovať obrysy ale aj nízkofrekvenčnú časť, lebo jednotlivé kodéry sa môžu svojimi parametrami lepšie prispôsobiť k charakteristikám samostatných častí obrazu. Bloková schéma obrysového kódovacieho a dekódovacieho systému je na obr.9.1.

Obr.9.1. Bloková schéma obrysového kódovacieho a dekódovacieho systému.

51

Page 55: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Pomocou detektora obrysov sa určia body obrazu, v ktorých gradient jasovej funkcie x(i,j) má veľký modul. Tento modul možno vypočítať z derivácií funkcie x(i,j) v ľubovoľných dvoch ortogonálnych smeroch alebo približne z rovnice 22 )j,1i(x)1j,i(x)1j,1i(x)j,i(x()j,i(x +−++++−≈Δ (9.1) pričom sa vychádza z krížového rozloženia bodov obrazu. Ak tieto štyri body sa nachádzajú v oblasti obrazu, kde je rovnomerné rozloženie jasu, tak modul gradientu sa rovná nule. Keď medzi riadkami i a i+1, alebo stĺpcami j a j+1, je značná zmena jasu, vtedy modul gradientu nadobúda veľké hodnoty a bod so súradnicami (i,j) leží na obryse. Potom obrysy, t.j. spojnice bodov s rovnakými gradientami možno kódovať pomocou kódovania súradníc ich začiatočných bodov ako aj modulov a smerov gradientov. Jednoduché kódovanie obrysov je pomocou reťazového kódu [5,6] vytvoreného postupnosťou čísel jednotlivých možných smerov pri prechode od jedného bodu obrysu k druhému. Možné smery môžu byť zo skupiny štyroch alebo ôsmich smerov ako to vidno z obr.9.2. Pre obrys definovaný na ortogonálnej mriežke a pre osem smerovú skupinu je tento zreťazený kód na obr.9.3.

Obr.9.2. Skupiny možných smerov zreťazeného kódu.

obrys zreťazený kód

Obr.9.3. Zreťazený kód obrysu definovaného na ortogonálnej mriežke.

0(00)

1(01)

2(10)

3(11)

0(000)

7(111)

6(110)

5(101)

4(100)

3(011)

2(010)

1(001)

6

6 6

6

5

3

0

5

3

7

2

2

2

1

1

52

Page 56: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Za účelom dosiahnutia väčšej efektívnosti kódovania obrysov po vytvorení zreťazeného kódu nasleduje jeho aritmetické kódovanie. Ak namiesto čísel možných smerov v zreťazenom kóde obrysu použijeme diferencie medzi týmito nasledujúcimi číslami a potom aritmetické kódovanie táto efektívnosť sa ďalej zväčšuje. Po spätnom dekódovaní obrysov v dekódovacom systéme sa ich obrazový signál pripočíta k dekódovanej nízkofrekvenčnej zložke a tak dochádza k zvýrazňovaniu obrysov vo výslednom dekódovanom obraze. Obrysové kódovanie obrazu dosahuje vysokú účinnosť kódovania, ale jeho technická realizácia je veľmi zložitá. 10. MODELOVÉ KÓDOVANIE OBRAZU Väčšina metód kódovania obrazu dosahuje kompresiu údajov na základe redukcie jeho vnútrosnímkovej alebo medzisnímkovej korelácie. Vyššiu účinnosť kódovania obrazu možno dosiahnúť pomocou modelovania jeho objektov [1,2]. To znamená, že relevantné objekty v obraze ako napr. ľudská hlava sú najprv identifikované a následne analyzované ako to vidno z obr.10.1. Pri tejto analýze sa využívajú všeobecné alebo špecifické modely objektov. Najčastejšie používaným špecifickým modelom pre ľudskú hlavu je trojrozmerný priečkový model známy z počítačovej grafiky. Naopak všeobecné modelové techniky umožňujú na základe polygonálnej (trojuholníkovej, štvorcovej) siete modelovať ľubovoľný objekt nezávislé od jeho tvaru.

Kodér

Parametre

Model

Analýza

Dekodér

Model

Syntéza

Obr.10.1. Bloková schéma modelového kódovania a dekódovania obrazu.

53

Page 57: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Výsledkom tejto analýzy sú parametre, ktoré sú vysielané do dekodéra, kde pomocou nich a tých istých modelov ako v kodéri sa vykoná syntéza objektov obrazu. Z tohto vyplýva, že výsledná bitová rýchlosť bude veľmi malá, lebo vysielané sú iba parametre objektov (modelov) a nie celý obraz po obrazových prvkoch. Pritom niektoré parametre ako napr. veľkosti, tvary a pozície objektov v dynamickom obraze sú vysielané iba v prvej snímke. Zároveň v tejto snímke sú kódované a vysielané textúry týchto objektov za účelom zlepšenia subjektívnej kvality dekódovaných objektov, pričom pre kódovanie týchto textúr možno použiť klasické metódy kódovania. Potom v nasledujúcich snímkach sa vysielajú len parametre o globálnom pohybe týchto objektov včítane parametrov ich lokálnych zmien, ak sú v objekte, ako napr. zmien očí, úst, nosa, výrazu pre objekt ľudskej hlavy. Odolnosť voči kanálovým poruchám modelového kódovania bude veľmi vysoká z dôvodu využívania neskreslenej informácie o modeloch v procese dekódovania. Za predpokladu použitia všeobecného modelu pre ľubovoľný dopredu neznámy objekt v kodéri aj dekodéri, modelové kódovanie obrazu je objektovo orientované [3]. Naopak modelové kódovanie obrazu [4], ktoré používa špecifické modely je založené na poznaní objektov, resp. dopredu známych informáciach o nich. Vtedy pre viacej objektov v obraze sa najprv rozpoznáva objekt a následne sa zatriedi do príslušnej triedy so známym špecifickým modelom. Ak v obraze je iba jeden relevantný objekt, potom operácia rozpoznávania nie je potrebná. Pritom vysielané parametre špecifických modelov sú určené pre ich definičné body alebo semantické časti. 11. ŠTATISTICKÉ A INÉ METÓDY KÓDOVANIA OBRAZU Štatistické (entropické) kódovanie obrazu [1,2,3] predpokladá nelineárne rozdelenie pravdepodobnosti hodnôt spracovávaných op, pričom dosahovaný priemerný počet bitov na op je blízky entrópii týchto spracovávaných op. Z tohto vyplýva nutnosť číslicového spracovania obrazu, aby jeho výsledkom bolo pole spracovávaných op, ktorých hustota rozdelenia pravdepodobnosti má ostré lokálne maximum. Vtedy je entrópia minimálna a štatistickým kódovaním možno dosiahnuť nízku bitovú rýchlosť bez vzniku prídavného skreslenia. Medzi vhodné metódy číslicového spracovania obrazu, ktoré umožňujú znížiť entrópiu, patria napr. predikčné, transformačné, subpásmové metódy. Štatistické kódovanie obrazu sa najčastejšie vykonáva pomocou Huffmanovho alebo Shannonovho-Fanovho kódu a aritmetického kódovania. Nemenné štatistické kódovanie používa rovnaké kódové slová a možno ho navrhnúť pre celý spracovaný obraz alebo jeho bloky op s konštantným histogramom. Pre reálne obrazy sa tento histogram môže meniť v každom bloku a preto sa menia aj kódové slová. Adaptívne štatistické kódovanie predpokladá štatistickú analýzu každého bloku op, ktorej výsledkom je histogram, na základe ktorého sa určia kódové slová (štruktúra kódu). Potom je nutné pre každý blok

54

Page 58: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

vysielať okrem kódovaných op aj informáciu o štruktúre kódu. Aby sa redukoval veľký počet možných štruktúr kódu, je výhodnejšie klasifikovať jednotlivé bloky do jednej z konečného počtu tried. Týmto triedam potom zodpovedajú určité štruktúry kódu, ktorých počet nie je veľký. Prídavná informácia o týchto triedach sa musí vysielať s kódovanými op, aby bolo možné ich jednoznačne dekódovať. Táto informácia je tým menšia, čím menší počet tried sa používa a čím väčšie sú rozmery bloku. Štatistické kódovanie sa používa spolu s inými metódami kódovania obrazu a umožňuje znížiť priemerný počet bitov na op o 1 bit pri zachovaní pomeru S/Š, resp. zvýšiť tento pomer o 6 dB pri zachovaní priemerného počtu bitov na op. Nevýhodou štatistického kódovania je, že sa mení bitová rýchlosť a preto je potrebné na výstup kodéra zapojiť vyrovnávaciu pamäť. Kódovanie mnohoúrovňového obrazu možno vykonať aj pomocou metód kódovania dvojúrovňového (binárneho) obrazu [4,5,6] ich aplikáciou v niekoľkých bitových rovinách mnohoúrovňového obrazu. Autoregresívne kódovanie obrazu [7] používa autoregresné modely, na základe ktorých sa obraz popisuje reflexnými koeficientami a tieto sa potom kódujú. Po ich dekódovaní možno pomocou nich vykonať syntézu obrazu. Fraktálové kódovanie obrazu [8] hľadá vhodnú kombináciu transformácií [9], ktorá najlepšie reprezentuje vstupný obraz pomocou fraktálov. Jeho hlavnou výhodou je možnosť dekódovania obrazu s ľubovoľným priestorovým rozlíšením. Na druhej strane požaduje veľký počet matemetických operácií pri hľadaní vhodných transformácií čo spôsobuje jeho malé použitie pri kódovaní obrazu v reálnom čase.

55

Page 59: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

12. ZÁVER Výskum v oblasti číslicového kódovania obrazu začal v 50-tich rokoch a bol orientovaný na metódy PCM, DPCM a štatistické kódovanie. Pokračoval v 60-tich rokoch transformačnými a obrysovými metódami kódovania. Do roku 1968 boli realizované základné kódovacie systémy týchto metód kódovania obrazu, pričom sa nevenovala veľká pozornosť ich účinnosti a skresleniu. Počas ďalších rokov boli tieto kódovacie systémy zdokonalené na základe optimalizácie transformačných procesorov, skalárnych kvantizátorov aj prediktorov, pričom boli navrhnuté a optimalizované aj mnohorozmerné skalárne prediktory. V nasledujúcich rokoch sa výskum sústreďuje na adaptívne medzisnímkové predikčné a transformačné kódovanie ako aj interpolačné kódovanie obrazu. Súčasne v roku 1974 bolo rozpracované hybridné kódovanie obrazu a od tohto roku spolu s výskumom adaptívnych, predikčných aj transformačných metód sa vykonával aj výskum adaptívnych hybridných metód kódovania. V prvej polovici 80-tich rokoch začal intenzívny výskum vektorového kvantovania obrazu, pričom aj naďalej prebiehal výskum predchádzajúcich adaptívnych metód najmä s využitím pohybovej kompenzácie. V druhej polovici 80-tich rokoch výsledkom výskumu sú rôzne modifikácie nemenných aj adaptívnych vektorových kvantizátorov a ich aplikácie, resp. náhrada skalárnych kvantizátorov v už navrhnutých kódovacích systémoch. Zároveň v 80-tich rokoch sa rozvíja kódovanie obrazu s použitím jeho hierarchických reprezentácií (pyramídová, subpásmová, waveletová). Koncom 80-tich rokov sa začal intenzívny výskum modelového a začiatkom 90-tich rokov aj fraktálového kódovania obrazu. V priebehu 90-tich rokov sa vyvíjajú nové účinnejšie modifikácie metód kódovania obrazu z predchádzajúcej dekády, ale zároveň dochádza k mnohonásobnej kombinácií stále väčšieho počtu jednotlivých algoritmov. V týchto ako aj posledných rokoch rozvíjajú sa metódy objektového (regiónového) a syntaxového kódovania obrazu, ktoré aplikujú už známe metódy segmentácie obrazu, modelovania ojektov, obrysového kódovania, kódovania textúr na jednotlivé objekty (regióny), ale aj menšie časti vizuálnej scény. Priebežne s vývojom metód kódovania obrazu v 80-tich rokoch sa začal proces štandardizácie obrazových (video) kodekov. Pretože najviac rozpracované v tom čase boli predikčné, transformačné a hybridné metódy kódovania obrazu, tie sa stali základom v tomto procese. Z nich najvhodnejšie je transformačné kódovanie, pretože dosahuje najväčšiu účinnosť kódovania a je najlepšie prispôsobené ľudskému zraku. Naopak technická realizácia transformačných kódovacích systémov je zložitá vplyvom používania transformačných procesorov s veľkými rozmermi blokov a až rýchly vývoj výroby transformačných procesorov VLSI umožnil ich praktické využitie. Hybridné kódovacie systémy majú veľké praktické využitie, pretože používajú transformačné procesory s malými rozmermi bloku a jednoduché systémy

56

Page 60: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

DPCM, pričom ich účinnosť je blízka účinnosti transformačných kódovacích systémov. Štatistické, interpolačné a extrapolačné kódovanie s predchádzajúcimi metódami umožňuje ďalej zvýšiť ich účinnosť kódovania obrazu. Štandardný obrazový kodek JPEG je založený na vnútrosnímkovom transformačnom kódovaní s DCT (8x8) a entropickom kódovaní. Naopak všetky ostatné štandardné videokodeky H.261, H.263, MPEG-1, MPEG-2, MPEG-4 sú založené na medzisnímkovom hybridnom kódovaní s DCT (8x8) a pohybovou kompenzáciou, ale s využívaním aj štatistického a interpolačného kódovania. Pritom štandardné videokodeky vyšších rádov H.263+, MPEG-2, MPEG-4 umožňujúce škálové kódovanie môžu používať aj hierarchické reprezentácie obrazu. MPEG-4 s obsahovým (objektovým) kódovaním vizuálnej scény využíva aj obrysové a modelové kódovanie obrazu. Aj keď všetky štandardné obrazové (video) kodeky používajú iba skalárne kvantovanie (lineárne alebo nelineárne), vektorové kvantovanie dáva možnosť ďalšieho zvyšovania ich účinnosti kódovania, ale za cenu narastajúcej zložitosti ich realizácie. Výskum kódovania obrazu nemožno pokladať za skončený, pričom sa zameriava nielen na hľadanie nových účinnejších metód, ale aj na zlepšenie už známych metód kódovania a vytváranie ich viacnásobných kombinácií. Bitovú rýchlosť kodekov možno ovplyvňovať ako metódami kódovania tak aj parametrami obrazu, vyplývajúcimi z požadovanej aplikácie. Napr. pre programovú televíziu sa vyžaduje vyššia priestorová aj časová rozlišovacia schopnosť ako pre videokonferencie, resp. videotelefóniu. Potom bitová rýchlosť pri kódovaní obrazu programovej televízie pomocou skalárnej PCM je 100 Mbit/s, ktorú možno znížiť pomocou efektívnych metód kódovania vo videokodekoch MPEG-2 rádove na desiatky až jednotky Mbit/s. Videotelefónne kodeky prvej generácie mali bitovú rýchlosť 2 Mbit/s, ktorú výkonnými úspornými metódami kódovania vo videokodekoch H.261 možno znížiť na 64 kbit/s, alebo v H.263 až na 8kbit/s. Možno predpokladať, že nasledovný výskum kódovania obrazu bude vyvíjať také výkonné efektívne metódy kódovania, ktoré umožnia kódovať obrazy s vysokými parametrami, ako napr. pre programovú televíziu s nízkymi bitovými rýchlosťami. Praktické využitie tak výkonných metód kódovania obrazu je predovšetkým ekonomickým problémom, pričom prudký rozvoj technológie integrovaných obvodov VLSI umožní znížiť ceny týchto kodekov.

57

Page 61: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

LITERATÚRA 1. ÚVOD [1] Pratt, W.K.: Digital Image Processing. John Willey and Sons, New York,1978. [2] Ekstrom, M.P.: Digital Image Processing Techniques. Academic Press, New York, 1984. [3] Jain, A.K.: Fundamentals of Digital Image Processing. Prentice Haal, New Jersey, 1989. [4] Jaroslavský, L. - Bajla, I.: Metódy a systémy číslicového spracovania obrazov. Alfa, Bratislava 1989. [5] Pratt, W.K. (Ed.): Image Transmission Techniques. Academic Press, NewYork, 1979. [6] Ptáček, M.: Digitální zpracování a přenos obrazové informace. NADAS, Praha 1983. [7] Netravali, A.N. - Haskell, B.G.: Digital Pictures (Representation and Compression). Plenum Press, New York, 1988. 2. PREHĽAD METÓD KÓDOVANIA OBRAZU [1] Netravali, A.N. - Limb, J.O.: Picture Coding: A Review. Proc. IEEE, Vol.68, No.3, 1980, p.366 - 407. [2] Jain,A.K.:Image Data Compression:A Review. Proc.IEEE, Vol.69, No.3, 1981, p.349-391. [3] Chmúrny, J. - Mihalík, J.: Metódy kódovania obrazov. Elektrotechnická ročenka. Alfa, Bratislava, 1985, s.315 - 330. [4] Musmann, H.G. - Pirsch, P. - Grallert, H.J.: Advances in Picture Coding. Proc. IEEE, Vol.73, No.4, 1985, p.523 - 548. [5] Habibi, A.: Survey of Adaptive Image Coding Techniques. IEEE Trans. Commun., Vol.COM - 25, No.11, 1977, p.1275 - 1284. [6] Gersho,A.-Gray,R.M.: Vector Quantization and Signal Compression. Kluwer Academic Publishers, Dordrecht, Notherlands, 1992. [7] Huang, T.S. - Tretiak, O.J. - Prasada, B. - Yamaguchi, Y.: Desing Considerations in PCM Transmission of Low - Resolution Monochrome Still Pictures. Proc.IEEE, Vol.55, No.3, 1967, p.331 - 335. [8] O`Neal, J. B.: Predictive Quantizing Systems ( Differential Pulse Code Modulation ) for the Transmission of Television Signals.Bell Syst.Tech. J.,Vol.45, No.3, 1966, p.689- 721. [9] Chmúrny,J.- Mihalík,J.: Predikčné metódy spracovania obrazových signálov. Elektrotech. časopis, 35, č.2, 1984, s.151 - 162. [10] Wintz, P.A.: Transform Picture Coding. Proc.IEEE, Vol.60, No.7, 1972, p.809 - 823. [11] Chmúrny, J. - Mihalík, J.: Transformačné metódy kódovania obrazov. Elektrotech. časopis, 35, č.5, 1984, s.400 - 408. [12] Habibi, A.: Hybrid Coding of Pictorial Data. IEEE Trans. Commun.,Vol.COM-22, No. 5, 1974, p.614 - 624. [13] Chmúrny, J. - Mihalík, J.: Hybridné kódovanie obrazu. Slab. Obzor, 44, č.5, 1983, s.253 - 255. [14] Pavlidis, T.: Optimal Piecewise Approximation of Funkctions of One and Two Dimensional Variables. IEEE Trans. Comput., Vol.C - 24, No.1, 1975, p.98 - 102. [15] Chen, C.H.: Laplacian Pyramid Image Data Compression. Proc. IEEE Intl. Conf.Acoust., Speech, and Signal Proc., 1987, p.737 - 739. [16] Woods, J.W. - O`Neil, S.D.: Subband Coding of Images. IEEE Trans. Acoust., Speech, and Signal Proc., Vol.ASSP - 34, No.5, 1986, p.1278 - 1288. [17] Davis,G.- Nostratinia,A.: Wavelet-based Image Coding: An Overview. Applied and Computational Control, Signals, and Circuits, Vol.1, No.1, 1998.

58

Page 62: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

[18] Jacquina,E.: Image Coding Based on a Fractal Theory of Iterated Contractive Image Transformation. IEEE Trans. on Signal Processing, Vol.40, No.6, 1992. [19] Mihalík, J. - Kuba, I. - Labovský, R.: Vektorové kvantovanie obrazu. Zborník Vedeckej konferencie s medzinárodnou účasťou FEI TU Košice, 1994. s. 215-220. [20] Hang, H. M. - Woods, J. W.: Predictive Vector Quantization of Images. IEEE Trans. Commun., Vol.COM - 33, No.11, 1985, p.1208 - 1219. [21] Mihalík,J.:Multistage Interpolative Vector Quantization of Image. Proc.4th Intl.Workshop on Systems, Signals and Image Processing, Poznaň, Poland, 1997, p.199-202. [22] King,R. A.- Nasrabadi,N. M.: Image Coding Using Vector Quantization in the Transform Domain. Pattern Recognition Letters, Vol.1, No.5,6, 1983, p.323 - 329. [23] Westerink,P.H.-Boekee,D.E.-Biemond,J.-Woods,J.W.: Subband Coding of Images Using Vector Quantization. IEEE Trans. Commun., Vol.COM - 56, No.6, 1988, p.713 - 719. [24] Chmúrny, J - Mihalík, J.: Gibridnoje kodirovanie izobraženia s primeneniem vektornoj differenciaľnej impuľsnej kodovej moduljacii. Izv.VUZ Radioelektronika, Tom 30, No.7, 1987, s.53 - 55. (Hybrid Coding of an Image Using Vector Differential Pulse Code Modulation. Radioelectron. and Commun. Syst.(USA), Vol.30, No.7, 1987, p.53-55.) [25] Elnahas,S.E.-Dunham,J.G.:Entropy Coding for Low-Bit-Rate Visual Telecommunications. IEEE J. on Selec. Areas in Commun., Vol.SAC - 5, No.7, 1987, p.1175 - 1183. [26] Howard,G.P.- Vitter,S.J.: Analysis of Arithmetic Coding for Data Compression. Information and Management, Vol.28, No.6, 1992, p.749-763. [27] Graham, D.N.: Image Transmission by Two-Dimensional Contour Coding. Proc. IEEE, Vol.55, No.3, 1967, p.336 - 346. [28] Golomb, S.W.: Run Length Encodings. IEEE Trans. Inform. Theory, Vol.IT - 12, No.7, 1966, p.399 - 401. [29] Morrin, T.H.: A Black - White Representation of a Gray-Scale Picture. IEEE Trans. Comput., Vol.C - 23, No.2, 1974. [30] Cheng-Chang Lu, Dunham, J. G.: Highly Efficient Coding Schemes for Contour Lines Based on Chain Code Representations. IEEE Trans. on Com. Vol. 39, No. 10, 1991 p. 1511-1514. [31] Gilge,M.-et al.: Coding of arbitrarily shaped image segments based on a generalized orthogonal transform. Signal Processing: Image Communication, Vol.1, No.1. 1989, p.153-180. [32] Pearson,D.E.: Developments in Model-Based Video Coding. Proc. IEEE, Vol.83, No.6, 1995, p.892-906. [33] Jain, A.K. - Ranganath, S.: Image Coding by Autoregressive Synthesis. Proc. IEEE Intl. Conf. Acoust., Speech, and Signal Proc., 1980, p.770 - 772. [34] Jiang,J.: Image Compression with Neural Networks-A Survey. Signal Processing: Image Communication, Vol.14, 1999, p.737-760. [35] Mihalík,J. – Labovský,R.: Neural Network Approaches for Predictive Vector Quantization of an Image. Neural Network World, 1/01, 2001, p.33-48. [36] Zhang,J.-Yan,Y.-Lades,M.: Face recognition: eigenface, elastic matching, and neural nets. Proc. IEEE, Vol.85, No.9, 1997, p.1423-1435. [37] Mihalík,J.: Neural Network Clustering Vector Quantizer Design. Neural Network World, Vol.2, No.5, 1993, p.197-207. 3. PREDIKČNÉ KÓDOVANIE OBRAZU [1] Poehler, P. L. - Choi, J.: Linear Predictive Coding of Imagery for Data Compression Applications. Proc.IEEE Intl.Conf.Acoust.,Speech, and Signal Proc.,1983, p.1240 - 1243. [2] Daut, D. G.-Fries, R. W. - Modestino, J. W.: Two - Dimensional DPCM Image Coding

59

Page 63: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Based on an Assumed Stohastic Image Model. IEEE Trans. Commun., Vol. COM - 29, No.9, 1981, p.1365 - 1374. [3] Sawada, K. - Kotera, H.: A 32 Mbit/s Component Separation DPCM Coding System for NTSC Color TV. IEEE Trans. Commun., Vol. COM-26, No.4, 1978, p.458 - 465. [4] Haskell, B. G. et al.: Interframe Coding of 525 - Line, Monochrome Television at 1.5 Mbit/s. IEEE Trans. Commun., Vol. COM - 25, No.11, 1977, p.1339 - 1348. [5] Sharma, D. K. - Netravali, A. N.: Design of Quantizers for DPCM Coding of Picture Signals. IEEE Trans. Commun., Vol.COM - 25, No.11, 1977, p.1267 - 1273. [6] O`Neal, J. B.: Differential Pulse - Code Modulation (PCM) with Entropy Coding. IEEE Trans. Inform. Theory, Vol.IT-22, 1976, p.169 - 174. [7] Arnstein, D. S.: Quantization Error in Predictive Coders. IEEE Trans. Commun., Vol.COM - 23, No.4, 1975, p.423 - 429. [8] Adams, W. C. - Giesler, C. E.: Quantizing Characteristics for Signals Having Laplacian Amplitude Probability Density Function. IEEE Trans. Commun., Vol.COM - 26, No.8, 1978, p.1295 - 1297. [9] Lippmann, R.: Influence of Channel Errors on DPCM Picture Coding. Acta Electron., Vol.19, 1977, p.289 – 294. [10] Daut, D. G. - Modestino, J. W.: Two - Dimensional DPCM Image Transmission over Fading Channels. IEEE Trans. Commun., Vol.COM - 31, No.3, 1983, p.315 - 328. [11] Dukhovich, I. J.: ADPCM System Based on a Composite Image Model. IEEE Trans. Commun., Vol.COM - 31, No.8, 1983, p.1003 - 1017. [12] Caudy, J. C. - Perucca, J. R.: A Differential Codec for Monochrome Television Signals. Radio and Electronic Engineer, Vol.48, No.6, 1978, p.310 - 312. [13] Chmúrny, J. - Mihalík, J.: Jednorozmerný predikčný kódovací systém obrazových signálov. Elektrotech. časopis, 36, č.5, 1985, s.427 - 434. [14] Girod, B.: Adaptive Prediction for DPCM Coding of TV Signals. IEEE Trans. Acoust. Speech, and Signal Proc., Vol.ASSP - 29, No.6, 1981, p.1142 - 1147. [15] Prasada, B. - Netravali, A. - Kobran, A.: Adaptive Companding of Picture Signals in a Predictive Coder.Proc.IEEE Intl.Conf.Acoust.,Speech and Signal Proc.,1978, p.161-164. [16] Ready, P. J. - Spencer, D. J.: Block Adaptive DPCM Transmision of Images. NTC Conf. Record, Vol.2, 1975, p.2210 - 2217. [17] Devarajan, V. - Rao, K. R.: DPCM Coders with Adaptive Prediction for NTSC Composite TV Signals. IEEE Trans. Commun., Vol.COM-28, No.7, 1980, p.1079 -1084. [18] Zschunke, W.: DPCM Picture Coding with Adaptive Prediction. IEEE Trans. Commun., Vol.COM - 25, No.11, 1977, p.1295 - 1302. [19] Janardhanan, E.: Diferential PCM Systems. IEEE.Trans. Commun.Vol. COM - 27, No.1, 1979, p.82 - 93. [20] Maxemchuk, N. F. - Stuller, J. A.: An Adaptive Intraframe DPCM Codec Based Upon Nonstationary Image Model. Bell Syst. Tech. J., Vol.58, No.6, 1979, p.1395 - 1412. [21] Arp, F.: Redundancy and Irrelevancy Reduction of TV-Signals by Interframe DPCM – Coding. EURASIP, 1986, p.817 - 820. [22] Haskell, B. G. et al.: Interframe Coding of Video-Telephone Pictures. Proc. IEEE, Vol.60, 1972, p.792 - 800. [23] Haskell, B. G. - Schmidt, R. L.: A Low Bite - Rate Interframe Coder for Video – Telephone. Bell Syst.Tech. J., Vol.54, No.7., 1975, p.1475 - 1495. [24] Pirsch, P.: Adaptive Intra - Interframe DPCM Coder. Bell Syst. Tech. J., Vol.61, No.5, 1982, p.747 - 764. [25] Mounts, F. W.: A Video Encoding System with Conditional Picture Element Replenishment. Bell Syst. Tech. J., Vol.48, No.6, 1969, p.2545 - 2554.

60

Page 64: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

[26] Limb, J. O. - Pease, R. W.: A Simpl Interframe Coder for Video Telephony. Bell Syst. Tech. J., Vol.50, No.5, 1971, p.1877 - 1888. [27] Netravali, A. N. - Robbins, J. D.: Motion Compensated Television Coding - Part I. Bell Syst. Tech. J., Vol.58, No.2, 1979, p.631 - 670. [28] Netravali, A. N. - Robbins, J. D.: Motion Compensated Television Coding : Some New Results. Bell Syst. Tech. J., Vol.59, No.9, 1980, p.1735 - 1745. [29] Ninomiya, Y. - Ohtsuka, Y.: A Motion Compensated Interframe Coding Scheme for Television Signals. IEEE Trans. Commun., Vol.COM - 32, No.3, 1984, p.328 - 334. [30] Walker, D. R. - Rao, K. R.: New Techniques in Pel Recursive Motion Compensation. IEEE Trans. Commun., Vol.COM - 32, No.10, 1984, p.1128 - 1134. 4. TRANSFORMAČNÉ KÓDOVANIE OBRAZU [1] Habibi, A.. - Wintz.P.A.: Image Coding by Linear Transformation and Bloc Quantization. IEEE Trans. Commun. Tech., Vol.COM-19, No.2, 1971, p.50 - 63. [2] Woods, J.W.-Huang, T.S.: Picture Bandwidth Compression by Linear Transformation and Block Quantization. (Huang,T.S.-Tretiak, O.J. (Eds.): Picture Bandwidth Compression), Gordon and Breach, New York, 1972, p.555 - 573. [3] Clarke, R.J.: Transform Coding of Images. Academic Press, New York, 1985. [4] Soame, T.A.: Bandwidth Compression Using Transform Techniques for Image Transmission Systems. Marconi Review, No.219, 1980, p.228-240. [5] Huang, J. J. Y. - Schultheiss, P. M.: Block Quantization of Correlated Gaussian Random Variables. IEEE Trans. Commun. Syst., Vol.CS – 11, No.9, 1963, p.289 - 296. [6] Segall, A.: Bit Allocation and Encoding for Vector Sources. IEEE Trans. Inform. Theory, Vol.IT – 22, No.3, 1976, p.162 - 169. [7] Hayes, J. F.- Bobilin,R.: Efficient Waveform Encoding. School of Electrical Engineering, Purdne University, Lafayette, Ind., Tech. Rep. TR – EE 69 – 4, 1969. [8] Modestino,J.W.- Daut,D.G.: Block Transform Image Coding in the Presence of Channel Errors. SPIE, Vol.249, Advances in Image Transmission, 1980, p.112-122. [9] Mitchell, O. R. – Tabatabai, A. J.: Channel Error Recovery for Transform Image Coding. IEEE Trans. Commun., Vol.COM – 29, No.12, 1981, p.1754 - 1762. [10] Pratt, W.K.: Spatial Transform Coding of Color Images. IEEE Trans. Commun.Technol., Vol.COM – 19, No.6, 1971, p.980 - 992. [11] Farrelle, P.M. - Jain, A.K.: Recursive Block Coding – A New Approach to Transform Coding. IEEE Trans. Commun., Vol.COM – 34, No.2, 1986, p.161 - 179. [12] Sakrison, D. J. - Algazi, V.R.: Comparison of Line – by – Line and Two-Dimensional Encoding of Random Images. IEEE Trans. Inform. Theory, Vol.IT – 17, No.7, 1971, p.386 - 398. [13] Polec,J.- Pavlovičová,J.-Oravec,M.: Vybrané metódy kompresie dát. Vydavateľstvo FABER Bratislava, 1996. [14] Ngan, K. N.: Adaptive Transform Coding of Video Signals. IEEE Proc., Vol.129, No.1, 1982. [15] Chen, W. H. - Smith,C.H.: Adaptive Coding of Monochrome and Color Images. IEEE Trans. Commun., Vol.COM – 25, No.11, 1977, p.1285 - 1294. [16] Tast, M. - Wintz, P. A.: Image Coding By Adaptive Block Quantization. IEEE Trans. Commun. Technol., Vol.COM – 19. No.6, 1971, p.957 - 971. [17] Landau, H. J. - Slepian, D.: Some Computer Experiments in Picture Processing for Bandwidth Reduction. Bell Syst. Tech. J., Vol.50, No.5, 1971, p.1525 - 1540. [18] Dillard, G. M.: Application of Ranking Techniques to Data Compression for Image Transmission. NTC Conf. Record, Vol.1, 1975, p.22.18 - 22.22.

61

Page 65: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

[19] Gimlett, J. I.: Use Of Activity Classes in Adaptive Transform Image Coding. IEEE Trans. Commun. Vol.COM – 23, No.7, 1975, p.785 - 786. [20] Claire, E. J.: Bandwidth Reduction in Image Transmission. ICC Conf. Record, 1972, p.39.8 - 39.13. [21] Cox, R. V. - Tescher, A. G.: Generalized Adaptive Transform Coding. Picture Coding Symposium, Asylomar, CA, 1976, p.28 - 30. [22] Tescher, A. G.: Transform Coding Strategies at Low Rates. Natl. Telecomm. Conf., 1981, p. C9.2.1 – C9.2.3. [23] Schaming, W. B.: Digital Image Transform Coding. PE – 622, Internal Memorandum, RCA Corporation, 1974. [24] Natarajan, T. R. - Ahmed, N.: On Interframe Transform Coding. IEEE Trans. Comm., Vol.COM – 25, No.11, 1977, p.1323 - 1338. [25] Roese, J. A. - Pratt, W. K. - Robinson, G. S.: Interframe Cosine Transform Image Coding. IEEE Trans. Commun., Vol.COM – 25, No.11, 1977, p.1329 - 1339. [26] Mihalík, J.: Trojrozmerné transformačné kódovanie obrazu. Zborník seminára Digitální spracovaní obrazu, ČSVTS Tesla VÚST, Praha, 1990. [27] Shibata, K.: Three - Dimensional Orthogonal Transform Coding of NTSC Color Signals. Picture Coding Symp., Tokyo, 1977. [28] Reader, C.: Intraframe and Interframe Adaptive Transform Coding. Proc.SPIE, Vol.66, No.8, 1975, p.108 - 118. [29] Knauer, S.C.: Real Time Video Compression Algorithm for Hadamard Transform Processing. Proc.SPIE, Vol.66, No.8, 1975, p.58 - 69. [30] Gotze, M. - Ocylok, G.: An Adaptive Interframe Transform Coding System for Images. Proc. IEEE Intl. Conf. Acoust, Speech, and Signal Proc., 1982, p.448 - 451. 5. HYBRIDNÉ KÓDOVANIE OBRAZU [1] Mihalík, J.: Adaptívne hybridné kódovanie obrazu. Elektrotech. časopis, 44, č.3, 1993, s.85-89. [2] Holzlwimmer, H. - Tengler, W. - Brandt, A. V.:A New Hybrid Coding Technique for Video Conference Applications at 2 Mbit/s. Proc. SPIE, Vol. 594, Image coding, 1986, p.250 - 259. [3] Mihalík, J.: Technické prostriedky hybridného kódovacieho systému obrazu. Elektrotech. časopis, 42, č.9-10, 1991, s.498-502. [4] Hall, Ch. F.: A Hybrid Image Compression Technique. Proc. IEEE Intl. Conf. Acoust., Speech, and Signal Proc., 1985, p.149 - 152. [5] Mihalík, J. - Chmúrny, J.: Optimalizácia jednorozmerných hybridných kódovacích systémov obrazov. Slab. obzor, 48, č.8, 1987, s.393 - 397. [6] Mihalík, J. - Chmúrny, J.:Optimalizácia dvojrozmerných hybridných kódovacích systémov obrazov. Slab. obzor, 48, č.9, 1987,s.435 - 438. [7] Yoshida, Y. - Nakamura, A. - Ogura, H.: A hybrid Image Coding Technique Using a Noncausal Stochastic Model. Proc.IEEE Intl. Conf. Acoust., Speech, and Signal Proc., 1985, p.121 - 124. [8] Chmúrny, J. - Mihalík, J.:Gibridnoje kodirovanie izobraženija s primeneniem preobrazovanija Uolša - Adamara i differenciaľnej impuľznej kodovej modiljacii. Izv. VUZ Radioelektronika, Tom.28, No.5, 1985, s.61 - 63. (Hybrid Coding of an Image Using a Walsh - Hadamard Transformation with Differential Pulse Code Modulation. Radioelectron and Commun. Syst. (USA), Vol.28, No.5, 1985, p.58-61). [9] Means, R. J. - Whitehouse, H. J. - Speiser, J. M.: Television Encoding Using a Hybrid Discrete Cosine Transform and Differential Pulse Code Modulator in Real-Time. Proc.

62

Page 66: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

Nat. Telecom. Conf., San Diego, 1974, p.61 - 66. [10] Clarke, R.J. - Tech, B. - Eng, C.: Hybrid Intraframe Transform Coding of Image Data. Proc.IEEE , Vol.131, Part F. No.1, p.2 - 6. [11] Rao, K.R. - Narasimhan, M. A. - Gorzinsku, W. J.: Processing Image Data by Hybrid Techniques. IEEE Trans. On Syst., Man and Cybern., Vol. SMC - 7, No.10,1977, p.728 - 734. [12] Daut, D. G. - Modestino, J. W.: Two - Dimensional Hybrid Block Transform/DPCM Coding of Images. Proc.IEEE Intl. Conf. On Commun., Philadelphia, 1982, p. 4H.4.1- 4H.4.7. [13] Daut, D. G.: Two - Dimensional Hybrid Image Coding and Transmission. Proc.SPIE, Vol.845 Visual Commun. and Image Proc., 1987, p.24 - 31. [14] Jones, R.A.: Adaptive Hybrid Picture Coding. Proc.SPIE, Vol.87, 1976, p.247 - 255. [15] Roese, J.A.: Hybrid Transform/Predictive Image Coding. Advances in Electronics and Electron Physics, Suppl.12, Academic, New York, 1979, p.157 - 187. [16] Jain, A.K. - Wang, S.H.: Stochastic Image Models and Hybrid Coding. Dep. Elec. Eng., State Univ. New York, Buffalo, Final Rep., NOSC Contr. N00953 – 77 – C - 003MJE, 1977. [17] Tam, T.O. - Stuller, J.A.: Line - Adaptive Hybrid Coding of Images. IEEE Trans. Commun., Vol.Com - 31, No.3, 1983, p.445 - 450. [18] Habibi, A.: An Adaptive Strategy for Hybrid Image Coding. IEEE Trans. Commun., Vol.Com - 29, No.12, 1981, p.1736 - 1740. [19] Kamangar, F.A. - Rao, K.R.: Interfield Hybrid Coding of Component Color Television Signals. IEEE Trans. Commun., Vol.Com - 29, No.12, 1981, p.1740 - 1753. [20] Pearlman, W.A.: The Effectiveness and Efficiency of Hybrid Transform/DPCM Interframe Image Coding. IEEE Trans. Comunn., Vol.COM - 32, 1984, p.832 - 838. [21] Pearlman, W.A. - Jakatdar, P.: Hybrid DFT/DPCM Interframe Image Quantization. Proc.IEEE Intl. Conf. Acoust., Speech, and Signal Proc., Atlanta, GA, 1981, p.1121 - 1124. [22] Mihalík, J.: Predikčný kódovací systém spektrálnych koeficientov. Elektrotech. časopis, 44, č.12, 1993, s.378-380. [23] Ericsson, S.: Fixed and Adaptive Predictors for Hybrid Predictive/Transform Coding. IEEE Trans.Commun., Vol.COM - 33, No.12, 1985, p.1291 - 1302. [24] May, F.: Hybrid Coding of Picture Sequences for Transmission over Narrowband Mobile Radio. Signal Processing: theories and Applications, EURASIP, 1980, p.283 - 288. [25] Ericsson, S: Fixed and Adaptive Predictors for Hybrid Predictive Transform Coding. Report No.TRITA – ITT - 8305, Telecomm. Theory, The Royal Inst. Of Tech., Stockholm, 1983. [26] Netravali, A.N. - Stuller, J.A.: Motion-Compensated Transform Coding. Bell Syst. Tech. J., Vol.58, No.7, 1979, p.1703 - 1717. [27] Plompen, R.H. - Shuurink, B.F. - Biemond, J.: A New Motion-Compensated Transform Coding Scheme. Proc.IEEE Intl. Conf. Acoust., Speech, and Signal Proc., 1985, p.371 - 374. [28] Girod, B - Micke, T.: Efficiency of Motion - Compensating Prediction in a Generalized Hybrid Coding Scheme. Picture Coding Symposium, Tokyo, 1986. [29] Jayant, N.S. - Noll, P.: Digital Coding of Waveforms, Principles and Applications to Speech and Video. Prentice Hall, New Jersey, 1984.

63

Page 67: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

6. INTERPOLAČNÉ A EXTRAPOLAČNÉ KÓDOVANIE OBRAZU [1] Netravali,A.N.: Interpolative Picture Coding Using a Subjective Criterion. IEEE Trans. Commun., Vol.COM - 25, No.5, 1977, p.503 - 508. [2] Yoshida, Y.: Hybrid Interpolation Coding for Still Image. Picture Coding Symposium, Tokyo, 1986, p.146 - 147. [3] Ehrman, L.: Analysis of some Redundancy Removal Bandwitch Compression Techniques. Proc.IEEE, Vol.55, No.3, 1967, p.278 – 287 [4] Parker, J.A.et al.: Comparison of Interpolating Methods for Image Resampling. IEEE Trans. Medical Imaging, Vol.2, No.3, 1983, p.31 - 39. [5] Davisson, L.D.: Data Compression Using Straight Line Interpolation. IEEE Trans. Inform.Theory, Vol.IT - 14, No.5, 1968, p.390 - 394. [6] Debougrenet de la Tocnaye, J.L. - Cavassilas, J.F.: Image Coding Using an Adaptive Sampling Technique. Signal Processing. Image Commun., 1989, p.75 - 80. [7] Hochman, D. - Katzman, H - Weber, D.R.: Application of Redundancy Reduction to Television Bandwitch Compression. Proc.IEEE, Vol.55, No.3, 1967, p.263 - 266. [8] Kurtman, C.M.: Redundancy Reduction-A Practical Method of Data Compression. Proc.IEEE, Vol.55, No.3, 1967, p.253 - 263. 7. KÓDOVANIE OBRAZU S POUŽITÍM JEHO HIERARCHICKÝCH REPREZENTÁCIÍ [1] Tran,A.- Liu,K.: An Efficient Pyramid Coding System. Proc. IEEE Intl.Conf. Acoust., Speech, and Signal Proc., 1987, p.744-747. [2] Park,S.H.- Lee,S.U.: A Pyramid Image Coder Using Classified Transform Vector Quantization. Signal Processing, Vol.22, No.1, 1991, p.25-42. [3] Gharavi,H.- Tabatai,A.: Subband Coding of Monochrome and Color Images. IEEE Trans. Circuits and Systems, Vol.35, No.2, 1988, p.207-214. [4] Woods,J.W. (ed.): Subband Image Coding. Kluwer Academic Publishers, 1991. [5] Casas,J.R.- Torres,L.: A Region-Based Subband Coding Scheme. Signal Processing: Image Communication, Vol.10, 1997, p.173-200. [6] Autonini, M.- Barlaud,M.- Mathieu,P.: Image Coding Using Wavelet Transform. IEEE Trans. Image Proc., Vol.1, 1992, p.205-220. [7] Barlaud,M.- Solé,P.- Gaidon,T.- Autonini,M.- Mathieu,P.: Pyramidal Lattice Vector Quantization for Multiscale Image Coding. IEEE Trans. Image Proc., Vol.3, No.4, 1994, p.367-381. [8] DeVore,R.A.- Jawerth,B.- Lucier,B.J.: Image Compression through Wavelet Transform Coding. IEEE Trans. Inform. Theory, Vol.38, 1992, p.719-746. 8. KÓDOVANIE OBRAZU POMOCOU VEKTOROVÉHO KVANTOVANIA [1] Nasrabadi,N.M.- King,R.A.: Image Coding using Vector Quantization: A Review. IEEE Trans. Commun., Vol.COM-56, No.8, 1988, p.957-971. [2] Mihalík,J. – Gladišová,I. – Michalčin,M.: Two Layer Vector Quantization of Images. Radioengineering, Vol.10, No.2, 2001, p.15-19. [3] Mihalík, J. – Chmúrny, J.: Zreťazený vektorový kvantizátor so stromovým kódovaním. Elektrotech. časopis, 40, č.2, 1989, s.141 – 144.

64

Page 68: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

[4] Aravind,R.- Gersho, A.: Image Compression Based on Vector Quantization with Finite Memory. Optical Engineering, Vol.26, No.7, 1987, p.570-580. [5] Bage,M.J.: Interframe Predictive Coding of Images Using Hybrid Vector Quantization. IEEE Trans. Commun., Vol. COM-34, No.4, 1986, p.411-415. [6] Panchanathan,S.- Goldberg,M.: Adaptive Algorithms for Image Coding Using Vector Quantization. Signal Proc.: Image Commun., Vol.3, No.4, 1991, p.81-92. [7] Mihalík, J.: Hierarchical Vector Quantization of Images in Transform Domain. Electrical Engineering Journal, 43, No.3, 1992, p.92-94. [8] Mihalík, J.: Multistage Vector Quantization of Image by Using Clustering Interpolation in DCT Domain. Radioengineering, Vol.6, No.4, 1997, p.10-13. [9] Breeuver,H.: Transform Coding of Images Using Directionally Adaptive Vector Quantization. Proc. IEEE Intl. Conf. Acoust. Speech, and Signal Proc., 1988, p.788-791. [10] Mihalík, J. – Chmúrny, J.: Hybridné kódovanie obrazov s vektorovým kvantovaním. Slab. obzor, 49, č.6, 1988, s.255-262. [11] Tseng,H.CH.- Fischer,T.R.: Tranform and Hybrid Transform/DPCM Coding of Images Using Pyramid Vector Quantization. IEEE Trans. Commun., Vol.COM-35, No.1, 1987, p.79-86. [12] Mihalík, J.-Kuba, I.: Interpolačné vektorové kvantovanie obrazu s určovaním obrysových smerov. Zborník medzinárodnej konferencie o telekomunikačných technológiach „Telekomunikácie 96“, Bratislava, 1996. [13] Chen, C.H.- Yen,R.C.: Laplacian Pyramid Image Data Compression Using Vector Quantization. Signal Proc. and Patern Recognition, NATO ASI Series Vol.F44, 1988, p.287-306. [14] Furukawa,I.-Nomura, M.-Ono,S.: Hierarchical Subband Coding of Super High Definition Image with Adaptive Block- Size Multistage VQ. Signal Proc.: Image Commun., Vol.5, No.5-6, 1993, p.527-538. [15] Mihalík, J. – Dzivý, J. – Zavacký, J.: Subpásmové kódovanie obrazu s vektorovým kvantovaním. Zborník medzinárodnej konferencie „Telekomunikácie 95“, Bratislava, 1995, s.136-137. [16] Antonini,M.- Barlaud,M.-Mathieu,P.-Daubechies,T.: Image Coding Using Vector Quantization in the Wavelet Transform Domain. Proc. IEEE Intl. Conf. Acoust., Speech, and Signal Proc., 1990, p.2297-2300. 9. OBRYSOVÉ KÓDOVANIE OBRAZU [1] Huang, T.S.:Coding of Two – Tone Images. IEEE Trans. Commun., Vol.COM – 25, No.11, 1977, p.1406 – 1424. [2] Schreiber, W.F. – Huang, T.S. – Tretiak, O.J.: Contour Coding of Images. (Huang, T.S. – Tretiak, O.J.(eds): Picture Bandwith Compression), Gordon and Breach, 1972. [3] Gabor, D – Hill ,P.C.J.: Television Band Compression by Contour Interpolation. Proc.Inst. Elec. Eng., Vol.108B, 1961, p.303 – 313. [4] Kunt,M.- Ikonomopoulos,A.- Kocher,M.: Second- Generation Image Coding Techniques. Proc. IEEE, Vol.73, No.4, 1985, p.549- 574. [5] Kaneko, T., Okudaira, M.: Encoding of Arbitrary Curves Based on the Chain Code Representation. IEEE Trans. Com., COM-33, 1985, p.697-706. [6] Eden, U., Kocher, M.: On the Performance of a Contour Coding Algorithm in the Context of Image Coding. Signal Processing 8, 1985, p.381-386.

65

Page 69: EFEKTÍVNE KÓDOVANIE OBRAZOVweb.tuke.sk/fei-ldipv/publications/books/Efektivne... · 2020. 11. 5. · Metódy kódovania obrazu delíme na PCM, predikčné ( DPCM ), transformačné,

10. MODELOVÉ KÓDOVANIE OBRAZU [1] Forchheimer,R.- Kromander,T.: Image Coding- from Waveforms to Animation. IEEE Trans. Acoust., Speech, and Signal Proc., Vol.ASSP-37, No.12, 1989, p.2008-2023. [2] Pearson,D.E.: Developments in Model-Based Video Coding. Proc. IEEE, Vol.83, No.6, 1995, p.892-906. [3] Aizawa,K.- Huang,T.S.: Model-Based Image Coding: Advanced Video Coding Techniques for Very Low Bit-Rate Aplications. Proc.IEEE, Vol.83, No.2, 1995, p.259-271. [4] Welsh,W.J.: Model-Based Coding of Videophone Images. Electronics&Commun. Engineering J., 1991, p.29-36. 11. ŠTATISTICKÉ A INÉ METÓDY KÓDOVANIA OBRAZU [1] Koga, T. - Ohta, M.: Entropy Coding for a Hybrid Scheme with Motion Compensation in Suprimary Rate Video Transmisssion. IEEE J. on Selec. Areas in Commun., Vol.SAC - 5, No.7, 1987, p.1166 - 1174. [2] Zetterberg,L.H.-Ericsson, S.-Brusewitz,H.: Interframe DPCM with Adaptive Quantization and Entropy Coding. IEEE Trans. Commun., Vol.COM - 30, No.8, 1982, p.1888 - 1889. [3] Howard, P. G., Vitter, J. S.: Arithmetic Coding for Data Compression. Proceedings of the IEEE, Vol. 82, No. 6, 1994. [4] Yasada, Y: Overwiev of Digital Facsimile Coding Techniques in Japan. Proc. IEEE, Vol.68, No.7, 1980, p.830 - 853. [5] Delameillieure, J.L.P. - Bruyland, I.: Comment on Algorithm for Construction of Variable Length Code with Limited Maximum Word Length. IEEE Trans.Commun., Vol.COM-34, No.12, 1986, p.1252 - 1253. [6] Gharavi, H.: Conditional Run-Length and Variable-Length Coding of Digital Pictures. IEEE Trans. Commun., Vol.COM - 35, No.6, 1987, p.671 - 679. [7] Kok, A.L.- Manolakis,D.G.- Ingle,V.K.: Efficient Algorithms for 1D and 2D Noncausal Autoregressive System Modelings. Proc. Intl. Conf. Acoust., Speech and Signal Proc., 1987, p.661-665. [8] Bedford,T.-Dekking,F.M.-Breeuwer,M.-Keane,M.S.- Dvan Schooneveld.: Fractal Coding of Monochrome Images. Signal Processing: Image Communication, Vol.6, No.5, 1994, p.405-419. [9] Lonardi,S.-Sommaruga,P.: Fractal Image Aproximation and Orthogonal Bases. Signal Processing: Image Communication, Vol.14, No.5, 1999, p.413-423.

66