50
Multimedijalni procesori - Chapter 3 -

Multimedijalni procesori - Chapter 3 -

  • Upload
    morgan

  • View
    58

  • Download
    2

Embed Size (px)

DESCRIPTION

Multimedijalni procesori - Chapter 3 -. Br zo procesiranje kod multimedijalnih aplikacija - MMA. Arhitekturna podrška za MMA se klasifikuje u sledeće tri kategorije: aplikaciono-specifični procesori/kola – ASIP i ASIC multimedijalna proširenja za GPP – GPP sa SIMD ekstenzijama - PowerPoint PPT Presentation

Citation preview

Page 1: Multimedijalni procesori - Chapter 3 -

Multimedijalni procesori- Chapter 3 -

Page 2: Multimedijalni procesori - Chapter 3 -

Brzo procesiranje kod multimedijalnih aplikacija - MMA

Arhitekturna podrška za MMA se klasifikuje u sledeće tri kategorije:   aplikaciono-specifični procesori/kola – ASIP i ASIC multimedijalna proširenja za GPP – GPP sa SIMD ekstenzijama media procesori – VLIW mašine

Page 3: Multimedijalni procesori - Chapter 3 -

Karakteristike MMA u odnosu na GPA

odziv u realnom vremenu: MMA kakve su video konferencije i elektronsko poslovanje zahtevaju odziv u realnom vremenu. Pored toga, dodatno se zahteva i ispunjenje određenog nivoa QoS ( Quality of Service, recimo procena kašnjena slika-govor).

procesiranje streaming podataka: kod MMA-ova program za obradu (kôd) je upisan u čip (on-chip), a niz podataka (stream of data) dolazi (prihvata se) van čipa (off-chip).  sitno-zrnasti i krupno-zrnasti paralelizam: obično MMA-ovi obavljaju istu operaciju nad različitim stavkama podataka (tj. pixel-a), kakvo je median filtriranje. Pored toga, veći broj funkcija treba da se istovremeno obavlja nad ovim vrednostima podataka (tipično je to za skaliranje obima slike). Imajući u vidu da su ove operacije i funkcije u velikoj meri međusobno nezavisne moguće je koristiti kako SIMD tako i Thread Level Parallelism (TLP).

Page 4: Multimedijalni procesori - Chapter 3 -

Karakteristike MMA u odnosu na GPA – prod.

Izrazita reorganizacija podataka: Pored SIMD načina procesiranja, kod velikog broja aplikacija javlja se potreba za reorganizacijom elemenata podataka kako bi se obezbedili efikasni data-stream layout-i (recimo reorganizacija podataka kod SA). U principu MMA-ovi nisu pogodni za realizaciju SIMD arhitekture u slučajevima kada hardver i cena koja se plaća za reorganizaciju podataka treba da je velika.

Male programske petlje: MMA-ovi troše 95% od svog vremena izvršenja na izvršenja ugneždenih petlji. Petlje se karakterišu većim brojem iteracija, obično 10 i više, a neke imaju na stotinu ili 1000 iteracija.

Zahtevi za velikom memorijskom propusnošću: Kod MMA-ove procesiraju se skupovi podataka velikog obima što u principu postavlja stroga ograničenja na rad memorijskog sistema.

Podaci malog obima: Kod MMA-ova koriste se integer-i malog obima, najčešće 16 bita ili manje.

Page 5: Multimedijalni procesori - Chapter 3 -

Distribucija operacija kod MMA-ova

Preovladjuju Integer operacije

Page 6: Multimedijalni procesori - Chapter 3 -

Odnos funkcionalnih resursa

Odnos Integer prema FP je 4:1

Page 7: Multimedijalni procesori - Chapter 3 -

Obim korišćenih podataka kod MMA

Karakteristike podataka kod MMA-ova su važne iz sledeća dva razloga:  

Paralelizam na nivou pod-reči koristi podatke manjeg obima kako bi se eksploatisao SIMD paralelizam (tipično je to za MMX instrukcije)

Media procesori imaju staze-podataka (data path) užeg obima u odnosu na GPP-ove jer manipulišu sa podacima manjeg obima. Najveći broj instrukcija operiše sa 8- ili 16-bitnim podacima. Izuzetak su grafičke aplikacije koje operišu sa single precision FP brojevima.

Najveći broj operanada manji od 16 bitova

Page 8: Multimedijalni procesori - Chapter 3 -

Procesorske arhitekture koje podržavaju MMA

Nalaze se počev od:• fully custom do • fully programmable dedicated arhitektura

Veći broj programabilnih DSP-ova (PDSP) se koristi od 1980. godine.

Ove arhitekture podržavaju rad sa specifičnim instrukcijama kakve su MAC, REPEAT, SHIFTADD, i dr

Page 9: Multimedijalni procesori - Chapter 3 -

Klasifikacione šeme - prva

Po prvoj od klasifikacionih šema koja se zasniva na različitim implementacionim metodama PDSP-ovi se mogu podeliti na:

PDSP čipovi – TMS320C55xx, TMS320C67x, ... PDSP core-ovi – soft i hard jezgra multimedia PDSP – audio i video aplikacije – Trimedia TM1000 native signal procesori (NSP) – proširuju skup instrukcija GPP-ova za multimedia procesiranje, Intel-MMX, Intel Streaming SIMD, ....

Page 10: Multimedijalni procesori - Chapter 3 -

Klasifikacione šeme - druga

Po drugoj klasifikacionoj šemi koja se bazira na evoluciji procesnih arhitektura postojeće arhitekture za media porcesiranje se mogu podeliti na:

programabilne procesore, namenske implementacije, rekonfigurabilne procesore.

Page 11: Multimedijalni procesori - Chapter 3 -

Klasifikacione šeme - treća

Osobine kakve su paralelizam, fleksibilnost i intenzivno procesiranje memorijskih podataka omogućavaju nam da klasifikujemo media procesore na osnovu arhitektura koje koriste:

paralelizam, iterativnu prirodu operacija, tehnike za redukciju off-chip memorijskih transakcija.

Page 12: Multimedijalni procesori - Chapter 3 -

Klasifikacione šeme - četvrta

Interesantna klasifikacija je ona koja deli PDSP-ova na:

namenske, programabilne.

Page 13: Multimedijalni procesori - Chapter 3 -

Klasifikacione šeme - peta

Kod pete klasifikacione šeme PDSP delimo na osnovu tipa procesiranja u sledeće tri kategorije:

vektorski procesori, superskalarni procesori, multimedia procesori.

Page 14: Multimedijalni procesori - Chapter 3 -

Klasifikacione šeme - šesta

Kod šeste klasifikacione šeme procesorske arhitekture koje podržavaju MMA se mogu podeliti na:

namenske arhitekture – od fully custom do programmable dedicated arhitekture, GPP sa multimedia ekstenzijom.

Page 15: Multimedijalni procesori - Chapter 3 -

Namenski muldimedia procesori

DMP-ovi (Dedicated Multimedia Processors) su predviđeni da obavljaju specifične multimedia funkcije kakve su video i audio kompresija, dekompresija, 2D i 3D grafičke aplikacije, i td. DMP-ovi koriste različite arhitekturne šeme koje mogu biti zasnovane na većem broju funkcionalnih jedinica počev od single RISC core procesora pa sve do multi-procesora. U skorije vreme DMP-ovi koriste SIMD i VLIW arhitekture. Namenske aplikacije obično predstavljaju dobro izborno rešenje koje se zasniva na: 

korišćenju mogućnosti koje pruža dostupna VLSI IC tehnologija, ostvarivanju zahtevane računarske propusnosti, tj. moći izračunavanja, optimalnoj realizaciji ciljnog algoritma.

 Dizajn rešenja DMP-ova se protežu od:  

fully custom – arhitektura sa minimalnom programabilnošću, poznate kao function oriented arhitekture fully programmed arhitekture.

Page 16: Multimedijalni procesori - Chapter 3 -

Function-oriented arhitekture

Funkcijsko-specifična implementacija se odnosi na direktno preslikavanje zadataka za multimedijalno procesiranje u hardversku implementaciju koja je optimizirana za izvršenje specifičnih funkcija.

Uparivanje individualnih hardverskih modula sa zahtevima za procesiranjem rezultira silicon area efikasnim implementacijama

Neke od karakteristika ovih DSP procesora su:

veći broj magistrala za podatke i instrukcije, paralelno izvršenje MAC operacija, ograničen broj instrukcija, efikasno izvršenje petlji (efficient loop control), low-cost alternative za specifične aplikacije, DSP-ovi su optimizirani da obavljaju regularne, predvidljive, i računsko-intenzivne zadatke.

Page 17: Multimedijalni procesori - Chapter 3 -

Prednosti i nedostaci funkcijsko orijentisanih arhitektura

Prednosti su sledeće: 

hardverski ovrhead koji se odnosi na upraljačku jedinicu procesora je mali, potrošnja energije je mala, za određene aplikacije DSP-ovi ostvaruju visoke performanse.

 Nedostaci su sledeće:

  pogodne su samo za izvršenje specifičnih funkcija, kasnije ekstenzije nisu moguće bez redizajna hardvera, fleksibilnost i prilagodljivost za nove aplikacije je veoma ograničena.

Page 18: Multimedijalni procesori - Chapter 3 -

Primer funkcijsko-specifične arhitekture

Page 19: Multimedijalni procesori - Chapter 3 -

Programabilne arhitektureProgramabilne arhitekture

Programabilne arhitekture za procesiranje MMA se dele na: 

fleksibilne programabilne arhitekture – karakteriše ih prosečna do jako izražena fleksibilnost, adapted (prilagođene za datu aplikaciju) – visoka efikasnost alii slabije izražena fleksibilnost.

Page 20: Multimedijalni procesori - Chapter 3 -

Programabilne arhitekture Programabilne arhitekture eksploatacija mogućnostieksploatacija mogućnosti

Data Level Parallelism – DLP Instruction Level Parallelism – ILP Thread Level Parallelism – TLP, ili primena specijalnih karakteristika algoritama putem implementacije specijalizovanih instrukcija i namenskih hardverskih modula. Pomenute primene, za ograničenu aplikacionu oblast, rezultiraju većoj efikasnosti.

Programabilne arhitekture imaju veći broj prednosti kakve su:fleksibilnost, visoke performanse, potpuna podrška multimedijalnom okruženju, i niska cena. Programabilnim arhitekturama se mogu implementirati različiti zadaci koji se realizuju softverski. Glavnu prednost programabilnih arhitektura predstavlja povećana funkcionalnost. Ipak, hardver za upravljanje izvršenjam programa, zbog postojanja paralelizma, i manipulacije sa keš memorijom je dosta složen, a takođe i vreme razvoja softvera kao i njegova verifikacija su vremenski duge aktivnosti.

Page 21: Multimedijalni procesori - Chapter 3 -

Tipičan primer – Multimedi Video Tipičan primer – Multimedi Video Processor - MVPProcessor - MVP

Operacija množenja kod FxP aritmetikeOperacija množenja kod FxP aritmetikeOperacija množenja kod FxP aritmetike

Page 22: Multimedijalni procesori - Chapter 3 -

Adapted (prilagođene) programabilne arhitekture – APA

APA obezbeđuje izrazitu efikasnost prilagođavajući arhitekturu specifičnim zahtevima koji se odnose na aplikacije kod video kodiranja.

Ove arhitekture poseduju namenske module za izvršenje zadataka tipa video kodiranje/dekodiranje (codec) kakvi su DCT modul ili VLC modul.

Tipično rešenje iz ove grupe je video RISC procesor (VRP) proizvod firme C-cube Microsystem.

Savremeni namenski multimedia procesori, u cilju eksploatacije paralelizma, koriste SIMD i VLIW arhitekturne šeme kao i njihove različite varijante izvođenja (2D i 1D unidirekciona i bidirekciona SA, 2, 4, 6, ili 8 procesorski VLIW).

Page 23: Multimedijalni procesori - Chapter 3 -

Primer Adapted programable Primer Adapted programable archt.archt.

Page 24: Multimedijalni procesori - Chapter 3 -

VLIW VLIW

VLIW procesori imaju veći broj nezavisnih funkcijskih jedinica, FU-e, koje istovremeno paralelno izvršavaju po nekoliko operacija.

Operacije kod VLIW mašina se grupišu u veoma duge instrukcione reči koje se nazivaju svežanj (bundle).

Zadatak kompajlera je da pronađe nezavisne instrukcije koje se mogu grupisati u jedan svežanj.

Visoke performanse kod VLIW-a se mogu postići zahvaljujući korišćenju ILP-a i DLP-a. Jedna tipična VLIW arhitektura je prikazana na slici 5

Page 25: Multimedijalni procesori - Chapter 3 -

Tipičan primer VLIW arhitektureTipičan primer VLIW arhitekture

Page 26: Multimedijalni procesori - Chapter 3 -

Prednosti i nedostaci VLIW Prednosti i nedostaci VLIW arhitekturearhitekture

Operation scheduling se izvodi od strane kompajlera, što znači da brzina izvršenja programa i ostvareni paralelizam u radu, u osnovi, zavise od mogućnosti kompajlera.

Sve operacije koje se specificiraju u okviru VLIW svežnja su nezavisne, što znači da je VLIW funkcionalni hardver veoma obiman i skup. Tako na primer, kod pakovane SIMD arhitekture koristi se isti ALU hardver da bi izvršio veći broj operacija nad pod-rečima svežnja, dok se kod VLIW-a zahteva ugradnja većeg broja FU-ova, da bi se postigao isti nivo paralelizma (SIMD koncept koristi protočnost, a VLIW paralelizam u radu).

Povezljivost (konektiranje) VLIW registara je mnogo složenije u odnosu na SIMD rešenje. Pakovana SIMD arhitektura koristi jedinstveni RF (register file) port za čitanje ili upis većeg broja vrednosti, dok se kod VLIW zahteva ugradnja većeg broja RF portova. Tako na primer, kod VLIW arhitekture, koja ima ugrađeno N dvo-ulaznih/jedno-izlaznih FU-ova, po jednom instrukcionom ciklusu ostvaruju se 2N operacija tipa Read i N operacija tipa Write. Ako je RF jedinstveni to znači da treba da postoje 2N portova za Read i N portova za Write operaciju (vrlo složen dizajn).

Prenosivost kôda za VLIW mašinu koja ima p FU-ova na VLIW mašinu koja ima q FU-ova nije moguća, tj. izvorni kôd treba ponovo rekompajlirati što je i veliki nedostatak VLIW pristupa.

Page 27: Multimedijalni procesori - Chapter 3 -

Primer VLIW – Trimedia TM1000Primer VLIW – Trimedia TM1000

Page 28: Multimedijalni procesori - Chapter 3 -

Procesori opšte namene – GPP

GPP-ovi obično koriste MicroSIMD pristup koji se karakteriše time da su putevi (magistrale) za prenos podataka tipa integer i FP vrednosti isti.

Cilj projektovanja SIMD media ISA proširenja kod GPP-ova je usmeren ka tome da se sa postojećim hardverom iskoristi subword level parallelism (SLP), bez da se pri tome naruši opšta namena procesora.

SLP-om se ostvaruje small-scale SIMD paralelizam po zaista niskoj ceni kod word-oriented procesora koji su pre svega namenjeni da operišu sa 32/64-bitnim operandima (32-/64-bitna reč podatka se razlaže na 4/8 8-bitnih operanada).

Tako na primer, word-wide integer FU se može particionisati na paralelne sub-word jedinice, uz relativno male hardverske ovrhead-e.

Page 29: Multimedijalni procesori - Chapter 3 -

MicroSIMD paralelizam koji korisit pakovane tipove podataka i ALU koja

se može particionisati

Page 30: Multimedijalni procesori - Chapter 3 -

Subword paralelizam

Subword paralelizam predstavlja oblik vektorskog procesiranja. GPP-ov registar se vidi kao mali vektor čiji su elementi manjeg obima od obima tog registra.

Drugim rečima podaci manjeg obima se smeštaju (čuvaju) u registre većeg obima.

Pri ovome, multimedia kerneli procesiraju tipove podataka manjeg obima, manipulišući pri tome sadržajem ovih podataka.

Ilustracije radi, double precision (64-bitni) FP registar može da čuva 8/4 8-/16-bitnih elemenata vektora. U datom trenutku ista operacija se može primeniti nad svim elementima vektora.

SLP predstavlja jeftino ali i efikasno rešenje za eksploataciju DLP-a kod MMA-ova

Page 31: Multimedijalni procesori - Chapter 3 -

Prvobitne implementacije GPP-aPrvobitne implementacije GPP-a

Prvobitna implementacija GPP-ova sa multimedia ekstenzijama su Intel-ov MMX, Sun-ov Visual Instruction Set (VIS), MIPS-ov Digital Media eXtension (MDMX), i dr.

Pomenute ekstenzije su uvedene početkom 90-ih godina prošlog veka.

U trenutku uvodjenja podržavale su samo rad sa integer tipovima podataka.

Sredinom 90-ih godina Intel je uveo streaming SIMD extension (SSE) i SSE2, a Motorola AltiVec koje su u stanju da manipulišu kako sa integer tako i FP brojevima.

Page 32: Multimedijalni procesori - Chapter 3 -

Sumarni pregled nekih GPP-ova

Page 33: Multimedijalni procesori - Chapter 3 -

Najvažnije osobine GPP-ova

procesori iniciraju izvršenje i izvršavaju dve ili veći broj instrukcija po instrukcionom ciklusu, iniciranje instrukcija je van-redosledno (out-of-order), a da bi se isto obavljalo potrebno je ugraditi značajan iznos hardvera, hardverske komponente zauzimaju veliku površinu na čipu što značajno dovodi do povećanja potrošnje energije, procesori koriste tehniku dinamičke predikcije grananja, keš mehanizam je projektovan da eksploatiše 1D lokalnost kod pristupa uzastopnim adresama, a kod media aplikacija uglavnom se zahteva multi-dimenziona lokalnost kod pristupa memorijskim lokacijama, dužina reči ovih procesora je 32 ili 64 bita. Naglasimo da dužina reči kod multimedijalnih aplikacija je obično 8- ili 16-bita. GPP sa multimedia ekstenzijama obično implementiraju 15 miliona pa i više tranzistora na čipu, SIMD efikasnost ovih procesora obično nije velika, multimedia proširenja obezbeđuju značajna performansna poboljšanja zahvaljujući korišćenju DLP-a koji je prisutan kod multimedia programa.

Page 34: Multimedijalni procesori - Chapter 3 -

Ograničenja kod GPP-ova problemi zbog memorijskog neporavnjanja (memory misalignemet) – sama priroda subword data uzrokuje probleme zbog memorijskog neporavnanja. Pristup podacima koji nisu poravnjani dovodi do izvršenja većeg broja instrukcija. ograničenja koja se tiču paralelizma – fiksni obim multimedia registara ograničava iznos paralelizma koji se može postići jedinstvenom instrukcijom na najviše 8 (VIS, MMX) ili 16 (SSE, AltiVec) paralelnih operacija, dok je kod MMA prisutan znatno veći nivo paralelizma. overhead instrukcija – implementacija multimedia kernela sa short-vector SIMD ekstenzijama dovodi do značajnog povećanja ovrhead-a (suvišnosti u kôdu i procesiranju) koji se javlja zbog konverzije između različitih tipova pakovanih podataka kao i izvođenja memorijskog poravnanja kod pristupa podacima. Nabrojane aktivnosti, u suštini, dovode do povećanja broja instrukcija u kôdu, tj. sporije brzine izvršenja. Overhead u povećanju broja instrukcija može biti i veći od 30%. ne-krupni memorijski pristupi – najveći broj GPP-ova mogu da obave samo po jedan krupan memorijski pristup. U suštini, pristupi tipa koloni matrice su veoma neefikasni (elementi matrice su obično smešteni po vrstama, a pristup, u ovom slučaju, se zahteva po kolonama, što podrazumeva izvodjenje brojnih adresnih transformacija). skalabilnost – skaliranje performansi se može jedino ostvariti dupliranjem obima reči što se postiže dupliranjem obima puteva (magistrala) za prenos podataka. često puta ne postoji adekvatna podrška od strane kompajlera.

Page 35: Multimedijalni procesori - Chapter 3 -

Uporedni pregled različitih rešenja

Page 36: Multimedijalni procesori - Chapter 3 -

Efikasnost MicroSIMD arhitektura

Efikasnost MicroSIMD arhitektura definisaćemo uporedjujući ih sa karakteristikama MIMD, SIMD, Superskalarnog i VLIW procesora

Broj potrebnih instrukcija po mašinskom ciklusu da bi se ostvario paralelizam stepena 4

Page 37: Multimedijalni procesori - Chapter 3 -

Složenost RF polja

Memorijski kapacitet i potrebna površina za fiksni broj bitova po registru kod RF polja

Page 38: Multimedijalni procesori - Chapter 3 -

Vektor procesori

Vektorski procesor je procesor koji obrađuje ceo vektor pomoću jedne instrukcije. Vektorske arhitekture su dobri kandiati za multimedia procesiranje jer one na efikasan način eksploatišu DLP.  Postoje sledeća dva pristupa za impelmentaciju vektorskog procesora:  

Kod prvog pristupa repliciraju se FU-ovi, a paralelizam se ostvaruje na taj način što se svi elementi vektora istovremeno procesiraju. Cena koja se plaća za ovakav rad prvenstveno je diktirana složenom sprežnom mrežom i velikim brojem puteva (magistrala) od memorije do procesora. Ove arhitekture se nazivaju paralelni vektorski procesori.

Drugi pristup se zasniva na egzistenciji jedne ili nekoliko protočno organizovanih FU-ova koje elemente vektora procesiraju na protočni način. Ovi procesori se nazivaju protočni-vektorski procesori. Drugi pristup se češće koristi u odnosu na prvi.

Page 39: Multimedijalni procesori - Chapter 3 -

Programabilni multimedia procesori – PMP

Media procesori, sa ciljem da ostvare visoke performanse, standardno implementiraju nekoliko pristupa kavi su:  1) subword paralelizam; 2) ILP; 3) specijalizovane instrukcije; i 4) koprocesori (DCT, VLC, procena pokreta).  Druga tri pristupa, od prethodno četiri pomenuta, su usmereni ka tome da se poboljšaju performanse multimedijalnih sistema a baziraju se na:  

a) povećanju frekvencije rada media procesora; b) poboljšanju ILP-a korišćenjem efikasnijih algoritama; i c) multicore i many-core pristupu.

Page 40: Multimedijalni procesori - Chapter 3 -

Gain ILP-a

Da bi se ostvario performansni dobitak (gain) ILP obično zahteva veći broj resursa.

Sa druge strane, povećanje frekvencije rada i implementacija hardvera za dinamički scheduling dovodi do toga da se poveća potrošnja energije, poveća površina čipa kao i složenost procesora (složenost se ne odnosi samo na kompleksnost hardvera i softvera nego i produženje vremena potrebnog da se projektuje jedan složeni media procesor).

Povećanje frekvencije rada procesora uslovljava da:  

a) se obrada realizuje korišćenjem dublje (deeper) protočnosti; b) se javlja duža latentnost kod izvršenja instrukcija; i c) dolazi do povećanja memorijske latencije.

Page 41: Multimedijalni procesori - Chapter 3 -

Nedostaci postojećih pristupa za multimedia procesiranje

Funkcijsko-orijentisani pristupi (ASIC i ASIP) nude prednosti veće brzine i manje potrošnje energije, ali faze projektovanja i debugging ovih sistema traje dosta dugo. Pored toga, ova rešenja su pogodna samo za specifične funkcije, pri čemu buduće ekstenzije dizajna nisu moguće bez redizajniranja hardvera. Drugim rečima, ASIC rešenjima nedostaje fleksibilnost da se prilagode algoritamskim modifikacijama. Programabilne arhitekture nude fleksibilnost u implementaciji, ali je disipacija snage kod ovih kola mnogo veća, često suviše velika i neprihvatljiva za mobilne aplikacije.  Samo nekoliko programabilnih procesora specijalne-namene se može programirati na nekom višem programskom jeziku, dok se kod najvećeg broja i dalje nudi programiranje na nivou firmware-a. 

Page 42: Multimedijalni procesori - Chapter 3 -

Nedostaci postojećih pristupa za multimedia procesiranje

Kod najvećeg broja arhitektura za MMA procesiranje ne nude se mogućnosti za eksploataciju TLP-a koji su esencijalni za efikasnu i fleksibilnu podrški rada procesora na višim nivoima aplikacije kakav je recimo slučaj kod MPEG-4. Adapted programabilne arhitekture koriste nekoliko namenskih modula za izvršenje multimedijalnih zadataka, ali ova rešenja nisu pogodna da ispune zahteve koji se tiču multi-standardnih i multi-formatnih media aplikacija.  GPP-ovi koji imaju ugrađene multimedijalne ekstenzije su pogodni za GPA, ali to postižu po ceni uvođenja overhead instrukcija (SSE, MMX) pa zbog toga ne mogu u potpunosti efikasno da podrže DLP kod MMA.

Page 43: Multimedijalni procesori - Chapter 3 -

Izazovi u projektovanju PMP-a

a) skalabilnostb) fleksibilnost c) korišćenje resursa d) mogućnosti dinamičke adaptibilnosti, i e) implementacije u realnom vremenu.

Page 44: Multimedijalni procesori - Chapter 3 -

Prednosti u odnosu na diskretna fixed function multimedia rešenja

Cena programabilnih media procesora je niža iz razloga što se korišćenjem jedinstvenog programabilnog kola mogu zameniti veći broj diskretnih fixed function kola. Programabilni media procesori sa aspekta proizvodnje i primene imaju veću fleksibilnost. Naime, jedinstvena hardverska platforma se može koristiti za različite potrebe tržišta, a to se obično izvodi promenom softvera.  Media procesori mogu naslediti (iskoristiti) veći broj karakteristika (osobina) koje su specifične za DSP arhitekture, kao što su DSP-ovi (brojni) putevi (magistrale) za prenos podataka. Tako na primer, media procesori standardno koriste direktne veze između FU-ova koje su tipične za MAC arhitekture kod DSP-ova. Koriste se velika RF polja koja su namenjena za memorisanje međurezultata kod MMA-ova tipa video kompresija/dekompresija.

Page 45: Multimedijalni procesori - Chapter 3 -

Dileme i izazovi

Istraživanje na polju činjenja kompromisa (trade-offs) između procesne moći, memorijske propusnosti, ulazno/izlazne propusnosti, sa jedne strane, i ograničene površine čipa, male potrošnje, i niske cene MMA, sa druge strane.  Sprovesti detaljnu analizu koja se odnosi na kompleksnost izračunavanja, korišćenja različitih tehnika, formata i standarda koji se tiču multimedia procesiranja. Evaluacija (procena) ograničenja koja se odnose na rad u realnom vremenu, koja je potrebna za podršku rada narednim generacijama MMA-ova. Sagledavanja i izbor različitih tipova paralelizma kakvi su DLP, ILP i TLP.  Razumevanje inter-procesorskih komunikacionih rešenja kod SoC dizajna. Izbor najbolje memorijske organizacije koja se bazira na temporal i spatial ponašanju MMA-ova.  

Page 46: Multimedijalni procesori - Chapter 3 -

Dileme i izazovi – prod.

Veći kapacitet on-chip memorije koja podržava streaming data. Ugradnja većeg broja FU-ova polazeći od zahteva za MMA.  Obezbeđenje veće fleksibilnosti koristeći HLL programabilnost radi simultanog brzog izvršenja nekoliko multimedia funkcija.  Ispitivanja koja se odnose na izbor načina prezentacije podataka, tipova podataka, puteva za prenos podataka i njihovog obima, i načina hijerarhijske orgtanizacije memorije za podršku MMA-ova. Izbor najbolje arhitekture za podršku budućih MMA-ova (MIMD, SIMD, MicroSIMD, superskalarne, i VLIW arhitekture)

Page 47: Multimedijalni procesori - Chapter 3 -

Potrebe za rekonfigurabilnim media procesiranjem

Opšte pravilo kod projektovanja sistema/kola je sledeće: Projektant koji želi da implementira neku aplikaciju mora da se odluči između performansi i generalnosti (opštosti rešenja).

U skorije vreme, kao opcija, na tržištu su se pojavila VLSI CMOS IC nazvana Field Programmable Gate Array (FPGA) sa statičkim RAM programskim mogućnostima. Ova kola omogućavaju veću prilagodljivost (customization) različitim MMA-ovima, kao i daleko bolje prilagođenje za izvršenje specifičnih funkcija u toku rada kola, tj. izvršenje aplikacija.

Rekonfigurabilna kola su relativno jeftina rešenja, imaju malu potrošnju, malu površinu čipa, i veliku fleksibilnost.

Kod rekonfigurabilnog sistema, hardver je fleksibilan. Glavna prednost rekonfigurabilnih arhitektura sastoji se u kombinaciji hardverske i softverske fleksibilnosti u cilju postizanja visokih performansi.

Page 48: Multimedijalni procesori - Chapter 3 -
Page 49: Multimedijalni procesori - Chapter 3 -
Page 50: Multimedijalni procesori - Chapter 3 -