Predavanja AVT

Embed Size (px)

DESCRIPTION

Predavanja iz predmeta Audio-Vizuelna Tehnilogija.2014./2015.Predavanja kod profesorice dr. sci. Samra Mujačić, van. prof.Tehnički odgoj i informatikaFilozofski fakultet Tuzla

Citation preview

  • 5.3.2015

    1

    Audio-vizuelna tehnologija

    Filozofski fakultet Tuzla

    Odsjek: Tehniki odgoj i informatika

    I ciklus studija

    Ak.god. 2014./2015.

    Nastavno osoblje

    Nastavnik dr.sci. Samra Mujai, vanr.prof.

    [email protected]

    ECTS: 3

    Predavanja: 30

  • 5.3.2015

    2

    Cilj predmeta

    Znanja u podruju audio, video i multimedijskih tehnologija

    Osnovni koncepti i odabrani primjeri + praktino iskustvo kroz projektne zadatke

    Sadraj predmeta

    Osnovni tipovi medija: Tekst; Nepomina slika; Pomina slika animacija; Audio zvuk; Video. Postupci obrade i kompresije medija. Formati zapisa. Audio-vizuelna

    integracija. Multimedija. Hipermedija. Multimedijski

    dokumenti. Sinhronizacija multimedije. Multimedijske

    tehnologije i aplikacije: videokonferencija, web

    konferencija, interaktivna televizija, strujanje medija,

    VoD, elektronski obrazovni sadraji, e-uenje.

  • 5.3.2015

    3

    Nastavna literatura (1)

    Slajdovi sa predavanja

    Projektni zadaci

    Nastavna literatura (2)

    Osnovne knjige:

    J. Barakovi Husi, E. Brka, M. Hadiali, M. krbi: Multimedija i kodiranje, univerzitetsko izdanje,

    Elektrotehniki fakultet Univerziteta u Sarajevu, Sarajevo, 2014.

    Z. Bojkovi, D. Martinovi: Osnove multimedijalnih tehnologija, udbenik, Visoka kola elektrotehnike i raunarstva, Beograd, 2011.

    P.Mari, S.Mujai, M.Zori-Venuti, A.Tibaut, V.uki, Z.Gaji, M.Gaji: Preporuke: Bosna i Herzegovina, Radna grupa za eObrazovanje. dopunjeno izdanje,

    Graz: World University Service Austrian Commitee. 2006.

  • 5.3.2015

    4

    Nastavne metode

    Predavanja

    Samostalan rad projektni zadaci

    Konsultacije

    Metode provjere znanja

    Projektni zadaci

    Testovi

    Zavrni ispit

  • 5.3.2015

    5

    Metode ocjenjivanja

    Prisustvo na nastavi

    Projektni zadaci

    Testovi

    Zavrni ispit

    Bodovanje aktivnosti za sticanje potpisa

    bodovi

    Prisustvo

    Projektni

    zadaci Potpis

    3 30 33 maksimalan broj

    bodova

    2,4 15 17,4 minimalan broj bodova

  • 5.3.2015

    6

    Bodovi za zavrni ispit

    Potpis Testovi

    Uslov za

    ZI

    33 50 83 maksimalan broj

    bodova

    17,4 25 42,4 minimalan broj bodova

    Bodovi ukupno

    Potpis Testovi ZIU Ukupno

    33 50 17 100 maksimalan broj

    bodova

    17,4 25 8,5 50,9

    minimalan broj

    bodova (nije dovoljan

    min po svim

    kriterijima!)

  • 5.3.2015

    7

    ...ili bodovi ukupno

    Potpis ZIP ZIU Ukupno

    33 50 17 100 maksimalan broj

    bodova

    17,4 25 8,5 50,9

    minimalan broj

    bodova (nije dovoljan

    min po svim

    kriterijima!)

    Konana ocjena

    Bodovi Ocjena

    54 - 63 6

    64 73 7

    74 83 8

    84 93 9

    94 - 100 10

  • 1

    Audio-vizuelna tehnologija

    Pojam, obiljeja i komunikacijski zahtjevi medija

    Tipovi medija

    Sadraj

    Uopte o medijima Podjela medija Multimedija Multimedijski sistemi Osnovni tipovi medija

    Tekst Raunarska grafika (nepomina slika, animacija) Zvuk Video

  • 2

    Medij, definicija i pojmovi

    multi [lat. multi-]: viestruki, vie, puno

    medij [lat. medium]: sredstvo za prikaz informacije

    vrste medija: vizualni medij: tekst, crte, nepokretna slika, pokretna slika

    (animacija), video

    akustini medij: zvuk, govor i muzika

    mediji vezani uz druga ljudska osjetila ili umjetna osjetila (senzore)

    prikaz na raunaru: analogno-digitalna pretvorba

    definicija multimedije (u irem smislu):

    informacija predoena preko vie medija

    Kvalitativna podjela medija vremenski neovisni medij (diskretni)

    valjanost podataka ne ovisi o vremenskim uslovima tj. o trenutku pojavljivanja, trajanju i sl.

    npr: tekst, nepomina slika

    vremenski ovisni medij (kontinuirani) vrijednost podataka se mijenja tokom vremena, valjanost ovisi o

    vremenskim uslovima obrada i komunikacija sloene npr: govor, muzika, video, animacija

    stroga definicija multimedije:

    vie objedinjenih medija od kojih je barem jedan kontinuiran (vremenski ovisan) i barem jedan diskretan

    (vremenski neovisan)

    Kada se konzumentu multimedijskog sadraja omogui da upravlja elementima koji e mu biti isporueni, tada govorimo o interaktivnoj multimediji

  • 3

    Definicije multimedije

    Na primjer, neko e pod multimedijom podrazumijevati PC sa ugraenom zvunom karticom, DVD-ROM-om, multimedijskim procesorom koji je u stanju obraivati dodatne multimedijske instrukcije.

    Ili na primjer, pod multimedijom se moe podrazumijevati interaktivna kablovska televizija sa stotinama digitalnih kanala i

    uslugama brzog irokopojasnog pristupa Internetu.

    Nadalje, pojam multimedije u kontekstu raunarskih nauka obino podrazumijeva zapravo multimedijske aplikacije.

    Multimedijska aplikacija je aplikacija koja koristi viestruke medijske izvore kao to su: tekst, slike, zvuk, animacije, video, itd.

    Pojam multimedije u kontekstu telekomunikacijskih nauka obino podrazumijeva multimedijske komunikacijske sisteme i usluge.

    Prema tome, vidimo da termin multimedija moe imati razliita znaenja ovisno o kontekstu upotrebe ovog termina.

    Interdisciplinarnost

    Multimedija je interdisciplinarno podruje zato to ukljuuje razliite teorije i vjetine:

    raunarsku tehnologiju

    telekomunikacijsku tehnologiju

    umjetnost, dizajn i prezentacijske vjetine

    znanje iz aplikacijske domene

  • 4

    Multimedijski sistemi 1/2

    Takoer, u literaturi se mogu nai razliite definicije za

    multimedijske aplikacije i multimedijske sisteme.

    Moemo izdvojiti slijedea tri kriterija za klasifikaciju nekog sistema kao multimedijskog sistema:

    Broj razliitih medija

    Tipovi koritenih medija

    Stepen integracije medija

    Najjednostavniji je prvi kriterij. Prema tom kriteriju je, na primjer, i program za obradu teksta (MS Word)

    multimedijski sistem.

    Tipovi koritenih medija su drugi kriterij. Ovdje moemo razlikovati vremenski ovisne i vremenski neovisne

    medije.

    Multimedijski sistemi 2/2

    Trei kriterij je integracija pod kojom podrazumijevamo da se razliiti tipovi medija obrauju i prikazuju zajedno, ali ostaju neovisni jedan od drugog.

    Budui da je integracija vremenski ovisnih medijskih objekata u stvari vrlo nov aspekt obrade informacija, neki

    autori definiraju multimedijski sistem kao sistem koji

    podrava obradu vie od jednog medija od kojih je barem jedan vremenski ovisan.

    Kombinirajui prethodna tri kriterija neki autori predlau slijedeu definiciju multimedijskog sistema:

    Multimedijski sistem je sistem ili aplikacija koja podrava integralnu obradu razliitih tipova medija sa barem jednim vremenski ovisnim medijem.

  • 5

    Elementi multimedijskog sistema

    Komponente multimedijskog

    sistema Komponente multimedijskog sistema su:

    Razliiti ulazni ureaji (video kamera, mikrofon, tastatura, mi, tableti, 3D ulazni ureaji, taktilni senzori, ...)

    Ureaji za pohranu (tvrdi diskovi, CD ROM-ovi, DVD ROM-ovi, ...)

    Ureaji za prikaz (monitori visoke rezolucije, HDTV, printeri u boji,...)

    Raunari (multimedijski desktop raunari, radne stanice, ...)

    Komunikacijske mree (lokalne mree, intranet, Internet, specifine mree s velikim brzinama prenosa)

  • 6

    Multimedijski sistemi/aplikacije

    Multimedijski sistemi/aplikacije ukljuuju sljedee elemente:

    Generiranje podataka

    Manipulaciju podacima

    Pohranjivanje podataka

    Prezentaciju podataka

    Prijenos podataka i informacija

    Multimedijski autorski alati Multimedijski autorski alati su alati koji

    omoguavaju kreiranje multimedijskih aplikacija ukljuujui i razliite komponente za interakciju.

    Primjeri:

    Adobe Flash (prije Macromedia Flash) omoguava kreiranje interaktivnih animacija

    Adobe Director (prije Macromedia Director)

    Adobe Authorware vizualni autorski alat za kreiranje aplikacija e-uenja

    Quest

    Grins Editor for SMIL 2.0

  • 7

    Multimedijske usluge

    interaktivne usluge dvosmjerna razmjena medija izmeu dva ili vie korisnika

    meusobno, i/ili s aplikacijskim posluiteljem/ima konverzacijske usluge (npr. videokonferencija)

    viekorisnike saradnike aplikacije, igre

    usluge pretraivanja (baze podataka, WWW)

    distribucijske usluge informacija se dostavlja razliitim udaljenim mjestima

    jednosmjerna komunikacija od izvora informacije prema udaljenim korisnicima

    s korisnikovom kontrolom prikaza; npr. video na zahtjev

    bez korisnikove kontrole prikaza; jednostavnije usluge, npr. kablovska televizija

    Trenutna podruja istraivanja i razvoja

    Istraivake teme povezane s multimedijskim sistemima su:

    Obrada i kodiranje multimedijskih sadraja (analiza sadraja, kompresija, pretraivanje multimedijskih baza podataka,...)

    Multimedijski alati i aplikacije (korisnika suelja, multimodalna interakcija, autorski sistemi, multimedija

    u edukaciji, virtualna okruenja, ...)

    Podrka multimedijskim sistemima i umreavanje (protokoli, operativni sistemi, serveri i klijenti, kvaliteta

    usluge,...)

  • 8

    Kratak historijski prikaz 1/2 1945 Wannevar Bush (1890-1974) opisao hipermedijski sistem

    pod nazivom Memex koji je bio memorijski ureaj koji je ukljuivao koncept asocijativnih veza. Bush je opisao ureaj kao elektroniki povezan u biblioteku koji bi mogao prikazivati knjige i filmove iz

    biblioteke i koji bi automatski mogao slijediti reference od jednog

    djela prema drugom. Memex je uticao na razvoj hiperteksta.

    1960-tih godine Ted Nelson pokrenuo projekat Xanadu koji je predstavljao prvi pokuaj hipertekst sistema

    1968- Douglas Engelbart pod uticajem Bush-a (As We May Think) je demonstrirao On-Line System kao primjer hipertekstualnog programa

    1969- Nelson i van Dam (Brown University) kreirali editor hiperteksta pod nazivom FRESS

    1978- MIT Architecture Machine Group kao rezultat projekta Multiple Media razvili Aspen Movie Map kao prvi hipermedijski videodisk

    Kratak historijski prikaz 2/2

    1985- Negroponte i Wiesner osnovali MIT Media Lab kao vodeu istraivaku instituciju za istraivanje digitalnog videa i multimedije.

    1989- Tim Berners-Lee predloio World Wide Web instituciji European Council for Nuclear Research (CERN)

    1991- standard MPEG-1 priznat kao meunarodni standard za digitalni video, nakon ega su se razvili novi standardi MPEG-2, MPEG-4, itd.

    1992- JPEG je prihvaen kao meunarodni standard za kompresiju digitalnih slika, nakon ega je slijedio razvoj novih JPEG standarda

    1993- University of Illinois National Center for Supercomputing Applications kreirao NCSA Mosaic kao prvi popularni web browser koji je bitno doprinio

    popularnosti web-a

    1994 Jim Clark i Marc Andreessen kreirali program Netscape kao prvi komercijani web browser

    1995- kreiran jezik JAVA

    1996- DVD video se poeo koristiti

    Dalje znate i sami...

  • 9

    Tipovi medija

    tekst, podaci

    Mediji koji nisu

    vremenski ovisni

    Tipovi medija

    Mediji u

    realnom vremenu

    slike

    Diskretni

    tekstualni

    razgovorInstant Messaging

    Kontinualni

    bez tolerancije

    kanjenja

    sa tolerancijom

    kanjenja

    pristup

    aplikacijama na

    udaljenom kompjutoru

    interaktivni

    audio/video

    streaming

    audio/video

    Bez tolerancije na greku

    Osnovni tipovi medija

    Tekst

    Raunarska grafika Nepomina slika

    Pomina slika (animacija)

    Audio

    Video

    -----------------------------------

    Multimedija

    Hipermedija

  • 10

    Medij Vrsta Prednosti Ogranienja

    tampani materijal

    Skripte, prirunici, knjige, primjeri,

    pomoni/radni materijali

    1.spontan

    2.jednostavan za

    koritenje 3.jeftin

    1.ogranieno vienje realnosti

    2.pasivan i

    jednosmjeran

    3.ograniena interakcija

    Kombinovani

    mediji

    (kompjuterski

    predstavljeni

    mediji)

    Kompjuterske

    aplikacije

    1.multimedijski

    2.interaktivan

    3.dostupan

    4.brz napredak i

    smanjenje cijene

    1.trokovi razvoja 2.isporuka

    3.auriranje 4.kompjuterska

    nepismenost

    Audio mediji Pasivni audio medij

    Aktivni audio medij

    1.jeftin

    2.dostupan

    3.jednostavan

    4.interaktivan

    5.efektivan

    1.nepostojanje

    vizualnih informacija

    2.ogranien sadraj audio zapisa

    Video mediji Pasivni video medij

    Aktivni video medij

    1.vizualni kontakt

    2.koritenje razliitih medija 3.dostupnost

    4.interaktivnost

    1.veliki trokovi 2.nekompatibilnost

    3.nepravilna

    konfiguracija

    4.nepravilno

    pripremljen sadraj

    Tekst

  • 11

    Razvoj pismene komunikacije

    Pismo ili pisana rije je sredstvo prostorne i vremenske komunikacije. Pismo se razvija paralelno s razvojem nae civilizacije i vjerovatno predstavlja najzasluniji faktor njenog napretka.

    Pismo, u irem smislu, predstavlja svaki sistem vidljivih oblika (slikarija, simbola, znakova i njihovih kombinacija) namjerno proizvedenih u svrhu memorisanja i obavjetavanja -

    u uem smislu predstavlja sistem znakova koji predstavljaju odreene elemente govornog jezika: pojedine rijei, slogove ili glasove.

    Slikovno pismo-piktografija

    piljski crtei Savremeni piktogrami

    Svi oblici pisama preuzeti su sa http://likovna-kultura.ufzg.unizg.hr/pismo.htm

  • 12

    Pojmovno pismo-ideogrami

    Vjerovatno je najprije razvijeno u sumerskoj kulturi oko 3400 godine prije Krista u obliku klinastog pisma[1].

    Kasnije su u Egiptu razvijeni hijeroglifi, a u Kini se i danas upotrebljava takav oblik pisma. Ideogrami su shematizirani oblici slikovnog predoavanja koji postaju nositelji pojedinih rijei i pojmova koji se mogu dovoditi u odnose i stvarati asocijacije na apstraktne pojmove. Tako se npr. kod kineskog pisma ideogram "ljubav" gradi udruivanjem sliica majke i djeteta; "pjevati" je sloen od ideograma ptice i usta, a dvije ene su simbol za svau.

    [1] Sumerska je kultura nastala u Mesopotamiji na podruju rijeka Eufrat i Tigris, gdje se danas nalazi Irak.

    Sumerski ideogram

    Savremeni ideogram

    Slogovno ili silabiko pismo Ovdje se svaki znak odnosi na jedan gramatiki

    slog. Slogovno pismo razvilo se tako da se znak za pojam (ideogram) ili rije (logogram) poeo odnositi samo na prvi slog te rijei, ili se vie ideograma kratkih rijei slagalo zajedno da bi se dobilo priblino fonetski sastav neke due rijei.

    Pretpostavlja se da je najstariji primjer takvog pisma kretsko linearno pismo, nastalo je poetkom 2000-te godine prije Krista (prvo pismo u Europi) pod utjecajem egipatskih hijeroglifa koje do danas nije deifrirano.

    Ostali primjeri silabikog pisma su hebrejsko kvadratino pismo i arapsko pismo koje je razvijeno u 7. vijeku kao prethodnik dananjem arapskom pismu. Japanci i danas koriste silabika pisma hiragana i katakana. Pored toga oni koriste i pismo kanji (kani) koje je slino kineskom slikovnom pismu.

    Kretsko linearno pismo

  • 13

    Hebrejsko kvadratino pismo

    Kvadratino pismo Kethabh merruba zove se jo i asirsko pismo. Sastoji se od 22 znaka za

    kosonante, pie se s desna na lijevo, a odsutnost vokala nadoknauje se dodatnim znakovima, takicama ili crticama ispod slova; nazivaju se masoretskim znakovima ili

    punktacijom.

    Indijsko pismo Devanagari

    Razvilo se u sjevernoj Indiji iz pisma

    brahmi u pismo devanagari ("pismo

    boanskog grada"). ita se i pie slijeva na desno. Dijeljenje rijei nije uobiajeno.

  • 14

    Arapsko pismo

    Razvilo se u 7. vijeku. Najstariji rukopisi Kurana

    napisani su kufskim pismom, monumentalnim i

    uglatim, prikladnim za urezivanje. Pisanjem na

    koi i papirusu izgubilo je svoju ukoenost i pretvorilo se u nashi, predhodnika dananjeg arapskog pisma. Arapsko se pismo se ita s desna na lijevo, a slova su unutar rijei povezana; dijeljenje rijei nije uobiajeno.

    Alfabet

    Na kraju razvojnog lanca pisma nalazi se alfabet, kojeg i danas koristimo za obradu teksta. Alfabet ine znakovi (grafemi) ili slova koji oznaavaju pojedini govorni glas.

    Smatra se da su ga prvi razvili Feniani koji su imali alfabet od 22 slova. Od njega su Grci u 10. vijeku prije nove ere razvili grki alfabet. Sama rije alfabet dolazi od prva dva grka slova alfa i beta.

    Slova grkog alfabeta

    izvor http://www.omniglot.com/writing/greek.htm

  • 15

    Tekst

    Tekst u multimediji karakterizira dualna priroda.

    Tekst predstavlja vidljivu reprezentaciju govornog jezika i ujedno grafiku, dizajnersku i estetsku komponentu multimedije.

    Kao reprezent govornog jezika, tekst nosi semantiki smisao zapisan slovima odgovarajue abecede koritenog pisma. Tekst se sastoji od grafikih elemenata kao to su znakovi, geometrijski ili fotografski elementi ili njihove kombinacije.

    Iako se tekst promatra kao dvodimenzionalan objekat, u raunarima se predstavlja kao jednodimenzionalni niz znakova.

    Vrste teksta

    Razlikuju se tri vrste teksta:

    neformatirani tekst (engl. unformatted text)

    formatirani tekst (engl. formatted text)

    hipertekst (engl. hypertext)

  • 16

    Mainsko tampanje teksta

    594. U Kini se izraivao otisak pomou izdubljenog negativa 1041. U Kini se koriste pomini glineni peati za pisanje znakova 1436. Gutenberg zapoeo rad na svom tamparskom ureaju 1440. Gutenberg zavrio svoj drveni tamparski stroj na kojem je koristio metalna

    slova

    1455. Gutenberg tampao bibliju u Mainzu (Neki uzimaju ovu godinu kao poetak mainskog tampanja teksta)

    1455. Gutenberg bankrotirao 1461. Albrecht Pfister tampao prvu ilustrovanu knjigu koristei drvene ablone (u

    Mainzu)

    1462. vojnici nadpiskupa od Nassau napali Mainz i proirili znanje o tamparskom stroju u Europu

    1499. tampanje se proirilo u vie od 250 gradova irom Europe 1501. prvi puta koriteni Italic znakovi 1518. romanski znakovi poeli istiskivati gotike 1609. tampane prve novine 1666. prvi papirni novac tampala Bank of Sweden 1798. Aloys Senefelder izumio litografiju to je predstavljalo revoluciju u tamparskoj

    tehnici. Koriteno je svojstvo da se ulje i voda ne mijeaju. Na kamenu povrinu se masnom kredom ucrtao znak ili crte. Nakon toga se kamena povrina umoila u tintu koja se nije zadravala na masnoj povrini

    1874. Cristopher Latam Sholes izradio prvi pisai stroj kojeg je komercijalno proizveo E. Remington and Sons

    Izvor http://www.dotprint.com/fgen/history1.htm

    Razvoj pisaih ureaja

    Replika Gutenbergovog tiskarskog stroja

    Prvi komercijalno proizvedeni pisai stroj (lijevo) i tipian mehaniki pisai stroj (desno)

    Tastatura prvog pisaeg stroja 1874.

  • 17

    Obrada teksta raunarom

    Tekst se unosi u raunar runo upisom na tastaturu ili strojno pomou ureaja za optiko prepoznavanje tekstova - OCR (Optical Character Recognition), koji danas mogu 'prepoznati' ak i rukopis.

    Tekst je u sutini niz znakova (characters) meu kojima se nalaze slova, brojevi i pomoni znakovi za ureenje teksta, kao to su znakovi interpunkcije (taka, zarez, upitnik usklinik), navodnici, akcenti itd.

    Razvojem informatike razvijali su se i standardi za memorisanje navedenih znakova. Danas ne postoji jedinstveni standard za memorisanje teksta.

    Standardi

    ASCII (American Standard Code for Information Interchange) kod - koji predstavlja 7- bitni sistem kodiranja slova engleske abecede koji omoguava upisivanje 128 znakova

    Latin Alphabet 1 (ISO 8859-1) koji koristi 8 bita (256 znakova) prvih 128 su ASCII znakovi a ostatak posebni nacionalni znakovi

    Latin Alphabet 2 (Latin 2- ISO 8859-2) koji sadri i hrvatske dijakritike znakove (,,,..)

    Microsoft CP -1250 koji sadri i hrvatske znakove i nalazi se na svim raunarima s Microsoft Windows platformom i koji je de facto postao standardom

    Unicode (ISO 10646-1) 16 bitni sistem (65536 znakova) koji omoguava svim nacionalnim pismima da se ugrade u jedan standard

  • 18

    Obrada teksta raunarom

    Prilikom obrade teksta raunarom, danas postoje dvije tehnike za prikazivanje

    znakova

    bitmap

    outline

    Najei outline oblik je vektorski

    Bitmapirani i vektorski prikaz

    Bitmapirani prikaz se temelji na mrei 'kvadratia' odnosno najmanjih jedinica koje se mogu prikazati (na ekranu ili printeru) koji se nazivaju dots, pa se popunjavanjem tih kvadratia stvara slika znaka. Nedostatak takvog prikaza je relativno veliki utroak memorije i ograniene mogunosti poveanja slike tj. poveanjem se gubi kvaliteta. Pojam dots per inch (dpi) je povezan s definicijom kvalitete tampaa (od 300

    dpi do preko 1200), dok se kod ekrana koristi naziv pixel (picture element) kao pojam za najmanji dot koji se moe prikazati i obino to bude od 72 do 96 pixel per inch.

    Vektorski prikaz definie znak kao skup geometrijskih oblika (Bezier-ove krivulje). Razlika se vidi na slici.

  • 19

    Primjeri programa za obradu teksta

    DOC i PPT Microsoft

    ovisni o platformi

    Windows, MacOS

    promjenljiv sadraj

    redundancija

    nezatien sadraj

    + dostupni autorski alati (Word, PowerPoint)

    + originalni dokument

    PDF i PS Adobe

    + neovisni o platformi

    samo je potreban preglednik

    nepromjenljiv sadraj

    + kompaktan

    + zatien od kopiranja (uslovno)

    manje dostupni autorski alati (Acrobat, LaTeX...)

    Formati za tekst

    U ovisnosti o svojstvima teksta i koritenoj metodi kompresije, tekst se moe pohranjivati u velikom broju formata. Svaki od formata zahtijeva specifinu aplikaciju za pristup i modificiranje sadraja.

    TXT (engl. Text)

    DOC (engl. Document)

    DOCX (DOC sa XML)

    OXPS (engl. Open XML Paper Specification)

    RTF (engl. Rich Text Format)

    PDF (engl. Portable Document Format)

    PS (engl. PostScript)

  • 20

    Fontovi

    Znakovi koji su osnovni elementi teksta imaju razliite mogunosti prikaza. Te se mogunosti najveim dijelom definiraju pod pojmom font. Pojam font objedinjuje

    razliite karakteristike znakova meu kojima je osnovna sam izgled znakova ali i

    neka druga svojstva koja neposredno

    utiu na taj izgled.

    Pojmovi u vezi s definisanjem fontova

    Ascender

    x- height (visina)

    Descender

    Baseline Mean line Serif

    .

  • 21

    Jo o fontu

    Veliina fonta se definie kao points koji predstavlja 1/72 ili 0,0138 inch-a (1 inch = 2,54

    cm). Kada se kae na primjer 12 points Arial, onda pojam Arial predstavlja font, dakle oblik

    slova a 12 points predstavlja 12/72 to je jednako jednu estinu inch-a odnosno 2,54/6 to je jednako 0,42 centimetra, odnosno neto vie od 4 milimetra

    ovo je primjer teksta Arial 20 points

    a ovo Times New Roman 20 points

    Vrste fontova u odnosu na irinu elije

    Svi znakovi nisu jednako iroki, pa ni razmak meu njima u tekstu ne mora biti jednak. Osnovna elija u koju se smjeta znak (slovo) moe biti uvijek iste irine i onda se govori o monospace fontovima. Ako se irina prostora kojeg e slovo zauzeti prilagoava irini samog slova onda se govori o proportional-space fontovima.

    Brza smea lisica Brza smea lisica Courier 24 Times New Roman 24

  • 22

    Hipertekst

    Knjigu moemo smatrati linearnim medijem zbog toga to itanje te knjige obavljamo od poetka prema kraju.

    S druge strane, hipertekst se ita obino nelinearno, slijedei veze koje pokazuju na druge dijelove nekog dokumenta ili

    ak na potpuno drugi dokument.

    Dakle, hipertekst je tekst koji sadri veze na druge tekstove.

    Ovaj termin je smislio Ted Nelson (1965)

    Gornje injenice imaju implikacije na raspored i organizaciju materijala.

    Na rapored i organizaciju materijala mnogo utie i konkretno podruje primjene.

    Raunarska grafika

  • 23

    Raunarska grafika

    Grafika podrazumijeva prikaz informacija pomou slika u kojima su osnovni nosioci informacija oblici i boje.

    Raunarska grafika (engl. computer graphics) se definira kao vid grafike u kojoj se za generiranje, pohranu i

    prezentiranje slikovnog sadraja koristi raunar.

    Raunarska grafika se moe odrediti i kao skup tehnologija koje se koriste u kreiranju i manipuliranju

    slikovnim sadrajima, odnosno kao podruje raunarskih nauka koje se bavi prouavanjem metoda za digitalno generiranje i manipuliranje vizuelnim sadrajima.

    Podjela raunarske grafike

    Raunarska grafika se moe podijeliti na vie razliitih vrsta u odnosu na nekoliko kriterija. Uobiajeno se spominju tri podjele raunarske grafike:

    1. interaktivna i neinteraktivna

    2. dvodimenzionalna i trodimenzionalna

    3. vektorska i rasterska

  • 24

    Interaktivna i neinteraktivna

    grafika

    U interaktivnoj grafici se koristi dinamiki prikaz slike na mediju koji to omoguava pri emu korisnik aktivno sudjeluje u stvaranju i/ili izmjeni slike.

    U neinteraktivoj grafici informacije su statine, a prezentiranju se bojama i oblicima, ali bez mogunosti interakcije.

    2D i 3D grafika

    Dvodimenzionalna grafika podrazumijeva raunarsko stvaranje digitalnih slika koje koriste dvodimenzionalni prikaz grafikih objekata.

    Trodimenzionalna grafika se zasniva na dvodimenzionalnoj vektorskoj grafici. Razlika je

    u tome to se ovdje koordinate taaka uvaju u prostoru umjesto u ravni, a objekti nemaju samo

    irinu i visinu, nego i dubinu.

  • 25

    2D i 3D raunarska grafika

    Primjer raunarske grafike: (a) dvodimenzionalna; (b) trodimenzionalna

    Vektorska i rasterska grafika

    Podjela na vektorsku i rastersku grafiku je izvrena prema osnovnim gradivnim elementima slike.

    Vektorska grafika kao osnovne gradivne elemente ima objekte poput taaka, linija, krivih i poligona koji se mogu uklapati, preklapati i

    prekrivati i tako graditi vektorsku sliku.

    Za razliku od vektorske grafike, rasterska grafika poznaje samo jedan slikovni element piksel (engl. picture element).

  • 26

    Vektorska i rasterska grafika

    Primjer raunarske grafike: (a) vektorska; (b) rasterska

    Vektorska grafika

    Kod vektorske grafike, slika predstavlja skup objekata koji su u potpunosti opisani

    matematiki, to omoguava izvoenje razliitih manipulacija nad objektima slike bez negativnog uticaja na kvalitetu slike.

    S obzirom na to, veliina vektorske datoteke je relativno mala, to je ini interesantnom za mnoga podruja primjene.

  • 27

    Rasterska grafika

    Kod rasterske grafike, slika predstavlja matricu piksela.

    Budui da je rasterska grafika namijenjena stvaranju i obradi slika s mnogo detalja izmeu kojih ne postoji matematika veza, javljaju se vei memorijski zahtjevi.

    S tim u vezi, razvijene su brojne metode za kompresiju rasterskih slika. To ima za posljedicu

    odreene gubitke s aspekta kvalitete slike.

    Slika Slika u multimediji uobiajeno podrazumijeva rastersku

    sliku koja predstavlja dvodimenzionalnu matricu

    diskretnih elemenata slike, odnosno piksela. Piksel kao

    element slike je odreen svojom svjetlinom i poloajem u slici.

    Svjetlina piksela se izraava brojnom vrijednou intenziteta, dok se poloaj piksela predstavlja koordinatama (x, y).

    Dimenzije matrice piksela odreuju rezoluciju slike. Rezolucija slike koju prikazuje zaslon mobitela,

    raunara, projektor ili televizor se iskazuje brojem piksela u redu i koloni matrice (npr. 320240, 1024768, 19201080), dok se kod digitalnih fotografskih i videokamera iskazuje ukupnim brojem piksela koji njihov

    senzor moe snimiti (najee u megapikselima).

  • 28

    Grafike slike (2D slike)

    Vektorski bazirana grafika

    Objekti

    matematiki definirani

    neovisni o rezoluciji

    Primjena kod

    tehnikih shema i projekata

    slika koje sadre dosta teksta

    dokumenata sa visokom izlaznom kvalitetom (print)

    Grafika bazirana na pikselima

    rasterska grafika

    Objekti

    grupa piksela

    ovisni o rezoluciji

    Primjena kod

    fotografija

    pregleda na ekranu

    kompresije bez gubitka informacije

    Alati za crtanje 2D slika

    Alati za vektorsku grafiku, crtanje linija, krugova, kocki, tehnikih shema, projekata

    CorelDraw

    Adobe Illustrator

    Macromedia Freehand MX

    Alati za obradu bitmapirane slike, dakle, ureivanje, preureivanje slika, brisanje elemenata na gotovim slikama, uklanjanje objekata sa slike, komponovanje dvije slike u jednu itd. Alati podravaju rad sa layer-ima, to znai da se svaka slika moe posmatrati kao jedan sloj na koji se moe dodati neka druga slika koja e biti drugi sloj - layer

    Adobe Photoshop Corel Painter Paint Shop Pro

    P1 P2

    P3

    VC unitTandberg 6000(MCU 1)

    VC unit Tandberg 880 MXP

    (MCU 2)University clinical centar Tuzla, BH

    VC unitTandberg 880 MXPRikshospitalet Oslo, Norway

    VC unitTandberg 550University clinical centar

    Banja Luka, BH

    ISDN

    VC unitTandberg 550Clinical center

    Mostar, BH

    S video/audiomatrix

    audio desk

    large multimedia room

    small multimedia room

    UCDED University of Tuzla, BH

    128 kbps

    128 kbps

    128 kbps

    128 kbps

    VC unitTandberg 550University hospital Sarajevo, BH

  • 29

    Formati slike

    Slike se mogu pohranjivati u velikom broju razliitih datotenih formata. Za svaki datoteni format je karakteristina specifina metode kompresije i dubina boje:

    BMP (engl. BitMaP)

    JPEG (engl. Joint Photographers Experts Group)

    GIF (engl. Graphics Interchange Format)

    TIFF (engl. Tag-based Image File Format)

    PNG (engl. Portable Network Graphic)

    PCX (engl. Personal Computer eXchange)

    TGA (engl. Truevision Graphics Adapter)

    Usporedba formata i veliine datoteke

    Na slici su prikazane iste slike amerikog borbenog aviona F-14 Tomcat koje su zapisane u razliitim formatima. Na osnovu podataka o koliini prostora za pohranu slike u odgovarajuem formatu, korisnik moe donijeti odluku o izboru adekvatnog formata.

  • 30

    Raunarska 3D grafika Modeliranje (oblikovanje pojedinog objekta koji e se kasnije koristiti u sceni.

    Moe ukljuivati i ureivanje povrine objekta odnosno njegovih materijalnih karakteristika: boja, sjaj, providnost, refleksija i sl., zatim dodavanje teksture, i

    dr.)

    Araniranje scene (araniranje virtuelnih objekata, svjetla, kamere i drugih objekata na sceni koji e se kasnije koristiti kod izrade nepokretne slike ili animacije. Ako se radi o animaciji ova faza se koristi za izradu kljunih okvira.)

    Renderiranje (objekat se projektira kao mrea meusobno povezanih geometrijskih oblika (kvadrata ili trouglova); zatim se dodaje materijalna

    struktura (tijelo) objekta; u treoj fazi dodaje se boja i sjaj koji ukazuju na izvor svjetlosti; konano, prikazuje se efekat objekta na okolinu, ukljuujui odraz i sjenu.)

    Animacija

    Animacija predstavlja udrueni, dinamini povezani skup grafikih elemenata/slika i nosi sva obiljeja grafikih prikaza.

    Posebne osobine animacijskih prikaza vezane su za dimenziju vremena koju kod prethodnih

    vrsta prikaza (tekst, grafika, fotografija) ne

    nalazimo. Dimenzija vremena odreuje kada e se i koji grafiki objekt/slika pojaviti i koliko e dugo trajati njegov prikaz na ekranu.

  • 31

    Zakoni kretanja u animaciji

    Animirana sekvenca sastoji se od niza crtea (kadrova) koji brzo promiu po ekranu. Veina sadri statiku sekvencu i lik (obino se naziva elijom u programima za animaciju) koji djeluje kao da se kree po sceni. Privid pokreta dobiva se crtanjem lika u razliitim poloajima u svakom okviru tako da izgleda da se on mie kad se okviri prikazuju zajedno velikom brzinom.

    Poput videa, i animacijska sekvenca treba prikazati odreen broj kadrova u svakoj sekundi ili e ljudsko oko primijetiti treperenje. Profesionalni, glatki crtani filmovi trebaju oko 30 okvira u svakoj sekundi animacije. Meutim, jednostavnija animacija treba oko 10 okvira u sekundi.

    Tipovi animacija

    1. Jednostavne animirane slike animirane GIF slike (Graphic Interchange Format) (Photoshop)

    (GIF Animator)

    2. Interaktivna animacija bez raunskog modela korisnik moe uticati na animacijski proces

    3. Interaktivna animacija sa raunskim modelom kompleksna animacija

    Klasifikacija s obzirom na prostor

    2D 3D

    Klasifikacija s obzirom na tehnologiju izvrni programi - exe Razliite web tehnologije - Java, Flash

  • 32

    Microsoft GIF animator

    Programsko okruenje u Microsoft GIF animatoru

    Kreiranje animacije pomou Microsoft GIF animatora

    - Ponavljanje animacije

    - Vrijeme trajanja okvira

    - Nain izmjene okvira

    Macromedia FLASH

    Vektorski bazirani program

    Programsko okruenje u Flash-u

    - Pozornica - Vremenska osa

    - Kutija alata

    - Biblioteka simbola

    - Paneli

    Stage (scena)

    Modifiers

    Tools (alati)

    Tim

    eline (v

    rijeme)

  • 33

    Rad u Flash-u

    Crtanje Uvezeni elementi Animacija

    animacija oblika shape tween animacija instanci simbola ili grupisanih objekata motion tween

    Maskiranje Tekst

    statika tekstualna polja dinamika tekstualna polja ulazna tekstualna polja

    Upravljanje animacijom akcije za kljuni okvir ili dugme (stop, play, goto) uvjeti za aktiviranje (press) ActionScript

    Drugi programi za rad sa 2D

    animacijama

    Swish animiranje tekst

    Swiff Chart izrada multimedijalnih grafova i dijagrama

    DEMO1

    DEMO2

  • 34

    Najpopularniji programi za 3D

    modeliranje i animacije

    Maya (Alias Wavefront)

    3D Studio Max (Discreet Logic)

    Animation:Master (Hash)

    Lightwave 3D (Newtek)

    Softimage XSI (Avid)

    Houdini (Side FX)

    Poser (Cirious Labs)

    Formati animacijskih datoteka

    Najei koriteni formati animacijskih datoteka su:

    posebna opcija slikovnog formata GIF i video formata AVI (engl. Audio Video Interleaved)

    na operativnom sistemu Windows

    format QTFF (engl. Quick Time File Format)

    format SWF (engl. ShockWave Flash)

    VRML (engl. Virtual Reality Modeling Language)

  • 35

    Audio - zvuk

    Zvuk

    Zvuk je valovita promjena pritiska zraka.

    Pojavu zvuka moemo opisati najobinijim pljeskom ruku. Kada ovjek pljesne rukama, zrak koji je bio meu dlanovima biva istisnut i na taj nain poveava se pritisak zraka u okolini ruku. Taj se poveani pritisak iri putem molekula zraka u svim smjerovima. Brzina irenja je oko 340 metara u sekundi. Kada stigne do naeg uha, odnosno bubnjia koji je osjetljiv na promjenu pritiska u zraku, ono ga registrira kao zvuk, kojeg iskustveno prepoznajemo kao pljesak ruku. Dakle, kad ne bi bilo zraka, ne bi mogli uti ni zvuk.

  • 36

    Snimanje i reprodukcija zvuka

    Za razumijevanje naina snimanja i reprodukcije zvuka bitno je shvatiti nain rada mikrofona i zvunika. Mikrofon je naprava koja promjene pritiska u zraku pretvara u struju razliitog napona, po naelu jai titraj vii napon, a zvunik radi obrnuto, on takvu struju pretvara u titranje membrane koja reproducira zvuk. Posljednjih 150 godina razvijene su razliite tehnike kojom se taj zvuk pohranjuje.

    Postoje dva razliita koncepta snimanja zvuka analogni i digitalni.

    Jo o zvuku

    Zvuk je uzrokovan promjenama u pritisku zraka koje stvaraju valni oblik koji podraava uni bubnji. Ljudsko uho uje zvune valove frekvencije izmeu 16 Hz i 20 kHz. Meutim, normalni ljudski glas je ogranien na podruje od 300 Hz do 3400 Hz.

    Za prijenos zvuka kroz mreu zvuni valni oblik se mora pretvoriti u binarni oblik (podaci u obliku bita) kroz proces koji se zove kodiranje (encoding). Zatim se ti bitovi podatka moraju integrirati u mreni transportni protokol. Takav posao rade audio codec ureaji.

    Audio (zvuk) je najvanija komponenta bilo koje videokonferencije, video streaminga ili IP telefonske aplikacije. Bitne informacije mogu se jo uvijek prenijeti samo pomou zvuka.

  • 37

    Percepcija glasnoe zvuka

    proporcionalna pritisku

    mjeri se u decibelima (dB)

    0 dB se teko uje (na 2 kHz to je granica ujnosti)

    120 dB je vrlo glasno! Izaziva bol!

    Percepcija frekvencije zvuka

    Ljudsko uho - 16Hz do 20kHz

    Percepcija se mijenja logaritamski

    npr. razlika izmeu 200Hz i 400Hz se percipira kao razlika izmeu 5kHz i 10kHz

  • 38

    Glasnoa i frekvencija zvuka

    Razliite frekvencije iste glasnoe se percipiraju kao razliite glasnoe

    Ljudsko uho je najosjetljivije na 3kHz, moemo uti vrlo tihu muziku

    Najvei raspon glasnoe je do 1kHz, zvuk mora biti glasan na niim frekvencijama da bismo ga mogli uti

    Glasnoa i frekvencija zvuka

  • 39

    Digitalizacija audio signala S obzirom da je gornja granica ujnosti 20 000 Hz, smatralo se

    da za digitalizaciju zvuka treba uzeti barem dvostruko toliko uzoraka, pa je npr. za Compact Disc (CD) taj broj odreen kao 44100 uzoraka u sekundi.

    Na CD-u se koriste 16-bitni format koji omoguava prikaz 65536 razliitih znakova. Danas se koriste 24 ili 32-bitni formati.

    Raunar koje moe obraivati zvuk mora imati ugraenu zvunu karticu. Ovisno o modelu i konfiguraciji raunara zvuna kartica moe biti ugraena u raunar ili se koristiti kao vanjska jedinica.

    Poput svih ostalih podataka i digitalizirani se zvuk u raunaru pohranjuje u datotekama. Te datoteke mogu biti razliitih formata.

    Najee koritena tehnika digitalizacije zvuka naziva se Puls Code Modulation i ukljuuje nekoliko formata datoteka kao WAV (Windows Wave Audio File Format) ili AIFF (Audio Interchange File Format).

    Kasnije su razvijeni i razni oblici komprimiranih datoteka kao MP3 koji komprimira zvuk u omjeru 10:1 uz vrlo malu degradaciju kvalitete.

    Uzorkovanje diskretni vremenski intervali

  • 40

    Kvantizacija diskretno vrijeme i vrijednosti

    Pogreka kvantiziranja

  • 41

    Parametri A/D konvertora

    samplingrate samplingsize Shannon/Nyquist-ov teorem: frekvencija uzorkovanja

    mora biti barem dva puta vea od frekvencije signala

    Kompresija audio signala

    Kompresija audio signala je neophodna radi lakeg pristupa i prijenosa audio signala, i zbog visoke cijene globalnih WAN mrea (Wide Area Network).

    Kompresija se moe definisati sa velikim brojem razliitih matematikih funkcija.

    Pulsno kodna modulacija (PCM) je najpopularnija metoda kodiranja analognog audio signala i iroko je implementirana u javnoj telefonskoj mrei. Uzorkuje analogni audio signal frekvencijom od 8000 uzoraka/sek i koristi 7 ili 8 bitnu kvantizaciju (56 kbps ili 64 kbps)

    Druge tehnike kodiranja kao to je Adaptivna diferencijalna PCM (ADPCM) koristi estimacije (procjene) temeljene na dva kvantizirana uzorka u nizu da bi smanjila zahtjev za irinom pojasa na polovicu.

  • 42

    Kodiranje audio signala

    Percepcijsko kodiranje Kod percepcijskog kodiranja

    koriste se kratkotrajne karakteristike izvornog signala i psihoakustike osobine maskiranja ljudskog uha da bi se smanjio tok podataka. Izvorni spektar dijeli se na frekvencijske pojaseve. Odgovarajua frekvencijska komponenta unutar nekog pojasa podignut e prag maskiranja u tom pojasu te okolni signali koji padnu ispod praga maskiranja nee biti ujni. Takvo se maskiranje zove i simultano maskiranje. Osim frekvencijskog, postoji i vremensko maskiranje koje nastaje prije i poslije pojave maskirajueg signala.

    Transformacijsko kodiranje Kod transformacijskog kodiranja

    blok ulaznih uzoraka se linearno transformira diskretnom transformacijom u niz transformacijskih koeficijenata. Ovi koeficijenti se zatim kvantiziraju i prenose. U dekoderu inverzna transformacija vraa signal nazad u vremensku domenu. Tipine transformacije su diskretna Fourier-ova transformacija (DFT), modificirana diskretna kosinusna transformacija (MDCT), Wavelet transformacija (WT)

    Video

  • 43

    Video

    Video odn. pokretna slika se sastoji od niza nepominih slika (okvira), prikazanih dovoljno brzo

    Frekvencija promjene slike je brzina osvjeavanja okvira (engl. frame rate) izraena u okvirima u sekundi [fps] Opaamo kretanje kao neprekinuto ako je brzina

    osvjeavanja slike od 15 fps (npr. za animaciju) do 25-30 fps (npr. za full-motion video)

    Posebne primjene, npr. 3D simulacija leta, do 60-75 fps

    ulo vida

    ulo vida je vjerovatno najvanije ulo ljudskih osjeaja

    Oko percepira intenzitet i boju

    Oko je osjetljivije na crno-bijele detalje

    Boja se ne opaa dobro ako su smanjeni uslovi osvjetljenja

  • 44

    Analogni video

    Analogni video karakterie analogni (kontinuirani)

    elektrini signal, ija amplituda i oblik sadre

    informacije o osobinama slike.

    Analogni video

    Video signal modulira jainu elektronskog topa koji red po red prolazi po ekranu i ostavlja trag

    Za mirnu sliku (bez titranja izmeu uzastopnih okvira) potrebno minimum 50 Hz, stoga se koristi preplitanje (interlace)

    Standardi za analogni video (TV) NTSC (National Television System Committee) 30 fps u SAD i

    Japanu

    PAL (Phase Alteration Line), 25 fps, u Europi, Kini i Australiji

    SECAM (Squentiel Couleur Avec Memoire), 25 fps, u Francuskoj

    (HDTV) (High Definition Television), 60 fps

  • 45

    Digitalni video

    Okvir videa digitalna nepomina slika Video telefonija, telekonferencija

    Simetrina primjena, koder i dekoder jednako sloeni Osjetljivost na kanjenje

    Digitalna TV, filmovi, DVD Asimetrina primjena, jedan koder opsluuje puno

    dekodera, dakle moe biti sloeniji Ukljuivanje u struju videa u bilo kojem trenutku

    Video preko Interneta i mobilnih mrea Relativno male brzine prijenosa Osjetljivost na greke

    Postupak kompresije videa

    Video sadri prostornu i vremensku redundanciju

    Uklanjanje prostorne redundancije Na razini svakog okvira/slike Koristi se (najee) transformacijsko kodiranje

    Uklanjanje vremenske redundancije U nizu uzastopnih okvira Koristi se slinost slika u nizu: diferencijalno kodiranje

    Pomak u slici je problem za diferencijalni koder Koristi se kompenzacija kretanja (motion

    compensation)

  • 46

    Standardi za kodiranje videa

  • 1

    Audio-vizuelna tehnologija

    Zvuk i kodiranje zvuka

    Fizikalne osnove zvuka

    Longitudinalni val titranja estica zraka Izvor zvuka stvara titranje estica (promjene pritiska) Titranje se iri brzinom v= f 340 m/s (ovisno o temperaturi i

    nadmorskoj visini)

    Lokalno titranje pritiska uzrokuje titranje struktura uha Punica ima vise od 10000 detektora osjetljivih na razne

    frekvencije; oni pretvaraju zvuk u ivane signale

  • 2

    Struktura grae uha

    Fizikalna svojstva zvuka

    Vremenska domena: valni oblik amplituda

    faza

    frekvencija

    Frekvencijska domena: frekvencijski spektar (prikazuje amplitude prema njihovim frekvencijama)

    - Harmonini spektar - harmonici (viekratnici osnovne frekvencije f, 2f, 3f, ..)

    - za govor, formanti (rezonantne frekvencije govornog trakta),

    npr:

    - a F1 660 F2 1700 F3 2400 Hz

    - e F1 530 F2 1850 F3 2500 Hz

    -u F1 300 F2 870 F3 2250 Hz

    - Kontinuirani spektar neperiodiki zvukovi ne postoje jasno istaknute frekvencije (um, buka)

  • 3

    Zvuni i bezvuni glasovi

    Primjer zvunog glasa: (a) talasni oblik; (b) frekvencijski spektar

    Primjer bezvunog glasa: (a) talasni oblik; (b) frekvencijski spektar

    Percepcija zvuka Percepcijski, ljudsko uho primjeuje visinu i glasnou zvuka

    logaritamski su vezani za fizikalne mjere

    Frekvencija (f) [Hz] visina: 20 log (f/fr) [Mel] (fr: 1000 Hz odgovara 1000 Mela) Jednake rastue korake frekvencije primjeujemo kao sve manje i

    manje korake rasta visine zvuka (100-200 Hz velika, 10000-10100 Hz neprimjetna razlika visine)

    ujno podruje 20 Hz do 20 kHz

    Amplituda (A) [Pa] Intenzitet (I) [W/m2] glasnoa: 20 log (I/Ir) [dB] (Ir je granica ujnosti) Jednake rastue korake amplitude (intenziteta) primjeujemo kao

    sve manje i manje korake rasta jaine odnosno, glasnoe zvuka

    granica ujnosti 0 dB (1*10-12W/m2)

    apat 25 dB

    uredska buka 50 dB

    razgovor 60-65 dB

    prosjeni kuni stereo ureaj ~90 dB

    granica boli 120 dB

    ozljeda bubnjia 130 dB

  • 4

    Podruje ujnosti ljudskog uha

    Izvori zvuka

    Prirodni - analogni ljudski glas (govor, pjevanje) glasanje ivotinja muziki instrumenti prirodni zvukovi, npr. um mora, vjetar, grmljavina,...

    Sintetiki obino digitalni oponaanje nekog od prirodnih zvukova, muzika na raunaru, ...

    Digitalni oblik je pogodan za pohranu, obradu i prijenos u raunarskim sistemima

    Prirodni zvukovi se stoga digitaliziraju Svrha kodiranja digitalnog zvuka: to manji zapis bez

    osjetnog gubitka kvalitete

  • 5

    Postupak digitalizacije zvuka

    1. uzorkovanje 2. kvantizacija

    vie ulaznih vrijednosti preslikava se na istu izlaznu vrijednost ime se gubi mogunost tane rekonstrukcije

    razlika stvarne i kvantizirane vrijednosti je kvantizacijska pogreka uz broj bita k dobiva se 2k razina kvantizacije openito vrijedi: vei broj bita po uzorku manje izoblienje

    kvantizacija moe biti fiksna (zadane razine) ili adaptivna (adaptivno odreene razine kvantizacije)

    3. kodiranje

    Vrste kodera s obzirom na namjenu

    uskopojasni (telefonski kanal; B = 4 kHz) prikaz zvuka s visokom tanou:

    fu = 8 kHz, 16 bita po uzorku (linearno) 128 kbit/s analogna telefonija: 300 Hz 3400 Hz

    fu = 8 kHz, 8 bita po uzorku (nelinarno, A/) 64 kbit/s

    irokopojasni ( AM radio, ISDN; videokonferencija; B = 7 kHz)

    zvuk visoke kvalitete (FM radio, televizija; B = 15 kHz) kanal 30 Hz 15 kHz

    fu = 32 kHz, 16 bita po uzorku

    zvuk visoke vjernosti (CD kvaliteta; B = 20 kHz)

    svaki kanal 20 Hz 20 kHz

    fu = 44.1 kHz, 16 ili 32 bita po

    uzorku

  • 6

    Kriteriji usporedbe kodera

    brzina kodera, bitrate (bit/s) izraava broj bita potreban za kodiranje jedne sekunde zvunog signala

    kvaliteta objektivna mjerila (klasine metode, izoblienje signala i SNR, nisu

    dobra mjerila za ljudsku percepciju rekonstruiranog signala)

    subjektivna mjerila (esto vanija od objektivnih!)

    kanjenje algoritamsko kanjenje u koderu na izvoru - koliko traje kodiranje? kod dekodiranja - koliko traje dekodiranje? sinhronizacija s ostalim medijima u multimedijskoj aplikaciji unosi

    dodatno kanjenje

    otpornost na gubitke posebno vano za prijenos preko mree

    primjenjivost na ostale zvukove koji nisu govor, npr. fax i modemske signale, te muziku

    sloenost (HW/SW) cijena izvedbe

    Subjektivna mjerila kvalitete

    Opta ocjena kvalitete - miljenje korisnika

    Mean Opinion Score (MOS)

    Degradation MOS (DMOS)

    Ocjena razumljivosti govora

    dijagnostiki testovi s parovima rijei koje slino zvue, 90% tanost smatra se toll quality

    Dynamic Rhyme Test (DRT) 96 parova engleskih rijei, npr. dune/tune, chair/care, moon/noon, .. sluaima se nudi popis i pita ih se koju rije su uli

  • 7

    Objektivne metode

    novije objektivne metode temelje se na poznavanju ljudskog slunog sistema raunaju izoblienje zvunog signala s percepcijskim teinskim faktorima ideja: izoblienja koje uho vie uje ima vei teinski faktor od

    onog manje primjetnog ili neprimjetnog

    Perceptual Evaluation of Speech Quality (PESQ) ITU-T preporuka P.862 metoda procjene subjektivne kvalitete govornih kodeka algoritam predvia subjektivnu ocjenu kvalitete degradiranog

    uzorka govora

    izlaz iz algoritma je procijenjena vrijednost MOS

    Perceptual Evaluation of Audio Quality (PEAQ) ITU-R preporuka BS.1387 algoritam za procjenu kvalitete zvuka

    Karakteristike govora vane za kodiranje

    Izvor: ljudski govorni organi Zrak iz plua prolaskom kroz govorne organe (dunik, grkljan, glasnice,

    upljine usta i nosa) stvara glas zvuni glasovi (zrak izaziva titranje glasnica; formanti) (npr. m, n, a)

    bezvuni glasovi (nema titranja glasnica; um) (npr. s, , h)

    Frekv. raspon 60 Hz - 8 kHz, dinamiki raspon 40 dB

    Prijemnik: ljudski sluni organi ujno podruje 20Hz 20 kHz, dinamiki raspon 120 dB

    Za razumljivost najvanije frekvencije 2 - 5 kHz (500-2000 Hz)

    Kvaliteta se ocjenjuje subjektivno

    Poznata anomalija: efekat maskiranja: jedan zvuni signal prekriva drugi (ovisno o relativnima glasnoama i frekvencijama)

    zvuk na nekoj frekvenciji prikriva slabije zvukove na toj i okolnim frekvencijama

  • 8

    Maskiranje zvuka

    Model govora u vremenu

    model govora u vremenu moe se opisati on-off modelom

    intervali govora prosjeno traju 800 ms - 1.2 s intervali tiine (izmeu pojedinih glasova, rijei i

    reenica) prosjeno traju 1 1.6 s ako se na izlaz kodera ne alje nita u intervalima tiine, moe

    se utedjeti do 40%

    Modeliranje govora jednostavnim Markovljevim lancem u kontinuiranom vremenu

  • 9

    Vremenska svojstva govornog signala

    govorni signal je nestacionaran (mijenja se u vremenu), ali u manjim vremenskim odsjecima (okvirima od 20 - 30 ms) moe se promatrati kao stacionaran

    govorni koderi koriste to svojstvo

    za kompresiju

    okvir-po-okvir

    algoritamsko kanjenje kod prijenosa, paket se

    alje tek kada je obraen itav okvir

    Vremenska analiza govora

  • 10

    Frekvencijska analiza govora (1)

    Frekvencijska analiza govora (2)

  • 11

    Ideje za konstrukciju kodera govora

    Svojstvo govornog signala je da ima veu vjerovatnou poprimanja manjih amplituda nego veih Uniformna kvantizacija nije optimalna Isplati se tanije kodirati manje vrijednosti od veih nelinearna

    kvantizacija daje bolju kvalitetu uz jednak broj bita po uzorku

    Postoji visoka korelacija izmeu uzastopnih uzoraka i uzastopnih okvira Uklanjanjem redundancije u signalu moe se saeti zapis

    diferencijalno kodiranje

    Na temelju poznavanja svojstava govora, tj. fiziolokih karakteristika govornog trakta, moe se napraviti model Parametri govornog modela se raunaju na temelju stvarnih uzoraka Prenose se samo parametri, a govor se rekonstruira (sintetizira) na

    temelju modela visok stepen kompresije U najnovijim koderima (npr. MPEG-4 SA) ova ideja proiruje se i na

    druge zvukove

    Koderi govora

  • 12

    Koderi valnog oblika

    Kodiranje uzoraka govora uz nelinearnu kvantizaciju

    Vee brzine, dobra kvaliteta, razvijeni za fiksnu i (kasnije doraeni) za mobilnu telefoniju

    Pulsno-kodna modulacija (PCM) preporuka ITU-T G.711 Pulse Code Modulation for voice

    frequencies (PCM)

    Adaptivna diferencijalna PCM (ADPCM) preporuka ITU-T G.726 Adaptive Differential Pulse Code

    Modulation (ADPCM); sadri zastarjelu preporuku G.721 (originalni standard)

    proirenje je ITU-T G.727 5-, 4-, 3- and 2 bits per sample embedded Adaptive Differential Pulse Code Modulation (ADPCM)

    Koderi govora

  • 13

    Koderi zasnovani na modelu

    Ideja: koder i dekoder imaju isti (parametrizirani) model govornog trakta Parametri modela se raunaju za okvire uzoraka govora

    Dekoderu se prenose parametri modela (a ne uzorci govora) te se govor sintetizira na odreditu

    Princip analize/sinteze

    postiu se vrlo male brzine

    prvi koderi, npr. LPC-10, su bili loije kvalitete, razvijeni za sisteme ograniene namjene, npr. robotika, sigurna telefonija

    noviji koderi, npr. CELP na malim brzinama postiu dobru kvalitetu, ali su raunski sloeniji

    Malo istorije

    Kempelen Farkas/ Wolfgang von Kempelen (1734-1804)

    govorni stroj govorni trakt simuliran pomou cijevi

    Prvi zabiljeeni pokuaj umjetne proizvodnje govora

    Homer Dudley, Bell Labs, 1939

    Channel vocoder (voice coder)

    Model govornog trakta s filterima

    Prethodnik dananjih kodera govora, postavlja osnovne principe

  • 14

    Ljudski govorni organi

    Model proizvodnje govora

    Simulacija govornog

    trakta na raunaru

  • 15

    Primjeri kodera zasnovanih na

    modelu preporuka ITU-T G.728 Low Delay CELP

    (LDCELP) 16 kbit/s, MOS 4, algoritamsko kanjenje samo 0,625

    ms

    preporuka ITU-T G.729 Conjugate Structure Algebraic CELP (CS-ACELP) 8 kbit/s, MOS 4, kanjenje 15 ms

    preporuka ITU-T G.723.1 Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s 5.3 i 6.3 kbit/s, MOS 3.8 pogodan za Internet telefoniju

    Primjeri kodera zasnovanih na

    modelu

    ETSI GSM 06.10: Full Rate codec na 13 kbit/s u upotrebi u veini GSM 900 and PCS 1800 mrea

    Regular Pulse Excitation LPC with Long Term Prediction (RPE-LTP) koder

    ETSI GSM 06.60: GSM Enhanced Full Rate na 12.2 kbit/s Algebraic Code-Excited Linear Prediction (ACELP)

    osnova i za sjevernoameriki TDMA IS-136, kao i za ITU-T G.729

    ETSI GSM 06.20: GSM Half Rate na 5.6 kbit/s Vector-Sum Excited Linear Prediction (VSELP)

  • 16

    Koderi valnog oblika Vs koderi

    zasnovani na modelu

    Fox PCM

    193 KB

    Fox ADPCM

    99 KB

    Govor PCM

    156 KB

    Govor- ADPCM

    40 KB

    Govor i zvuk - LPC

    Koderi zvuka u frekvencijskoj

    domeni Koderi zvuka u frekvencijskoj domeni nisu ogranieni na govor; imaju dobra

    svojstva za bilo kakve zvukove npr. muziku Koriste podpojasno kodiranje (podjela na frekvencijske podpojase prije kodiranja)

    Koriste efekt maskiranja uz jaki signal na nekoj frekvenciji uho ne moe uti slabiji signal na bliskoj

    frekvenciji

    osim u zadanom trenutku, maskiranje ima utjecaj i u vremenu (prije/poslije)

  • 17

    Standardi za kodiranje zvuka

    Standardi imaju veliku ulogu u kompresiji zvunih signala jer osiguravaju kompromis izmeu onoga to je teorijski omogueno s jedne strane, i onoga to je tehnoloki ostvarivo s druge strane.

    Standardi se openito dijele na otvorene i vlasnike.

    Otvorene standarde izdaju meunarodne standardizacijske organizacije, kao to su ISO, IEC ili ITU.

    Vlasniki standardi nastaju saradnjom istraivakih i industrijskih institucija, kao to su Phillips, Thomson Consumer Electronics, Fraunhofer Institute ili Dolby.

    U nastavku su ukratko opisani neki od najpoznatijih otvorenih i vlasnikih standarda za kompresiju zvunog signala.

    Pregled nekih kodera govora i zvuka

  • 18

    MPEG standardi

    Budui da su karakteristike ljudskog vida i sluha veoma razliite, za kompresiju zvuka se koriste potpuno drugaiji algoritmi kompresije od kompresija video signala. Uho ima puno vei dinamiki opseg i rezoluciju ali je "sporije".

    MPEG je preporuio 3 naina kompresije: Layer-1, Layer-2 i Layer-3. Svaki sljedei layer je kompatibilan sa svim niim i zahtijeva sloeniji koder ali daje bolje performanse (kvalitet zvuka prema potrebnoj brzini prijenosa).

    MPEG audio za oba MPEG-1 and MPEG-2 je audio CD-kvalitete, pohranjujui dva kanala 16-bitnog zvuka uzorkovanog na 32 kHz, 44.1 kHz ili 48 kHz. MPEG komprimira audio uglavnom tako da uklanja frekvencije koje su sline, ili "iza" ciljane frekvencije. Taj proces se naziva maskiranje, i teko se razlikuju rezultati tog procesa od originala.

    MPEG Audio

    MPEG - Moving Picture Expert Group (ISO/IEC JTC1/SC29/WG11) MPEG-1

    Dva audio kanala fu = 44.1 kHz (isto kao CD), 32 kHz, 48 kHz (isto kao DAT) Brzine od 8-16 kbit/s do 320 kbit/s MPEG Audio Layer -1, -2, -3: razine kodiranja rastue sloenosti Koristi se percepcijsko kodiranje

    MPEG-2 Isti osnovni koder kao MPEG-1 Pet audio kanala + niskofrekventni kanal Uz MPEG-1 jo i fu = 16 kHz, 22.05 kHz, 24 kHz AAC Advanced Audio Codec, dodan kasnije

    MPEG-4 AAC, dva kodera za govor, strukturirani audio, ...

  • 19

    MPEG-1

    MPEG-1 omoguava prijenos 2 audio kanala. To mogu biti 1 ili 2 mono signala, stereo ili zajedniki stereo (joint stereo).

    Kod obinog (l/r) stereo signala jedan kanal prenosi lijevi, a drugi prenosi desni kanal.

    Joint stereo moe biti intensity stereo ili m/s stereo.

    Intensity stereo omoguavaju layer-2 i layer-3 sheme kodiranja, a realizira se tako da komponente lijevog i desnog

    kanala frekvencije vee od 2 kHz kombiniraju u jedan signal, a prenosi se i boni pojas.

    M/s stereo omoguava samo layer-3 shema kodiranja, a realiziran je tako da jedan kanal prenosi sumu l+r, a drugi

    razliku signala l-r.

    MPEG-2

    MPEG-2 omoguava prijenos vrlo malim brzinama (od 8kbps) uz frekvencije uzorkovanja 16 ili 24 kHz.

    Takoer omoguava i prijenos do 5 glavnih audio kanala (lijevi, srednji, desni, lijevi surround, desni surround) i 1

    dodatni niskofrekfencijski (LFE-Low Frequency

    Enhacement).

  • 20

    MPEG-4

    MPEG-4: Standard razvijen za aplikacije koje zahtijevaju malu brzinu prijenosa (videotelefonija). Video i audio

    signal se opisuje audiovizualnim objektima (prirodni i

    kompjuterski generirani) i vezama meu njima.

    Brzine prijenosa o kojima govori MPEG-4 standard su izmeu 5 i 64 kbps za primjenu u telekomunikacijskim mreama pa do 2 Mbps za TV/filmsku industriju.

    Koder MP3

    Primjer konkretnog percepcijskog kodera je koder MP3 (MPEG Audio1 Layer 3).

    Podjela na podpojase vri se u dva koraka prvi u 32 podpojasa, potom jo svaki u 18 finijih podpojasa za ukupno njih 576.

    Ovaj koder radi brzinama od 8 kbit/s do 160 kbit/s i frekvencijama uzorkovanja od 16 kHz do

    48 kHz. Moe raditi s konstantnom ili s promjenjivom brzinom kodiranja.

  • 21

    ITU-T standardi

    ITU

    oznaka Audio frekvencija Brzina prijenosa

    Codec

    algoritam Komentar

    G.711 300 Hz - 3.4 kHz 56 kbit/s , 64 kbit/s PCM

    Jednostavna

    amplitudna

    kompresija. iroko primjenjen u

    PSTN.

    G.728 300 Hz - 3.4 kHz 16 kbit/s

    LD-CELP

    (Low-Delay

    Code-Excited

    Linear

    Prediction)

    Slina kvaliteta k a o G . 7 1 1 .

    V i d e k o n f e r e n c i j e

    s a m a l o m b r z i n o m

    p r i j e n o s a .

    G . 7 2 2 5 0 H z - 7 k H z

    4 8 k b i t / s , 5 6 k b i t / s ,

    6 4 k b i t / s

    A D P C M

    B o l j a k v a l i t e t a o d

    G . 7 1 1 .

    V i d e o k o n f e r e n c i j e

    s a v e l i k o m

    b r z i n o m p r i j e n o s a .

    G . 7 2 3 . 1 3 0 0 H z - 3 . 4 k H z 5 . 3 k b i t / s , 6 . 3 k b i t / s

    A C E L P ( 5 . 3 ) ,

    M P - M L Q ( 6 . 3 )

    P r i b l i n o

    t e l e f o n s k a

    k v a l i t e t a . O s n o v n i

    c o d e c V o I P

    f o r u m a .

    G . 7 2 9 i

    G . 7 2 9 A

    3 0 0 H z - 3 . 4 k H z 8 k b i t / s C S - A C E L P

    M a n j a l a t e n c i j a i

    n e z n a t n o b o l j a

    k v a l i t e t a o d

    G . 7 2 3 . 1 . N o v i j e

    V o I P a p l i k a c i j e .

    Standard G.711

    ITU je standardizirao PCM kao G.711 koji omoguava kodiranje audio signala (govor) telefonske kvalitete sa irinom pojasa 3.1 kHz za prijenos brzinom od 56 kbps do 64 kbps.

    G.711 koristi A-law ili -law (varijante osnovne metode PCM kodiranja koje uljuuju nelinearnu kvantizaciju tj. kvantizaciju sa promjenjivim ili

    nelinearnim kvantizacijskim nivoima) kompresiju

    amplitude i osnovni je uslov za veinu ITU multimedijskih komunikacijskih standarda.

  • 22

    Standard G.728

    G.728 kodira audio signal (govor) telefonske kvalitete sa irinom pojasa 3.1 kHz za prijenos brzinom od 16 kbps.

    Obino se koristi u videokonferencijskim sistemima koji rade sa 56 kbps ili 64 kbps.

    Sa veim raunskim zahtjevima G.728 omoguava kvalitetu G.711 na 1/4 zahtijevane brzine prijenosa podataka.

    Standard G.722

    G.722 daje standard za kodiranje audio signala sa irinom pojasa od 7 kHz koji daje audio kvalitetu slinu AM radiju.

    Koristi adaptivni diferencijalni PCM (ADPCM) za kodiranje 7 kHz audio signala za prijenos brzinama od 48 kbps, 56 kbps ili 64 kbps.

    Budui da je G.722 znaajno bolji od G.711, a zahtijeva samo malo veu procesnu mo, koristi se za videokonferencijske aplikacije preko mrenih veza sa brzinom od 384 kbps.

  • 23

    Standard G.723.1

    G.723.1 definira kako se audio signal (govor) sa irinom pojasa 3.1 kHz moe kodirati za prijenos na brzinama od 5.3 kbps i 6.3 kbps. G.723.1

    zahtijeva vrlo malu brzinu prijenosa podataka

    dok prenosi audio signal priblino telefonske kvalitete.

    G.723.1 je odabran od strane Voice over IP (VoIP) foruma kao osnovni kodek za VoIP

    aplikacije niske brzine prijenosa podataka.

    Standardi G.729 i G.729A

    Postavi slubenim ITU standardima u 1996.godini, G.729 i G.729A kodiraju audio signal (govor) priblino telefonske kvalitete sa irinom pojasa 3.1 kHz za prijenos brzinom od 8 kbps.

    G.729A zahtijeva manju procesnu mo nego G.729 i G.723.1. G.729 i G.729A imaju manje kanjenje nego G.723.1.

    Oekuje se da e G.729A imati glavnu primjenu u kompresiji glasa za prijenos preko beinih mrea.

  • 24

    Koderi govora u mobilnim mreama ETSI standardi

    Efektivnost kodera govora se jako poboljala u proteklih nekoliko godina.

    GSM mree sada imaju enhanced fullrate (bolji kvalitet) i halfrate kodere (manje propusnog opsega sa skoro istom kvalitetom).

    AMR koderi

    Adaptive Multi-Rate (AMR) kodiranje govora bazirano je na ACELP (Algebraic Code Excited Linear Prediction) principima.

    Podrano je 8 bitskih brzina: 12.2 (GSM enhanced full rate), 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 i 4.75 kbps.

    3GPP (Third Generation Partnership Project) je odabrao AMR kao uskopojasni govorni koder i G.722.2 AMR-WB kao irokopojasni govorni koder za UMTS Release 5.

  • 25

    UMTS AMR i AMR-WB koderi

    AMR i AMR-WB koderi su prvobitno bili dizajnirani za mobilne radio sisteme sa

    komutacijom kanala.

    Zbog njihove fleksibilnosti i robusnosti, oni su takoer pogodni za druge real-time govorne komunikacijske usluge paketskih

    mrea kao to je na primjer Internet.

    UMTS AMR koder

    AMR je multimodni koder koji podrava 8 uskopojasnih govornih kodnih modova sa

    bitskim brzinama izmeu 4.75 i 12.2 kbps.

    Ime uskopojasni koder dolazi od frekvencije uzorkovanja od 8 KHz koja se koristi u AMR-u.

    Kodiranje se provodi na govornim okvirima od 20 ms. Stoga svaki kodirani AMR govorni okvir

    reprezentira 160 uzoraka originalnog govora.

  • 26

    UMTS AMR-WB koder

    Slino AMR koderu, AMR-WB je takoer multimodni govorni koder. AMR-WB podrava 9 irokopojasnih govornih kodnih modova sa respektivnim bitskim brzinama koje se proteu od 6.6 do 23.85 kbps.

    Ime irokopojasni koder dolazi od 16 KHz frekvencije uzorkovanja koja se koristi u AMR-WB koderu.

    Procesiranje govora se vri na okvirima od 20 ms. To znai da svaki AMR-WB kodirani okvir reprezentira 320 govornih uzoraka.

    Poto je ova kodna tehnika primjenjiva i u ianim i beinim platformama, interoperabilnost izmeu 3G beinih infrastruktura i fiksnih IP mrea moe biti mnogo jednostavnije realizovana.

    Zadatak 3

    Va je zadatak meusobno uporediti odabrane audio kodere s obzirom na brzinu (bitrate) i

    subjektivnu kvalitetu.

    Presluajte sve verzije datoteke Fox i popunite tablicu iz word dokumenta. Za ocjenu

    subjektivne kvalitete koristite ocjene od 1-10 ili

    neko od mjerila (MOS, DMOS) spomenuta na

    predavanjima.

    Usporedite veliine datoteka i ocjene njihove subjektivne kvalitete, ta zakljuujete?

  • 27

    Vlasniki standardi za kodiranje zvuka

    Standardi Dolby AC-2 i AC-3

    Dolby laboratoriji bili su aktivni u razvoju standarda MPEG, ali su razvili i svoje metode kodiranja pod

    imenima AC-2 i AC-3.

    Standard MIDI

    Nastao je saradnjom proizvoaa muzikih instrumenata, kao to su Roland, Yamaha, Korg, Kawai i drugih. Ovaj standard se ne zasniva na

    prenoenju talasnog oblika zvunog signala nego digitalnog opisa izvoenja muzike u obliku poruka MIDI. Poruka se sastoji od statusnog okteta za kojim

    slijede jedan ili dva okteta podataka.

  • 1

    Audio-vizuelna tehnologija

    Nepomina slika

    Informacijska svojstva i kodiranje

    nepomine slike

    Izvori digitalne slike

    Ljudski vid i percepcija slike

    Raunarski prikaz slike

    Principi kodiranja slike

    Kodiranje bez gubitaka

    Kodiranje sa gubicima

  • 2

    Digitalna slika

    Digitalna slika je vrsta zapisa koji je prikazan u binarnoj formi i sastoji se od logikih nula i jedinica.

    Pod slikom se podrazumijeva nepokretna slika koja se ne mijenja u vremenu.

    Obrada slike ima iroko podruje primjene: astronomija, meteorologija, seizmologija,

    navigacija, oceanografija, radar, fizika estica, mikroskopi, radiologija, itd.

    Podruja primjene obrade slike

  • 3

    Digitalna (nepomina, 2D) slika

    Slika iz stvarnog svijeta (u digitalnom obliku): slika snimljena digitalnom kamerom

    slika prenesena na raunar preko optikog itaa (scanner)

    ...

    Slika stvorena pomou raunara: crte (vektorska grafika)

    slika (obraena digitalna slika, bitmap, raunarska grafika)

    fraktalna slika

    graf

    vizualizacija

    ...

    Slika kao jedinica unutar animiranog filma ili videa

    Percepcija slike Vidljiva svjetlost = dvojne prirode elektromagnetski val (i roj fotona)

    = 330 - 770 nm, c 3x108 m/s (ovisno o gustoi medija)

    tri svojstva boje koje ljudsko oko raspoznaje su obojenost (hue), koja zavisi od osnovne frekvencije tj. talasne duine svjetlosti, zasienost (saturation), koja se moe shvatiti kao istoa boje (obr. prop. irini frekvenc. pojasa) i svjetlina (brightness), koja odgovara amplitudi talasa

    to je osnova za HSB model boja u raunarskoj grafici (prikazuje se cilindrinim koordinatnim sistemom, gdje ugao izraava obojenost, poluprenik zasienje, a visina svjetlinu)

  • 4

    Anatomija ljudskog oka Slika se fokusira na mrenicu (lat. retina) pomou lee. Mrenica

    predstavlja podruje za detektiranje slike koje je prekriveno fotoreceptorskim elijama. arenica (lat. iris) kontrolira otvor lee i time upravlja koliinom svjetlosti koja ulazi u oko i koju zatim apsorbiraju fotoreceptorske elije. Iris je prstenasti organ koji se nalazi izmeu ronice i lee, a u svom sreditu ima okrugli otvor zjenicu. Mrenica se sastoji od niza unjia i tapia.

    tapii i unjii Obje vrste su duine otprilike 1/25 mm i debljine 1/500 mm. tapii su osjetljivi na svjetlinu, a ne detektiraju boju. tapii

    omoguavaju vid pri slaboj svjetlosti i osjetljivost na pokrete, no imaju slabu vizuelnu preciznost i ne omoguavaju dobru percepciju detalja.

    unjii omoguavaju vid u boji i dobru percepciju detalja. Postoje tri vrste unjia od kojih je svaka osjetljiva na odreene talasne duine koje odgovaraju crvenoj ( unjii), plavoj ( unjii) i zelenoj ( unjii). Najvea koncentracija unjia je u podruju na mrenici koje se naziva fovea centralis, te je stoga to podruje najotrijeg vida. Zbog toga otro vidimo samo u sredini vidnog polja, a sa strane slika je mutna. U podruju fovea centralis nema tapia. To je razlog da nou bolje vidimo malo sa strane nego u sredini vidnog polja.

  • 5

    Ljudski vid

    Digitalizacija slike

    Signal slike je po svojoj prirodi analogan. Takav signal se mora konvertirati u digitalni oblik da bi se mogao obraivati u digitalnom domenu. Digitalizacija signala se odvija preko dva procesa -

    uzorkovanja i kvantizacije.

  • 6

    Raunarski prikaz slike

    slika se promatra kao matrica obojenih taaka, odn. piksela pixel = picture element

    razlikujemo pixel slike od pixela ureaja (device pixel, dot)!! Npr: printer 600 dpi: kvadrat sa stranicom 1/600" video monitor rezolucije 1280x1024 piksela (ukupan broj taaka ureaja)

    rezolucija slike = dimenzija matrice piksela N1xN2 dubina slike = broj bita (d) za opis piksela (odn. boje svakog piksela)

    boja = varijabla koja opisuje piksel modeli boje za sliku: RGB, CMY, HSB, HSI, ... modeli boje za video: YUV, YIQ, ...

    Modeli boje za sliku

    RGB: Red Green Blue

    (Crvena Zelena - Plava)

    svjetlo, zbrojive boje

    TV ekran, monitor

    CMY:

    Cyan, Magenta, Yellow

    (Svijetlomodra Ruiasta- uta)

    pigment, oduzimljive boje

    tampa

    Boja je varijabla koja opisuje piksel!

  • 7

    Modeli boje za sliku

    U svakom od ovih modela boja se prikazuje kao kombinacija triju komponenti boje. Ove tri komponente se kombiniraju uz pomo teinskih faktora koji se izraavaju brojevima 0-255 ili realnim brojevima 0-1.

    RGB su zbrojive boje, a CMY oduzimljive. Model zbrojivih boja se koristi za sluajeve kada se svjetlost emitira,

    te se komponente zbrajaju. Zbrajanjem maksimuma svih triju

    komponenti dobiva se bijela boja.

    Model oduzimljivih boja dobro prikazuje situaciju boje na papiru, gdje svaka komponenta djeluje kao filter i oduzima dio spektra iz

    bijele svjetlosti. Dodavanjem komponenti boje oduzima se sve vie iz bijele svjetlosti, te ako se kombinuje maksimum sve tri

    komponente oduzeo bi se itav spektar i dobiva se crno.

    Model boje RGB

    Format boje RGB se zasniva na tri

    komponente boje:

    crvene R (700.0 nm),

    zelene G (546.1 nm) i

    plave B (435.8 nm).

    Svaka komponenta boje odgovara odreenoj talasnoj duini vidljivog spektra.

    Tri komponente boje mogu se promatrati kao

    tri koordinate vektora.

    Crna je (0,0,0), a bijela (1,1,1). Sve nijanse sive se nalaze na ovoj dijagonali

    izmeu crne i bijele.

  • 8

    Slika i njene RGB komponente

    Model boje CMY Format boje CMY (engl. Cyan, Magenta, Yellow) koristi tirkiznu C,

    purpurnu M i utu Y boju kao primarne boje. Ovaj format boje se koristi u substraktivnoj reprodukciji, na primjer kod tampaa. U praksi se mijeanjem punih intenziteta tirkizne, purpurne i ute nee dobiti prava crna boja, jer zasienje te crne boje nije dovoljno. Crna boja je veoma vana za ljudsku percepciju, tako da se uz ove tri boje dodaje jo i crna K (engl. black). Takav prostor boje se zove CMYK i koristi se kod etverobojnih tampaa.

  • 9

    Model boje HSB/HSV

    Ljudi opisuju boju njenim percepcijskim atributima, a postoje

    dva modela boja koja odvajaju

    intenzitet od kromatskog dijela. To su

    modeli boje: HSB (engl. Hue,

    Saturation, Brightness) - ton,

    zasienost, sjajnost (svjetlina) i HSV (engl. Hue, Saturation, Value) - ton,

    zasienost, vrijednost. Ton boje varira po krunici od zelene do

    plave i dalje i protee se od 0 do 360 stepeni, gdje 0 oznaava zelenu, 240 stepeni plavu, itd.

    Zasienje boje varira od 0 do 100%, a naziva se i istoom boje, odnosno nivo sivila koje je prisutno u boji.

    Vrijednost ili sjajnost (svjetlina) varira od 0 do 100%.

    Standardi za kodiranje nepomine slike

    brojni vlasniki i otvoreni standardi, npr:

    BMP (Bitmap)

    XBM (X11 Bitmap)

    GIF (Graphics Interchange Format)

    PNG (Portable Network Graphics)

    TIFF (Tagged Image File Format)

    JPEG (Joint Photographic Expert Group)

    JPEG 2000

  • 10

    Kodiranje slike zasniva se na:

    Statistikim karakteristikama slike (i metodama entropijskog kodiranja): kodiranje bez gubitaka

    Karakteristikama ljudskog sistema vida: kodiranje s neprimjetnim gubicima

    Saimanju manje vanih elemenata slike prema nekom kriteriju: kodiranje s vidljivim gubicima

    Obino se radi o kombinaciji ovih ideja (npr. JPEG koristi transformacijsko, slijedno i

    Huffmanovo kodiranje)

    Kodiranje bez gubitaka

    Koriste se metode entropijskog kodiranja Slijedno kodiranje

    Telefax (starija verzija)

    Huffmanovo kodiranje Telefax

    LZW metoda (metode rjenika) GIF (Graphics Interchange Format) bez gubitaka ako se

    koristi do 256 boja; pogodan za raunarsku grafiku

    Huffmanovo kodiranje i LZ77 PNG (Portable Network Graphics)

  • 11

    Kodiranje sa gubicima

    Moe se koristiti karakteristikama ljudskog vida i postii puno vei omjer kompresije od kodiranja bez gubitaka

    Koriste se hibridne metode kodiranja (jedna ili vie metoda izvornog i entropijskog kodiranja)

    Kodiranje sa gubicima

    Diferencijalno (prediktivno) kodiranje

    Transformacijsko kodiranje

    JPEG (transformacijsko, slijedno i Huffmanovo kodiranje)

    Kodiranje valiima (wavelets)

    JPEG 2000

    Fraktalno kodiranje

  • 12

    Diferencijalno (prediktivno)

    kodiranje slike

    Princip: vrijednost sljedeeg signala (piksela) predvia se iz prethodnih vrijednosti, te se kodira razlika stvarnog i predvienog

    Raspon amplituda diferencijalnog signala je

    povoljniji za kodiranje od originalne slike

    Primjer: slika i njen histogram

    Histogram prikazuje uestalost pojavljivanja odreenih vrijednosti svjetline u slici

    Vrijednosti boje se kreu u rasponu 0 (crna) do 255 (bijela) Podjednaka raspodjela vrijednosti visoka entropija signala Direktnim entropijskim kodiranjem moe se postii 7 bit/pixel

  • 13

    Signal razlike Prikazan je signal razlike za sliku iz primjera uz jedan stepen

    predvianja svodi se na razliku susjednih piksela

    Neke vrijednosti ovakvog signala razlike se oito pojavljuju esto (velike sive povrine na slici), a sve ostale rijetko

    Sve vrijednosti se nalaze u intervalu [-50, 50], s najveom koncentracijom vrijednosti oko nule nejednoliki raspored pojavljivanja smanjuje entropiju Entropijskim kodiranjem dobiva se 2.6 bit/pixel! Kompresija entropijskim kodiranjem bez gubitaka

    Svojstva diferencijalnog kodiranja

    + Jednostavna implementacija

    + Moe biti bez gubitaka (ovisno o tome da li se upotrebljava kvantizacija)

    - Postie se relativno slaba kompresija

  • 14

    Transformacijsko kodiranje slike

    Poruka se pretvara u oblik pogodniji za kompresiju

    Signal se transformira u prostorno-frekvencijske komponente, te se one kodiraju

    Neke frekvencijske komponente slike pojavljuju se puno vie od ostalih, to rezultira dobrim kodiranjem

    Metoda razvijena 70-tih godina

    iroka primjena kroz JPEG standard (ITU & ISO) intraframe hibridna kodna metoda

    JPEG = Joint Photographic Experts Group

    Primjer Izvorna slika se 2DFT

    transformacijom pretvara u

    frekvencijske komponente, na taj

    nain da se slika interpretira kao funkcija dviju varijabli I=f(x,y), gdje su

    x i y kooridinatne take u slici, a I vrijednost svjetline u toj taki.

    Na funkciju f primjenjuje se DFT transformacija bez kompresije.

    Najjae zastupljene nie frekvencijske komponente one u sredini grafa.

    Dole desno slika u frekvencijskoj domeni uz odbaene vie frekvencijske komponente kompresija.

    U rekonstruiranoj slici detalji poneto zamueni, to je posljedica nestanka viih frekvencijskih komponenti.

  • 15

    Metode kompresije slike

    Metode kompresije slike Kompresija slike se zasniva na razliitim metodama koje koriste statistika

    svojstva slike i prostornu redundantnost sadranih informacija.

    Redundantnost informacija u slici postoji zbog znaajne prostorne korelacije piksela. Statistika redundantnost se moe otkloniti koritenjem metoda entropijskog kodiranja koje omoguavaju kompresiju bez gubitka. Metode kompresije bez gubitaka omoguavaju perfektnu rekonstrukciju originalne slike, dok kod metoda s gubicima rekonstruirana slika odstupa od originalne

    slike ovisno o stepenu kompresije.

    Metode kompresije s gubicima omoguavaju vei omjer kompresije i stoga se ee primjenjuju. Najee se koriste hibridne metode za kompresiju slika koje kombiniraju metode kompresije s gubicima i metode kompresije

    bez gubitka kako bi se postigao optimalan rezultat.

    Subjektivna redundantnost se javlja zbog nesavrenosti ljudskog vizuelnog sistema. Statistika i subjektivna redundantnost nisu u direktnoj korelaciji. Transformacijsko kodiranje ima za cilj iskoristiti neke od osobina ljudskog

    vizuelnog sistema. Ljudski vizuelni sistem je osjetljiviji na nisku prostornu

    frekvenciju, tako da se kod kompresije slike mogu odbaciti neke vie frekvencije.

  • 16

    Standard JPEG

    Standard JPEG je meunarodni standard za kompresiju monokromatskih slika i slika u boji. S

    obzirom na zahtjeve da se zadovolji irok opseg razliitih slika, ovaj standard se zasniva na dvije osnovne metode:

    metoda zasnovana na diskretnoj kosinusnoj transformaciji DCT je namijenjena za kompresiju s

    gubicima. Ova metoda ima iroku primjenu.

    metoda predikcijskog kodiranja se koristi za kompresiju bez gubitaka.

    JPEG (Joint Photographic Experts Group)

    ISO standard 10918-1

    Zasniva se na diskretnoj kosinusnoj transformaciji blokova slike (8x8 piksela)

    Svaki blok se transformira sa DCT

    Koeficijenti se kvantiziraju i entropijski kodiraju

  • 17

    Svojstva slike u frekvencijskoj

    domeni

    Frekvencijske komponente na niim frekvencijama su izraenije od onih na viim frekvencijama

    Prva etiri koeficijenta u primjeru opisuju gotovo cijelu sliku

    Visoke frekvencije izraavaju zaista sitne detalje u slici

    Doprinos lanova na viim frekvencijama je mali kada su razlike susjednih piksela relativno male, dakle kada slika

    ne sadri puno detalja

    Za veinu slika, ovo je zaista sluaj, te se na tom svojstvu zasniva JPEG kompresija (i druge metode

    transformacijskog kodiranja)

    Blok shema JPEG kodera

  • 18

    JPEG primjer

    Slika 516 x 516 taaka

    Kompresija 1:16 (0.5 bit/pixel)

    Originalna slika JPEG kodirana slika

    Svojstva transformacijskog

    kodiranja

    + Visoka kompresija

    (odlina kvaliteta slike do 0.25 bit/pixel)

    + Kvaliteta se moe regulirati

    - Pri veim kompresijama postaju vidljive granice blokova

  • 19

    Standard JPEG 2000

    Standard JPEG je bio u upotrebi ve deset godina kada se pojavila inicijativa za razvoj novog standarda za kodiranje slika koji e odgovoriti na sloene zahtjeve skalabilnosti i interoperabilnosti u mrenom i mobilnom okruenju. Ideja o razvoju novog standarda za kompresiju nepokretnih slika JPEG 2000 pojavila se 1997. godine.

    Zamiljeno je da JPEG 2000 bude novi sistem kodiranja namijenjen razliitim tipovima nepokretnih slika (s dva nivoa, sive, obojene, multikomponentne) s razliitim svojstvima (prirodne, naune, medicinske, itd.) uz razliite modele (klijent/server, prijenos u realnom vremenu, biblioteka slika, ogranieni resursi spremnika i propusni opseg, itd.).

    Razvoj standarda se odvijao unutar grupe JPEG. Cilj razvoja novog standarda nije bio zamjena, ve nadopuna i prevazilaenje nedostataka standarda JPEG.

    JPEG 2000

    Koristi kodiranje valiima (wavelet coding) - diskretna wavelet transformacija DWT

    (engl. Discrete Wavelet Transform)

    Zasniva se na podpojasnom kodiranju frekvencijske komponente manje vanosti kodiraju se manjim brojem bita

  • 20

    JPEG 2000 koder i dekoder

    Koraci kompresije prema standardu JPEG2000 su: podjela slike na blokove, wavelet transformacija,

    kvantizacija, kodiranje ravni bita i entropijsko kodiranje.

    Nakon toga, slijedi paketizacija.

    Kodiranje valiima: svojstva Visoka kompresija (25-30% vea od

    JPEG)

    Prirodna distorzija (zamuenost)

    Prednosti u odnosu na transformacijsko kodiranje:

    Manja sloenost

    Nema blok efekta

    Mogunost progresivnog primanja i stvaranja slike

    Osnova novog standarda JPEG 2000

  • 21

    JPEG 2000 vs JPEG (1/2)

    Vei dinamiki raspon (16-32 bit/pixel)

    Bolja kompresija (25-30% manje podataka)

    Progresivno slanje podataka

    Kodiranje bez gubitaka prema podrujima interesa (Region-of-interest ROI)

    Meunarodni standard 2001. godine

    JPEG 2000 vs JPEG (2/2)

    Usporedba rezultata uz jednaku kompresiju 1:64

  • 1

    Audio-vizuelna tehnologija

    Video

    Informacijska svojstva i kodiranje

    videa

    Osnovna svojstva videa

    Analogni i digitalni video, primjene

    Modeli boje za video, formati

    Postupak kompresije videa

    Evolucija standarda za kodiranje videa

  • 2

    ulo vida

    ulo vida je vjerovatno najvanije ulo ljudskih osjeaja

    Percepcija intenziteta i boja

    Oko je osjetljivije na crno-bijele detalje

    Boja se ne opaa dobro ako su smanjeni uslovi osvjetljenja

    Slike u pokretu

    Perzistencija ula vida: sukcesivno prikazane slike (15 do 20 u sekundi)

    stvaraju iluziju kretanja

    Manji broj okvira treperenje slike (engl. flickering), poveanjem broja okvira dobija se pokret bez prekida

  • 3

    Video se sastoji od vremenski ureenih nizova slika.

    Video matematiki moemo prikazati kao signal:

    I(x,y,t)

    Video - slike u pokretu

    Video

    Video odn. pokretna slika se sastoji od niza nepominih slika (okvira), prikazanih dovoljno brzo

    Frekvencija promjene slike je brzina osvjeavanja okvira (engl. frame rate) izraena u okvirima u sekundi [fps] Opaamo kretanje kao neprekinuto ako je brzina

    osvjeavanja slike od 15 fps (npr. za animaciju) do 25-30 fps (npr. za full-motion video)

    Posebne primjene, npr. 3D simulacija leta, do 60-75 fps

  • 4

    Razlika ...

    Poreenje videa sa razliitim fps

    Movies: 24 fps

    TV:

    American: 30 fps

    European: 25 fps

    HDTV: 60 fps

    Filmovi rade na sljedei nain ...

    24 fps

    ali: svaki okvir je osvijetljen dva puta

    Odnos irina/visina (aspect ratio - format slike, veliina kadra) je 16:9

    ira slika se postie specijalnom optikom (Cinemascope, Panavision)

  • 5

    Analogni video

    Analogni video karakterie analogni (kontinuirani)

    elektrini signal, ija amplituda i oblik sadre

    informacije o osobinama slike.

    Analogni video

    Video signal modulira jainu elektronskog topa koji red po red prolazi po ekranu i ostavlja trag

    Za mirnu sliku (bez titranja izmeu uzastopnih okvira) minimum 50 Hz, stoga se koristi preplitanje (interlace)

    Standardi za analogni video (TV) NTSC (National Television System Committee) 30 fps u SAD i

    Japanu

    PAL (Phase Alteration Line), 25 fps, u Europi, Kini i Australiji

    SECAM (Squentiel Couleur Avec Memoire), 25 fps, u Francuskoj

    (HDTV) (High Definition Television), 60 fps

    Naalost, ne postoji kompatibilnost izmeu standarda

  • 6

    Digitalni video ureaji moraju da odgovaraju standardima ranije utvrenim za TV ureaje.

    Digitalni standardi moraju zadrati kompatibilnost u odnosu na standarde za

    analogne ureaje.

    TV video standardi

    Osnovi standarda za TV:

    Svaki okvir je podijeljen na dva polja

    Parne i neparne linije

    Polja se prenose jedno za drugim

    Okvir je sainjen od isprepletenih polja

    TV video standardi

  • 7

    Interlacing-preplitanje

    Koristi se zbog nesavrene elektronike u analognom TV

    ureaju.

    Brzina okvira se sinhronizira na polovinu frekvencije

    struje.

    Parne linije skenirane u jednom polu-okviru, a

    neparne linije u drugom.

    50 ili 60 polu-okvira u sekundi (half-frames per

    second).

    TV video standardi Analogni

  • 8

    Digitalni video

    Digitalni video skup digitaliziranih slika, koje se prikazuju dovoljnom brzinom okvira u sekundi

    Ako elimo da prenosimo niz slika u boji treba...

    16 ili 24 bpp (za dobru boju)

    najmanje 640 x 480 piksela (za prihvatljivu rezoluciju)

    najmanje 25 fps

    Ovo daje oko 15 MBps, ili preko 100 GB za cijeli film

    Vea rezolucija slike (1280 x 1024) i 30 fps zahtijevaju oko 112.5 MBps irinu opsega, ili skoro 1TB memorije!

    Digitalni video

    Okvir videa digitalna nepomina slika Video telefonija, telekonferencija

    Simetrina primjena, koder i dekoder jednako sloeni Osjetljivost na kanjenje

    Digitalna TV, filmovi, DVD Asimetrina primjena, jedan koder posluuje puno

    dekodera, dakle moe biti sloeniji Ukljuivanje u struju videa u bilo kojem trenutku

    Video preko Interneta i mobilnih mrea Relativno male brzine prijenosa Osjetljivost na greke

  • 9

    RGB reprezentacija

    Prvobitna kompjuterska grafika koristila je monokromatsku sliku (crno i bijelo). Sljedei stepen je predstavljala upotreba gray skale, gdje je svaki piksel imao i odreeni nivo luminance (intenzitet osvijetljenosti) od crne, preko mnogo nijansi sive, do bijele boje.

    Za prikaz slika, kompjuteri koriste primarne boje svjetlosti: crvenu, zelenu i plavu, to se naziva RGB reprezentacija. Odgovarajuim mijeanjem tih primarnih boja moe se postii bilo koja druga boja.

    Ovakva reprezentacij