Transcript
  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    1/12

    1

    TEHNIKA KOLA RUERA BOKOVIAGETALDIEVA 4, ZAGREB

    ZAVRNI STRUNI RAD:

    DIGITALNA OBRADA ZVUKA

    MENTOR: prof. Damir Mileta UENIK: Domagoj VujevaRAZRED: 4.d

    U Zagrebu, (..)

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    2/12

    2

    SADRAJ: napravit cu ga kad dovrsim rad, nakon sto obradim zvuk u Audacity-u, iuredim teoriju za to (jos moram dodati 10-ak strana iz tog dijela, zakljucak, itd.)

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    3/12

    3

    UVOD

    Cilj svakog snimka je njegova kvalitetna reprodukcija u budunosti. Donedavno su glavnimediji bile magnetske vrpce s analognim zapisom. Osim kvalitetnih mikrofona i snimaa, tu

    je krucijalna konstantna i velika brzina kretanja trake ispred magnetske glave. Vea brzinaznai bolji ferkvencijski odaziv, manji pozadinski um i sporiju degradaciju tokom godina. Za

    jeftinije studijske snimke je dovoljno oko 38cm/s, dok je za zahtjevnu klasinu glazbu inajvjerniju reprodukciju potrebna duplo vea brzina.

    Odkad postoje magnetske trake, postoji i obrada njenog zvuka. Pod tim se podrazumjevalo

    fiziko rezanje, lijepljenje i ostale akrobacije danas nezamislive i nepotrebne. Da bi se snimakpribliio prosjenom sluatelju, koristili su se razni strujni krugovi koji su upravljalisnimljenim materijalomna eljeni nain. Tu su kompresori koji snimaju dinamiku zvuka zalake sluanje u bunom okruenju ili tiho sluanje, limiteri koji slue kao gruba barijera zanagle skokove napona (zvuka) te tako tite od distorzija i potencijalnih oteenja opreme,ekvalizatori koji manipuliraju ferkvencijskom karakteristikom, itd. Sva ta oprema je dodatno

    unosila smetnje te se odnos signala i uma pogoravao. Takoer, svako presnimavanje nadrugu vrpcu je znailo degradaciju. To su samo neke mane analogne tehnike koje smodigitalnim nainom otpisali.

    Velika prednost digitalnog zapisa je savrena reprodukcija svaki put, to objanjava zato seuvukao u sve medije dananjice, CD-i, kompaktni MP3 svirai, DVD-i, pa i napokon izemaljska televizija u Hrvatskoj (satelitska je digitalna od 1995. godine), svi koriste binarni

    kod zbog vrhunske redundancije.

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    4/12

    4

    Openito o zvuku

    Kad govorimo o zvuku potrebno je reci da zapravo govorimo o zvunim valovima.Ljudsko uho ih registrira kao promjenu pritiska na bubnjiu u nekom vremenu.Na slici jedan prikazan je sinusni signal konstantne amplitude.

    Najvanije svojstvo takvog vala u naim primjerima je da je on kontinuiran i neprekinut usvakom trenutku bez obzir koliko ga zumirali po bilo kojoj osi. On je dakle neprekinut i u

    nekom trenutku moe imati samo jedan iznos amplitude. Najvea frekvencija signala kojumoe uti ovjek je oko 20 kHz, dok je za prosjene ljude ta granica na oko 17kHz. Najniaferkvencija koju ovijek moe uti je oko 20Hz. Ljudskom uhu nije lako detektirati fazuzvuka. Zvuni valovi ispod 20 Hz nazivamo infrazvuk, a iznad 20000 Hz ultrazvuk.

    Kako ovjek uje?

    Kad zvuni val doe do ljudskog uha, djeluje na dio koji se zove bubnji. Bubnji zbog toga zatitra. Titraji se prenose do organa sluha (punica) koji se nalazi u unutranjem dijelu uha, gdje se

    pretvaraju u signale koji mogu putovati ivcima sve do mozga.

    Zvuni val

    Zvuk nastaje titranjem izvora zvuka. To se titranje prenosi na susjedne molekule zraka, zatim na idue molekule zraka i takoredom.

    Tako nastaje zvuni val.

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    5/12

    5

    Zvuk je po svojoj prirodi val koji se iri zrakom u odreenom intenzitetu i odreenombrzinom. Uobiajena tehnologija koja omoguava prijenos/pohranjivanje zvunih sadrajatemelji se na preslikavanju ovih pojava na odreeni medij zadravajui i dalje oblik vala,odnosno i dalje je zadravan analogni oblik.

    Informacije predstavljene kontinuiranim valom predstavljaju analogni skup podataka. Svaki

    zvuni sadraj sastavljen je u osnovi od tri dijela koji tvore temeljnu strukturu zvunog vala.Povezivanje ovih elemenata i njihovih odnosa pomoglo je u definiranju postupka njihove

    pretvorbe u digitalni oblik, pa ak i umjetno proizvoenje zvunih sadraja (sintetski zvuk).

    Digitalna obrada zvuka

    Digitalizacija zvuka je proces pretvaranja analognog audio signala u digitalni oblik a

    obuhvaa 3 koraka: uzorkovanje (sampling) kvantiziranje kodiranje.

    Digitalni audio zapis je definiran je s tri parametra: brojem kanala, frekvencijom

    uzorkovanja i rezolucijom. O ovim parametrima ovisi kvaliteta zvuka. Uobiajeni parametrakod raunalnog WAV formata su broj kanala 2 (stereo), rezolucija - 16 bit i frekvencijauzorkovanja 44100 Hz. Broj kanala daje informaciju da li je zvuk snimljen u mono ili stereo

    tehnici. Mono podrazumijeva jednokanalno snimanje odnosno da e zvuk kod reprodukcijebiti identian na desnom i lijevom kanalu (zvuniku) ali i da je koliina zapisa (memorija)dvostruko manja od stereo zvuka. Stereo zvuk je dvokanalni (desni i lijevi) i pogodan je za

    pohranjivanje glazbenih datoteka.

    BRZINA UZROKOAVANJA (SAMPLE RATE)

    Frekvencija uzorkovanja je brzina (uestalost) kojom se zvuk uzorkuje (semplira).Uobiajena vrijednost za kvalitetno snimanje zvuka iznosi 44100Hz. To znai da se 44100

    puta u sekundi uzima uzorak a svaka vremenska toka uzorkovanja se kvantizira (pridodajejoj se brojana vrijednost trenutnog stanja zvuka).

    Frekvencija uzorkovanja i kvaliteta zvuka.

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    6/12

    6

    REZOLUCIJA UZROKOAVANJA (SAMPLE DEPTH)

    Rezolucija je broj bitova koritenih za mjerenje amplituda (glasnoe) uzorka. Kod 8bitne rezolucije koristi se 256 razliitih razina (varijacija) glasnoa, dok se kod 16 bitnerezolucije koristi 65536jedinstvenih glasnoa. Dakle, to je vea rezolucija bolji je I

    dinamiki raspon (omjer izmeu najtieg i najglasnijeg dijela zvuka) i bolji odnos uma isignala.

    VRSTE DIGITALNIH AUDIO ZAPISA

    Razvojem raunalne tehnologije i osobito interneta razvio se niz digitalnih audioformata za pohranjivanje zvuka, osobito glazbe. Na raunalima se najee mogu sresti 3vrste audio datoteka: WAV, MP3 i WMA. Meutim, kvalitetno pohanjen audio formatzahtijeva veliku koliinu memorije i pohranjivanje velike koliine informacija. Takav je npr.standardni Windows-ov format datotekaWAV koji ne koriste nikakvo saimanje

    (kompresiju) podataka ali je zato pogodan za naknadne akustike obrade i analizu zvuka.Komprimiranje audio datoteka moe se izvriti na dva naina bez gubitka informacija(lossless) ili uz gubitak (lossy). ''Lossless'' formati bez gubitka zahtijevaju vee datoteke ikoliinu memorije pa je njihov nedostatak da su takve datoteke vee ali im je prednost da jezvuk uvijek mogue rekonstruirati u izvorni oblik i s originalnom kvalitetom. No, zboginterneta, sve vie se koristi ''lossy'' tehnika saimanja zvuka. Prilikom takvog saimanja neuvaju se svi podaci o zvuku, eliminaraju se oni podaci koje ljudsko uho ionako ne moe uti.

    Takve su datoteke i do 10 20 puta manje od originalnog zvuka a pri tome ipak ostaje sauvanadovoljno dobra kvaliteta zvuka. Meu trenutno najkoritenije formate koji komprimiraju(kompresiraju) podatke spada MP3 koji zbog svoje male veliine datoteka i vrlo dobrekvalitete zvuka postaje vrlo korisan za prikazivanje na internetu ili njegovo slanje putem

    elektronske pote (e-maila). Sve Microsoft-ove aplikacije vezane uz zvuk koriste saetiformat glazbenih datoteka - WMA (to je kratica za Windows Media Audio). Taj je format

    primarno namijenjen koritenju za Windows Media Player. Danas veina audio (CD) idigitalnih snimaa/playera podrava izvorni audio, WAV, WMA i MP3 formate audio zapisa.

    Formati audio zapisa

    Ba kao to je to sluaj s mnogobrojnim slikovnim formatima koji definiraju na koji nain sepohranjuju slike, formati audio datoteka koriste razne naine pohranjivanja podataka.Najee se moete susresti s 3 vrste audio datoteka: WAV, MP3 i WMA.

    Razlog za relativno velik broj razliitih formata za zapis zvuka lei u injenici da je zvukmemorijski vrlo zahtjevan. Pohranjivanje informacija o nekom zvuku zahtijeva velike

    koliine podataka. Neki formati datoteka, poput Microsoftovog WAV formata, ne koristenikakvo saimanje (kompresiju), pa su datoteke velike i neprimjenjive za koritenje naInternetu ili za slanje elektronikompotom.

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    7/12

    7

    Drugi pak formati datoteka koriste saimanje. Saimanje moe biti izvedeno na nain danema gubitka informacija (lossless saimanje). Formati datoteka koji nude ovakve algoritmesaimanja u konanici uvijek imaju manju uspjenost, pa su datoteke vee. Prednost takvihdatoteka je taj da je zvuk uvijek mogue rekonstruirati u originalnom obliku. Danas sunajpopularniji formati koji koriste lossytehniku saimanja zvuka. Prilikom takvog saimanja

    ne uvaju se svi podaci o zvuku, ve algoritam za saimanje odbacuje manje vane podatkekoji predstavljaju zvukove koje ljudsko uho ionako ne bi moglo uti. Konana veliina takvih

    datoteka mnogo je manja u odnosu na nesaete datoteke (ponekad i do 20 puta). Primjer

    takvog zapisa je MP3.

    Svaki tip raunalne platforme i operativnog sustava koristi svoj jedinstven format audio

    zapisa za reprodukciju i snimanje. Neki od najpoznatijih audio formata koji se koriste na

    webu su: WMA, MP3,...

    Tablica 1.1. Prikaz audio formata

    Pregled vrsta audio zapisa:

    WAV(od enleske rijei wave, val) je matini format zvuka u operacijskom sustavu Windows.Sve Windows aplikacije koje imaju ikakve veze sa zvukom znaju raditi s WAV datotekama.

    Nesaete WAV datoteke mogu biti vrlo velike. Jedna minuta glazbe u WAV formatu,pohranjene u CD kvaliteti, bit e vie od 10 MB podataka na disku. Za pohranjivanje jednogglazbenog CD-a na tvrdom disku u WAV formatu stoga bi bilo potrebno oko 600 MB. ak iuz dananje kapacitete tvrdih diskova ovo je vrlo mnogo. Prilikom prenoenja glazbe s audioCD-a na raunalo koristi se WAV format za zapis zvuka koji se onda moe kodirati u nekidrugi saeti format, primjerice MP3. Ovakav se postupak naziva digitalna audioekstrakcijailiu argonu ripanje CD-a.

    Tablica 1.2. Tipine veliine datoteka za jednu minutu zvuka pohranjenu u WAV formatu

    MP3je krai naziv za algoritam kodiranja zvuka MPEG-1 Audio Layer 3. Kratica MPEGdolazi od Moving Pictures Experts Group to oznaava skupina strunjaka za pokretneslike, koja je dio Meunarodne organizacije za standarde ISO.

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    8/12

    8

    Osim kompatibilnosti, jedan od najveih prednosti MP3-a nad ostalim formatima glazbenihdatoteka jest u tome to korisnici mogu sami odabrati stupanj saimanja. Logika je jasna: veistupanj saimanja daje manju MP3 datoteku, no i loiju kvalitetu zvuka, dok manji stupanjsaimanja stvara veu datoteku, ali i vjernije odgovara originalnom zvunom zapisu iz kojega

    je stvoren. Mjerilo kvalitete MP3 zapisa je bit rate, dakle koliina bitova kojom je

    predstavljena jedna sekunda zvunog zapisa. Vei bit rate znai da se koristi manji stupanjsaimanja i obrnuto. MP3 datoteke su najee kodirane nekim od slijedeih standardnih bitratea:

    Tablica 1.3. Tipine veliine datoteka za jedan sat zvuka pohranjen u MP3 formatu

    Mnogo je programa koji vam omoguuju da stvorite vlastite MP3 datoteke. Ti programi vam

    u naelu omoguuju da napravite jednu od dvije stari:

    moete uzeti bilo koji glazbeni CD, umetnuti ga u svoj CD-ROM ureaj i zatim ga cijelogpretvoriti u MP3 format; ako na disku ve imate ripane WAV datoteke koritenjem MP3kodera i pripadajuih programa moete ih jednostavno pretvoriti u MP3 datoteke;Osnovne karakteristike MP3 formata, i glavni razlog njegove popularnosti su velika

    kompresija uz ouvanje kvaliteta zvuka. Ipak, MP3 format je tzv. lossy algoritam, to znai daodstranjuje dio informacija iz ulaza sa ciljem smanjenja veliine datoteke. Ovaj gubitak je

    meutim uglavnom neprimjetan, budui da MP3 algoritam odstranjuje uglavnom dijelove kojinisu primjetni ljudskom uhu. Na ovaj nain, MP3 omoguava veliku kompresiju uz (naizgled)neprimjetan gubitak kvalitete zvuka.

    Microsoft je suoen s oitim nedostacima WAV datoteka, razvio vlastiti saeti formatglazbenih datoteka WMA(to je kratica za Windows Media Audio). Taj je format primarnonamijenjen koritenju za Windows Media Player. Sve su ei i prijenosni MP3/WMAplayeri, a ovaj format zapisa glazbe prihvatili su i divovi glazbene industrije poput Sonyja.

    Iako nije toliko rairen (u odnosu na MP3) i popularan meu korisnicima, WMA datotekenude CD kvalitetu zvuka s upola manjom veliinom datoteka. Sve je vei broj prijenosnih

    playera koji podravaju WMA, pa ova memorijska uteda nikako nije zanemariva. Ovakviureaji mogu koritenjem WMA saimanja u istom memorijskom prostoru tako pohraniti

    dvostruko vie glazbe nego u sluaju MP3-a.Stvaranje WMA datoteka nije nita sloenije od istog postupka kod MP3 datoteka. WindowsMedia Player u Windowsima XP posjeduje Copy from CDopciju, koja e konvertirati glazbeniCD u niz WMA datoteka. Pritom je, slino kao kod MP3-a, mogue odabrati bit rate kojim ekodiranje i saimanje biti obavljeno.

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    9/12

    9

    Pulsno-kodna modulacija

    Pojam "PCM" skovan je u okviru razvitka standarda za digitalni prijenos govornog signala,

    odnosno za digitalnu modulaciju. Danas se taj pojam odnosi na metodu digitaliziranja bilo

    kakvog analognog signala.

    PCM ne oznaava nikakvu konkretnu kompresiju: on obuhvaa samo kvantizaciju idigitalizaciju analogne veliine. Ukupni opseg moguih vrijednosti te veliine (tzv.kvantizacijski opseg) podijeli se na segmente i svakom segmentu se pridijeli jedna kodna rije(niz bitova). Vrijednost koju je analogna veliina postigla u nekoj toki zove se uzorak. Dabismo digitalizirali uzorak, odredimo unutar kojeg segmenta se nalazi i zapi emo kodnu rijetog segmenta. Uzorke uzimamo u pravilnim razmacima (uestalost uzimanja uzoraka zove sefrekvencija uzorkovanja). Na taj nain se vremenski ili prostorni tijek analogne veliinemo e prikazati kao niz bitova.

    Primjer kodiranja signala PCM-omU na em primjeru kvantiziramo signal pomou 8 kvantizacijskih segmenata u 11 vremenskih

    toaka. Sve vrijednosti signala koje padaju u odreeni segment aproksimiraju sepripadajuom kvantizacijskom razinom koja se nalazi u sredini segmenta. Razine su kodiranekodnim rijeima od tri bita na sljedei nain:

    Razina Kodna Rije

    0 000

    1 001

    2 010

    3 011

    4 100

    5 101

    6 110

    7 111

    Na prvoj slici je prikazan proces kvantiziranja i digitaliziranja signala. Prikazani uzorci ve sukvantizirani - aproksimirani su najbli om kvantizacijskom razinom. Uz svaki uzorak oznaen

    je broj njegove kvantizacijske razine. Taj broj se pomou gornje tablice pretvara u kodnu rijeod 3 bita.

    Na drugoj slici se vidi proces rekonstruiranja signala prema digitalnom PCM zapisu. Sada

    signal tono slijedi kvantizirane uzorke i zato se razlikuje od originalnog. Ta razlika semanifestira kao um kvantiziranja. On ima uvijek isti intenzitet, bez obzira na intenzitet

    signala. Ako se intenzitet signala smanji, um kvantiziranja e se jae osjetiti (pokvarit e seodnos signal/ um).

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    10/12

    10

    Signal je kodiran nizom bitova:

    101 111 110 001 010 100 111 100 011 010 101 - ukupno 33 bita.Osnovne metode kompresije

    1. Smanjenje broja kvantizacijskih segmenataBroj kvantizacijskih segmenata mo emo smanjiti tako da npr. po dva susjedna kvantizacijska

    segmenta spojimo u jedan. Tako emo umjesto 8 imati 4 kvantizacijske razine i moi emo ihkodirati kodnim rijeima od samo 2 bita:

    Razina Kodna Rije

    0 00

    1 01

    2 103 11

    Na slici je prikazan rekonstruirani signal nakon provedene kompresije. Signal je zadr ao isti

    osnovni oblik, ali su uvedena vea izoblienja zbog grublje aproksimacije -povean je umkvantiziranja.

  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    11/12

    11

    Komprimirani signal je kodiran ovako:

    10 11 11 00 01 10 11 10 01 01 10 - ukupno 22 bita. Stupanj kompresije je 1.5:1 (smanjenje

    veliine za 33%).Praktika uporaba metodeU praksi se za zvuni signal kodiran PCM-om koriste vei stupnjevi kompresije - npr. sa 16na 8 bita. U ovom standardu (zvanom A-zakon) primjenjuje se nejednolika kvantizacija -

    kvantizacijske razine u komprimiranom signalu gu e su rasporeene oko nule, arjee prirubovima kvantizacijskog opsega. Time se smanjuje kvantizacijski um za signale slabijeg

    intenziteta.

    2. Smanjenje broja uzorakaDa bismo smanjili broj uzoraka, mo emo npr. po dva susjedna uzorka zamijeniti jednim koji

    je jednak njihovoj srednjoj vrijednosti. Sada su uzorci dvostruko rjei -- to znai da sefrekvencija uzorkovanja smanjila na pola. Budui da je frekvencijski opseg rekonstruiranog

    signala proporcionalan frekvenciji uzorkovanja (B = 0.5Fu), i on je sada dvostruko manji. Una em primjeru to je rezultiralo gubitkom najvi e frekvencijske komponente signala:

    U praksi treba odrediti koje su frekvencije u signalu bitne, a koje se mogu izbaciti radi

    svoenja koliine podataka na razumnu mjeru.Postoji i varijacija PCM-a koja omoguuje kompresiju bez gubitka kvalitete -DPCM.Danas se intenzivno radi na razvoju novih metoda kompresije PCM signala. Cilj je postii

    puno vee stupnjeve kompresije (preko 100:1, odnosno smanjenje na manje od 1% originalneveliine) uz praktiki neprimjetni gubitak kvalitete signala. Osnovni kriterij za kvalitetusignala je ovjekova percepcija. Zato se detaljno istra uju pragovi percepcije za zvune ivideo signale. Standardi kao JPEG i MPEG temelje se upravo na takvim istraivanjima.

    http://oldwww.rasip.fer.hr/research/compress/algorithms/fund/pcm/dpcm/index_hr.htmlhttp://oldwww.rasip.fer.hr/research/compress/algorithms/fund/pcm/dpcm/index_hr.htmlhttp://oldwww.rasip.fer.hr/research/compress/algorithms/fund/pcm/dpcm/index_hr.htmlhttp://oldwww.rasip.fer.hr/research/compress/algorithms/fund/pcm/dpcm/index_hr.html
  • 8/2/2019 DIGITALNA OBRADA ZVUKA (nedovreno)

    12/12

    12


Recommended