12
Fakultet elektrotehnike Komunikacije - ZADAĆA- I - PREDMET: MULTIMEDIJSKI SISTEMI I KOMUNIKACIJE Rudi Perić III-21/07

izvjestaj( zadaca1)

Embed Size (px)

DESCRIPTION

multimediski sistemi i komunikacijeanaliza glasa kako zvucnih tako i bezvucnih signala prikaz spektra

Citation preview

Page 1: izvjestaj( zadaca1)

Fakultet elektrotehnike

Komunikacije

- ZADAĆA- I -

PREDMET: MULTIMEDIJSKI SISTEMI I KOMUNIKACIJE

Rudi Perić

III-21/07

Page 2: izvjestaj( zadaca1)

Zadatak 1. Potrebno je analizirati govorni signal, uočiti razlike između njegovih zvučnih i

bezvučnih glasova.

Slika 1.1. Talasni oblik zvučnog signala „Seven“

Analiza glasa „S“

Slika1. 2. Talasni oblik bezvučnog glasa „S“

Page 3: izvjestaj( zadaca1)

Slika 1. 3. Frekvetni spektar glasa „S“

Slika 1.3. predstavlja frekventni spektar glasa „S“ koji je inače bezvučni suglasnik. Sa slike

vidimo da je frekventni spektar kontinualan tj. nemamo jasno istaknute frekvencije niti

možemo uočiti pravilnost u frekvencijskoj domeni.

Analiza glasa „N“

Slika 1.4

Slika 1.4 predstavlja talasni oblik govornog signala „Seven“ dok markirani dio predstavlja

talasni oblik glasa „N“.

Page 4: izvjestaj( zadaca1)

Slika 1.5. Frekventni spektar glasa „N“

Suglasnik „N“ spada u grupu zvučnih glasova pri čijem stvaranju glasnice titraju što za

posljedicu ima periodičnost zvučnog signala koju uočavamo i na slici 1.4. U frekvencijskoj

domeni pojavljeju se karakteristične frekvencije odnosno rezonantne frekvencije tj. Formanti

koje uočavamo i na slici 1.5.

Analiza glasa „E“

Slika 1.6. Frekventni spektar glasa „E“

Harmonici odnosno višekratnici osnovne frekvencije (f ,2f , 3f...) za samoglasnik „E“ se

pojavljuju na frekvencijama f1 607 Hz , f2 1871, f3 2490 Hz ...što je predstavljeno na slici

1.6. i u rangu sa očekivanim vrijednostima.

Zadatak 2.

Vaš zadatak je snimiti vlastiti govorni signal i analizirati ga. Cilj je uočiti razlike između

zvučnih i bezvučnih glasova te karakteristične formante pojedinih glasova.

Odgovorite na sljedeća pitanja:

Page 5: izvjestaj( zadaca1)

a) Na vremenskom prikazu signala pronađite po jedan zvučni i bezvučni glas (po izboru) te

uočite razlike između odabranih signala. Po potrebi uvećajte prikaz dijela signala opcijom

View->Zoom In. U slučaju pojave šumova u snimljenom govornom signalu, provedite opciju

fitriranja šuma Efect->Noise Removal. Filtriranjem šuma će se jasnije uočiti razlike između

signala zvučnih i bezvučnih glasova. Kopirajte sliku iz aplikacije, na kojoj ste označili

posmatrane signale te opišite uočene razlike.

b) Odabrane signale glasova prikažite u frekventnom domenu (opcija Analyze -> Plot

Spectrum). Objasnite prikazane razlike u spektru. Kopirajte sliku sa frekventnim spektrom

koji ste dobili ovom analizom te na njemu označite specifičnosti vezane za te glasove.

c) Identificirajte (približno) formante jednog od sljedećih glasova: "a", "e", "i" koji se

pojavljuju u vašem govornom signalu. Na kojim se frekvencijama pojavljuju formanti?

Kopirajte sliku iz aplikacije sa uočenim formantima i naznačite o kojem je glasu riječ.

a)

Slika 2.1 Vremenski prikaz snimljene riječi „Solenar“

Analiza glasa „S“

Slika 2.2

Slika 2.2 predstavlja vremenski prikaz glasa „S“ a budući da je u pitanju bezvučni glas

nemamo nikakvu pravilnost signala što se dobro uočava i na samoj slici.

Page 6: izvjestaj( zadaca1)

Slika 2.3. Vremenski oblik glasa „N“

Sa slike 2.3. uočavamo da glas „N“ ima određenu periodičnost u svom vremenskom domenu

iako nismo odstranili prisutni šum a koji će biti još očitij nakon uklanjanja šuma. Razlog tome

je to što „N“ spada u grupu zvučnih glasova pri čijem stvaranju glasnice titraju.

Nakon uklanjanja šuma

Slika 2.4 Vremenski oblik signala „Solenar“ nakon uklanjanja šuma

Slika 2.5. Vremenski oblik glasa „S“ i glasa „N“ nakon uklanjanja šuma

Sa slika 2.4. i 2.5. koje predstavljaju slučaj kada smo odstranili šum uočavamo da se

karakteristike zvučnih i bezvučnih glasova bolje uočavaju. Tako na slici 2.5. bolje možemo

primjetiti nepravilnost bezvučnog glasa „S“ a periodičnost zvučnog signala „N“.

Page 7: izvjestaj( zadaca1)

b)

Slika 2.6. Frekvencijski spektar glasa „S“

Slika 2.7. Frekvencijski spektar glasa „N“

Na slikama 2.6. i 2.7. su predstavljeni frekvencijski spektri glasa „S“ i glasa „N“ signala

„Solenar“ sa kojih uočavamo, slično kao kod analize signala „Seven“, da bezvučni glas „S“

ima kontinualan frekvencijski spektar dok se kod zvučnog glasa „N“ pojavljuju rezonantne

frekvencije odnosno formanti.

Page 8: izvjestaj( zadaca1)

c)

Slika 2.8 Vremenski oblik glasa „E“

Slika 2.9. Frekvencijski spektar glasa „E“

Page 9: izvjestaj( zadaca1)

Na slici 2.9. je predstavljen frekvencijski spektar glasa“E“ sa kojeg se mogu uočiti formanti a

koji su na frekvencijama f1 560 Hz f2 1954 Hz f3 2812 Hz ...

Zadatak 3

Vaš je zadatak analizirati neku od ponuđenih izgovorenih fraza mijenjajući broj

koeficijenata LPC kodera. Prvo odaberite izgovorenu frazu, a zatim snimite vlastiti glas

(upustvo u nastavku). Odgovoriti na sljedeća pitanja za oba slučaja.

a) Šta zaključujete, kako broj koeficijenata utječe na kvalitetu zvuka (govornog signala)? Šta

se događa sa frekventnim spektrom u zavisnosti od broja koeficijenata? Obrazložite.

b) Za odabranu frazu (snimljeni glas) odaberite prikaz osnovne frekvencije i pomoću

ponuđenih opcija modificirajte osnovnu frekvenciju. Objasnite uticaj promjena na doživljaj i

kvalitetu zvuka?

c) Odaberite zvučnu datoteku Beethoven (muzika) u padajućem meniju te je analizirajte

(promjenom broja koeficijenata). Postoji li razlika u kvaliteti kodiranja govornog i muzičkog

signala s koderom LPC? Obrazložite.

d) Izračunati brzinu (engl. bitrate) kodera LPC za slučaj u kojem je linearni filter određen sa

10 koeficijenata.

a)

Slika 3.1 Izvorni signal mog snimljenog glasa

Slika 3.2. Izvorni signal rečenice „They took a test for school“ sa prikazom amplitude

Page 10: izvjestaj( zadaca1)

Slika 3.2.a Slika 3.2.b

Slika 3.2.c

Slika 3.2.d

Zaključak :

Za oba slučaja sam moglao zaključiti da zavisnost između broja koeficijenata i kvalitete zvuka

je takva da sa povećanjem broja koeficijenata dobija kvalitetniji zvuk gotovo isti izvornom.

Za slučaj kada koristimo manji broj koeficienata za kodiranje govornog signala pojavljuje

Page 11: izvjestaj( zadaca1)

nam se šum koji naravno degradira kvalitet zvuka a dobro se može primjetiti i na

frekvencijskom spektru koji postaje u tom slučaju širi (slike 3.2.a, 3.2.b, 3.2.c, 3.2.d ) .

b) Također za oba slučaja (snimljeni glas i ponuđenu rečenicu ) promjenom osnovne

frekvencije uočavamo da dolazi do izobličenja signala i to na način da kako mjenjamo visinu

glasa dobijamo dublji ili viši glas te dolazi do pojave harmonika višeg reda.

c)

Slika 3.3 Izvorni i kodirani signal zvučne datoteke „Beethoven“

Zaključak:

Analizom muzičke datoteke „Beethoven“ možemo zaključiti da LPC koder nije pogodan za

kodiranje muzičkog signala jer ni sa promjenom odnosno povećanjem broja koeficijenata ne

postižemo zadovoljavajući nivo kvalitete šta više izvorni signal je teško prepoznatljiv.

d)

LPC koder

Parametri modela:

Frekvencija pobude: 6 bita

Jačina pobude: 5 bita

Zvučni/bezvučni glas: 1 bit

Za slučaj kada uzimamo 10 koeficijenata:

10 koeficijenata filtra :42 bita

Frekvencija uzorkovanja: 8 kHz

Dužina okvira:180 uzoraka = 22.5ms

Ukupan broj bita za jedan okvir :54

Brzina = 54*(1000/22.5) = 2400 bita/s = 2.4 kbita/s

Page 12: izvjestaj( zadaca1)

Zadatak 4. Vaš je zadatak međusobno uporediti odabrane kodeke s obzirom na brzinu (bitrate) i

subjektivnu kvalitetu.

a) Preslušajte sve verzije datoteke Fox i popunite tablicu 1. Za ocjenu subjektivne kvalitete

mjerila ( ocjene ) spomenuta na predavanjima. Izračunajte približnu brzinu za svaku

datoteku.

b) Usporedite veličine datoteka i ocjene njihove subjektivne kvalitete, šta zaključujete?

a)

Brzina Fox.aiff = 192 kB / 17s = 11.3 kB/s Brzina Fox_gsm.wav = 39.2 kB / 17s = 2.3 kB/s Brzina Fox_adpcm.wav = 98.8 kB / 17s = 5.8 kB/s Brzina Fox_pcm.wav = 192 kB/ 17s = 11.3 kB/s b) Upoređivanjem veličine datoteke možemo zaključiti da je Fox_pcm.wav iste veličine kao i

original Fox.aiff a preslušavanjem nisam mogao primjetiti nikakvu razliku u kvalitetu te

shodno tome sam ih ocjenio sa subjektivnom ocjenom 5 . Preostale dvije verzije

Fox_gsm.wav i Fox_adpcm.wav imaju veličine datoteka 39,2 kB i 98,8 kB respektivno. Iako

to predstavlja značajno smanjenje veličine u odnosu na original kvalitet je izuzetno dobar čak

je teško uočiti razliku u kvaliteti stoga sam im dao ocijenu 4.