Upload
rudi-peric
View
113
Download
6
Tags:
Embed Size (px)
DESCRIPTION
multimediski sistemi i komunikacijeanaliza glasa kako zvucnih tako i bezvucnih signala prikaz spektra
Citation preview
Fakultet elektrotehnike
Komunikacije
- ZADAĆA- I -
PREDMET: MULTIMEDIJSKI SISTEMI I KOMUNIKACIJE
Rudi Perić
III-21/07
Zadatak 1. Potrebno je analizirati govorni signal, uočiti razlike između njegovih zvučnih i
bezvučnih glasova.
Slika 1.1. Talasni oblik zvučnog signala „Seven“
Analiza glasa „S“
Slika1. 2. Talasni oblik bezvučnog glasa „S“
Slika 1. 3. Frekvetni spektar glasa „S“
Slika 1.3. predstavlja frekventni spektar glasa „S“ koji je inače bezvučni suglasnik. Sa slike
vidimo da je frekventni spektar kontinualan tj. nemamo jasno istaknute frekvencije niti
možemo uočiti pravilnost u frekvencijskoj domeni.
Analiza glasa „N“
Slika 1.4
Slika 1.4 predstavlja talasni oblik govornog signala „Seven“ dok markirani dio predstavlja
talasni oblik glasa „N“.
Slika 1.5. Frekventni spektar glasa „N“
Suglasnik „N“ spada u grupu zvučnih glasova pri čijem stvaranju glasnice titraju što za
posljedicu ima periodičnost zvučnog signala koju uočavamo i na slici 1.4. U frekvencijskoj
domeni pojavljeju se karakteristične frekvencije odnosno rezonantne frekvencije tj. Formanti
koje uočavamo i na slici 1.5.
Analiza glasa „E“
Slika 1.6. Frekventni spektar glasa „E“
Harmonici odnosno višekratnici osnovne frekvencije (f ,2f , 3f...) za samoglasnik „E“ se
pojavljuju na frekvencijama f1 607 Hz , f2 1871, f3 2490 Hz ...što je predstavljeno na slici
1.6. i u rangu sa očekivanim vrijednostima.
Zadatak 2.
Vaš zadatak je snimiti vlastiti govorni signal i analizirati ga. Cilj je uočiti razlike između
zvučnih i bezvučnih glasova te karakteristične formante pojedinih glasova.
Odgovorite na sljedeća pitanja:
a) Na vremenskom prikazu signala pronađite po jedan zvučni i bezvučni glas (po izboru) te
uočite razlike između odabranih signala. Po potrebi uvećajte prikaz dijela signala opcijom
View->Zoom In. U slučaju pojave šumova u snimljenom govornom signalu, provedite opciju
fitriranja šuma Efect->Noise Removal. Filtriranjem šuma će se jasnije uočiti razlike između
signala zvučnih i bezvučnih glasova. Kopirajte sliku iz aplikacije, na kojoj ste označili
posmatrane signale te opišite uočene razlike.
b) Odabrane signale glasova prikažite u frekventnom domenu (opcija Analyze -> Plot
Spectrum). Objasnite prikazane razlike u spektru. Kopirajte sliku sa frekventnim spektrom
koji ste dobili ovom analizom te na njemu označite specifičnosti vezane za te glasove.
c) Identificirajte (približno) formante jednog od sljedećih glasova: "a", "e", "i" koji se
pojavljuju u vašem govornom signalu. Na kojim se frekvencijama pojavljuju formanti?
Kopirajte sliku iz aplikacije sa uočenim formantima i naznačite o kojem je glasu riječ.
a)
Slika 2.1 Vremenski prikaz snimljene riječi „Solenar“
Analiza glasa „S“
Slika 2.2
Slika 2.2 predstavlja vremenski prikaz glasa „S“ a budući da je u pitanju bezvučni glas
nemamo nikakvu pravilnost signala što se dobro uočava i na samoj slici.
Slika 2.3. Vremenski oblik glasa „N“
Sa slike 2.3. uočavamo da glas „N“ ima određenu periodičnost u svom vremenskom domenu
iako nismo odstranili prisutni šum a koji će biti još očitij nakon uklanjanja šuma. Razlog tome
je to što „N“ spada u grupu zvučnih glasova pri čijem stvaranju glasnice titraju.
Nakon uklanjanja šuma
Slika 2.4 Vremenski oblik signala „Solenar“ nakon uklanjanja šuma
Slika 2.5. Vremenski oblik glasa „S“ i glasa „N“ nakon uklanjanja šuma
Sa slika 2.4. i 2.5. koje predstavljaju slučaj kada smo odstranili šum uočavamo da se
karakteristike zvučnih i bezvučnih glasova bolje uočavaju. Tako na slici 2.5. bolje možemo
primjetiti nepravilnost bezvučnog glasa „S“ a periodičnost zvučnog signala „N“.
b)
Slika 2.6. Frekvencijski spektar glasa „S“
Slika 2.7. Frekvencijski spektar glasa „N“
Na slikama 2.6. i 2.7. su predstavljeni frekvencijski spektri glasa „S“ i glasa „N“ signala
„Solenar“ sa kojih uočavamo, slično kao kod analize signala „Seven“, da bezvučni glas „S“
ima kontinualan frekvencijski spektar dok se kod zvučnog glasa „N“ pojavljuju rezonantne
frekvencije odnosno formanti.
c)
Slika 2.8 Vremenski oblik glasa „E“
Slika 2.9. Frekvencijski spektar glasa „E“
Na slici 2.9. je predstavljen frekvencijski spektar glasa“E“ sa kojeg se mogu uočiti formanti a
koji su na frekvencijama f1 560 Hz f2 1954 Hz f3 2812 Hz ...
Zadatak 3
Vaš je zadatak analizirati neku od ponuđenih izgovorenih fraza mijenjajući broj
koeficijenata LPC kodera. Prvo odaberite izgovorenu frazu, a zatim snimite vlastiti glas
(upustvo u nastavku). Odgovoriti na sljedeća pitanja za oba slučaja.
a) Šta zaključujete, kako broj koeficijenata utječe na kvalitetu zvuka (govornog signala)? Šta
se događa sa frekventnim spektrom u zavisnosti od broja koeficijenata? Obrazložite.
b) Za odabranu frazu (snimljeni glas) odaberite prikaz osnovne frekvencije i pomoću
ponuđenih opcija modificirajte osnovnu frekvenciju. Objasnite uticaj promjena na doživljaj i
kvalitetu zvuka?
c) Odaberite zvučnu datoteku Beethoven (muzika) u padajućem meniju te je analizirajte
(promjenom broja koeficijenata). Postoji li razlika u kvaliteti kodiranja govornog i muzičkog
signala s koderom LPC? Obrazložite.
d) Izračunati brzinu (engl. bitrate) kodera LPC za slučaj u kojem je linearni filter određen sa
10 koeficijenata.
a)
Slika 3.1 Izvorni signal mog snimljenog glasa
Slika 3.2. Izvorni signal rečenice „They took a test for school“ sa prikazom amplitude
Slika 3.2.a Slika 3.2.b
Slika 3.2.c
Slika 3.2.d
Zaključak :
Za oba slučaja sam moglao zaključiti da zavisnost između broja koeficijenata i kvalitete zvuka
je takva da sa povećanjem broja koeficijenata dobija kvalitetniji zvuk gotovo isti izvornom.
Za slučaj kada koristimo manji broj koeficienata za kodiranje govornog signala pojavljuje
nam se šum koji naravno degradira kvalitet zvuka a dobro se može primjetiti i na
frekvencijskom spektru koji postaje u tom slučaju širi (slike 3.2.a, 3.2.b, 3.2.c, 3.2.d ) .
b) Također za oba slučaja (snimljeni glas i ponuđenu rečenicu ) promjenom osnovne
frekvencije uočavamo da dolazi do izobličenja signala i to na način da kako mjenjamo visinu
glasa dobijamo dublji ili viši glas te dolazi do pojave harmonika višeg reda.
c)
Slika 3.3 Izvorni i kodirani signal zvučne datoteke „Beethoven“
Zaključak:
Analizom muzičke datoteke „Beethoven“ možemo zaključiti da LPC koder nije pogodan za
kodiranje muzičkog signala jer ni sa promjenom odnosno povećanjem broja koeficijenata ne
postižemo zadovoljavajući nivo kvalitete šta više izvorni signal je teško prepoznatljiv.
d)
LPC koder
Parametri modela:
Frekvencija pobude: 6 bita
Jačina pobude: 5 bita
Zvučni/bezvučni glas: 1 bit
Za slučaj kada uzimamo 10 koeficijenata:
10 koeficijenata filtra :42 bita
Frekvencija uzorkovanja: 8 kHz
Dužina okvira:180 uzoraka = 22.5ms
Ukupan broj bita za jedan okvir :54
Brzina = 54*(1000/22.5) = 2400 bita/s = 2.4 kbita/s
Zadatak 4. Vaš je zadatak međusobno uporediti odabrane kodeke s obzirom na brzinu (bitrate) i
subjektivnu kvalitetu.
a) Preslušajte sve verzije datoteke Fox i popunite tablicu 1. Za ocjenu subjektivne kvalitete
mjerila ( ocjene ) spomenuta na predavanjima. Izračunajte približnu brzinu za svaku
datoteku.
b) Usporedite veličine datoteka i ocjene njihove subjektivne kvalitete, šta zaključujete?
a)
Brzina Fox.aiff = 192 kB / 17s = 11.3 kB/s Brzina Fox_gsm.wav = 39.2 kB / 17s = 2.3 kB/s Brzina Fox_adpcm.wav = 98.8 kB / 17s = 5.8 kB/s Brzina Fox_pcm.wav = 192 kB/ 17s = 11.3 kB/s b) Upoređivanjem veličine datoteke možemo zaključiti da je Fox_pcm.wav iste veličine kao i
original Fox.aiff a preslušavanjem nisam mogao primjetiti nikakvu razliku u kvalitetu te
shodno tome sam ih ocjenio sa subjektivnom ocjenom 5 . Preostale dvije verzije
Fox_gsm.wav i Fox_adpcm.wav imaju veličine datoteka 39,2 kB i 98,8 kB respektivno. Iako
to predstavlja značajno smanjenje veličine u odnosu na original kvalitet je izuzetno dobar čak
je teško uočiti razliku u kvaliteti stoga sam im dao ocijenu 4.