18
Mássalhangzó-magánhangzó kapcsolatok automatikus osztályozása szubglottális rezonanciák alapján Csapó Tamás Gábor, Németh Géza {csapot,nemeth}@tmit.bme.hu BME Távközlési és Médiainformatikai Tanszék VI. Magyar Számítógépes Nyelvészeti Konferencia, 2009. december 4.

Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Mássalhangzó-magánhangzókapcsolatok automatikus osztályozása

szubglottális rezonanciák alapján

Csapó Tamás Gábor, Németh Géza{csapot,nemeth}@tmit.bme.hu

BME Távközlési és Médiainformatikai Tanszék

VI. Magyar Számítógépes Nyelvészeti Konferencia,2009. december 4.

Page 2: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás

1 BevezetésA szubglottális rendszerFormánsmenetek hangkapcsolatokban

2 MódszerekFelvételek, mérések

3 EredményekLocus egyenletOsztályozás

4 ÖsszefoglalásKövetkeztetésekTovábbi kutatási irányok

2 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 3: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Szubglottális rendszer Formánsmenetek

A szubglottális rendszer, rezonanciái

alsó légúti rendszer(tüdo, légcso)szubglottális rezonanciák (SGR)

Sg1 ~600 HzSg2 ~1400 HzSg3 ~2100 Hz

korábbi kutatásokSGR ↔ formánsmagánhangzók: kerülik az SGRkörnyéki frekvenciákatangol, spanyol, német, koreai,magyar

3 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 4: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Szubglottális rendszer Formánsmenetek

Magyar magánhangzók

korábbi eredmények,magyar nyelvre2 férfi és 2 no, logatomokSGR-ek: határ amagánhangzócsoportokközött

Sg1: alsó ↔ nem-alsóSg2: elöl ↔ hátul képzettSg3: elöl képzettajakkerek. ↔ ajakréses

F1-F2 formánstérh9

h x9 x

t9 t

19

1 d9

D

n

n9

N

`9

Sg3 Sg2

Sg1

4 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 5: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Szubglottális rendszer Formánsmenetek

Formánsmenetek CV kapcsolatokban

koartikulációmássalhangzó (C) +magánhangzó (V)változó F2 érték

locus egyenletlineáris regresszióF2msh = m · F2mgh + bképzési helytol függ

locus egyenlet térCV csoportok

hipotézisSGR-ek → CVcsoportok elkülönülése

Ido (s)74.71 75.740

2200

Fre

kven

cia

(Hz)

N c n9 a N

Idı (s)

F2

F1

5 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 6: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Felvételek, mérések (formánsok, szubglottális rezonanci ák)

Felvételek, mérések (formánsok)

felvételek1 férfi beszélo ("B1", 29 éves)beszéd felvételek (logatom: "OCVbO")C: összes zárhang

alveoláris: [d,t], labiális: [b,p], palatális: [é,c], veláris: [g,k]V: összes magánhangzó

elso: [i,i:,e:,a,e,ø,ø:,y,y:], hátsó: [O,o,o:,u,u:]

összesen 1120 logatomformánsmérések

automatikus címkézés (BME TMIT) + kézi ellenorzésautomatikus formánsmérés (Praat) + kézi ellenorzésF2msh, mássalhangzó végén (C, 95%)F2mgh, magánhangzó közepén (V, 50%)

6 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 7: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Felvételek, mérések (formánsok, szubglottális rezonanci ák)

Felvételek, mérések (SGR)

felvételek1 férfi beszélo ("B1", 29 éves)folyamatos beszédgyorsulásméro felvételek

szubglottális rezonanciamanuális mérés(Wavesurfer, LPC)Sg1, Sg2 és Sg320 mérési pont / SGR

Sg1 Sg2 Sg3

Átlag 545 Hz 1241 Hz 2027 HzMedián 554 Hz 1244 Hz 2022 HzSzórás 60 Hz 42 Hz 145 Hz

Time (s)0 0.5

0

4

Fre

qu

en

cy (

kH

z)

0

1

2

3

4

0 0.1 0.2 0.3 0.4 0.5

Fre

kven

cia

(kH

z)

Idı (s)

Frekvencia (kHz)

Sg1 Sg2 Sg3

7 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 8: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Locus egyenlet Osztályozás, eredménye

Locus egyenlet tér

1 L, V + H2 A, P + H3 A, L, V + E14 A, L + E25 P + E16 P + E2

A = alveoláris = [d,t]

L = labiális = [b,p]

P = palatális = [é,c]

V = veláris = [g,k]

E1 = elso/1 = [a,e,ø,ø:,y,y:]

E2 = elso/2 = [i,i:,e:]

H = hátsó = [O,o,o:,u,u:]

1

2 3 4

5 6

Sg1

Sg2

Sg3

Sg1 Sg2 Sg3

8 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 9: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Locus egyenlet Osztályozás, eredménye

Locus egyenletek (C-osztályok)

F2msh = m · F2mgh + b

m b R2

Alveoláris 0,33 1184,35 0,76Labiális 0,73 301,22 0,91Palatális 0,30 1552,82 0,62Veláris 0,91 179,19 0,93

9 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 10: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Locus egyenlet Osztályozás, eredménye

CV kapcsolatok osztályozása

tartományok,határok

1. F2msh < Sg2F2mgh < Sg2

1

2 3 4

5 6

Sg1

Sg2

Sg3

Sg1 Sg2 Sg3

10 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 11: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Locus egyenlet Osztályozás, eredménye

CV kapcsolatok osztályozása

tartományok,határok

1. F2msh < Sg2F2mgh < Sg2

2. Sg2 < F2msh

F2mgh < Sg23. F2msh < Sg3

Sg2 < F2mgh < Sg34. F2msh < Sg3

Sg3 < F2mgh

5. Sg3 < F2msh

Sg2 < F2mgh < Sg36. Sg3 < F2msh

Sg3 < F2mgh

1

2 3 4

5 6

Sg1

Sg2

Sg3

Sg1 Sg2 Sg3

11 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 12: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Locus egyenlet Osztályozás, eredménye

Osztályozás eredménye

Sg2 = 1000 . . . 1500 Hz

Sg3 = 1, 6254 · Sg2("B1" adatai alapján)

0255075

100

0255075

0255075

0255075

Tal

álat

i ar

ányok

0255075

0255075

1100 1200 1300 14000

255075

Sg2

0

25

0

25

0

25

0

25

Tév

es r

iasz

tási

ará

nyok

0

25

0

25

1100 1200 1300 14000

25

Sg2

1

2

3

4

5

6

3

1

2

4

5

6

Összes CV kapcsolat Összes CV kapcsolat

Sg2 (Hz)

(%) (%

)

Sg2 (Hz)

12 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 13: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Locus egyenlet Osztályozás, eredménye

Osztályozás eredménye

Sg2 = 1000 . . . 1500 Hz

Sg3 = 1, 6254 · Sg2("B1" adatai alapján)

tartományonként eltérooptimum

optimális osztályozás:Sg2 = 1260 Hz

0255075

100

0255075

0255075

0255075

Tal

álat

i ar

ányok

0255075

0255075

1100 1200 1300 14000

255075

Sg2

0

25

0

25

0

25

0

25

Tév

es r

iasz

tási

ará

nyok

0

25

0

25

1100 1200 1300 14000

25

Sg2

1

2

3

4

5

6

3

1

2

4

5

6

Összes CV kapcsolat Összes CV kapcsolat

Sg2 (Hz)

(%) (%

)

Sg2 (Hz)

12 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 14: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Locus egyenlet Osztályozás, eredménye

Osztályozás eredménye - összesítve

Sg2 = 1260 Hz

Találat (%) 86,6%Téves (%) 2,3%

Sg2meres = 1244 Hz

Találat (%) 85,5%Téves (%) 2,4%

0255075

100

0

25

Sg2 (Hz) 1000 1250 1500

Találati arány (%)

Téves riasztási arány (%)

1000 1250 1500

Sg2 (Hz)

Összes CV kapcsolat

13 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 15: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Következtetések További irányok

Összefoglalás, következtetések

"B1" beszéloformánsokszubglottális rezonanciák

locus egyenlet tér: F2msh − F2mghCV csoportok képzési hely szerint

osztályozás6 elkülönülo tartománySGR közel az optimumhoz

SGR-ek szerepe a beszédbenhatár a magánhangzócsoportok közötthatár a mássalhangzócsoportok között

14 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 16: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Következtetések További irányok

További kutatási irányok

lehetséges alkalmazási területekbeszélo normalizálásbeszélo felismerés

további kutatásalternatív SGR mérési módszerekpercepciós kísérletektöbb beszélo vizsgálatamás nyelvek vizsgálata

15 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 17: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Következtetések További irányok

További kutatási irányok

lehetséges alkalmazási területekbeszélo normalizálásbeszélo felismerés

további kutatásalternatív SGR mérési módszerekpercepciós kísérletektöbb beszélo vizsgálatamás nyelvek vizsgálata

Köszönöm a [email protected]

15 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján

Page 18: Mássalhangzó-magánhangzó kapcsolatok automatikus ...smartlab.tmit.bme.hu/downloads/pdf/csapot/CsapoNemeth-mszny2009... · Mássalhangzó-magánhangzó kapcsolatok automatikus

Bevezetés Módszerek Eredmények Összefoglalás Következtetések További irányok

IrodalomjegyzékBoersma, P. and Weenink, D.: Praat (Version 5.1.19), http://www.praat.org, (2009).Chi, X. and Sonderegger, M.: Subglottal coupling and its influence on vowel formants, JASA 122, 1735–1745, (2007).Csapó, T. G., Bárkányi, Zs., Gráczi, T. E., Bohm, T. and Lulich, S. M.: Relation of formants and subglottal resonancesin Hungarian vowels, Proc. Interspeech, 484–487, (2009).Gray, H.: Anatomy of the human body, Philadelphia: Lea & Febiger, (1918).Gósy, M.: Fonetika, a beszéd tudománya, Osiris Kiadó, Budapest, (2004).Jung, Y.: Subglottal effects on the vowels across language: Preliminary study on Korean, JASA 125, 2638, (2009).Lulich, S. M., Bachrach, A. and Malyska, N.: A role for the second subglottal resonance in lexical access, JASA 122,2320–2327, (2007).Lulich, S. M.: Subglottal resonances and distinctive features, J. Phon., doi:10.1016/j.wocn.2008.10.006, (2009).Lulich, S. M.: On the relation between locus equations and subglottal resonances, POMA 5, 060003, (2009).Lulich, S. M. and Chen, N. F.: Automatic classification of consonant-vowel transitions based on subglottal resonancesand the second formant, POMA 6, 060005, (2009).Madsack, A., Lulich, S. M., Wokurek, W., and Dogil, G.: Subglottal resonances and vowel formant variability: A casestudy of High German monophthongs and Swabian diphthongs, Proc. LabPhon11, 91–92, (2008).Mihajlik, P., Révész, T. and Tatai, P.: Phonetic Transcription in Automatic Speech Recognition, Acta LinguisticaHungarica, Vol. 49. (3-4), 407–425, (2002).Sjölander, K. and Beskow, J.: Wavesurfer (Version 1.8.5), http://www.speech.kth.se/wavesurfer, (2009).Stevens, K. N.: On the quantal nature of speech, J. Phon. 17, 3–45, (1989).Stevens, K. N.: Acoustic Phonetics, MIT Press: Cambridge, MA, (1998).Wang, S., Lulich, S. M. and Alwan, A.: A reliable technique for detecting the second subglottal resonance and its usein cross-language speaker adaptation, Proc. Interspeech, 1717–1720, (2008).Wang, S., Lee, Y.-H. and Alwan, A.: Bark-shift based nonlinear speaker normalization using the second subglottalresonance, Proc. Interspeech, 1619–1622, (2009).Wokurek, W. and Madsack, A.: Comparison of Manual and Automated Estimates of Subglottal Resonances, Proc.Interspeech, 1671–1674, (2009).

16 / 15 Csapó Tamás Gábor, Németh Géza CV kapcsolatok automatikus osztályozása SGR-ek alapján