63
1 xö lý tiÕng nãi xö lý tiÕng nãi TrÞnh V¨n Loan TrÞnh V¨n Loan FIT-HUT FIT-HUT

Bài giảng Xu Li Tieng Noi Thay Loan

Embed Size (px)

DESCRIPTION

bài giảng xử lý tiếng nói đại học bách khoa hà nội

Citation preview

Page 1: Bài giảng Xu Li Tieng Noi Thay Loan

1

xö lý tiÕng nãixö lý tiÕng nãixö lý tiÕng nãixö lý tiÕng nãi

TrÞnh V¨n LoanTrÞnh V¨n LoanFIT-HUTFIT-HUT

Page 2: Bài giảng Xu Li Tieng Noi Thay Loan

2

Xö lý tiÕng nãi

Tµi liÖu tham kh¶oTµi liÖu tham kh¶o1.1. La parole et son traitement La parole et son traitement automatiqueautomatique

Calliope, Masson, 1989Calliope, Masson, 1989 22. . Traitement de la paroleTraitement de la parole

Rene Boite et Murat Kunt, Presse Rene Boite et Murat Kunt, Presse Polytechniques Romandes, 1987Polytechniques Romandes, 1987

33.. Fundamentals of Speech Signal Fundamentals of Speech Signal ProcessingProcessing

Saito S., Nakata K. , Academic Press, Saito S., Nakata K. , Academic Press, 19851985

Tµi liÖu tham kh¶oTµi liÖu tham kh¶o1.1. La parole et son traitement La parole et son traitement automatiqueautomatique

Calliope, Masson, 1989Calliope, Masson, 1989 22. . Traitement de la paroleTraitement de la parole

Rene Boite et Murat Kunt, Presse Rene Boite et Murat Kunt, Presse Polytechniques Romandes, 1987Polytechniques Romandes, 1987

33.. Fundamentals of Speech Signal Fundamentals of Speech Signal ProcessingProcessing

Saito S., Nakata K. , Academic Press, Saito S., Nakata K. , Academic Press, 19851985

Page 3: Bài giảng Xu Li Tieng Noi Thay Loan

3

Xö lý tiÕng nãi

Néi dungNéi dung

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

2. 2. Xö lý tin hiÖu tiÕng nãiXö lý tin hiÖu tiÕng nãi

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

4.4. Tæng hîp tiÕng nãi Tæng hîp tiÕng nãi

5.5. NhËn d¹ng tiÕng nãi NhËn d¹ng tiÕng nãi

Néi dungNéi dung

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

2. 2. Xö lý tin hiÖu tiÕng nãiXö lý tin hiÖu tiÕng nãi

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

4.4. Tæng hîp tiÕng nãi Tæng hîp tiÕng nãi

5.5. NhËn d¹ng tiÕng nãi NhËn d¹ng tiÕng nãi

Page 4: Bài giảng Xu Li Tieng Noi Thay Loan

4

Xö lý tiÕng nãi ?Xö lý tiÕng nãi ?

Xö lý th«ng tin chøa trong Xö lý th«ng tin chøa trong tÝn hiÖu tiÕng nãi nh»m tÝn hiÖu tiÕng nãi nh»m truyÒn, l u tr÷truyÒn, l u tr÷ tÝn hiÖu nµy tÝn hiÖu nµy hoÆc hoÆc tæng hîp, nhËn d¹ngtæng hîp, nhËn d¹ng tiÕng nãi.tiÕng nãi.

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

C¸c nghiªn cøu ® îc tiÕn C¸c nghiªn cøu ® îc tiÕn hµnh ®Ó xö lý tiÕng nãi yªu hµnh ®Ó xö lý tiÕng nãi yªu cÇu nh÷ng hiÓu biÕt trªn cÇu nh÷ng hiÓu biÕt trªn nhiÒu lÜnh vùc ngµy cµng ®a nhiÒu lÜnh vùc ngµy cµng ®a d¹ng: tõ d¹ng: tõ ng÷ ©mng÷ ©m vµ vµ ng«n ng÷ ng«n ng÷ hächäc cho ®Õn cho ®Õn xö lý tÝn hiÖu...xö lý tÝn hiÖu...

Page 5: Bài giảng Xu Li Tieng Noi Thay Loan

5

Môc ®ÝchMôc ®Ých • M· ho¸M· ho¸ mét c¸ch cã hiÖu qu¶ mét c¸ch cã hiÖu qu¶ tÝn hiÖu tiÕng nãi ®Ó truyÒn vµ l tÝn hiÖu tiÕng nãi ®Ó truyÒn vµ l u tr÷ tiÕng nãi.u tr÷ tiÕng nãi.

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

•Tæng hîpTæng hîp vµ vµ nhËn d¹ngnhËn d¹ng tiÕng nãi tiÕng nãi tiÕn tíi giao tiÕp ng êi-m¸y b»ng tiÕn tíi giao tiÕp ng êi-m¸y b»ng tiÕng nãi.tiÕng nãi.TÊt c¶ c¸c øng dông cña xö lý TÊt c¶ c¸c øng dông cña xö lý tiÕng nãi ®Òu cÇn ph¶i dùa trªn tiÕng nãi ®Òu cÇn ph¶i dùa trªn c¸c kÕt qu¶ cña c¸c kÕt qu¶ cña ph©n tÝchph©n tÝch tiÕng tiÕng nãinãi

Page 6: Bài giảng Xu Li Tieng Noi Thay Loan

6

11. . Mét sè kh¸i niÖm c¬ b¶nMét sè kh¸i niÖm c¬ b¶n

Ph©n biÖt tiÕng nãi vµ Ph©n biÖt tiÕng nãi vµ ©m ©m thanh:thanh:

c¸c ®Æc tÝnh ©m häc cã c¸c ®Æc tÝnh ©m häc cã nguån gèc tõ c¬ chÕ t¹o tiÕng nguån gèc tõ c¬ chÕ t¹o tiÕng nãi.nãi.

Cã 2 lo¹i nguån ©mCã 2 lo¹i nguån ©m tuÇn hoµn (d©y thanh tuÇn hoµn (d©y thanh rung)rung) t¹p ©m (d©y thanh kh«ng t¹p ©m (d©y thanh kh«ng rung)rung)

Page 7: Bài giảng Xu Li Tieng Noi Thay Loan

7

Bé m¸y ph¸t ©mBé m¸y ph¸t ©m1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Họng

Thực quản

Nắp thanh quản

Khí quản

Dây thanh

Vòm miệng cứng

Vòm miệng mềm

Khoang mũi

Lưỡi

Page 8: Bài giảng Xu Li Tieng Noi Thay Loan

8

S¬ ®å khèi bé m¸y ph¸t ©mS¬ ®å khèi bé m¸y ph¸t ©m

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 9: Bài giảng Xu Li Tieng Noi Thay Loan

9

Thanh m«n (1)Thanh m«n (1)11.. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Thanh môn

Dây thanh

Page 10: Bài giảng Xu Li Tieng Noi Thay Loan

10

Thanh m«n (2Thanh m«n (2))ë c¸c vÞ trÝ hÝt, thë, ph¸t ©m, ë c¸c vÞ trÝ hÝt, thë, ph¸t ©m, nãi th× thµonãi th× thµo

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 11: Bài giảng Xu Li Tieng Noi Thay Loan

11

D©y thanh trong mét chu kú dao D©y thanh trong mét chu kú dao ®éng®éng

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 12: Bài giảng Xu Li Tieng Noi Thay Loan

12

BiÓu diÔn tÝn hiÖu tiÕng BiÓu diÔn tÝn hiÖu tiÕng nãinãi

D¹ng sãng theo thêi gianD¹ng sãng theo thêi gian

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 13: Bài giảng Xu Li Tieng Noi Thay Loan

13

BiÓu diÔn tÝn hiÖu tiÕng nãiBiÓu diÔn tÝn hiÖu tiÕng nãi

Phæ tÝn hiÖu tiÕng nãiPhæ tÝn hiÖu tiÕng nãi

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 14: Bài giảng Xu Li Tieng Noi Thay Loan

14

BiÓu diÔn tÝn hiÖu tiÕng nãiBiÓu diÔn tÝn hiÖu tiÕng nãi

Spectrogram (Sonagram)Spectrogram (Sonagram)

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 15: Bài giảng Xu Li Tieng Noi Thay Loan

15

T¹o ©m h÷u thanh . Formant vµ T¹o ©m h÷u thanh . Formant vµ antiformantantiformant

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 16: Bài giảng Xu Li Tieng Noi Thay Loan

16

T¹o ©m v« thanhT¹o ©m v« thanh

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 17: Bài giảng Xu Li Tieng Noi Thay Loan

17

Mét sè ®Æc ®iÓm ng÷ ©m Mét sè ®Æc ®iÓm ng÷ ©m tiÕng ViÖttiÕng ViÖt

§¬n ©m tiÕt§¬n ©m tiÕt

Cã thanh ®iÖu (6), biÕn ®æi Cã thanh ®iÖu (6), biÕn ®æi

thanh ®iÖu kÌm theo biÕn ®æi thanh ®iÖu kÌm theo biÕn ®æi

nghÜanghÜa Kh«ng biÕn ®æi h×nh th¸iKh«ng biÕn ®æi h×nh th¸i

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Page 18: Bài giảng Xu Li Tieng Noi Thay Loan

18

M« h×nh t¹o tiÕng nãi (Fant-M« h×nh t¹o tiÕng nãi (Fant-1960)1960)

)z1)(z1(A

)z(G 11 )z1)(z1(

A)z(G 11

K

1k

2k2

1k1 )zbzb1(

B)z(V

K

1k

2k2

1k1 )zbzb1(

B)z(V

)z1(C)z(R 1 )z1(C)z(R 1

P

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Läc th«ng Läc th«ng

thÊp G(z)thÊp G(z)

Läc th«ng Läc th«ng

thÊp G(z)thÊp G(z)TuyÕn TuyÕn ©m ©m

V(z)V(z)

TuyÕn TuyÕn ©m ©m

V(z)V(z)

T¶i bøc x¹T¶i bøc x¹

R(z)R(z)

T¶i bøc x¹T¶i bøc x¹

R(z)R(z)

Page 19: Bài giảng Xu Li Tieng Noi Thay Loan

19

A(z): Hµm truyÒn ®¹t cña bé läc A(z): Hµm truyÒn ®¹t cña bé läc ®¶o®¶o

M« h×nh toµn ®iÓm cùc M« h×nh toµn ®iÓm cùc (AR(AR))

)z(A)z(R)z(V)z(G)z(T

)z(A)z(R)z(V)z(G)z(T

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

1K2

1i

iiza1)z(A

1K2

1i

iiza1)z(A

)n(u)in(xa)n(xp

1ii

)n(u)in(xa)n(xp

1ii

)z(A)z(T

)z(A)z(T

Page 20: Bài giảng Xu Li Tieng Noi Thay Loan

20

NÕu tÝnh ®Õn khoang mòi NÕu tÝnh ®Õn khoang mòi xuÊt hiÖn c¸c ®iÓm xuÊt hiÖn c¸c ®iÓm kh«ng(ARMA)kh«ng(ARMA)

)z(A)z(C

)z(A)z(A)z(T

2

2

1

1 )z(A)z(C

)z(A)z(A)z(T

2

2

1

1 1zc)z(C -iq

0ii

0c 1zc)z(C -i

q

0ii

0c

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

)in(uc)in(xa)n(xq

0ii

p

1ii

)in(uc)in(xa)n(xq

0ii

p

1ii

Page 21: Bài giảng Xu Li Tieng Noi Thay Loan

21

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

2

k k kk 21 2

k k k

1 2 z cos zH (z)

1 2 z cos z z z

Bài 1.Hàm truyền đạt của một bộ lọc số ở tần số formant Fk được cho bởi:

 trong đó , , T: chu kỳ lấy mẫu, : dải thông. 1.       Vẽ các điểm cực của Hk(z) trong mặt phẳng Z

2.        Viết phương trình sai phân mô tả quan hệ giữa tín hiệu ra yk(n) và tín hiệu vào xk(n)

3.        Vẽ sơ đồ khối của bộ lọc số này với 3 bộ nhân.4.        Bằng cách sắp xếp lại các số hạng của phương trình sai phân, vẽ sơ đồ khối của bộ lọc số chỉ có 2 bộ nhân

kTkz e

k k2 F T k2

Page 22: Bài giảng Xu Li Tieng Noi Thay Loan

22

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

Bài 1.Hàm truyền đạt của một bộ lọc số ở tần số formant Fk được cho bởi:

 trong đó , , T: chu kỳ lấy mẫu, : dải thông. 

2

k k kk 21 2

k k k

1 2 z cos zH (z)

1 2 z cos z z z

kT

kz e k k2 F T k2

k

' 2 2 2 2 2k k k k k

1,2 k k k k

jk

| z | cos |z | |z | sin

p |z |cos j|z |sin

|z |e

  H(z) có 2 điểm cực là nghiệm của mẫu số:   

Page 23: Bài giảng Xu Li Tieng Noi Thay Loan

23

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

f

K

Dải thông

Fk

Bk

Page 24: Bài giảng Xu Li Tieng Noi Thay Loan

24

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

k

k Re(z)

Im(z)

|zk|

|zk|

p1

p2

Page 25: Bài giảng Xu Li Tieng Noi Thay Loan

25

Bài tậpBài tập

1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n

a) Xác định biến đổi z của g(n): Tra bảng

Page 26: Bài giảng Xu Li Tieng Noi Thay Loan

26

Ph©n tÝch phæ tÝn hiÖu tiÕng Ph©n tÝch phæ tÝn hiÖu tiÕng nãinãi

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

2. 2. XöXö lý tÝn hiÖu tiÕng nãilý tÝn hiÖu tiÕng nãi

Bé läc Bé läc hiÖu hiÖu

chØnhchØnh

Bé läc Bé läc hiÖu hiÖu

chØnhchØnh

Cöa Cöa sæsæ

Cöa Cöa sæsæ

FFTFFTFFTFFT

LogLog1010|.|.||

LogLog1010|.|.||H(z)=1-az-1

a = 0,95..0,98

Hamming

Page 27: Bài giảng Xu Li Tieng Noi Thay Loan

27

x’(n)= x(n).w(n)

X’(f) = X(f) * W(f)

Page 28: Bài giảng Xu Li Tieng Noi Thay Loan

28

s(n) = h(n) * e(n) S() = H().E()

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Xö lý ®ång h×nh Xö lý ®ång h×nh (homomorphisme) (homomorphisme)

log[S()]= log[H()]+ log[E()]

FFT-1{log[S()]}=FFT-1{log[H()]}+ FFT-1{log[E()]}FFT-1{log[S()]}: cepstrum:

FFT-1{log[H()]}: thông tin vê`h(n): FFT-1{log[E()]}: thông tin vê`nguô`n:

s(n)

h(n)

e(n)

Page 29: Bài giảng Xu Li Tieng Noi Thay Loan

29

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

S¬ ®å khèi xö lý ®ång h×nh

Bé läc hiÖu

chØnh

Bé läc hiÖu

chØnh

Cöa sæ

Cöa sæ

FFTFFT

Log10|.|

Log10|.|

FFT-1FFT-1

c(n)

FFT

?

Page 30: Bài giảng Xu Li Tieng Noi Thay Loan

30

T0

h(n)

ˆˆ ˆs(n) h(n) e(n)

Page 31: Bài giảng Xu Li Tieng Noi Thay Loan

31

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Tiªn ®o¸n tuyÕn tÝnh (Linear

Prediction Coding)

Tiªn ®o¸n

p

1ii )in(xa)n(x

p

1ii )in(xa)n(x

Sai sè tiªn ®o¸n

)n(x)n(x)n(e )n(x)n(x)n(e

Sai sè b×nh ph ¬ng toµn phÇn

n

2 )n(eE n

2 )n(eE

Tèi thiÓu ho¸ sai sè

p,...,2,1i,0aE

i

p,...,2,1i,0aE

i

M« h×nh toµn ®iÓm cùc

)n(u)in(xa)n(xp

1ii

)n(u)in(xa)n(xp

1ii

Page 32: Bài giảng Xu Li Tieng Noi Thay Loan

32

22.. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

X¸c ®Þnh tÇn sè c¬ b¶n Fo

Giäng nam: 80 .. 250 Hz. Giäng n÷: 150..500 Hz

X¸c ®Þnh

Fo

X¸c ®Þnh

Fo

§¸nh gi¸

kÕt qu¶

§¸nh gi¸

kÕt qu¶

TiÒn

xö lý

TiÒn

xö lý

Mét sè ph ¬ng ph¸p x¸c ®Þnh Fo Dùa vµo hµm tù t ¬ng quan

Dùa vµo hµm vi sai biªn ®é trung b×nh

Dïng bé läc ®¶o vµ hµm tù t ¬ng quan

Xö lý ®ång h×nh

Page 33: Bài giảng Xu Li Tieng Noi Thay Loan

33

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm tù t ¬ng quan

1

1

( ) ( ) ( ) 0,1,..., N k

n

r k x n x n k k K

Fs = 10 kHz, N = 300, K = Fs = 10 kHz, N = 300, K =

150150

T×m cùc ®¹i trong kho¶ng T×m cùc ®¹i trong kho¶ng (0, K)(0, K)

Page 34: Bài giảng Xu Li Tieng Noi Thay Loan

34

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm tù t ¬ng quan

H¹n chÕ, lo¹i bá |x|<CH¹n chÕ, lo¹i bá |x|<CLL

Page 35: Bài giảng Xu Li Tieng Noi Thay Loan

35

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm vi sai biªn ®é trung b×nh (Average Magnitude Difference Function) (1)

( ) 0, 0,1,... D iP i 1/ 21 1

2

0 0

1 1( ) ( )

N N

n n

u n u nN N

2

1/ 2

1( ) [ ( ) ( )]

2[ (0) ( )] 0,1,...,1

1/2N-1

n=0

D k x n x n kNr r k k K

ví i

KkknxnxkDkN

n

,...,1,0 )()()(1

1

Page 36: Bài giảng Xu Li Tieng Noi Thay Loan

36

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm vi sai biªn ®é trung b×nh (Average Magnitude Difference Function) (2)

1000 1050 1100 1150 1200 1250

-0.25

-0.2

-0.15

-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25

x(n)

n50 100 150 200

0

10

20

30

40

50

D(k

)

k

1000 1050 1100 1150 1200 1250

-0.25

-0.2

-0.15

-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25

x(n)

n50 100 150 200

0

10

20

30

40

50

D(k

)

k

Page 37: Bài giảng Xu Li Tieng Noi Thay Loan

37

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Dïng bé läc ®¶o (Simplified Inverse Filter Tracking)(Simplified Inverse Filter Tracking)

Th«ng Th«ng thÊpthÊp

Th«ng Th«ng thÊpthÊp

Th«ng thÊp

Th«ng thÊp

1-z-11-z-1W(n)W(n)

LPC(p=4)

LPC(p=4)

A(z)A(z) Hµm tù t ¬ng quan

Hµm tù t ¬ng quan

T×m cùc ®¹iT×m cùc ®¹iNéi suyNéi suy§¸nh gi¸ kÕt qu¶§¸nh gi¸ kÕt qu¶

FoFo

HT/HT/VTVT

10kH10kHzz

47004700HzHz

900H900Hzz

Page 38: Bài giảng Xu Li Tieng Noi Thay Loan

38

Page 39: Bài giảng Xu Li Tieng Noi Thay Loan

39

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Xö lý ®ång h×nh

Page 40: Bài giảng Xu Li Tieng Noi Thay Loan

40

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Xö lý ®ång h×nh

X¸c ®Þnh formant (1)

Bé läc hiÖu

chØnh

Bé läc hiÖu

chØnh

Cöa sæ

Cöa sæ

FFTFFT

Log10|.|

Log10|.|

FFT-1FFT-1 FFTFFT

Wc(n)

Page 41: Bài giảng Xu Li Tieng Noi Thay Loan

41

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Xö lý ®ång h×nh

X¸c ®Þnh formant (1)

Page 42: Bài giảng Xu Li Tieng Noi Thay Loan

42

2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi

Tiªn ®o¸n tuyÕn tÝnh (LPC)

FFkk,B,Bkk

s(ns(n))

Bé läc

hiÖu chØnh

Bé läc

hiÖu chØnh

Cöa sæ

Cöa sæ

TÝnh h.s.

ai

TÝnh h.s.

ai

TÝnh1/ |A(ej)|

b»ng FFT

TÝnh1/ |A(ej)|

b»ng FFT

T×m

cùc ®¹i

T×m

cùc ®¹i

TÝnh nghiÖm

cña A(z)

TÝnh nghiÖm

cña A(z)

QuyÕt ®Þnh

QuyÕt ®Þnh

X¸c ®Þnh formant (2)

Page 43: Bài giảng Xu Li Tieng Noi Thay Loan

43

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

3. 3. M· ho¸ tiÕng nãiM· ho¸ tiÕng nãi

D·y thao t¸c m· ho¸ vµ gi¶i m·D·y thao t¸c m· ho¸ vµ gi¶i m·

M· ho¸M· ho¸F1F1 ADAD

Gi¶i m·

Gi¶i m·

DADA F2F2

NhiÔu, suy gi¶m,sai sè

NhiÔu, suy gi¶m,sai sè

Page 44: Bài giảng Xu Li Tieng Noi Thay Loan

44

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Mét sè tÝnh chÊt thèng kª cña Mét sè tÝnh chÊt thèng kª cña tÝn hiÖu tiÕng nãitÝn hiÖu tiÕng nãi MËt ®é x¸c suÊt N : sè l îng mÉu x(n)

cã biªn ®é trong kho¶ng [-/2, +/2] n[-N,...,N] x egodic vµ dõng

0

( ) lim[ /(2 1)]xN

p N N

Page 45: Bài giảng Xu Li Tieng Noi Thay Loan

45

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Gi¸ trÞ trung b×nh vµ ph ¬ng sai• Gi¸ trÞ trung b×nh cña tÝn hiÖu

dõng

víi tÝn hiÖu tiÕng nãi, gi¶ thiÕt x = 0

• Ph ¬ng sai

1( )d lim ( )

2 1

N

x xN

n N

p x nN

2 2 21( )d lim ( )

2 1

N

x xN

n N

p x nN

Page 46: Bài giảng Xu Li Tieng Noi Thay Loan

46

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö tøc thêi (kh«ng nhí)L îng tö tøc thêi (kh«ng nhí)• LuËt l îng tö y = Q(x) ® îc ®Þnh nghÜa:

(L+1) møc tÝn hiÖu x(0), x(1), ..., x(L)

L møc l îng tö ho¸

• Mçi møc l îng tö ho¸ biÓu diÔn b»ng tõ b bit L = 2b.

• Sai sè l îng tö (t¹p ©m l îng tö) e = Q(x) - x• B íc l îng tö : hiÖu 2 møc tÝn hiÖu kÒ nhau

(i) = x(i)-x(i-1)• Th«ng l îng I = bFs (bit/s). Fs : tÇn sè lÊy

mÉu

Page 47: Bài giảng Xu Li Tieng Noi Thay Loan

47

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Thông lượng (1)• Tín hiệu lượng tử 8 bit (256 mức), Fs = 8

kHz Thông lượng = 64 kbit/s

• Tín hiệu lượng tử 16 bit (65536 mức), Fs = 16 kHz Thông lượng = 256 kbit/s ,

1 giờ tiếng nói 100 Mbyte

• Cần phải mã hoá tín hiệu tiếng nói (MPEG,

GSM, G723, ...) để truyền tiếng nói trên mạng hoặc lưu trữ

Page 48: Bài giảng Xu Li Tieng Noi Thay Loan

48

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Thông lượng (2)

Tần số lấy mẫu (kHz)

Số bit cho 1 mẫu

Thông luợng kbit/s

Dung lượng / phút

(kbyte)Lĩnh vực

48 16 768 11520 Ghi âm chuyên nghiệp

44,1 16 705,6 10584 CD Audio

32 16 512 7680 Radio FM

22 8 264 3960 Radio AM

8 8 64 960 Điện thoại

Page 49: Bài giảng Xu Li Tieng Noi Thay Loan

49

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®Òu• Tæng qu¸t, b íc l îng tö lµ hµm cña biªn ®é

tÝn hiÖu x (l îng tö kh«ng ®Òu) ®¬n gi¶n nhÊt lµ l îng tö ®Òu.

• Møc l îng tö ® îc chän gi÷a 2 møc tÝn hiÖuy(i) = (1/2)[x(i-1)+x(i)]

• LuËt l îng tö ®Òu vµ ®èi xøng ®Æc tr ng bëi:- c¸c møc b·o hoµ xs

- møc l îng tö L hoÆc (L+1) = 2b.

• B íc l îng tö = 2xs/L

Page 50: Bài giảng Xu Li Tieng Noi Thay Loan

50

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®ÒuL = 9

Page 51: Bài giảng Xu Li Tieng Noi Thay Loan

51

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®ÒuL = ?

0 2 4 6 8 10 12 14-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

0 2 4 6 8 10 12 14-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

Page 52: Bài giảng Xu Li Tieng Noi Thay Loan

52

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®ÒuL = 16

0 2 4 6 8 10 12 14-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

0 2 4 6 8 10 12 14-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

Page 53: Bài giảng Xu Li Tieng Noi Thay Loan

53

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö ®ÒuL îng tö ®Òu

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-0.2

0

0.2Quantification Error

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-1

0

1

0 2 4 6 8 10 12-0.2

0

0.2Quantification Error

Page 54: Bài giảng Xu Li Tieng Noi Thay Loan

54

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

C¸c tÝnh chÊt l îng tö ®ÒuC¸c tÝnh chÊt l îng tö ®Òu• MËt ®é x¸c suÊt sai sè l îng tö

ph©n bè ®Òu gi÷a -/2 vµ + -/2

• Trung b×nh t¹p ©m l îng tö = 0• Ph ¬ng sai

( ) ( ), ( 1) / 2 e xi

p p i L

/ 22 2 2

/ 2

/ d /12e

( ) ( ), ( 1) / 2 e xi

p p i L

( ) 1/ , / 20, / 2

ep

Page 55: Bài giảng Xu Li Tieng Noi Thay Loan

55

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

C¸c tÝnh chÊt l îng tö ®ÒuC¸c tÝnh chÊt l îng tö ®Òu• Tû sè tÝn hiÖu trªn nhiÔu

2

210lg (d B) 6,02 4,77 20lgx s

xe

xSN b

max4 (d B) 6 7,3NÕu sx SN b

Víi b 6, t¨ng 6 dB mçi khi t¨ng 1 bit l îng tö

§Ó cã chÊt l îng thÝch hîp cÇn cã b 11

Page 56: Bài giảng Xu Li Tieng Noi Thay Loan

56

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Tỷ số tín hiệu trên nhiễu

s

n

dB 10

WNSN

N W

SN 10log SN

¨ng l î ng tÝn hiÖu¨ng l î ng nhiÔu

dB 10

BiSN 20log

Bi

ªn ®é tÝn hiÖuªn ®é nhiÔu

Hoặc

Page 57: Bài giảng Xu Li Tieng Noi Thay Loan

57

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Tỷ số tín hiệu trên nhiễuNăng lượng SN (dB)

Tín hiệu = Nhiễu 0

Tín hiệu = 2 Nhiễu 2

Tín hiệu = 10 Nhiễu 10

Tín hiệu = 100 Nhiễu 20

Tín hiệu = 1000 Nhiễu 30

Tín hiệu = 10N Nhiễu N x 10

Page 58: Bài giảng Xu Li Tieng Noi Thay Loan

58

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö logaritL îng tö logarit• Sau khi lÊy logarit biªn ®é tÝn hiÖu sÏ m·

ho¸ tuyÕn tÝnh

log[]log[] Q[]Q[] M· ho¸M· ho¸

signe[]signe[]

x(n) c(n)

y(n)

y'(n)

exp[]exp[]Gi¶i m·

Gi¶i m·

signe[x(n)]

c’(n)

x'(n)x'(n)

Page 59: Bài giảng Xu Li Tieng Noi Thay Loan

59

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö logaritL îng tö logarit• Hai gi¶i ph¸p dïng cho ®iÖn tho¹iHai gi¶i ph¸p dïng cho ®iÖn tho¹iLuËt LuËt (dïng ë Mü) (dïng ë Mü)

log(1 )

log(1 )

xy

LuËt LuËt AA (dïng ë (dïng ë ch©u ¢u)ch©u ¢u)1 log

1 log

A xy

A

255 87,56 A

8 bit logarit ~ 12 bit l îng tö 8 bit logarit ~ 12 bit l îng tö ®Òu®Òu

Page 60: Bài giảng Xu Li Tieng Noi Thay Loan

60

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö thÝch nghiL îng tö thÝch nghi• B íc l îng tö tuú thuéc vµo biªn ®é tÝn hiÖu B íc l îng tö tuú thuéc vµo biªn ®é tÝn hiÖu

ThÝch nghi tr ícThÝch nghi tr ícy(n)y(n)

Q[]Q[] M· ho¸M· ho¸x(n)x(n)

c(n)c(n)ThÝch nghi

®é k.®¹i

ThÝch nghi

®é k.®¹iG(nG(n))

G(nG(n))

y(n)

y'(n)

Gi¶i m·

Gi¶i m·

c’(nc’(n))

::ˆ

ˆ y'(n)x'(n)=

G'(n)G’(n)G’(n)

Page 61: Bài giảng Xu Li Tieng Noi Thay Loan

61

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

L îng tö thÝch nghiL îng tö thÝch nghi ThÝch nghi sauThÝch nghi sau

Q[]Q[] M· ho¸M· ho¸x(n)x(n)

c(n)c(n)

y(n)y(n)

ThÝch nghi

®é k.®¹i

ThÝch nghi

®é k.®¹i

G(nG(n))

y(n)

y'(n)

Gi¶i m·

Gi¶i m·

c’(nc’(n))

::ˆ

ˆ y'(n)x'(n)=

G'(n)

G’(n)G’(n) ThÝch nghi

®é k.®¹i

ThÝch nghi

®é k.®¹i

Page 62: Bài giảng Xu Li Tieng Noi Thay Loan

62

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

M· ho¸ vi sai (DPCM) M· ho¸ vi sai (DPCM) L îng tö ho¸ L îng tö ho¸

Page 63: Bài giảng Xu Li Tieng Noi Thay Loan

63

3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi

Một số chuẩn mã hoá âm thanh/tiếng nói• G.721 : ADPCM, 32 kbps, 4bits, 8kHz• G.722 : ~ADPCM, 48 đến 64 kbps,• G.723 : ~ADPCM, 24 kbps, 3 bits, 8kHz• G.728 : 16 Kbps• GSM : điện thoại di động, 13 kbps• Linear Predictive Encoding (Xerox), 5 kbps• Code Excited Linear Prediction (CELP)• Digital Video Interactive : ~ADPCM, 4 đến 8 bits• VoIP: G723.1 (6.4kbits/s), G728, G729 (8kbits/s)