Upload
dung-nguyen
View
220
Download
0
Embed Size (px)
DESCRIPTION
bài giảng xử lý tiếng nói đại học bách khoa hà nội
Citation preview
1
xö lý tiÕng nãixö lý tiÕng nãixö lý tiÕng nãixö lý tiÕng nãi
TrÞnh V¨n LoanTrÞnh V¨n LoanFIT-HUTFIT-HUT
2
Xö lý tiÕng nãi
Tµi liÖu tham kh¶oTµi liÖu tham kh¶o1.1. La parole et son traitement La parole et son traitement automatiqueautomatique
Calliope, Masson, 1989Calliope, Masson, 1989 22. . Traitement de la paroleTraitement de la parole
Rene Boite et Murat Kunt, Presse Rene Boite et Murat Kunt, Presse Polytechniques Romandes, 1987Polytechniques Romandes, 1987
33.. Fundamentals of Speech Signal Fundamentals of Speech Signal ProcessingProcessing
Saito S., Nakata K. , Academic Press, Saito S., Nakata K. , Academic Press, 19851985
Tµi liÖu tham kh¶oTµi liÖu tham kh¶o1.1. La parole et son traitement La parole et son traitement automatiqueautomatique
Calliope, Masson, 1989Calliope, Masson, 1989 22. . Traitement de la paroleTraitement de la parole
Rene Boite et Murat Kunt, Presse Rene Boite et Murat Kunt, Presse Polytechniques Romandes, 1987Polytechniques Romandes, 1987
33.. Fundamentals of Speech Signal Fundamentals of Speech Signal ProcessingProcessing
Saito S., Nakata K. , Academic Press, Saito S., Nakata K. , Academic Press, 19851985
3
Xö lý tiÕng nãi
Néi dungNéi dung
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
2. 2. Xö lý tin hiÖu tiÕng nãiXö lý tin hiÖu tiÕng nãi
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
4.4. Tæng hîp tiÕng nãi Tæng hîp tiÕng nãi
5.5. NhËn d¹ng tiÕng nãi NhËn d¹ng tiÕng nãi
Néi dungNéi dung
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
2. 2. Xö lý tin hiÖu tiÕng nãiXö lý tin hiÖu tiÕng nãi
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
4.4. Tæng hîp tiÕng nãi Tæng hîp tiÕng nãi
5.5. NhËn d¹ng tiÕng nãi NhËn d¹ng tiÕng nãi
4
Xö lý tiÕng nãi ?Xö lý tiÕng nãi ?
Xö lý th«ng tin chøa trong Xö lý th«ng tin chøa trong tÝn hiÖu tiÕng nãi nh»m tÝn hiÖu tiÕng nãi nh»m truyÒn, l u tr÷truyÒn, l u tr÷ tÝn hiÖu nµy tÝn hiÖu nµy hoÆc hoÆc tæng hîp, nhËn d¹ngtæng hîp, nhËn d¹ng tiÕng nãi.tiÕng nãi.
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
C¸c nghiªn cøu ® îc tiÕn C¸c nghiªn cøu ® îc tiÕn hµnh ®Ó xö lý tiÕng nãi yªu hµnh ®Ó xö lý tiÕng nãi yªu cÇu nh÷ng hiÓu biÕt trªn cÇu nh÷ng hiÓu biÕt trªn nhiÒu lÜnh vùc ngµy cµng ®a nhiÒu lÜnh vùc ngµy cµng ®a d¹ng: tõ d¹ng: tõ ng÷ ©mng÷ ©m vµ vµ ng«n ng÷ ng«n ng÷ hächäc cho ®Õn cho ®Õn xö lý tÝn hiÖu...xö lý tÝn hiÖu...
5
Môc ®ÝchMôc ®Ých • M· ho¸M· ho¸ mét c¸ch cã hiÖu qu¶ mét c¸ch cã hiÖu qu¶ tÝn hiÖu tiÕng nãi ®Ó truyÒn vµ l tÝn hiÖu tiÕng nãi ®Ó truyÒn vµ l u tr÷ tiÕng nãi.u tr÷ tiÕng nãi.
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
•Tæng hîpTæng hîp vµ vµ nhËn d¹ngnhËn d¹ng tiÕng nãi tiÕng nãi tiÕn tíi giao tiÕp ng êi-m¸y b»ng tiÕn tíi giao tiÕp ng êi-m¸y b»ng tiÕng nãi.tiÕng nãi.TÊt c¶ c¸c øng dông cña xö lý TÊt c¶ c¸c øng dông cña xö lý tiÕng nãi ®Òu cÇn ph¶i dùa trªn tiÕng nãi ®Òu cÇn ph¶i dùa trªn c¸c kÕt qu¶ cña c¸c kÕt qu¶ cña ph©n tÝchph©n tÝch tiÕng tiÕng nãinãi
6
11. . Mét sè kh¸i niÖm c¬ b¶nMét sè kh¸i niÖm c¬ b¶n
Ph©n biÖt tiÕng nãi vµ Ph©n biÖt tiÕng nãi vµ ©m ©m thanh:thanh:
c¸c ®Æc tÝnh ©m häc cã c¸c ®Æc tÝnh ©m häc cã nguån gèc tõ c¬ chÕ t¹o tiÕng nguån gèc tõ c¬ chÕ t¹o tiÕng nãi.nãi.
Cã 2 lo¹i nguån ©mCã 2 lo¹i nguån ©m tuÇn hoµn (d©y thanh tuÇn hoµn (d©y thanh rung)rung) t¹p ©m (d©y thanh kh«ng t¹p ©m (d©y thanh kh«ng rung)rung)
7
Bé m¸y ph¸t ©mBé m¸y ph¸t ©m1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
Họng
Thực quản
Nắp thanh quản
Khí quản
Dây thanh
Vòm miệng cứng
Vòm miệng mềm
Khoang mũi
Lưỡi
8
S¬ ®å khèi bé m¸y ph¸t ©mS¬ ®å khèi bé m¸y ph¸t ©m
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
9
Thanh m«n (1)Thanh m«n (1)11.. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
Thanh môn
Dây thanh
10
Thanh m«n (2Thanh m«n (2))ë c¸c vÞ trÝ hÝt, thë, ph¸t ©m, ë c¸c vÞ trÝ hÝt, thë, ph¸t ©m, nãi th× thµonãi th× thµo
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
11
D©y thanh trong mét chu kú dao D©y thanh trong mét chu kú dao ®éng®éng
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
12
BiÓu diÔn tÝn hiÖu tiÕng BiÓu diÔn tÝn hiÖu tiÕng nãinãi
D¹ng sãng theo thêi gianD¹ng sãng theo thêi gian
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
13
BiÓu diÔn tÝn hiÖu tiÕng nãiBiÓu diÔn tÝn hiÖu tiÕng nãi
Phæ tÝn hiÖu tiÕng nãiPhæ tÝn hiÖu tiÕng nãi
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
14
BiÓu diÔn tÝn hiÖu tiÕng nãiBiÓu diÔn tÝn hiÖu tiÕng nãi
Spectrogram (Sonagram)Spectrogram (Sonagram)
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
15
T¹o ©m h÷u thanh . Formant vµ T¹o ©m h÷u thanh . Formant vµ antiformantantiformant
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
16
T¹o ©m v« thanhT¹o ©m v« thanh
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
17
Mét sè ®Æc ®iÓm ng÷ ©m Mét sè ®Æc ®iÓm ng÷ ©m tiÕng ViÖttiÕng ViÖt
§¬n ©m tiÕt§¬n ©m tiÕt
Cã thanh ®iÖu (6), biÕn ®æi Cã thanh ®iÖu (6), biÕn ®æi
thanh ®iÖu kÌm theo biÕn ®æi thanh ®iÖu kÌm theo biÕn ®æi
nghÜanghÜa Kh«ng biÕn ®æi h×nh th¸iKh«ng biÕn ®æi h×nh th¸i
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
18
M« h×nh t¹o tiÕng nãi (Fant-M« h×nh t¹o tiÕng nãi (Fant-1960)1960)
)z1)(z1(A
)z(G 11 )z1)(z1(
A)z(G 11
K
1k
2k2
1k1 )zbzb1(
B)z(V
K
1k
2k2
1k1 )zbzb1(
B)z(V
)z1(C)z(R 1 )z1(C)z(R 1
P
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
Läc th«ng Läc th«ng
thÊp G(z)thÊp G(z)
Läc th«ng Läc th«ng
thÊp G(z)thÊp G(z)TuyÕn TuyÕn ©m ©m
V(z)V(z)
TuyÕn TuyÕn ©m ©m
V(z)V(z)
T¶i bøc x¹T¶i bøc x¹
R(z)R(z)
T¶i bøc x¹T¶i bøc x¹
R(z)R(z)
19
A(z): Hµm truyÒn ®¹t cña bé läc A(z): Hµm truyÒn ®¹t cña bé läc ®¶o®¶o
M« h×nh toµn ®iÓm cùc M« h×nh toµn ®iÓm cùc (AR(AR))
)z(A)z(R)z(V)z(G)z(T
)z(A)z(R)z(V)z(G)z(T
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
1K2
1i
iiza1)z(A
1K2
1i
iiza1)z(A
)n(u)in(xa)n(xp
1ii
)n(u)in(xa)n(xp
1ii
)z(A)z(T
)z(A)z(T
20
NÕu tÝnh ®Õn khoang mòi NÕu tÝnh ®Õn khoang mòi xuÊt hiÖn c¸c ®iÓm xuÊt hiÖn c¸c ®iÓm kh«ng(ARMA)kh«ng(ARMA)
)z(A)z(C
)z(A)z(A)z(T
2
2
1
1 )z(A)z(C
)z(A)z(A)z(T
2
2
1
1 1zc)z(C -iq
0ii
0c 1zc)z(C -i
q
0ii
0c
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
)in(uc)in(xa)n(xq
0ii
p
1ii
)in(uc)in(xa)n(xq
0ii
p
1ii
21
Bài tậpBài tập
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
2
k k kk 21 2
k k k
1 2 z cos zH (z)
1 2 z cos z z z
Bài 1.Hàm truyền đạt của một bộ lọc số ở tần số formant Fk được cho bởi:
trong đó , , T: chu kỳ lấy mẫu, : dải thông. 1. Vẽ các điểm cực của Hk(z) trong mặt phẳng Z
2. Viết phương trình sai phân mô tả quan hệ giữa tín hiệu ra yk(n) và tín hiệu vào xk(n)
3. Vẽ sơ đồ khối của bộ lọc số này với 3 bộ nhân.4. Bằng cách sắp xếp lại các số hạng của phương trình sai phân, vẽ sơ đồ khối của bộ lọc số chỉ có 2 bộ nhân
kTkz e
k k2 F T k2
22
Bài tậpBài tập
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
Bài 1.Hàm truyền đạt của một bộ lọc số ở tần số formant Fk được cho bởi:
trong đó , , T: chu kỳ lấy mẫu, : dải thông.
2
k k kk 21 2
k k k
1 2 z cos zH (z)
1 2 z cos z z z
kT
kz e k k2 F T k2
k
' 2 2 2 2 2k k k k k
1,2 k k k k
jk
| z | cos |z | |z | sin
p |z |cos j|z |sin
|z |e
H(z) có 2 điểm cực là nghiệm của mẫu số:
23
Bài tậpBài tập
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
f
K
Dải thông
Fk
Bk
24
Bài tậpBài tập
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
k
k Re(z)
Im(z)
|zk|
|zk|
p1
p2
25
Bài tậpBài tập
1.1. Mét sè kh¸i niÖm c¬ b¶n Mét sè kh¸i niÖm c¬ b¶n
a) Xác định biến đổi z của g(n): Tra bảng
26
Ph©n tÝch phæ tÝn hiÖu tiÕng Ph©n tÝch phæ tÝn hiÖu tiÕng nãinãi
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
2. 2. XöXö lý tÝn hiÖu tiÕng nãilý tÝn hiÖu tiÕng nãi
Bé läc Bé läc hiÖu hiÖu
chØnhchØnh
Bé läc Bé läc hiÖu hiÖu
chØnhchØnh
Cöa Cöa sæsæ
Cöa Cöa sæsæ
FFTFFTFFTFFT
LogLog1010|.|.||
LogLog1010|.|.||H(z)=1-az-1
a = 0,95..0,98
Hamming
27
x’(n)= x(n).w(n)
X’(f) = X(f) * W(f)
28
s(n) = h(n) * e(n) S() = H().E()
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
Xö lý ®ång h×nh Xö lý ®ång h×nh (homomorphisme) (homomorphisme)
log[S()]= log[H()]+ log[E()]
FFT-1{log[S()]}=FFT-1{log[H()]}+ FFT-1{log[E()]}FFT-1{log[S()]}: cepstrum:
FFT-1{log[H()]}: thông tin vê`h(n): FFT-1{log[E()]}: thông tin vê`nguô`n:
s(n)
h(n)
e(n)
29
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
S¬ ®å khèi xö lý ®ång h×nh
Bé läc hiÖu
chØnh
Bé läc hiÖu
chØnh
Cöa sæ
Cöa sæ
FFTFFT
Log10|.|
Log10|.|
FFT-1FFT-1
c(n)
FFT
?
30
T0
h(n)
ˆˆ ˆs(n) h(n) e(n)
31
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
Tiªn ®o¸n tuyÕn tÝnh (Linear
Prediction Coding)
Tiªn ®o¸n
p
1ii )in(xa)n(x
p
1ii )in(xa)n(x
Sai sè tiªn ®o¸n
)n(x)n(x)n(e )n(x)n(x)n(e
Sai sè b×nh ph ¬ng toµn phÇn
n
2 )n(eE n
2 )n(eE
Tèi thiÓu ho¸ sai sè
p,...,2,1i,0aE
i
p,...,2,1i,0aE
i
M« h×nh toµn ®iÓm cùc
)n(u)in(xa)n(xp
1ii
)n(u)in(xa)n(xp
1ii
32
22.. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
X¸c ®Þnh tÇn sè c¬ b¶n Fo
Giäng nam: 80 .. 250 Hz. Giäng n÷: 150..500 Hz
X¸c ®Þnh
Fo
X¸c ®Þnh
Fo
§¸nh gi¸
kÕt qu¶
§¸nh gi¸
kÕt qu¶
TiÒn
xö lý
TiÒn
xö lý
Mét sè ph ¬ng ph¸p x¸c ®Þnh Fo Dùa vµo hµm tù t ¬ng quan
Dùa vµo hµm vi sai biªn ®é trung b×nh
Dïng bé läc ®¶o vµ hµm tù t ¬ng quan
Xö lý ®ång h×nh
33
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm tù t ¬ng quan
1
1
( ) ( ) ( ) 0,1,..., N k
n
r k x n x n k k K
Fs = 10 kHz, N = 300, K = Fs = 10 kHz, N = 300, K =
150150
T×m cùc ®¹i trong kho¶ng T×m cùc ®¹i trong kho¶ng (0, K)(0, K)
34
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm tù t ¬ng quan
H¹n chÕ, lo¹i bá |x|<CH¹n chÕ, lo¹i bá |x|<CLL
35
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm vi sai biªn ®é trung b×nh (Average Magnitude Difference Function) (1)
( ) 0, 0,1,... D iP i 1/ 21 1
2
0 0
1 1( ) ( )
N N
n n
u n u nN N
2
1/ 2
1( ) [ ( ) ( )]
2[ (0) ( )] 0,1,...,1
1/2N-1
n=0
D k x n x n kNr r k k K
ví i
KkknxnxkDkN
n
,...,1,0 )()()(1
1
36
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi Dùa vµo hµm vi sai biªn ®é trung b×nh (Average Magnitude Difference Function) (2)
1000 1050 1100 1150 1200 1250
-0.25
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
0.25
x(n)
n50 100 150 200
0
10
20
30
40
50
D(k
)
k
1000 1050 1100 1150 1200 1250
-0.25
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
0.25
x(n)
n50 100 150 200
0
10
20
30
40
50
D(k
)
k
37
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
Dïng bé läc ®¶o (Simplified Inverse Filter Tracking)(Simplified Inverse Filter Tracking)
Th«ng Th«ng thÊpthÊp
Th«ng Th«ng thÊpthÊp
Th«ng thÊp
Th«ng thÊp
1-z-11-z-1W(n)W(n)
LPC(p=4)
LPC(p=4)
A(z)A(z) Hµm tù t ¬ng quan
Hµm tù t ¬ng quan
T×m cùc ®¹iT×m cùc ®¹iNéi suyNéi suy§¸nh gi¸ kÕt qu¶§¸nh gi¸ kÕt qu¶
FoFo
HT/HT/VTVT
10kH10kHzz
47004700HzHz
900H900Hzz
38
39
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
Xö lý ®ång h×nh
40
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
Xö lý ®ång h×nh
X¸c ®Þnh formant (1)
Bé läc hiÖu
chØnh
Bé läc hiÖu
chØnh
Cöa sæ
Cöa sæ
FFTFFT
Log10|.|
Log10|.|
FFT-1FFT-1 FFTFFT
Wc(n)
41
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
Xö lý ®ång h×nh
X¸c ®Þnh formant (1)
42
2.2. Xö lý tÝn hiÖu tiÕng nãi Xö lý tÝn hiÖu tiÕng nãi
Tiªn ®o¸n tuyÕn tÝnh (LPC)
FFkk,B,Bkk
s(ns(n))
Bé läc
hiÖu chØnh
Bé läc
hiÖu chØnh
Cöa sæ
Cöa sæ
TÝnh h.s.
ai
TÝnh h.s.
ai
TÝnh1/ |A(ej)|
b»ng FFT
TÝnh1/ |A(ej)|
b»ng FFT
T×m
cùc ®¹i
T×m
cùc ®¹i
TÝnh nghiÖm
cña A(z)
TÝnh nghiÖm
cña A(z)
QuyÕt ®Þnh
QuyÕt ®Þnh
X¸c ®Þnh formant (2)
43
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
3. 3. M· ho¸ tiÕng nãiM· ho¸ tiÕng nãi
D·y thao t¸c m· ho¸ vµ gi¶i m·D·y thao t¸c m· ho¸ vµ gi¶i m·
M· ho¸M· ho¸F1F1 ADAD
Gi¶i m·
Gi¶i m·
DADA F2F2
NhiÔu, suy gi¶m,sai sè
NhiÔu, suy gi¶m,sai sè
44
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
Mét sè tÝnh chÊt thèng kª cña Mét sè tÝnh chÊt thèng kª cña tÝn hiÖu tiÕng nãitÝn hiÖu tiÕng nãi MËt ®é x¸c suÊt N : sè l îng mÉu x(n)
cã biªn ®é trong kho¶ng [-/2, +/2] n[-N,...,N] x egodic vµ dõng
0
( ) lim[ /(2 1)]xN
p N N
45
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
Gi¸ trÞ trung b×nh vµ ph ¬ng sai• Gi¸ trÞ trung b×nh cña tÝn hiÖu
dõng
víi tÝn hiÖu tiÕng nãi, gi¶ thiÕt x = 0
• Ph ¬ng sai
1( )d lim ( )
2 1
N
x xN
n N
p x nN
2 2 21( )d lim ( )
2 1
N
x xN
n N
p x nN
46
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö tøc thêi (kh«ng nhí)L îng tö tøc thêi (kh«ng nhí)• LuËt l îng tö y = Q(x) ® îc ®Þnh nghÜa:
(L+1) møc tÝn hiÖu x(0), x(1), ..., x(L)
L møc l îng tö ho¸
• Mçi møc l îng tö ho¸ biÓu diÔn b»ng tõ b bit L = 2b.
• Sai sè l îng tö (t¹p ©m l îng tö) e = Q(x) - x• B íc l îng tö : hiÖu 2 møc tÝn hiÖu kÒ nhau
(i) = x(i)-x(i-1)• Th«ng l îng I = bFs (bit/s). Fs : tÇn sè lÊy
mÉu
47
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
Thông lượng (1)• Tín hiệu lượng tử 8 bit (256 mức), Fs = 8
kHz Thông lượng = 64 kbit/s
• Tín hiệu lượng tử 16 bit (65536 mức), Fs = 16 kHz Thông lượng = 256 kbit/s ,
1 giờ tiếng nói 100 Mbyte
• Cần phải mã hoá tín hiệu tiếng nói (MPEG,
GSM, G723, ...) để truyền tiếng nói trên mạng hoặc lưu trữ
48
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
Thông lượng (2)
Tần số lấy mẫu (kHz)
Số bit cho 1 mẫu
Thông luợng kbit/s
Dung lượng / phút
(kbyte)Lĩnh vực
48 16 768 11520 Ghi âm chuyên nghiệp
44,1 16 705,6 10584 CD Audio
32 16 512 7680 Radio FM
22 8 264 3960 Radio AM
8 8 64 960 Điện thoại
49
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö ®ÒuL îng tö ®Òu• Tæng qu¸t, b íc l îng tö lµ hµm cña biªn ®é
tÝn hiÖu x (l îng tö kh«ng ®Òu) ®¬n gi¶n nhÊt lµ l îng tö ®Òu.
• Møc l îng tö ® îc chän gi÷a 2 møc tÝn hiÖuy(i) = (1/2)[x(i-1)+x(i)]
• LuËt l îng tö ®Òu vµ ®èi xøng ®Æc tr ng bëi:- c¸c møc b·o hoµ xs
- møc l îng tö L hoÆc (L+1) = 2b.
• B íc l îng tö = 2xs/L
50
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö ®ÒuL îng tö ®ÒuL = 9
51
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö ®ÒuL îng tö ®ÒuL = ?
0 2 4 6 8 10 12 14-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
0 2 4 6 8 10 12 14-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
52
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö ®ÒuL îng tö ®ÒuL = 16
0 2 4 6 8 10 12 14-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
0 2 4 6 8 10 12 14-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
53
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö ®ÒuL îng tö ®Òu
0 2 4 6 8 10 12-1
0
1
0 2 4 6 8 10 12-1
0
1
0 2 4 6 8 10 12-1
0
1
0 2 4 6 8 10 12-0.2
0
0.2Quantification Error
0 2 4 6 8 10 12-1
0
1
0 2 4 6 8 10 12-1
0
1
0 2 4 6 8 10 12-1
0
1
0 2 4 6 8 10 12-0.2
0
0.2Quantification Error
54
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
C¸c tÝnh chÊt l îng tö ®ÒuC¸c tÝnh chÊt l îng tö ®Òu• MËt ®é x¸c suÊt sai sè l îng tö
ph©n bè ®Òu gi÷a -/2 vµ + -/2
• Trung b×nh t¹p ©m l îng tö = 0• Ph ¬ng sai
( ) ( ), ( 1) / 2 e xi
p p i L
/ 22 2 2
/ 2
/ d /12e
( ) ( ), ( 1) / 2 e xi
p p i L
( ) 1/ , / 20, / 2
ep
55
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
C¸c tÝnh chÊt l îng tö ®ÒuC¸c tÝnh chÊt l îng tö ®Òu• Tû sè tÝn hiÖu trªn nhiÔu
2
210lg (d B) 6,02 4,77 20lgx s
xe
xSN b
max4 (d B) 6 7,3NÕu sx SN b
Víi b 6, t¨ng 6 dB mçi khi t¨ng 1 bit l îng tö
§Ó cã chÊt l îng thÝch hîp cÇn cã b 11
56
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
Tỷ số tín hiệu trên nhiễu
s
n
dB 10
WNSN
N W
SN 10log SN
¨ng l î ng tÝn hiÖu¨ng l î ng nhiÔu
dB 10
BiSN 20log
Bi
ªn ®é tÝn hiÖuªn ®é nhiÔu
Hoặc
57
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
Tỷ số tín hiệu trên nhiễuNăng lượng SN (dB)
Tín hiệu = Nhiễu 0
Tín hiệu = 2 Nhiễu 2
Tín hiệu = 10 Nhiễu 10
Tín hiệu = 100 Nhiễu 20
Tín hiệu = 1000 Nhiễu 30
Tín hiệu = 10N Nhiễu N x 10
58
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö logaritL îng tö logarit• Sau khi lÊy logarit biªn ®é tÝn hiÖu sÏ m·
ho¸ tuyÕn tÝnh
log[]log[] Q[]Q[] M· ho¸M· ho¸
signe[]signe[]
x(n) c(n)
y(n)
y'(n)
exp[]exp[]Gi¶i m·
Gi¶i m·
signe[x(n)]
c’(n)
x'(n)x'(n)
59
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö logaritL îng tö logarit• Hai gi¶i ph¸p dïng cho ®iÖn tho¹iHai gi¶i ph¸p dïng cho ®iÖn tho¹iLuËt LuËt (dïng ë Mü) (dïng ë Mü)
log(1 )
log(1 )
xy
LuËt LuËt AA (dïng ë (dïng ë ch©u ¢u)ch©u ¢u)1 log
1 log
A xy
A
255 87,56 A
8 bit logarit ~ 12 bit l îng tö 8 bit logarit ~ 12 bit l îng tö ®Òu®Òu
60
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö thÝch nghiL îng tö thÝch nghi• B íc l îng tö tuú thuéc vµo biªn ®é tÝn hiÖu B íc l îng tö tuú thuéc vµo biªn ®é tÝn hiÖu
ThÝch nghi tr ícThÝch nghi tr ícy(n)y(n)
Q[]Q[] M· ho¸M· ho¸x(n)x(n)
c(n)c(n)ThÝch nghi
®é k.®¹i
ThÝch nghi
®é k.®¹iG(nG(n))
G(nG(n))
y(n)
y'(n)
Gi¶i m·
Gi¶i m·
c’(nc’(n))
::ˆ
ˆ y'(n)x'(n)=
G'(n)G’(n)G’(n)
61
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
L îng tö thÝch nghiL îng tö thÝch nghi ThÝch nghi sauThÝch nghi sau
Q[]Q[] M· ho¸M· ho¸x(n)x(n)
c(n)c(n)
y(n)y(n)
ThÝch nghi
®é k.®¹i
ThÝch nghi
®é k.®¹i
G(nG(n))
y(n)
y'(n)
Gi¶i m·
Gi¶i m·
c’(nc’(n))
::ˆ
ˆ y'(n)x'(n)=
G'(n)
G’(n)G’(n) ThÝch nghi
®é k.®¹i
ThÝch nghi
®é k.®¹i
62
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
M· ho¸ vi sai (DPCM) M· ho¸ vi sai (DPCM) L îng tö ho¸ L îng tö ho¸
63
3.3. M· ho¸ tiÕng nãi M· ho¸ tiÕng nãi
Một số chuẩn mã hoá âm thanh/tiếng nói• G.721 : ADPCM, 32 kbps, 4bits, 8kHz• G.722 : ~ADPCM, 48 đến 64 kbps,• G.723 : ~ADPCM, 24 kbps, 3 bits, 8kHz• G.728 : 16 Kbps• GSM : điện thoại di động, 13 kbps• Linear Predictive Encoding (Xerox), 5 kbps• Code Excited Linear Prediction (CELP)• Digital Video Interactive : ~ADPCM, 4 đến 8 bits• VoIP: G723.1 (6.4kbits/s), G728, G729 (8kbits/s)