27
Chng 6 KIM ĐNH GI THIT THNG KÊ 133 Chương 6 Kim ñịnh githiết thng kê 1. KHÁI NIM Nhng thông tin tmu ca mt tng thñược dùng ñể suy ñoán vcác ñặc trưng ca tng thñó, chng hn ước lượng các tham sca mt tng thchúng ta ñã gp chương 6. Trong chương này, chúng ta bàn ñến mt dng suy ñoán khác, liên quan ñến các githiết thng kê, và các phép kim ñịnh ñể quyết ñịnh chp nhn hay bác bcác githiết ñó. 1.1. Định nghĩa. Mt githiết thng kê là mt khng ñịnh vphân phi ca mt hoc nhiu biến ngu nhiên. Nếu githiết thng kê xác ñịnh hoàn toàn mt phân phi, thì nó ñược gi là mt githiết thng kê ñơn; trường hp ngược li, nó ñược gi là mt githiết thng kê hp. Trong quá trình ñi ñến mt quyết ñịnh, chúng ta thường da vào mt qui lut hay mt kinh nghim nào ñó ñể ñặt ra mt githiết thng kê; sau ñó, xây dng nhng thtc, theo ñó, nhng githiết ñã ñặt ra ñược chp nhn hay bác b. Nhng thtc ñó ñược gi là nhng phép kim ñịnh (trc nghim) githiết thng kê. Phép kim ñịnh thường là phép so sánh gia hai hay nhiu giá tr. Githiết ñược ñặt ra ttường ñược gi là Githiết không, ký hiu H o . Ch“không” ñây có nghĩa là không có skhác bit có ý nghĩa vmt thng kê gia các giá trcn so sánh. Khi bác bH o , chúng ta schp nhn mt githiết H 1 khác, ñược gi là githiết ñối ca H o . Thí d, ñể so sánh hiu quñiu trca hai loi thuc A và B ñối vi mt bnh X, ñiu tra trên mu chúng ta có kết qutlkhi bnh p(A) > p(B). Vi ý mun chng minh hiu quca hai loi thuc trên là khác nhau, chúng ta ñặt githiết H o “ không có skhác nhau vhiu quñiu trca hai loi thuc A và B

Ki ểm ñị nh gi ả thi ết thống kê - AGU Staff Zone · Ch ng 6 KI M ĐNH GI THI T TH NG KÊ 133 Ch ương 6 Ki ểm ñịnh gi ả thi ết thống kê 1. KHÁI NI ỆM

  • Upload
    vodien

  • View
    219

  • Download
    0

Embed Size (px)

Citation preview

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 133

Chương 6

Kiểm ñịnh giả thiết thống kê

1. KHÁI NIỆM

Những thông tin từ mẫu của một tổng thể ñược dùng ñể suy ñoán về các ñặc trưng của tổng thể ñó, chẳng hạn ước lượng các tham số của một tổng thể mà chúng ta ñã gặp ở chương 6. Trong chương này, chúng ta bàn ñến một dạng suy ñoán khác, liên quan ñến các giả thiết thống kê, và các phép kiểm ñịnh ñể có quyết ñịnh chấp nhận hay bác bỏ các giả thiết ñó.

1.1. Định nghĩa. Một giả thiết thống kê là một khẳng ñịnh về phân phối của một hoặc nhiều biến ngẫu nhiên. Nếu giả thiết thống kê xác ñịnh hoàn toàn một phân phối, thì nó ñược gọi là một giả thiết thống kê ñơn; trường hợp ngược lại, nó ñược gọi là một giả thiết thống kê hợp.

Trong quá trình ñi ñến một quyết ñịnh, chúng ta thường dựa vào một qui luật hay một kinh nghiệm nào ñó ñể ñặt ra một giả thiết thống kê; sau ñó, xây dựng những thủ tục, theo ñó, những giả thiết ñã ñặt ra ñược chấp nhận hay bác bỏ. Những thủ tục ñó ñược gọi là những phép kiểm ñịnh (trắc nghiệm) giả thiết thống kê.

Phép kiểm ñịnh thường là phép so sánh giữa hai hay nhiều giá trị. Giả thiết ñược ñặt ra ttường ñược gọi là Giả thiết không, ký hiệu Ho. Chữ “không” ở ñây có nghĩa là không có sự khác biệt có ý nghĩa về mặt thống kê giữa các giá trị cần so sánh. Khi bác bỏ Ho, chúng ta sẽ chấp nhận một giả thiết H1 khác, ñược gọi là giả thiết ñối của Ho.

Thí dụ, ñể so sánh hiệu quả ñiều trị của hai loại thuốc A và B ñối với một bệnh X, ñiều tra trên mẫu chúng ta có kết quả tỉ lệ khỏi bệnh p(A) > p(B). Với ý muốn chứng minh hiệu quả của hai loại thuốc trên là khác nhau, chúng ta ñặt giả thiết Ho là “ không có sự khác nhau về hiệu quả ñiều trị của hai loại thuốc A và B

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 134

” hay “ sự khác nhau về hiệu quả ñiều trị của hai loại thuốc A và B là không có ý nghĩa ”.

Phương pháp của thủ tục là dùng kết quả của mẫu ñể chứng minh một giả thiết.

Xét mẫu kích thước n (X1, X2, …, Xn) ñược thành lập từ tổng thể X . Người ta chia Im(X1, X2, …, Xn) (còn gọi là không gian mẫu ) thành hai tập con, lần

lượt ñược ký hiệu là W và W* = Im(X1, X2, …, Xn) −−−− W. Khi mẫu cụ thể (x1, x2,

…, xn) ñược thực hiện, nếu (x1, x2, …, xn) ∈ W thì giả thiết Ho bị bác bỏ (chấp

nhận H1); nếu (x1, x2, …, xn) ∈ W* thì Ho ñược chấp nhận (bác bỏ H1). Tập hợp W ñược gọi là miền bác bỏ (hay miền tới hạn) của phép kiểm ñịnh. Như vậy, chúng ta có ñịnh nghĩa

1.2. Định nghĩa. Một phép kiểm ñịnh (hay trắc nghiệm) một giả thiết thống kê là một qui tắc, theo ñó, dựa vào một mẫu cụ thể ñược thực hiện, chúng ta có thể quyết ñịnh chấp nhận hay bác bỏ giả thiết ñang xét.

1.3. Định nghĩa. Nếu chúng ta bác bỏ giả thiết Ho khi, thực ra, nó phải ñược chấp nhận thì chúng ta ñã mắc phải sai lầm gọi là Sai lầm loại I. Nếu chúng ta chấp nhận Ho trong khi, thực ra, nó phải bị bác bỏ thì chúng ta ñã mắc phải sai lầm gọi là Sai lầm loại II.

Xác suất mắc phải sai lầm loại I, thường ký hiệu là α, gọi là Mức ý nghĩa của trắc nghiệm. Như vậy, xác suất ñể chấp nhận Ho khi nó ñúng là (1 − α).

Nếu ký hiệu β là xác suất mắc phải sai lầm loại II, thì xác suất ñể bác bỏ Ho khi nó sai là (1 − β), ñược gọi là Năng lực của phép kiểm ñịnh.

Như vậy, một báo cáo kết quả so sánh là “ sự khác biệt có ý nghĩa về mặt thống kê ở mức ý nghĩa 5% ” có nghĩa là “giả thiết không” Ho ñã bị bác bỏ với nguy cơ sai lầm là 5%. Các bước cơ bản của một phép kiểm ñịnh giả thiết thống kê:

1. Đặt giả thiết không Ho và giả thiết ñối H1,

2. Xác ñịnh mức ý nghĩa α của phép kiểm ñịnh,

3. Với cặp giả thiết và mức ý nghĩa α ñã xác ñịnh, chúng ta thiết lập ñược một Qui luật quyết ñịnh dùng ñể quyết ñịnh chấp nhận hay bác bỏ giả thiết Ho. Qui luật này bao gồm việc chọn một thống kê thích hợp ñể dùng cho phép kiểm ñịnh và ñưa ra một giá trị tới hạn ñể so sánh.

• Khác với phép kiểm ñịnh một giả thiết với mức ý nghĩa α cho trước, các nhà nghiên cứu thường xác ñịnh mức ý nghĩa nhỏ nhất, tại ñó, “giả thiết không” Ho bị bác bỏ. Từ ñó, người ta có ñịnh nghĩa

1.4. Định nghĩa. Trong một phép kiểm ñịnh, mức ý nghĩa nhỏ nhất, tại ñó, “giả thiết không” Ho có thể bị bác bỏ ñược gọi là giá trị xác suất hay p −−−− giá trị (p – value) của phép kiểm ñịnh.

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 135

Trong phạm vi của chương trình, giáo trình này chỉ giới thiệu một số phép kiểm ñịnh cơ bản.

1.5. Định nghĩa. Giả sử chúng ta có "giả thiết không" liên quan ñến một tham số θ là Ho: θ = θo. Khi ñó,

(a) nếu H1 là θ ≠ θo thì trắc nghiệm ñược gọi là hai ñuôi

(b) nếu H1 là θ < θo hay θ > θo thì trắc nghiệm ñược gọi là một ñuôi

2. KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ

Giả sử tổng thể X có phân phối chuẩn, với trung bình µ chưa biết. Chúng ta cần kiểm ñịnh giả thiết

Ho: µ = µo ñối với H1: µ ≠ µo,

với mức ý nghĩa α cho trước.

Phân biệt hai trường hợp:

2.1. Trường hợp 1: Biết σσσσ

Nếu Ho ñúng thì BNN

( )oX nU

− µσ

= ~ N(0,1).

Giả thiết Ho sẽ bị bác bỏ nếu |U| có giá trị khá lớn. Miền tới hạn ñược xác ñịnh bởi: Có một số C sao cho

P(|U| > C) = α ⇔ 1

2

C u α−=

C ñược gọi là giá trị tới hạn ( viết tắt là gtth) của trắc nghiệm

Như vậy, trong trường hợp này, gtth = −

u αααα12

Với mẫu cụ thể, chúng ta tính ñược giá trị u của U.

* Ho bị bác bỏ nếu ||||u|||| > gtth.

2.2. Trường hợp 2: Không biết σσσσ

Nếu Ho ñúng thì BNN

( )oX n

ST

− µ= ~ t(n -1)

Lý luận như trên, gtth = ( )−

nt

αααα1

12

Với mẫu cụ thể, chúng ta tính ñược giá trị u của U.

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 136

* Ho bị bác bỏ nếu |||| t |||| > gtth.

2.3. Chú ý. Trong trường hợp cỡ mẫu lớn ( n > 30), không cần giả thiết tổng thể X có phân phối chuẩn (do Định lý giới hạn trung tâm).

2.4. Thí dụ. Công ty ABC muốn sản xuất loại bóng ñèn có tuổi thọ trung bình µ = 1600 giờ. Nếu thời gian dùng ngắn hơn 1600 giờ thì công ty sẽ mất khách hàng; nếu thời gian dùng dài hơn thì chi phí sản xuất tăng lên. Để biết xem qui trình sản xuất có tốt không, công ty chọn một mẫu ngẫu nhiên gồm 64 bóng ñèn ñốt thử và thấy tuổi thọ trung bình của chúng là 1570 giờ với ñộ lệch chuẩn là 121 giờ. Hãy cho kết luận về qui trình sản xuất ở mức ý nghĩa 5%.

Giải.

Gọi X là BNN chỉ tuổi thọ của loại bóng ñèn do công ty ABC sản xuất

Kiểm ñịnh giả thiết:

Ho: µ = µo = 1600 giờ ñối với H1: µ ≠ µo.

Nếu Ho ñúng thì BNN ( ) 64oX

ST

− µ= ~ t(63).

Với mức ý nghĩa α = 0,05, gtth = (63)0,975

t = 1,9983

Với mẫu cụ thể, chúng ta có :

x = 1570, s = 121 và

(1570 1600) 64121

1,9835t−

= = − .

Vì |t | < gtth nên: Ở mức α = 0,05, giả thiết Ho ñược chấp nhận, nghĩa là qui trình sản xuất của công ty vẫn tốt.

2.5. Trắc nghiệm một ñuôi.

Trong phép kiểm ñịnh trên, có hai miền bác bỏ nằm ở “hai ñuôi” của phân phối nên còn ñược gọi là Trắc nghiệm hai ñuôi. Tuy nhiên, ñôi khi, chúng ta chỉ quan tâm ñến ñộ lệch về một phía so với giá trị của giả thiết. Phép kiểm ñịnh trong trường hợp này ñược gọi là Trắc nghiệm một ñuôi. Khi ñó,

Giả thiết Ho là µ = µo, còn H1 là µ > µo hay µ < µo.

Cụ thể.

2.5.1. Kiểm ñịnh giả thiết:

Ho: µ = µo ñối với H1: µ > µo,

với mức ý nghĩa α cho trước.

Giá trị tới hạn C ñược xác ñịnh bởi:

P(U > C) = α ⇔ gtth = 1u −α ( nếu biết σ ),

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 137

hoặc

P(T > C) = α ⇔ gtth = ( 1)1n

t−

− α ( nếu không biết σ )

Với mẫu cụ thể, nếu giá trị u hoặc t lớn hơn gtth thì Ho bị bác bỏ.

2.5.2. Kiểm ñịnh giả thiết:

Ho: µ = µo ñối với H1: µ < µo,

với mức ý nghĩa α cho trước.

Giá trị tới hạn là:

−−−− 1u −α , nếu biết σ;

hoặc −−−− ( 1)1n

t−

− α, nếu không biết σ

Vậy, với mẫu cụ thể:

* Ho bị bác bỏ nếu u < gtth. (hoặc t < gtth)

2.6. Thí dụ. Trở lại công ty ABC trong Thí dụ 5.2.4, Công ty tuyên bố rằng tuổi thọ trung bình của bóng ñèn do họ sản xuất là không dưới 1600 giờ. Với mẫu trên, bạn hãy cho kết luận về lời tuyên bố của công ty, ở mức ý nghĩa 4%.

Giải.

Kiểm ñịnh giả thiết:

Ho: µ = µo = 1600 giờ; ñối với H1: µ < µo.

Nếu Ho ñúng thì BNN

( ) 64oX

ST

− µ=

tuân theo luật phân phối t(63).

Với mức ý nghĩa α = 4%, gtth = 0,96

(63)t− = −−−− 1,7794

Với mẫu cụ thể, chúng ta có :

(1570 1600) 64121

1,9835t−= = − < gtth.

Vậy, ở mức ý nghĩa α = 0,04, giả thiết Ho bị bác bỏ, nghĩa là lời tuyên bố của công ty không phù hợp với thực tế.

3. KIỂM ĐỊNH GIẢ THIẾT VỀ TỈ LỆ TỔNG THỂ

(MẪU LỚN)

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 138

Giả sử tổng thể X có phân phối B(p). Với mẫu cỡ n > 30 thoả np ≥ 5 và n(1 − p) ≥ 5 thì phân phối nhị thức tiệm cận phân phối chuẩn nên có thể dùng trắc nghiệm U.

Chúng ta cần kiểm ñịnh giả thiết:

Ho: p = po ñối với H1 là: p ≠ po hay p < po hay p > po

Dùng trắc nghiệm U (2 ñuôi hoặc 1 ñuôi), với

( )

(1 )~ (0,1)o

o o

P p n

p pU N

−=

Thí dụ. Tại một ñịa phương, bệnh B có tỉ lệ 34%. Sau một ñợt ñiều trị, kiểm tra lại trên 100 người, thấy có 24 người bị bệnh B.

Hỏi ñợt ñiều trị có thực sự làm giảm tỉ lệ bệnh B ở ñịa phương trên không? ( kết luận ở mức α = 0,05 )

Giải. Gọi p là tỉ lệ bệnh B ở ñịa phương sau ñợt ñiều trị.

Kiểm ñịnh giả thiết:

Ho: p = po = 0,34 ñối với H1: p < po

Giá trị tỉ lệ bệnh B trên mẫu: p = 0,24

Nếu Ho ñúng thì BNN

( ) 100

(1 )

P po

p po oU

−= ~ N(0,1)

Với mức α = 0,05, gtth = − u0,95 = − 1,6449

Với mẫu cụ thể,

(0,24 0,34) 100

0,34 0,662,111u

×= = − < gtth

Vậy, chúng ta bác bỏ giả thiết Ho, i.e. ñợt ñiều trị thực sự có làm giảm tỉ lệ

bệnh B tại ñịa phương (kết luận ở mức α = 5%).

4. SO SÁNH HAI TRUNG BÌNH VỚI HAI MẪU ĐỘC LẬP

Xét hai mẫu (X1, X2, ..., Xn), ñặc tính X có phân phối chuẩn, với kỳ vọng

µX, ñộ lệch chuẩn σX và mẫu (Y1, Y2, ..., Ym), ñặc tính Y có phân phối chuẩn,

với kỳ vọng µY, ñộ lệch chuẩn σY. Giả sử hai mẫu trên ñộc lập nhau. Chúng ta

muốn kiểm ñịnh xem giữa µX và µY, thể hiện qua x và y , có khác nhau không?.

Phân biệt 2 trường hợp:

4.1. Trường hợp 1: Biết σσσσX và σσσσ Y.

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 139

Trắc nghiệm U sẽ ñược dùng, với

( ) ( )X Y

X Y

X YU

− − µ − µ=

σ

trong ñó,

2 2X Y

X Y n m

σ σ−σ = +

Chúng ta ñặt giả thiết không Ho là “sự khác nhau giữa x và y , là không có ý nghĩa về mặt thống kê”, hay hai mẫu trên ñược rút từ cùng một tổng thể, i.e.

µX = µY, và σX = σY.

Vậy, chúng ta phải có quyết ñịnh giữa hai giả thiết:

Ho: µX = µY

và H1: µX ≠ µY hay H1: µX > µY hay H1: µX < µY

Nếu Ho ñúng thì BNN

2 2X Yn m

X YU

σ σ

+

=

tuân theo luật phân phối chuẩn N(0, 1).

Thí dụ. Người ta cho hai nhóm học sinh, theo thứ tự, ñại diện cho hai trường A và B, làm một bài kiểm tra. Nhóm thứ nhất gồm 40 học sinh, có ñiểm trung bình 7,4; nhóm thứ hai gồm 50 học sinh, có ñiểm trung bình 7,8. Dựa vào mẫu trên, có thể kết luận rằng: Điểm trung bình của trường B tốt hơn ñiểm trung bình của trường A không? (kết luận ở mức ý nghĩa 4%). Biết rằng ñiểm số của mỗi học sinh của hai trường A và B có phân phối chuẩn với ñộ lệch chuẩn, theo thứ tự, là 0,8 và 0,7.

Giải.

Gọi X và Y, theo thứ tự, là biến ngẫu nhiên chỉ ñiểm số của mỗi học sinh của hai trường A và B thì X ~ N(µX, (0,8)2 ) và Y ~ N(µY, (0,7)2 ).

Chúng ta phải có quyết ñịnh giữa hai giả thiết:

Ho: µX = µY và H1: µX < µY

Nếu Ho ñúng thì BNN

2 2

40 50X Y

X YU

σ σ

+

= ~ N (0,1)

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 140

Với mức ý nghĩa α = 0,04, gtth = − u0,96 = − 1,7507

Với mẫu cụ thể, chúng ta có :

2 2(0,8) (0, 7)

40 50

7,4 7,82,4903u

−= = −

+

< gtth

Vậy, ở mức ý nghĩa 4%, giả thiết Ho bị bác bỏ, i.e. ñiểm trung bình của trường B thực sự tốt hơn trường A.

4.2. Trường hợp 2: Không biết σσσσX và σσσσY , nhưng biết σσσσX = σσσσY.

Nếu Ho ñúng thì BNN

( )2 1 1n m

X YT

S

−=

+,

trong ñó 2 2

2 ( 1) ( 1)

2X Yn S m S

Sn m

− + −=

+ −,

tuân theo luật phân phối Student với (n + m − 2) bậc tự do.

Trắc nghiệm t ñược sử dụng như trong trường hợp kiểm ñịnh giả thiết về trung bình.

Thí dụ. Trong một công ty sản xuất bóng ñèn, người ta muốn kiểm tra sự làm việc của hai phân xưởng A và B. Một mẫu gồm n = 10 bóng ñèn của phân xưởng A cho tuổi thọ trung bình 4000 giờ với ñộ lệch chuẩn 200 giờ. Một mẫu gồm m = 8 bóng ñèn của phân xưởng B cho tuổi thọ trung bình 4300 giờ với ñộ lệch chuẩn 250 giờ. Biết rằng tuổi thọ của mỗi bóng ñèn của haơ phân xưởng A và B, theo thứ tự, tuân theo luật phân phối chuẩn có cùng phương sai. Hãy cho kết luận về sự khác nhau giữa tuổi thọ trung bình của hai loại bóng ñèn trên ở mức ý nghĩa 1%.

Giải.

Gọi X và Y lần lượt là BNN chỉ tuổi thọ của bóng ñèn của phân xưởng A và B. Kiểm ñịnh giả thiết:

Ho: µX = µY ñối với H1: µX ≠ µY .

Nếu Ho ñúng thì BNN

( )2 1 110 8

X YT

S

−=

+~ t(10 + 8 −−−− 2)

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 141

Với mức α = 0,01, gtth = (16)0,995t = 2,9208

Với mẫu cụ thể:

2 22 9s 7s

s10 8 2

X Y+=

+ −49 843 75= . , ;

( )2 1 110 8

4000 4300

49843,75 0,2252,8329

x y

s

t− −

×+= = = −

Vì |t |< gtth nên không thể bác bỏ giả thiết Ho ở mức 1%.

Vậy, chúng ta kết luận rằng: Với mức ý nghĩa 1%, sự khác nhau về tuổi thọ trung bình của hai loại bóng ñèn trên là không có ý nghĩa về mặt thống kê..

5. SO SÁNH HAI TRUNG BÌNH VỚI DÃY SỐ LIỆU TỪNG CẶP

Phép kiểm ñịnh trên về hiệu hai trung bình nêu trên dựa trên cơ sở hai mẫu ñộc lập. Tuy nhiên, trong nhiều trường hợp, hai mẫu ñược chọn như là các giá trị ñược quan sát từng cặp ( ix , iy ), không ñộc lập; e.g. ño huyết áp của mỗi bệnh

nhân trước và sau khi ñiều trị bằng một loại thuốc.

Trong trường hợp này, ñặt D = X − Y, chúng ta có dãy số liệu trên mẫu tương ứng: i i id x y= − , (i = 1, 2, ..., n) ( hiệu giữa hai giá trị của cặp thứ i).

Chúng ta trở về trường hợp một mẫu (D1, D2, ..., Dn), ñặc tính D và giả thiết

không:

Ho: µX = µY ⇔ Ho: µD = 0.

Vì không biết σ D nên trắc nghiệm t là thích hợp cho trường hợp này, với

. ~ ( 1)D

D n

ST t n= −

Thí dụ. Người ta muốn nghiên cứu về ảnh hưởng của loại thuốc M ñến nhịp tim. Một mẫu ngẫu nhiên gồm 10 bệnh nhân ñược cho dùng thuốc M và ghi nhận nhịp tim trước và sau khi dùng thuốc. Kết quả nhịp tim như sau:

Bệnh nhân 1 2 3 4 5 6 7 8 9 10

Trước thuốc 65 68 71 79 75 83 77 80 65 78

Sau thuốc 63 68 75 72 80 80 80 85 67 81

Thuốc M có làm thay ñổi nhịp tim không? ( ở mức ý nghĩa 8%), biết rằng nhịp tim là biến ngẫu nhiên tuân theo luật phân phối chuẩn.

Giải.

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 142

Gọi X và Y, theo thứ tự, là biến ngẫu nhiên chỉ nhịp tim của mỗi người trước và sau khi dùng thuốc. Đặt: D = X −−−− Y, chúng ta có dãy số liệu trên mẫu như sau:

i 1 2 3 4 5 6 7 8 9 10

di 2 0 − 4 7 − 5 3 − 3 − 5 − 2 − 3

Kiểm ñịnh giả thiết:

Ho: µD = 0 ñối với H1: µD ≠ 0.

Nếu Ho ñúng thì BNN

=10

D

DT

S ~ t(9)

Với mức α = 0,08, gtth = 90 96 1 9727t =( ),

,

Với mẫu cụ thể:

1 3 94405Dd s= − =; , và

1 10

3 944050 8018t

−= = −( )

,,

Vì t < 2,262 nên: Với mức α = 5%, giả thiết Ho ñược chấp nhận , i.e. thuốc M không làm thay ñổi nhịp tim người sử dụng.

6. SO SÁNH HAI TỈ LỆ VỚI HAI MẪU LỚN ĐỘC LẬP

Giả sử mẫu (X1, X2, . . ., Xn), ñặc tính X ~ b(p1), có tỉ lệ mẫu 1P và giá trị tỉ

lệ mẫu 1p ; mẫu (Y1, Y2, . . ., Ym), ñặc tính Y ~ b(p2), có tỉ lệ mẫu 2P và giá trị

tỉ lệ mẫu 2p . Chúng ta muốn kiểm ñịnh xem sự khác nhau giữa 1p và 2p là có ý

nghĩa về mặt thống kê không? Trắc nghiệm U sẽ ñược dùng khi n ≥ 30, m ≥ 30,

1np ≥ 5, n(1 − 1p ) ≥ 5, 2mp ≥ 5 và m(1− 2p ) ≥ 5.

Chúng ta ñặt giả thiết không Ho là “ sự khác nhau giữa 1p và 2p là không có ý nghĩa về mặt thống kê ”, i.e. hai mẫu trên ñược rút từ cùng một tổng thể có ước lượng tỉ lệ là

1 2ˆ n p m p

n mp

++=

và ước lượng phương sai

2ˆ ˆ ˆ(1 )p pσ = −

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 143

Dùng trắc nghiệm U như trong phép kiểm ñịnh giả thiết về hiệu hai trung bình, với

( )1 2

1 1ˆ ˆ(1 )~ (0,1)

n m

P P

p p

U N−

− +=

Thí dụ. Để so sánh về tỉ lệ một loại bệnh B ñối với trẻ sơ sinh trai và trẻ sơ sinh gái, người ta quan sát 100 bé trai thấy có 20 cháu mắc bệnh B; quan sát 120 bé gái thấy có 30 cháu mắc bệnh B, Hỏi tỉ lệ nhiễm bệnh B ñối với bé trai và gái có như nhau không? ( kết luận với mức ý nghĩa α = 0,01 ).

Giải.

Giả sử p1 và p2 lần lượt là tỉ lệ bệnh B của bé trai và bé gái.

Kiểm ñịnh giả thiết:

Ho: p1 = p2 ñối với H1: p1 ≠ p2

Nếu Ho ñúng, thì hai mẫu trên ñược xem như rút từ cùng một tổng thể có ước lượng tỉ lệ là

20 30 5220 22

p̂+= =

và BNN

( )1 2

1 1100 120

ˆ ˆ(1 )~ (0,1)

P P

p p

U N−

− +=

Với mức ý nghĩa α = 0,01, gtth = 0,995 2,5758u =

Với mẫu cụ thể,

20 301 2100 120

0,2; 0,25;p p= = = =

5 17 1 122 22 100 120

0,2 0,25

. .( )0,8812u

+= = < gtth

Vậy ở mức ý nghĩa 1%, Ho không thể bị bác bỏ, i.e. tỉ lệ nhiễm loại bệnh B ñối với bé trai và bé gái là như nhau.

7. KIỂM ĐỊNH GIẢ THIẾT VỀ PHƯƠNG SAI

Giả sử tổng thể X có phân phối N(µ, σ2), trong ñó σ chưa biết. Dựa vào mẫu

cỡ n, chúng ta kiểm ñịnh giả thiết H0: σ2 = 20σ ở mức ý nghĩa α cho trước.

Nếu H0 ñúng thì biến ngẫu nhiên

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 144

−=

2

2( 1)

o

n SY

σσσσ

tuân theo luật phân phối χ 2 (n − 1).

Trắc nghiệm dựa trên phân phối của Y có thể là trắc nghiệm 1 ñuôi hay 2 ñuôi. Chúng ta dễ dàng tìm ñược giá trị tới hạn trong mỗi trường hợp.

(a) Trường hợp giả thiết ñối là H1: σ2 < 20σ :

gtth = 2 ( 1)nαχ − và H0 bị bác bỏ nếu y < gtth

(b) Trường hợp giả thiết ñối là H1: σ2 > 20σ :

gtth = 21 ( 1)n− αχ − và Ho bị bác bỏ nếu y > gtth

(c) Trường hợp giả thiết ñối là : H1: σ2 ≠ 20σ :

Ho bị bác bỏ khi P(Y < a) + P(Y > b) = α, trong ñó a và b ñược chọn sao cho

P(Y < a) = P(Y > b) = 2α .

Vậy, các giá trị tới hạn là:

2

2 ( 1)nαχ − và

2

2

1( 1)nα−

χ − .

Ho bị bác bỏ nếu

y <

2

2 ( 1)nαχ − hay y >

2

2

1( 1)nα−

χ −

Thí dụ. Bằng phương pháp cũ, người ta tìm ñược hàm lượng ñạm trong một loại hạt ñạt mức trung bình là 4,2% với ñộ lệch chuẩn 0,45%. Người ta làm với phương pháp mới lặp lại 5 lần với kết quả như sau: 2,3%; 2,4%; 4,0%; 5,5%; 5,8%. Hãy cho kết luận về hiệu quả của hai phương pháp trên ở mức ý nghĩa 1%.

Giải.

Gọi X là BNN chỉ hàm lượng ñạm trong loại hạt ñang khảo sát.

Giá trị trung bình mẫu: x = 4,0%, ñộ lệch chuẩn chuẩn mẫu: s = 1,654%.

Nếu chỉ so sánh giá trị trung bình thì hiệu quả của hai phương pháp không khác nhau mấy. Để ñánh giá hiệu quả của hai phương pháp, chúng ta hãy kiểm ñịnh về phương sai của hai phương pháp. Gọi σ2 là phương sai của phương pháp mới, chúng ta kiểm ñịnh giả thiết:

Ho: σ2 = 20σ = (0,45)2 ñối với H1: σ2 > (0,45)2

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 145

Nếu Ho ñúng thì biến ngẫu nhiên

2

24

o

SY =

σ

tuân theo luật phân phối χ 2 (4).

Với mức ý nghĩa α = 1%, gtth = 20,99 (4) 13,277χ =

Với mẫu cụ thể,

2

2 24 4 2,735

54,0247(0,45)o

sy

×= = =

σ> gtth

Ở mức ý nghĩa 1%, H0 bị bác bỏ.

Vậy, ở mức ý nghĩa 1%, phương pháp mới có phương sai lớn hơn phương pháp cũ, nói cách khác, phương pháp mới biến ñộng hơn nên không hiệu quả bằng phương pháp cũ.

8. TRẮC NGHIỆM χχχχ2

Trong nhiều trường hợp, các kết quả thu thập ñược trên mẫu thường không hoàn toàn phù hợp với những kết quả tương ứng trên lý thuyết. Thí dụ, mặc dù theo lý thuyết, khi chúng ta gieo một ñồng tiền vô tư 100 lần thì sẽ xuất hiện 50 lần mặt sấp và 50 lần mặt ngửa, nhưng thật hiếm khi chúng ta quan sát ñược ñúng kết quả trên.

Giả sử với một tổng thể nhất ñịnh, dựa trên một số tiêu chuẩn nào ñó, người ta chia tổng thể ñó thành nhiều lớp (biến cố ) rời nhau: B1, B2, . . ., Bk, với các

xác suất, theo thứ tự, là p1, p2, . . ., pk, với p1+ p2 + . . . + pk = 1.

Một mẫu cỡ n ñược thành lập từ tổng thể trên. Ký hiệu oi là tần số quan sát ñược trên mẫu của biến cố Bi, i = 1, 2, . . ., k.

Biến cố B1 B2 B3 . . . Bk Tổng

Tần số quan sát o1 o2 o3 . . . ok n

Giả thiết Ho: Xác suất ñể một phần tử rơi vào một trong các lớp B1, B2, .

. ., Bk, lần lượt là p1, p2, . . ., pk.

Giả thiết H1: Phủ ñịnh mệnh ñề trên.

Nếu Ho ñúng thì số phần tử kỳ vọng rơi vào một trong các lớp B1, B2, . .

., Bk , gọi là tần số lý thuyết, lần lượt là:

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 146

e1 = np1, e2 = np2, . . ., ek = npk

Như vậy, chúng ta có bảng:

Biến cố B1 B2 B3 . . . Bk Tổng

Tần số quan sát

Tần số lý thuyết

o1

e1

o2

e2

o3

e3

. . .

. . .

ok

ek

n

n

Chúng ta muốn biết sự khác biệt giữa tần số quan sát và tần số lý thuyết thực sự có ý nghĩa không?.

Để ñánh giá sự khác biệt trên, thống kê sau ñây ñã ñược sử dụng:

2 22

1 1

( )k ki i i

i ii i

O e OQ n

e e= =

−= = −∑ ∑

Nếu Q2 = 0 thì tần số quan sát và tần số lý thuyết hoàn toàn phù hợp nhau; trong khi nếu Q2 > 0 thì chúng không hoàn toàn phù hợp nhau. Giá trị của Q2

càng lớn thì sự khác biệt giữa tần số quan sát và tần số lý thuyết càng có ý nghĩa.

Chúng ta công nhận:

8.1. Định lý. Phân phối mẫu của Q2 rất tiệm cận với phân phối χ2 ñịnh bởi:

2 21 1 12 2 2

( 2)2 2Y ( )Q ZQ

o oY Q e Y Q eν − − −ν −= =

nếu các tần số lý thuyết không nhỏ hơn 5. Sự tiệm cận càng tốt với n càng lớn.

Bậc tự do ν ñược cho bởi:

a) ν = k − 1 nếu các tần số lý thuyết có thể ñược tính mà không có một sự ước lượng nào từ mẫu.

b) ν = k − 1− m nếu các tần số lý thuyết có thể ñược tính nhờ vào m ước lượng từ mẫu.

Trong thực hành, các tần số lý thuyết ñược tính trên cơ sở của giả thiết H0.

Nếu với giả thiết này và với mức ý nghĩa α cho trước, giá trị của Q2 lớn hơn 21 ( )− αχ ν thì chúng ta kết luận rằng sự khác nhau giữa tần số quan sát và lý

thuyết là có ý nghĩa.và giả thiết H0 bị bác bỏ. H0 ñược chấp nhận trong trường hợp

ngược lại. Thủ tục này ñược gọi là Trắc nghiệm χχχχ2.

• Trắc nghiệm χ2

thường ñược dùng trong việc kiểm ñịnh các giả thiết liên quan ñến tính phù hợp giữa phân phối thực nghiệm với phân phối lý thuyết, tính ñộc lập giữa hai biến ngẫu nhiên và sự khác nhau giữa nhiều tỉ lệ.

Dữ liệu dùng trong trắc nghiệm χ2

thường ñược trình bày dưới dạng bảng. Thí dụ như bảng nêu trên gọi là bảng một chiều, bảng 1 × c. Mở rộng, chúng ta có

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 147

bảng hai chiều dạng h × c, trong ñó, các tần số quan sát ñược viết trong h hàng và c cột. Các báng như thế ñược gọi là các Bảng ngẫu nhiên.

Tương ứng với mỗi tần số quan sát trong bảng ngẫu nhiên h × c, có một tần số lý thuyết ñược tính dựa trên giả thiết không. Những tần số trong những ô của một bảng ngẫu nhiên ñược gọi là những Tần số ô. Tổng các tần số theo hàng hoặc theo cột ñược gọi là Tần số lề.

Theo Định lý 6.8.1, phân phối mẫu của BNN Q2 tiệm cận phân phối χ2 với bậc tự do ν, với h > 1 và c > 1, ñược cho bởi:

a) ν = (h − 1)(c − 1) nếu các tần số lý thuyết có thể ñược tính mà không có một sự ước lượng nào từ mẫu.

b) ν = (h − 1)(c − 1) − m nếu các tần số lý thuyết có thể ñược tính nhờ vào m ước lượng từ mẫu.

Bảng ngẫu nhiên 2 × 3

I II III Tổng

A o1 o2 o3 nA

B o4 o5 o6 nB

Tổng nI nII nIII n

8.2. Thí dụ. Quan sát khối lượng X (kg) của một nhóm người cùng lứa tuổi, kết quả ñược ghi lại như sau:

Xi (30, 40] (40, 45] (45, 50] (50, 55] (55, 60] (60, 70]

Số người 9 15 24 27 17 8

Có tài liệu cho rằng khối lượng của những người cùng lứa tuổi trên tuân theo luật phân phối chuẩn. Tài liệu trên có phù hợp với kết quả quan sát trên mẫu không? ( kết luận ở mức α = 0,05 ).

Giải.

Các giả thiết:

Giả thiết H0: Khối lượng của những người cùng lứa tuổi trên tuân theo luật phân phối chuẩn.

Giả thiết H1: Khối lượng của những người cùng lứa tuổi trên không tuân theo luật phân phối chuẩn.

Ước lượng trung bình và phương sai của X bằng các giá trị của trung bình và phương sai mẫu.

Từ mẫu, chúng ta tính ñược: x = 50,075 và s2 = 60,032

Nếu H0 ñúng thì X ~ N(50 ; 60). Khi ñó:

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 148

p1 = 40 50 43 50

7,75 7,75(30 40) ( ) ( ) 0,1P X

− −≤ ≤ = Φ − Φ = 0 ;

p2 = P(40 < X � 45) = 0,16;

p3 = P(45 < X ≤ 50) = 0,24; p4 = P(50 < X ≤ 55) = 0,24;

p5 = P(55 < X ≤ 60) = 0,16; p6 = P(60 < X ≤ 70) = 0,10.

Bảng tính χ2 với 3 bậc tự do:

Lớp oi pi ei (oi − ei)2 / ei

(30, 40] 9 0,10 10 0,1

(40, 45] 15 0,16 16 0,0625

(45, 50] 24 0,24 24 0

(50, 55] 27 0,24 24 0.375

(55, 60] 17 0,16 16 0,0625

(60, 70] 8 0,10 10 0,4

Tổng N = 100 Q2 = 1

Với mức ý nghĩa α = 0,05, gtth = 21 α−χ (3) = 7,82.

Vì Q2 < 7,82 nên, ở mức 5%, chúng ta không thể bác bỏ H0, i.e. chúng ta chấp nhận rằng X tuân theo luật phân phối chuẩn.

8.3. Thí dụ. Gieo một con xúc xắc 120 lần, tần số quan sát của các mặt ñược cho trong bảng sau:

Mặt 1 2 3 4 5 6

Tần số 25 17 15 23 24 16

Hãy kiểm ñịnh giả thiết cho rằng con xúc xắc là vô tư ở mức ý nghĩa 5%.

Giải.

Giả thiết Ho: Con xúc xắc là vô tư.

Giả thiết H1: Con xúc xắc là không vô tư.

Với giả thiết H0, chúng ta có các tần số lý thuyết ñược cho trong bảng sau:

Mặt 1 2 3 4 5 6

Tần số quan sát

Tần số lý thuyết

25

20

17

20

15

20

23

20

24

20

16

20

Giá trị của Q2 với 5 bậc tự do là:

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 149

262

1

( )Q 5,00i i

ii

o e

e=

−= =∑

Với mức ý nghĩa α = 0,05, gtth = 21 α−χ (5) = 11,1

Vì Q2 < gtth nên ở mức ý nghĩa α = 5%., chúng ta không thể bác bỏ giả thiết Ho, i.e. chúng ta chập nhận rằng con xúc xắc là vô tư

8.4. Thí dụ. Trong một trường ñại học, số các sinh viên ñậu và rớt bởi môn học của 3 Thầy A, B và C ñược cho trong bảng dưới ñây. Hãy kiểm ñịnh giả thiết cho rằng tỉ lệ sinh viên bị rớt bởi môn học của 3 Thầy là như nhau ở mức ý nghĩa α = 5%.

Thầy A Thầy B Thầy C Tổng

Đậu 50 47 56 153

Rớt 5 14 8 27

Tổng 55 61 64 180

Giải. Với giả thiết H0, cho rằng tỉ lệ sinh viên bị rớt bởi môn học của 3 Thầy là như nhau, chúng ta dễ dàng tính ñược các tần số lý thuyết, ñược viết trong ngoặc ñơn, phía dưới tần số quan sát tương ứng.

Thầy A Thầy B Thầy C Tổng

Đậu 50

( 46,75 )

47

( 51,85 )

56

( 54,40 )

153

Rớt 5

( 8,25 )

14

( 9,15 )

8

( 9,60 )

27

Tổng 55 61 64 180

Giá trị của Q2 với (h − 1)(c − 1) = 2 bậc tự do là:

2 2 22

2 2 2

(50 46,75) (47 51,85) (56 54, 40 )

46,75 51,85 54, 40

(5 8,25) (14 9,15) (8 9,60)4,84

8,25 9,15 9,60

Q− − −

= + + +

− − −+ + + =

Với mức ý nghĩa α = 0,05, gtth = 21 α−χ (2) = 5,99.

Vì Q2 < gtth nên chúng ta không thể bác bỏ giả thiết H0 ở mức ý nghĩa 5%.

Nói cách khác, chúng ta chấp nhận rằng tỉ lệ sinh viên bị rớt bởi ba Thầy là như nhau ở mức ý nghĩa 5%.

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 150

BÀI TẬP

6.1. Trong một cuộc ñiều tra về nhịp mạch của 64 thanh niên làm nghề A, kết quả là nhịp mạch trung bình 74 lần/phút và ñộ lệch chuẩn bằng 9 lần/phút. Hãy kiểm ñịnh xem ñặc ñiểm nghề A có làm cho nhịp mạch của thanh niên tăng quá mức bình thường không, biết rằng nhịp mạch bình thường của thanh niên là 72 lần / phút. ( kết luận với mức α = 0,01 ).

6.2. Điều tra Cholesterol toàn phần trong huyết thanh của 25 bệnh nhân bị một loại bệnh B, ta có trung bình cộng của lượng Cholesterol là 172 mg% và ñộ lệch chuẩn bằng 40 mg%. Theo tài liệu về hằng số sinh hoá bình thường của người Việt Nam thì lượng Cholesterol trung bình toàn phần trong huyết thanh là 156 mg% và tuân theo luật phân phối chuẩn.

Hỏi lượng Cholesterol của các bệnh nhân mắc bệnh B có cao hơn bình thường không ? ( mức α = 0,05 )

6.3. Một công ty bào chế một loại thuốc chữa dị ứng tuyên bố rằng thuốc của họ có hiệu quả không dưới 90% trong việc làm giảm cơn dị ứng trong vòng 8 giờ. Một mẫu gồm 200 người bị dị ứng sử dụng loại thuốc trên, có 160 người giảm cơn dị ứng. Hãy xác ñịnh xem lời tuyên bố của công ty có giá trị không? ( ở mức ý nghĩa α = 0,07).

6.4. Trước ñây, Nhà máy Alpha sản xuất ra một loại sản phẩm với tỉ lệ phế phẩm 5%. Năm nay, sau ñợt cải tiến kỹ thuật, ñể kiểm tra hiệu quả, người ta lấy ra ra một mẫu gồm 800 sản phẩm ñể kiểm tra thì thấy có 24 phế phẩm.

(a) Với mức ý nghĩa α = 5%, hãy kiểm ñịnh xem ñợt cải tiến kỹ thuật có thực sự làm giảm tỉ lệ phế phẩm không?.

(b) Sau ñợt cải tiến kỹ thuật, nếu nhà máy báo cáo tỉ lệ phế phẩm là 2% thì có chấp nhận ñược không? (ở mức ý nghĩa α = 3%)

6.5. Tiền lương hàng tuần trung bình trên một mẫu gồm 30 công nhân trong một xí nghiệp lớn là 180 (ngàn ñồng) với với ñộ lệch chuẩn 14 (ngàn ñồng). Trong một xí nghiệp lớn khác, một mẫu gồm 40 công nhân ñược chọn ngẫu nhiên có tiền lương hàng tuần trung bình là 170 (ngàn ñồng) với ñộ lệch chuẩn 10 (ngàn ñồng). Tiền lương hàng tuần trung bình ở hai xí nghiệp trên có khác nhau không? ( ở mức ý nghĩa α = 5%).

6.6. Gọi X và Y lần lượt là biến ngẫu nhiên chỉ khối lượng của trẻ sơ sinh trai và trẻ sơ sinh gái. Cho biết X và Y tuân theo luật phân phối chuẩn có cùng phương sai. Khảo sát ngẫu nhiên 20 trẻ sơ sinh trai, người ta tính ñược x = 3200 g, sX = 400 g và 17 trẻ sơ sinh gái, người ta tính ñược y = 3000 g, sY = 380 g.

Phải chăng khối lượng của trẻ sơ sinh trai lớn hơn khối lượng của trẻ sơ sinh gái? (kết luận với mức ý nghĩa α = 5%)

6.7. Khối lượng của một loại sản phẩm do một nhà máy sản xuất là một

biến ngẫu nhiên tuân luật phân phối chuẩn N(500; (8,5)2). Sau một thời gian sản

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 151

xuất, ban lãnh ñạo nhà máy nghi ngờ rằng khối lượng của loại sản phẩm này có xu hướng giảm, nên tiến hành cân thử 25 sản phẩm và thu ñược kết quả sau:

Khối lượng (g) 480 485 490 495 500 510

Số sản phẩm 2 3 8 5 3 4

Với mức ý nghĩa α = 5% , hãy cho kết luận về ñiều nghi ngờ trên.

6.8. Một công ty muốn ñánh giá về hiệu quả của một ñợt quảng cáo ñối với số sản phẩm bản ra của công ty. 10 cửa hàng bán sản phẩm của công ty ñược chọn ngẫu nhiên ñể theo dõi số lượng sản phẩm bán ra trong một tuần trước ñợt quảng cáo (TĐQC) và một tuần sau ñợt quảng cáo (SĐQC).

Cửa hàng 1 2 3 4 5 6 7 8 9 10

TĐQC 53 114 81 86 34 66 89 113 88 111

SĐQC 137 135 83 125 47 46 114 157 57 144

Hãy cho kết luận về hiệu quả của ñợt quảng cáo (ở mức α = 5%)

6.9. Một máy sản xuất tự ñộng có tỉ lệ sản xuất ra sản phẩm loại A lúc ñầu là 48%. Máy ñược cải tiến và sau một thời gian áp dụng, người ta kiểm tra 40 hộp, mỗi hộp gồm 10 sản phẩm và ghi lại số sản phẩm loại A trong mỗi hộp (SSPLA/h) như sau :

SSPLA/h 1 2 3 4 5 6 7 8 9 10

Số hộp 2 0 4 6 8 10 4 5 1 0

(a). Hãy ước lượng tỉ lệ sản phẩm loại A sau khi máy ñược cải tiến bằng khoảng tin cậy 95,44%

(b). Hãy cho kết luận về hiệu quả của việc cải tiến máy ở mức ý nghĩa α = 0,05.

6.10. Khối lượng trung bình khi xuất chuồng ở một trại chăn nuôi gà công nghiệp năm trước là 3,3 kg/con. Năm nay người ta sử dụng loại thức ăn mới. Sau một thời gian, cân thử 15 con khi xuất chuồng, có các số liệu sau: (ñơn vị kg)

3,25; 2,50; 4,00; 3,75; 3,80; 3,90; 4,02;

3,60; 3,80; 3,20; 3,82; 3,40; 3,75; 4,00; 3,50.

Giả thiết khối lượng gà là biến ngẫu nhiên phân phối theo qui luật chuẩn với phương sai 0,04.

(a) Với mức ý nghĩa α = 0,05, hãy cho kết luận về tác dụng của loại thức ăn mới.

(b) Nếu trại chăn nuôi báo cáo khối lượng trung bình của gà xuất chuồng năm nay là 3,7 kg/con thì có chấp nhận ñược không? (ở mức ý nghĩa α = 0,05)

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 152

6.11. Một cuộc ñiều tra của Hội phụ nữ ñể ñánh giá về một dư luận xã hội cho rằng lương của phụ nữ thấp hon lương của nam giới. Một mẫu nhiên gồm 4 ñàn ông có lương trung bình là 78,0 (ngàn ñồng), với ñộ lệch chuẩn mẫu là 24,4; một mẫu ngẫu nhiên khác ñôc lập với mẫu trên gồm 4 phụ nữ có lương trung bình là 63,5 (ngàn ñồng), với ñộ lệch chuẩn là 20,2. Giả sử rằng lương của cả nam và nữ giới ñều là các biến ngẫu nhiên tuân theo luật phân phối chuẩn có cùng phương sai. Hãy cho kết luận về cuộc ñiều tra trên ở mức ý nghĩa 10%.

6.12. Người ta muốn nghiên cứu tác dụng của việc cho sinh viên ñi thực tế xem sự tiếp thu kiến thức có tốt hơn không bằng cách so sánh ñiểm thi của nhóm sinh viên không ñi thực tế (SVKĐTT) với nhóm sinh viên có ñi thực tế (SVCĐTT). Kết quả như sau:

Điểm 0 1 2 3 4 5 6 7 8 9 10

SVCĐTT 0 0 3 9 7 5 17 10 11 4 1

SVKĐTT 3 3 6 11 7 13 10 12 4 1 3

Gọi X và Y lần lượt là biến ngẫu nhiên biểu thị ñiểm số của sinh viên có ñi thực tế và sinh viên không ñi thực tế.

Điểm thi của nhóm sinh viên có ñi thực tế có thực sự tốt hơn không? (kết luận ở mức ý nghĩa α = 0,01 )

6.13. Một công ty vận tải, muốn ñánh giá tác dụng của một loại chất phụ gia pha vào xăng, ñã chọn 10 chiếc xe. Cho mỗi chiếc chạy hai lần với cùng ñiều kiện như nhau; nhưng lần ñầu với xăng không có chất phụ gia (KPG), lần sau, với cùng một lượng xăng như lần ñầu, có chất phụ gia (CPG). Người ta ghi lại số dặm ñã ñi ñược của 10 chiếc xe trên trong hai lần như sau:

Xe KPG CPG Xe KPG CPG

1

2

2

4

5

26,2

25,7

22,3

19,6

18,1

26,7

25,8

21,9

19,3

18,4

6

7

8

9

10

15,8

13,9

12,0

11,5

10,0

15,7

14,2

12,6

11,9

10,3

Có sự khác nhau giữa số dặm trung bình ñi ñược với xăng không có chất phụ gia và có chất phụ gia không? (kết luận ở mức ý nghĩa 5%)

6.14. Khối lượng bao gạo (KLBG) là biến ngẫu nhiên có phân phối chuẩn N(50; 0,01). Có nhiều ý kiến của khách hàng phản ánh là khối lượng bị thiếu. Một nhóm thanh tra ñã cân ngẫu nhiên 25 bao gạo trong kho và ñược kết quả như sau:

KLBG (kg) (48; 48,5] (48,5; 49] (49; 49,5] (49,5; 50] (50; 50,5]

Số bao gạo 2 5 10 6 2

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 153

Hãy kiểm ñịnh xem ý kiến của khách hàng phản ánh có ñúng không? (kết luận ở mức ý nghĩa α = 5%).

6.15. Một mẫu gồm 300 cử tri ở khu vực A và một mẫu gồm 200 cử tri ở khu vực B cho thấy có 56% và 48%, theo thứ tự, ủng hộ ứng cử viên X. Ở mức ý nghĩa 5%, hãy kiểm ñịnh giả thiết:

(a) Có sự khác biệt giữa hai khu vực về sự ủng hộ ứng cử viên X.

(b) Ứng cử viên X ñược ủng hộ hơn ở khu vực A.

6.16. Điều tra ngẫu nhiên 200 người có hút thuốc lá, thấy có 28 người bị lao phổi; 170 người không hút thuốc lá, thấy có 12 người bị lao phổi. Tỉ lệ lao phổi giữa những người có và không hút thuốc lá có khác khau không? (kết luận ở mức ý nghĩa α = 1%).

6.17. Một nhà máy có hai phân xưởng A và B cùng sản xuất một loại trục máy. Sau một thời gian hoạt ñộng, chọn ngẫu nhiên 20 trục máy do phân xưởng A sản xuất, người ta ño ñược ñường kính của chúng như sau (ñơn vị mm)

250; 249; 251; 253; 248; 250; 250; 252; 257; 245;

248; 247; 249; 250; 280; 250; 247; 253; 256; 249.

Giả sử ñường kính của các trục máy ở hai phân xưởng A và B tuân theo luật phân phối chuẩn có cùng phương sai.

(a) Tìm khoảng tin cậy 95% cho ñường kính trung bình các trục máy do phân xưởng A sản xuất.

(b) Tìm khoảng tin cậy 90% cho phương sai của ñường kính các trục máy do phân xưởng A sản xuất.

(c) Giả sử ñường kính của một trục máy do phân xưởng A sản xuất, theo qui ñịnh là 250 mm. Hãy cho kết luận về chất lượng sản xuất của phân xưởng A ở mức ý nghĩa α = 5%.

(d) Đo ngẫu nhiên ñường kính 20 trục máy do phân xưởng B sản xuất, người ta tính ñược ñường kính trung bình là 249,8 với phương sai 56,2. Hãy kiểm ñịnh, ở mức ý nghĩa α = 5%, giả thiết Ho cho rằng ñường kính trung bình các trục máy ñược sản xuất ở hai phân xưởng là như nhau ñối với giả thiết H1 cho rằng chúng khác nhau.

6.18. Sản phẩm của một xí nghiệp ñúc cho phép số khuyết tật trung bình cho một sản phẩm là 3. Sau một ñợt cải tiến kỹ thuật, người ta lấy ngẫu nhiên 36 sản phẩm ñể kiểm tra số khuyết tật trên mỗi sản phẩm (SKTTMSP). Kết quả thu ñược như sau:

SKTTMSP 0 1 2 3 4 5 6

Số sản phẩm 7 4 4 6 8 6 1

(a) Hãy cho kết luận về hiệu quả của ñợt cải tiến kỹ thuật ñối với số khuyết tật trung bình của một sản phẩm ở mức ý nghĩa α = 10%.

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 154

(b) Sản phẩm có không quá 2 khuyết tật ñược gọi là sản phẩm loại A. Tỉ lệ sản phẩm loại A trước ñợt cải tiến kỹ thuật là 40%. Đợt cải tiến kỹ thuật có thực sự làm tăng tỉ lệ sản phẩm loại A không? (kết luận ở mức ý nghĩa 5%).

6.19. Điều tra về hai chỉ tiêu X (cm) và Y(g), ñều có phân phối chuẩn, trên một một mẫu gồm một số sản phẩm do xí nghiệp A sản xuất, người ta có kết quả:

yk

xi

(90, 95] (95, 100] (100, 105] (105, 110]

25 5 19 12

30 13 23 10

35 2 15 7 5

40 8 2

(a) Những sản phẩm có chỉ tiêu Y không hơn 95 g gọi là sản phẩm loại II. Tìm khoảng tin cậy 98% cho trung bình chỉ tiêu X của những sản phẩm loại II.

(b) Báo cáo của xí nghiệp cho rằng tỉ lệ sản phẩm loại II của xí nghiệp không quá 13%. Hãy cho nhận xét về báo cáo trên ở mức ý nghĩa α = 8%.

6.20. Một hãng bào chế thuốc ñang thử nghiệm hai loại thuốc gây mê A và B mới. Việc thử nghiệm ñược tiến hành trên hai nhóm thú vật khác nhau. Nhóm thứ nhất gồm 100 con dùng thuốc A thì có 71 con bị mê; nhóm thứ hai, khi dùng thuốc B, có 58 con bị mê trong 90 con. Hãng bào chế muốn kiểm ñịnh xem tác dụng của hai loại thuốc trên có khác nhau không ở mức ý nghĩa 5%. Hãy cho biết kết luận.

6.21. Với ý muốn làm tăng chỉ số mỡ sữa của loại giống bò A, một trại chăn nuôi cho lai bò giống A với một loại bò giống B. Đo chỉ số mỡ sữa của 130 con bò lai giống ñược chọn ngẫu nhiên trong ñàn bò của trại, người ta có kết quả sau:

Chỉ số mỡ sữa Số bò lai

[3,0; 3,6)

[3,6; 4,2)

[4,2; 4,8)

[4,8; 5,4)

[5,4; 6,0)

[6,0; 6,6)

[6,6; 7,2)

2

8

35

43

22

15

5

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 155

(a) Hãy ước lượng chỉ số mỡ sữa trung bình của giống bò lai bằng khoảng tin cậy 99%.

(b) Biết rằng chỉ số mỡ sữa trung bình của giống bò A thuần chủng là 4,95. Hãy cho kết luận về hiệu quả của việc lai giống ở mức ý nghĩa 1%.

6.22. Điều tra về một nguyên nhân gây ung thư phổi:

Thăm dò trong 200 người có hút thuốc lá, thấy có 28 người bị K phổi; trong 170 người không không hút thuốc lá, có 12 người bị K phổi. Hai tỉ lệ này có khác nhau không ? Kết luận rằng thuốc lá là nguyên nhân gây K phổi có ñúng không? ( ở mức ý nghĩa α = 5%).

6.23. Để khảo sát mức thu nhập hàng năm của một nhân viên công ty ABC gồm 3000 người, một mẫu ngẫu nhiên gồm 144 nhân viên của công ty ñược quan sát về thu nhập hàng năm (ñơn vị tính triệu ñồng/năm). Kết quả như sau:

Thu nhập

(106ñ/năm)

số người Thu nhập

(106ñ/năm)

số người

[10, 14)

[14, 16)

[16, 18)

[18, 20)

5

15

22

34

[20, 22)

[22, 24)

[24, 26)

[26, 30)

25

20

14

9

(a) Tìm khoảng tin cậy 95% cho thu nhập trung bình hàng năm của một nhân viên công ty ABC.

(b) Những người có thu nhập hàng năm dưới 16 triệu là những người có thu nhập thấp. Hãy ước lượng số người có thu nhập thấp của công ty ABC với ñộ tin cậy 98%. Báo cáo của công ty cho rằng tỉ lệ những người có thu nhập thấp trong công ty là không quá 12%. Hãy cho nhận xét về báo cáo trên ở mức ý nghĩa 5%.

(c) Nếu công ty báo cáo rằng mức thu nhập trung bình của một nhân viên của công ty là không dưới 1,4 triệu ñ/tháng thì có chấp nhận ñược không? (kết luận ở mức ý nghĩa 4%)

(d) Nếu muốn dùng mẫu trên ñể ước lượng thu nhập trung bình của một nhân viên của công ty với sai số là 558 ngàn ñồng thì ñộ tin cậy ñạt ñược là bao nhiêu?

6.24. Nếu máy móc hoạt ñộng bình thường thì khối lượng một sản phẩm tuân theo luật phân phối chuẩn với ñộ lệch chuẩn không quá 1kg. Có thể coi máy móc còn hoạt ñộng bình thường hay không nếu cân thử 30 sản phẩm do máy ñó sản xuất ra, thì tính ñược ñộ lệch chuẩn là 1,1 kg. Yêu cầu kết luận ở mức ý nghĩa α = 1%.

6.25. Một nhà sản xuất bóng ñèn cho rằng chất lượng bóng ñèn ñược coi là ñồng ñều nếu tuổi thọ của bóng ñèn có ñộ lệch chuẩn bằng 1000 hoặc ít hơn. Lấy ngẫu nhiên 10 bóng ñể kiểm tra, thì ñược ñộ lệch chuẩn mẫu là 1150. Vậy, với

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 156

mức ý nghĩa 5%, có thể coi chất lượng bóng ñèn do công ty ñó sản xuất là ñồng ñều không? Biết rằng tuổi thọ của bóng ñèn là một BNN có phân phối chuẩn.

6.26. Tại một nông trường, ñể ñiều tra khối lượng của một loại trái cây, sau một ñợt bón một loại phân mới, người ta cân thử một số trái cây ñược chọn ngẫu nhiên và ñược kết quả sau:

Khối lượng (gam) Số trái cây

[45, 50)

[50, 55)

[55, 60)

[60, 65)

[65, 70)

[70, 75)

[75, 80)

≥ 80

2

11

25

74

187

43

16

3

(a) Người ta qui ñịnh rằng những trái cây có khối lượng nhỏ hơn 60 gam là thuộc loại 2. Hãy ước lượng tỉ lệ trái cây loại 2 bằng khoảng tin cậy 95% và ước lượng khối lượng trung bình của mỗi trái cây loại bằng khoảng tin cậy 90%

(b) Trước kia, khối lượng trung bình của mỗi trái là 65 gam. Hãy ñánh giá xem loại phân bón mới có mang lại hiệu quả không? (kết luận ở mức ý nghĩa α = 1%).

6.27. Một công ty thương mại, dựa vào kinh nghiệm quá khứ, ñã xác ñịnh rằng vào cuối năm thì 80% số hoá ñơn ñã ñược thanh toán ñầy ñủ, 10% khất lại 1 tháng, 6% khất lại 2 tháng, và 6% khất lại hơn 2 tháng. Vào cuối năm nay, công ty kiểm tra một mẫu ngẫu nhiên gồm 400 hoá ñơn và thấy rằng: 287 hoá ñơn ñã ñược thanh toán ñầy dủ, 49 khất lại 1 tháng, 30 khất lại 2 tháng và 34 khất lại hơn 2 tháng. Như vậy, việc thanh toán hoá ñơn năm nay có còn theo qui luật như những năm trước không? (kết luận ở mức ý nghĩa α = 5%).

6.28. Để lập kế hoạch sản xuất mặt hàng mới, một công ty ñã tiến hành ñiều tra về sở thích của khách hàng về 3 loại mẫu khác nhau của cùng một loại hàng. Kết quả ñược trình bày ở bảng sau:

Mẫu hàng

Ý kiến

A B C

Thích 43 30 42

Không thích 35 53 39

Không có ý kiến 22 17 19

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 157

Có hay không sự phân biệt về sở thích của khách hàng ñối với 3 loại mẫu nói trên? Kết luận ở mức ý nghĩa 5%

6.29. Điều tra một số sản phẩm của một xí nghiệp về chiều dài (X (cm)) và hàm lượng chất A (Y (%)), người ta có kết quả sau:

Y

X

8 10 12 14 16

100 5 5

110 4 6 7

120 5 9 8

130 4 6 9

140 5 7

(a) Các sản phẩm có chiều dài không quá 110cm và hàm lượng chất A không hơn 12% ñược gọi là sản phẩm loại II. Nếu xí nghiệp báo cáo rằng sản phẩm loại II có chỉ tiêu Y trung bình là 10% thì có thể chấp nhận ñược không? Kết luận ở mức ý nghĩa 5% (giả thiết hàm lượng này có phân phối chuẩn)

(b) Giá 1m sản phẩm là 280 VNĐ. Tìm khoảng tin cậy 98% cho giá trung bình một sản phẩm của xí nghiệp.

(c) Nếu muốc ước lượng tỉ lệ sản phẩm loại II với sai số không quá 3% và ước lượng chiều dài trung bình của sản phẩm với sai số không quá 8 mm, và cả hai ước lượng cùng ñộ tin cậy 87%, thì phải ñiều tra thêm bao nhiêu sản phẩm nữa?

6.30. Trong tổng thể bệnh M, bác sĩ (BS) tự hỏi, liệu hai triệu chứng S1 và

S2 có liên quan hay không?. BS quan sát ngẫu nhiên 300 người bệnh M, kết quả

như sau:

S2

S1

0 1

0 45 105

1 72 78

(a) Làm cách nào BS kiểm ñịnh sự liên quan giữa 2 triệu chứng trên?

(b) Với phép kiểm ñịnh ñã chọn, những giá trị nào của ngưỡng α có thể giúp kết luận?

(c) Tìm khoảng tin cậy 95% về tỉ lệ bệnh nhân M có cả hai triệu chứng S1

và S2 trong tổng thể.

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 158

(d) Một ñồng nghiệp cho rằng sự liên hệ giữa S1, S2 xảy ra do sự kiện là

bệnh M có 2 kiểu khác nhau là M1 và M2, nên ông cho rằng nếu lưu ý

ñiều này thì sự liên hệ S1, S2 sẽ không còn. Để chứng minh, ông ta dựa

trên mẫu vừa rồi, phân M ra 2 dạng M1, M2 và theo S1, S2.

M1 M2

S2

S1

0 1 S2

S1

0 1

0 27 93 0 18 12

1 11 35

1 61 43

Hãy giúp ông ta thực hiện phép kiểm ñịnh và kết luận.

(e) Dưạ vào quan sát trên, người ta kết hợp cả 3 biến S1, S2 và M, chẳng

hạn khả năng một bệnh nhân không có S1, S2 và bị M2 là 18/300 …

Nếu dùng S1, S2 ñể chẩn ñoán bệnh M1, M2 khi biết là bị bệnh M, bạn

cho biết khă năng bị M1 hoặc M2 khi: không có S1 lẫn S2; có S1

không S2; không S1 có S2; có cả S1 lẫn S2.

Xác suất sai lầm trong chẩn ñoán theo cách này là bao nhiêu?.

6.31. Gạo ñủ tiêu chuẩn xuất khẩu là gạo có tỉ lệ hạt nguyên, hạt vỡ và tấm, theo thứ tự, là: 90%, 6% và 4%.

Kiểm tra 1000 hạt gạo của một lô gạo, người ta thấy trong ñó có:

Hạt nguyên: 880; hạt vỡ: 60 và tấm: 60

Hỏi lô gạo có ñủ tiêu chuẩn xuất khẩu không? Cho kết luận ở mức ý nghĩa 5%.

6.32. Giám ñốc trại gà Alpha xem lại hồ sơ cũ của một ñợt khảo sát về khối lượng của gà xuất chuồng ở trại gà thì thấy số liệu ñược ghi như sau:

Khối lượng (kg) Số con gà

[2,3; 2,7)

[2,7; 2,9)

[2,9; 3,1)

[3,1; 3,3)

[3,3; 3,5)

[3,5; 3,7)

[3,7; 3,9)

5

30

25

10

5

5

(a) Giá trị … bỏ trống trong dòng thứ 3 do quá trình bảo quản tài liệu không tốt nên bị hoen ố mất ñi. Nhưng khi xem lại bảng tính cũ thì thấy

Ch��ng 6 KI�M Đ�NH GI� THI�T TH�NG KÊ 159

giá trị trung bình mẫu ñược tính là 3,075. Hãy tìm và ñiền lại giá trị bị mất này vào bảng trên và tìm khoảng tin cậy 96% cho tổng khối lượng trung bình của gà khi xuất chuồng. Biết rằng trại có 30.000 con gà.

(b) Hãy ước lượng số gà ñạt tiêu chuẩn loại 1 với ñộ tin cậy 98%, biết rằng gà loại 1 là gà có khối lượng không dưới 3,3 kg.

(c) Tìm khoảng tin cậy 95% cho khối lượng trung bình của một con gà loại 1 khi xuất chuồng.

(d) Ban giám ñốc trại gà Alpha báo cáo rằng tỉ lệ gà loại 1 của trại là 35%. Hãy cho nhận xét về báo cáo trên ở mức ý nghĩa 2%.

6.33. Để so sánh thời gian cắt trung bình của một máy tiện loại cũ với một máy tiện loại mới, người ta cho mỗi máy cắt thử 10 lần và ño thời gian cắt (tính bằng giây) . Kết quả thu ñược như sau:

Máy loại cũ: 58, 58, 56, 38, 70, 38, 42, 75, 68, 67.

Máy loại mới: 57, 55, 63, 24, 67, 43, 33, 68, 56, 54..

Biết rằng thời gian cắt của máy loại cũ và của máy loại mới là các biến ngẫu nhiên tuân theo luật phân phối chuẩn có ñộ lệch chuẩn, theo thứ tự, là 13,5 giây và 14,5 giây.

Với mức ý nghĩa 5%, có thể cho rằng máy loại mới tốt hơn (có thời gian cắt trung bình ít hơn) máy loại cũ hay không?

XS

TTKK

2008