43
Chương 7: Kiểm định giả thuyết 1 Khánh Duy 2 Đức Trình 3 Duy Bách 4 Ngọc Hân

Kiểm định giả thuyết thống kê

Embed Size (px)

Citation preview

Chương 7: Kiểm định giả thuyết

1 • Khánh Duy2 • Đức Trình3 • Duy Bách4 • Ngọc Hân

PHÂN PHỐI CHUẨNĐại lượng ngẫu nhiên liên tục X có phân phối chuẩn , ký hiệu X2) thì: Giá trị trung bình E(X) = Mod(X) = µ

Phương sai Var(X) = 2

CHUẨN TẮC HÓA X 2) THÀNH Z )

Chuẩn tắc hóa đại lượng ngẫu nhiên X, với Z =

• Cột ngoài cùng bên tay trái thể hiện chữ số hàng đơn vị và chữ số thập phân thứ nhất của giá trị z.

• Dòng trên cùng của bảng thể hiện chữ số thập phân thứ hai của giá trị z.

CÁCH TRA BẢNG PHÂN PHỐI CHUẨN

VD: Cho X N(67,)1.P(53<X<70)=() – ()= (0,6)- (-2,8)=0,7232

2.P(X>78)=P(78<X<)= ()- ()=0,5- =0,0139

PHÂN PHỐI STUDENT

• Đại lượng ngẫu nhiên X có phân phối Student, với n bậc tự do, ký hiệu X

• Khi n khá lớn (nphân phối Student rất gần với phân phối chuẩn N(0;1)

CÁCH TRA BẢNG PHÂN PHỐI STUDENT

• Cột ngoài cùng bên tay trái thể hiện số bậc tự do n.

• Dòng trên cùng của bảng thể hiện giá trị .

VD: Đồ thị của phân phối Student 9 bậc tự do1.Tìm giá trị với phần diện tích tô đậm bên phải là 0,05P(T>)=0,05 => =1,83312.Tìm với tổng diện tích được tô

đậm bằng 0,05P(|T|>) = P(T>)+P(T<)=0,05=>=2,26223.P(-3,2489<T<3,2489)=0,994.P(T< -2,8214)=0,015.P(T> 1,3830)=0,10

9

7.1. Khái niệm

Ñeå coù nhöõng quyeát ñònh veà vaán ñeà nghieân

cöùu, ñieàu höõu ích laø chuùng ta phaûi coù nhöõng

giaû ñònh hoaëc döï ñoaùn veà toång theå. Nhöõng giaû

ñònh naøy, coù theå ñuùng hoaëc coù theå sai, ñöôïc

goïi laø giaû thuyeát thoáng keâ vaø thöôøng laø nhöõng

nhaän ñònh veà phân phối xác suất của tổng thể, nghóa

laø nhöõng nhaän ñònh veà caùc tham soá cuûa toång

theå.

7.1. Khái niệm• Việc tìm ra kết luận bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết thống kê

• VD: Trong báo cáo: Năng suất lúa trung bình của tỉnh Y năm 2010 là 6,9 tấn/ha, thì ta có thể coi đó là một giả thuyết thống kê, giả thuyết này nói về nói về một tham số (kỳ vọng toán) của đại lượng ngẫu nhiên X biểu thị năng suất lúa.

Cách đặt giả thuyết thống kê

VD: Chân lý là và cũng là điều cần chứng minhCách 1: Đưa ra giả thuyết rồi tìm dữ kiện để chứng tỏ giả thuyết ấy đúngCách 2: Đưa ra giả thuyết A = B và tìm dữ kiện để chứng tỏ rằng giả thuyết này không phù hợp và bác bỏ giả thuyết này

Cách đặt giả thuyết thống kê

• Thống kê đi từ trường hợp cá biệt (mẫu) để suy ra trường hợp tổng quát (tổng thể) bằng cách dùng dữ kiện của mẫu để chứng minh giả thuyết về tổng thể đó

-> Khi dữ kiện phù hợp với giả thuyết, cũng chưa c/m được giả thuyết đúng một cách chắc chắn- Còn khi dữ kiện không phù hợp với giả thuyết thì điều này chắc chắn là cơ sở để bác bỏ giả thuyết đó

Khi đặt giả thuyết thông kê lưu ý một số vấn đề sau:

1.Gỉa thuyết đặt ra với ý đồ bác bỏ nó, nghĩa là giả thuyết đặt ra ngược lại với điều ta muốn chứng minh, muốn thuyết phục.

2.Giả thuyết đặt ra sao cho khi chấp nhận hoặc bác bỏ nó sẽ có tác dụng trả lời câu hỏi bài toán thực tế đặt ra.

7.2. Giả thuyết và giả thuyết 7.2.1. Giả thuyết - Là một giả định thăm dò về tham số của tổng thể

- Được cho là đúng cho đến khi nó được chứng minh sai

7.2.2. Giả thuyết - Là phát biểu ngược với - Được cho là đúng nếu bị bác bỏ

Một phía(Bên trái)

Một phía(Bên phải)

Hai phía

Kiểm định giả thuyết Giả thuyết : luôn có trường hợp “=“.

Tổng quát, một bài toán kiểm định giả thuyết cho kỳvọng sẽ có một trong 3 dạng dưới đây (với 0 là giá trị kiểm định của kỳ vọng).

0 0: H

0: aH 0 0: H

0: aH 0 0: H

0: aH

Ví dụ: Metro EMS

Với khoảng 20 xe cấp cứu, mụctiêu của trung tâm là cung cấp dịchvụ cấp cứu trong khoảng thời gian trungbình là 12 phút sau khi nhận được điện thoại yêu cầu.

Một bệnh viện tại trung tâm thànhphố cung cấp dịch vụ cấp cứu tại nhà.

Giả thuyết và đối thuyết

Dựa trên số liệu mẫu về thời gianphục vụ khách hàng đã được ghi nhận, giám đốc trung tâm muốn thực hiện một kiểm định xem thời gian phụcvụ khách hàng có bằng 12 phút hay ít hơn?

Ví dụ: Metro EMS

Giả thuyết và đối thuyết

Thời gian đáp ứng của dịch vụ cấp cứu đạt yêu cầu, không cần phải thay đổi.

Thời gian đáp ứng của dịch vụ cấp cứukhông đạt yêu cầu, cần điều chỉnh.

H0:

H1:

Với: = thời gian đáp ứng trung bình (theo tổng thể) củadịch vụ cấp cứu.

Giả thuyết và đối thuyết

• VD 7.1/148: Một nhà sx quan tâm dây chuyền đóng mì gói. Theo thiết kế khối lượng 1 gói mì là 80g. Nhưng ông ta nghi ngờ có trục trặc nên chọn một mẫu ngẫu nhiên các gói mì, dùng thông tin trên mẫu để kiểm định

• được đặt trên cơ sở dây chuyền hoạt động bình thường. mô tả ngược lại, thể hiện nghi ngờ mà nhà sx đang muốn chứng minh

TH1: Nghi ngờ khối lượng gói mì tăng lên

TH2: Nghi ngờ khối lượng gói mì giảm xuống

TH3: Không rõ hướng sai lệch

• Lưu ý:- Khi nói “chấp nhận ” điều đó không đồng nghĩa với đúng mà chỉ có nghĩa là với số liệu của mẫu ta chưa đủ bằng chứng để loại nó mà thôi.

- Trong thực hành tốt hơn nên nói là “có thể chấp nhận “ hoặc “chưa có cơ sở để bác bỏ “

Sai lầm loại 1 laø sai laàm cuûa vieäc baùc boû giaû thuyeát H0 khi giaû thuyeát này ñuùng ôû möùc yù nghóa naøo ñoù cuûa kieåm ñònh ( - Xaùc suaát lớn nhất cuûa vieäc maéc sai laàm loaïi 1). Xaùc suaát phaûi ñöôïc ñònh tröôùc

khi nghieân cöùu. Trong thöïc teá caùc möùc coù yù nghóa laø 0,05; 0,02 vaø 0,01 thöôøng hay ñöôïc choïn.

22

7.2.3. Sai lầm loại 1 và sai lầm loại 2

23

Ví dụ: Vôùi möùc yù nghóa 0,05; chuùng ta chæ

coù 5% “May maén” laø boû giaû thuyeát H0 khi

thöïc söï H0 ñuùng.

Noùi caùch khaùc, ta coù theå tin caäy tôùi

95% laø ta ñaõ quyeát ñònh ñuùng. Trong tröôøng

hôïp này, chúng ta nói là giả thuyết đã được

loại bỏ vôùi möùc yù nghóa 5%, chuùng ta coù

theå quyeát ñònh sai vôùi xaùc suaát toái ña

0,05

24

Sai lầm loại 2: Laø loaïi sai laàm cuûa vieäc

chaáp nhaän giaû thuyeát H0 khi giaû này sai.

Neáu xaùc suaát cuûa vieäc quyeát ñònh chaáp

nhaän moät giaû thuyeát H0 sai ñöôïc kyù hieäu

laø thì xaùc suaát ñeå baùc boû giaû thuyeát

H0 sai laø: (1 - )

Trong phần lớn các tình huống kiểm định giả thuyết, không thể dễ dàng tính ; tuy nhiên, và liên quan nhau khi giảm thì tăng và ngược lại.

25

26

α

β

1-β

Z=0 Zα

Vùng chấp nhận H0 Vùng chấp nhận H1

27

Toùm taét caùc loaïi sai laàm vaø xaùc suaát xãy

ra khi kieåm ñònh giaû thuyeát

Giaû thuyeát

Keát luaän

Giaû thuyeát H0 ñuùng

Giaû thuyeátH0 sai

Chaáp nhaän

Quyeát ñònh ñuùng

Xaùc suaát: 1 - α

Sai laàm loaïi II

Xaùc suaát: ß

Baùc boû

Sai laàm loaïi I, xaùc suaát: α (α - laø möùc yù nghóa cuûa kieåm

ñònh

Quyeát ñònh ñuùng

Xaùc suaát: 1- ß

(1-ß) goïi laø giaù trò cuûa kieåm

ñònh

7.2.4 Các bước thực hiện bài toán kiểm định

1.Nhận định tình hình về tham số tổng thể mà ta muốn kiểm định

2.Đặt giả thuyết . Tùy theo nhận định ở bước 1 mà đặt giả thuyết một bên hay hai bên

3.Chọn mức ý nghĩa cho bài toán kiểm định

4.Tính giá trị của tiêu chuẩn kiểm định5.Xem xét bác bỏ hay không bác bỏ 6.Kết luận nội dung bài toán

Giá trị p• Giá trị p là mức ý nghĩa nhỏ nhất mà ở đó giả thuyết Ho bị bác bỏ

Ví dụ:Trong ví dụ 7.4/154: Nếu ta thay α =10%

= = 1,645 < trị tuyệt đối của z= 1,79. Ta bác bỏ H0.Mức ý nghĩa nhỏ nhất mà ở đó H0 bị bác bỏ, gọi là giá trị pNhư vậy giả thuyết H0 bị bác bỏ ở bất cứ giá trị nào của α mà ở đó < -1,79

Ta tìm p:Φ(1,79) =0.4633 => p/2= 0.5-0.4633=0.0367p =2 x 0.0367 = 7.34%

Do vậy, giả thuyết Ho sẽ bị bác bỏ ở bất kì mức ý nghĩa αnào lớn hơn hoặc bằng 7,34%

Giá trị p• Ta cũng có thể tính p-value bằng cách dùng hàm NORMSDIST trong EXCEL

• Ta có: p-value = P(z>1,79) =P(z<-1,79) =1- NORMDIMIST(1.79) =0.0367269p-value = 0.0734

Nếu quy định trước ý nghĩa mức ý nghĩa α thì có thể dùng p-value để kết luận theo α:- Nếu p-value <= α thì bác bỏ H0, thừa nhận H1

- Nếu p-value > α thì chưa có cơ sở để bác bỏ Ho

Giá trị p• Ngoài ra người ta cũng có thể kiểm định giả thuyết theo p-value và được tiến hành theo nguyên tắc sau:

- Nếu p-value > 0,1 thì thường người ta không thể bác bỏ Ho

- Nếu 0,05< p-value<0,1 thì cần cân nhắc cẩn thận trước khi bác bỏ H0

- Nếu 0,01< p-value <0,05 thì nghiêng về hướng bác bỏ Ho nhiều hơn

- Nếu 0,001< p-value <= 0,01 thì ít băn khoăn khi bác bỏ Ho nhiều hơn

- Nếu p-value <=0,001 thì có thể yên tâm bác bỏ Ho

• Ví dụ 7.6/159: = 100 giờ, μ chưa biết n =15, =0,15, α=5%Giải:Đặt giả thuyết: Ho: μ= =100 H1: μ Kiểm tra giả thuyết n=15 <30, = 0,15, =99,7, = 100,=2,145Giá trị kiểm định: t= -3|t| =3> 2,145 nên bác bỏ giả thuyết HoDo =99,7 < =100 nên μ < =100Nghĩa là thực tế sản phẩm có tuổi thọ thấp hơn quy định là 100 giờ. Kết luận này đưa ra ở mức ý nghĩa 5%, nghĩa là khả năng ta có thể phạm sai lầm loại 1 trong kết luận của mình là 5% Giả thuyết sẽ bị bác bỏ ở bất kỳ giá trị nào của α>= 0,95%

• Một nhà máy sản xuất đèn chụp hình cho biết tuổi thọ trung bình của sản phẩm ít nhất là 100 giờ. Người ta chọn ngẫu nhiên rạ bóng thử nghiệm thấy tuổi thọ trung bình là 99,7 giờ, =0,15

Giả sử tuổi thọ đèn có phân phối chuẩn . Cho kết luận về lời tuyên bố của nhà sx α=0,5%

Bài giảiTa đặt giả thuyết: Ho: μ >= 100 H1: μ < 100Nhận xét: đây là kiểm định 1 bên, bên trái.Kiểm tra giả thuyết: n=15< 30, = 0,15 , = 99,7, = 100, =1,761Giá trị kiểm định:

t=-3Vì -3 < -1,761 nên ta bác bỏ giả thuyết Ho

BAØI 54: Moät coâng ty quan taâm ñeán möùc ñoä taïp chaát trong saûn phaåm, toái ña khoâng vöợt quaù 3%. Laáy maãu ngaãu nhieân 100 vieân thöoác thì möùc ñoä taïp chaát trung bình laø 3,09%. Giaû söû möùc ñoä taïp chaát tuaân theo phaân phoái chuaån vôùi ñoä leäch tieâu chuaån 0,5%.1.Haõy öôùc löôïng khoaûng tin caäy 95% cho möùc ñoä taïp chaát?2.ÔÛ möùc yù nghóa 5% coù theå noùi raèng möùc ñoä taïp chaát trong saûn phaåm toái ña laø 3%, ñöôïc khoâng?3.Tính toaùn giaù trò p value4.Giaû söû raèng kieåm ñònh ñöôïc thöïc hieän hai beân. Khoâng caàn tính toaùn haõy cho bieát p- value seõ thay ñoåi ra sao? (nhoû hôn, lôùn hôn hay khoâng thay ñoåi so vôùi keát quaû ôû yeâu caàu 3)5.ÔÕ baøi taäp naøy theo Anh, Chò, neân thöïc hieän kieåm ñònh hai beân hay moät beân, taïi sao?

 

1/ Ta có :Gọi μ là mức độ tạp chất trung bình của ctyH0 : μ = 3% ; H1 : μ > 3%n = 100 > 30; = 0.5%; X = Ϭ3.09% ; μ =3%Độ tin cậy : 1 – α = 95% => zα/2 = z0.025

= φ(0.5 – 0.025) => Tra bảng phân phối chuẩn Þzα/2 = 1.96

μ1 = X - zα/2 * = 2.902%

μ2 = X + zα/2 * = 3.098%

Vậy khoảng tin cậy của mức độ tạp chất là giá trị nằm trong khoảng (0.02902, 0.03098) với độ tin cậy 95%

2/ Đây là bài toán kiểm định 1 phíaH0 : μ = 3% ; H1 : μ > 3%z = = 1.8Với mức ý nghĩa α = 5% => zα= z0.05

= φ(0.5 – 0.05) => Tra bảng phân phối chuẩn Þ zα = z0.05 = 1.645Ta thấy : z > zα => bác bỏ H0

=> KO

3/ H0 : μ = 3% ; H1 : μ > 3%p-value = P(Z > 1.8) = 0.5 – φ(1.8) = 0.0359=> p-value < α => bác bỏ H0

4/ Kiểm định 2 bên :p-value = P( > 1.8)

Hình =>p-value sẽ lớn hơn

5/ Trong bài tập này nên thực hiện kiểm định 1 bên vì :cty ko muốn möùc ñoä taïp chaát trong saûn phaåm vượt quá 3% nên ta chỉ quan tâm điều này có xảy ra hay không thôi.