111
BμI GI¶NG Lý thuyÕt Lý thuyÕt Lý thuyÕt Lý thuyÕt X¸C SUÊT THè X¸C SUÊT THè X¸C SUÊT THè X¸C SUÊT THèNG K£ NG K£ NG K£ NG K£ Hµ Néi - 2014

Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

BµI GI¶NG

Lý thuyÕt Lý thuyÕt Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG K£NG K£NG K£NG K£

Hµ Néi - 2014

Page 2: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

2

MỞ ĐẦU

Lý thuyết Xác suất Thống kê là một bộ phân của Toán học nghiên cứu các hiện tượng ngẫu nhiên và ứng dụng chúng vào thực tế. Ta có thể hiểu hiện tượng ngẫu nhiên là hiện tương không thể nói trước được nó có thể xảy ra hay không khi thực hiện một lần quan sát. Tuy nhiên, nếu tiến hành quan sát khá nhiều lần một hiệ tượng ngẫu nhiên trong các phép thử như nhau, ta có thể rút ra những kết luận khoa học về hiện tượng này.

Lý thuyết Xác suất cũng là cơ sở để nghiên cứu Thống kê – môn học nghiên cứu các phương pháp thu thập thông tin, chọn mẫu, xử lý thông tin nhằm rút ra các kết luận hoặc quyết định cần thiết.

Lý thuyết Xác suất Thống kê ngày phát triển theo tiến trình phát triển của xã hội, nó đóng vai trò rất quan trọng trong hầu hết mọi lĩnh vực của thế giới hiện đại, từ khoa học, công nghệ, đến kinh tế, chính trị, đến sức khỏe, môi trường,…

Ngày nay, máy tính đã giúp cho việc tính toán các vấn đề xác suất thống kê ngày càng trở nên dễ dàng, một khi đã có số liệu đúng đắn và mô hình hợp lý. Thế nhưng, bản thân máy tính không biết mô hình nào là hợp lý. Đấy là vấn đề của người sử dụng: cần phải hiểu được bản chất của các khái niệm và mô hình xác suất thống kê, thì mới có thể dùng chúng được. Chính vì vậy, mặc dù đã được giới thiệu ở bậc học Phổ thông, Lý thuyết Xác suất Thống kê được giảng dạy cho hầu hết các nhóm ngành ở bậc Đại học.

Chương trình học Môn Lý thuyết Xác suất Thống kế

(tại Trường Đại học Thủy Lợi)

1. Định nghĩa về xác suât

2. Đại lượng ngẫu nhiên và phân phối xác suât

3. Kỳ vọng và phương sai

4. Một số phân phối xác suất thường gặp

5. Mẫu ngẫu nhiên đơn giản và các hàm phân phối mẫu của các thống kê thường gặp

6. Bài toán ước lượng

7. Kiểm định giả thuyết

8. Đường hồi quy tuyến tính

Giáo trình chính:

Giáo trình Lý thuyết Xác suất Thống kê, Bản dịch (đã chỉnh lý lần thứ nhất) - Tài liệu lưu hành nội

bộ của Trường Đại học Thủy Lợi – (Bản dich từ "Probability and statisics for Engineers and

Scientists" của Walpole. H. Myers, L. Myers)

Page 3: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

3

Bài số 1

NHỮNG KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT

I. NHẮC LẠI VÀ BỔ XUNG VỀ GIẢI TÍCH TỔ HỢP

Những kiến thức phần này liên quan tới việc đếm các điểm mẫu.

1.Quy tắc cộng. Giải sử một công việc nào có k trường hợp để thực hiện:

Trường hợp 1 có 1n cách thực hiện

Trường hợp 2 có 2n cách thực hiện …..

Trường hợp k có kn cách thực hiện

Khi đó ta có: 1 2

...k

n n n n= + + + cách thực hiện công việc đã cho.

2.Quy tắc nhân.Giải sử một công việc nào đó được chia thành k giai đoạn:

Có 1n cách thực hiện giai đoạn thứ nhất

Có 2n cách thực hiện giai đoạn thứ hai…..

Có kn cách thực hiện giai đoạn thứ k

Khi đó ta có: 1 2. ...

kn n n n= cách thực hiện công việc đã cho.

Ví dụ 1. Có bao nhiêu cách lựa chọn bữa ăn gồm có xúp, sandwich, món tráng miệng, và một đồ uống từ 4 món xúp, 3 kiểu sandwich, 5 món tráng miệng, và 4 đồ uống? Giải: Do n1 = 4, n2 = 3, n3 = 5 và n4 = 4, có n1×n2×n3×n4 = 4 × 3 × 5 × 4 = 240 cách khác nhau để chọn bữa ăn. 3. Hoán vị.

a. Định nghĩa: Hoán vị của n phần tử là một bộ có thứ tự gồm k phần tử khác nhau chọn từ n

phần tử đã cho hoặc gồm đúng n phần tử đã cho.

b. Công thức 1: Số các hoán vị của n phần tử phân biệt là !nP n= .

c. Công thức 2: Số những hoán vị của n phần tử phân biệt được lấy k lần liên tiếp là !

( )!k

n

nA

n k=

− (còn gọi là chỉnh hợp chập k của n phần tử).

Ví dụ 2. Một đề tài nhánh của Hội Hóa học Mỹ có bao nhiêu cách bố trí 3 báo cáo viên cho 3 cuộc họp khác nhau nếu họ đều có thể thu xếp được bất kỳ một trong 5 ngày? Giải: Tổng số cách bố trí bằng

3

5

5!60

2!A = = .

Page 4: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

4

Những hoán vị xuất hiện khi sắp xếp các phần tử theo một vòng tròn được gọi là những hoán vị vòng quanh.

d. Công thức 3: Số những hoán vị của n phần tử phân biệt được sắp xếp theo một vòng tròn là : ( 1)!n − .

Cho đến bây giờ ta đã xét hoán vị của những phần tử phân biệt. Trường hợp có các phần tử gióng nhau thì sẽ thế nào.

e. Công thức 4: Số những hoán vị phân biệt của n phần tử mà trong đó 1n phần tử thuộc kiểu thứ

nhất, 2n phần tử thuộc kiểu thứ hai, ... ,

kn phần tử thuộc kiểu thứ k là:

1 2

!

! ! !k

n

n n n⋯.

Ví dụ 3. Có bao nhiêu cách sắp khác nhau để tạo thành một xâu đèn của cây thông Noel có 3 bóng đèn đỏ, 4 bóng đèn vàng, và 2 bóng đèn xanh với 9 ổ cắm? Giải: Tổng số sắp xếp phân biệt là

9!1260

3!4 !2!= .

4. Phân hoạch. Tổ hợp.

Ta thường quan tâm đến số cách phân hoạch một tập gồm n phần tử thành r tập con được gọi là các ngăn. Một phân hoạch được hoàn thành khi giao của mọi cặp trong r tập con là tập rỗng ∅ và hợp của tất cả những tập con là tập ban đầu. Thứ tự của các phần tử bên trong một ngăn là không quan trọng. a. Công thức 1: Ta phân hoạch một tập gồm n phần tử thành k ngăn sao cho:

có 1n phần tử trong ngăn thứ nhất,

có 2n phần tử trong ngăn thứ hai,...

có kn phân tử trong ngăn thứ k

Khi đó số cách phân hoạch là:

1 2 1 2

!

, ,..., ! ! !r k

n n

n n n n n n

= ⋯

trong đó 1 2

...k

n n n n+ + + = .

Ví dụ 4. Có bao nhiêu cách phân cho 7 nhà khoa học vào một buồng ba và hai buồng đôi của một khách sạn? Giải: Tổng số phân hoạch có thể có là

7

3, 2, 2

=

7 !210

3! 2! 2!= .

Trong nhiều bài toán ta quan tâm đến số cách chọn r phần tử từ n phần tử mà không quan tâm đến thứ tự. Những phép chọn này được gọi là các tổ hợp. Một tổ hợp thực chất là một phân

Page 5: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

5

hoạch có hai ngăn, một ngăn chứa r đối tượng được chọn còn ngăn kia chứa ( )n r− đối tượng còn lại. b. Công thức 2: Số các tổ hợp của n phần tử phân biệt được tạo ra khi lấy r phần tử cùng một lúc là

!

!( )!k

n

n nC

r r n r

= = −

Ví dụ 5. Hãy tìm số ủy ban gồm 2 nhà Hóa học và 1 nhà Vật lí mà có thể tạo được từ 4 nhà Hóa học và 3 nhà Vật lý. Giả:

Số cách chọn 2 trong 4 nhà hóa học là 4

2

=

4!

2! 2! = 6.

Số cách chọn 1 trong 3 nhà vật lí là 3

1

=

3!

1! 2! = 3.

Sử dụng quy tắc nhân với 1

6n = và 2

3n = , ta có thể tạo được: 1 2. (6).(3) 18n n n= = = ủy ban

với 2 nhà Hóa học và 1 nhà Vật lí.

c. Chú ý: Ta có

i) Quy ước: 0! 1=

ii) k n k

n nC C −=

iii) 1

1 1

k k k

n n nC C C−

− −= + .

5. Nhị thức Newton. 0

( )n

n k n k k

nk

a b C a b−

=

+ =∑ .

II. BIẾN CỐ VÀ QUAN HỆ GIỮA CÁC BIẾN CỐ

1.Phép thử ngẫu nhiên và không gian mẫu.

Ví dụ mở đầu: Khi cho cuộn dây quay đều trong từ trường của một thanh nam châm, kết quả là chắc chắn xuất hiện dòng điện trong cuộn dây

Đây là một phép thử không ngẫu nhiên. Khi gieo một con xúc xắc cân đối và đồng chất, ta không đoán chắc chắn được kết quả. Chỉ biết được kết quả là xuất hiện số chấm trong 1,2, 3,4,5,6 .

Đây là một phép thử ngẫu nhiên.

Như vậy: Một phép thử ngẫu nhiên luôn thỏa hai đặc tính: 1. Không biết chắc kết quả nào sẽ xảy ra 2. Nhưng biết được các kết quả sẽ xảy ra

Page 6: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

6

Việc dựa trên một nhóm các điều kiện cơ bản để quan sát một hiện tượng nào đó được gọi là

một phép thử ngẫu nhiên, ở đây các kết quả của nó không dự đoán trước được. Do bài giảng này chỉ xét các phép thử ngẫu nhiên, nên ta gọi tắt chúng là phép thử. a. Định nghĩa. Tập hợp tất cả những kết quả có thể của một phép thử thống kê được gọi là không gian mẫu và được ký hiệu bởi S ( hoặc Ω ).

Mỗi kết quả trong không gian mẫu được gọi là một phần tử của không gian mẫu, hoặc đơn giản là một điểm mẫu.

b. Cách mô tả không gian mẫu:

+ Khi không gian mẫu có hữu hạn phần tử, ta có thể liệt kê những phần tử . + Khi không gian mẫu có vô hạn phần tử, hoặc các phần tử có thuộc tính chung: ta có thể mô tả bằng mệnh đề hoặc quy tắc + Ta cũng có thể dùng sơ đồ hình cây.

Ví dụ 6. Khi tung một đồng xu không gian mẫu Ω có thể viết là: , H TΩ = , trong đó H và T

tương ứng với “heads” và “tails”, nghĩa là "ngửa" và "sấp". Ví dụ 7. Khi gieo một con xúc sắc: + Nếu ta quan tâm đến số chấm xuất hiện trên mỗi mặt thi không gian mẫu là:

1,2, 3,4,5,6Ω =

+ Nếu ta quan tâm đến mặt chẵn hay lẻ (số chấm xuất hiện trên mặt là chẵn hay lẻ) thì không

gian mẫu là: ,chan leΩ =

Ví dụ 8. Khi tung hai đồng xu, với ký hiệu S: sấp còn N: ngửa khi đó không gian mẫu là:

, , ,SS SN NN NSΩ =

Ví dụ 9. Lấy ngẫu nhiên một điểm nằm trong miền hình chữ nhật trên mặt phẳng tọa độ Oxy với kích thước [0; 3] [0;2]× , khi đó không gian mẫu là:

( , ) 0 3; 0 2S x y x y= Ω = ≤ ≤ ≤ ≤

Ví dụ 10. Xét phép thử là tung một đồng xu.

+ Nếu xuất hiện mặt sấp xuất thì ta tung đồng xu đó lần thứ hai. + Nếu xuất hiện mặt ngửa thì ta tiếp tục tung một con xúc xắc được tung một lần.

Trong trường hợp này ta đi xây dựng sơ đồ cây như hình vẽ để xác định không gian mẫu. Bây giờ, những con đường khác nhau dọc theo các cành cây đi tới những điểm mẫu khác biệt.

Page 7: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

7

Từ đó ta xác định được không gian mẫu là :

; ; 1; 2; 3; 4; 5; 6SS NN N N N N N NΩ = .

c. Cách xây dựng không gian mẫu : + Đặt tên cho các phần tử có mặt hoặc các bước hình thành phép thử +Mô tả điểm mẫu theo các kết quả xảy ra trong phép thử. 2. Biến cố

a. Định nghĩa. Các kết quả có thể xảy ra của phép thử được gọi là biến cố. Như vậy biến cố của một

phép thử chính là mỗi tập con của không gian mẫu.

Ký hiệu biến cố : Dùng các chữ in hoa như , , ,...A B C Chú ý

• Mỗi điểm mẫu là một biến cố và được gọ là biến cố sơ cấp.

• Biến cố không thể là biến cố không bao giờ xảy ra khi thực hiện phép thử, ký hiệu là ∅ .

• Biến cố chắc chắn là biến cố luôn luôn xảy ra khi thực hiện phép thử, nó tương ứng với

chính không gian mẫu Ω nên ký hiệu là Ω .

b. Quan hệ giữa các biến cố. Cho A và B là hai biến cố của một phép thử với không gian mẫu Ω .

Khi đó :

• Biến cố A được gọi là kéo theo biến cố B , ký hiệu A B⊂ , nếu A xảy ra thì B cũng xảy ra.

•Biến cố A được gọi là tương đương với biến cố B , ký hiệu A B= , nếu A xảy ra thì B xảy ra

và ngược lại.

• Biến cố đối của biến cố A , ký hiệu A , là biến cố xảy ra khi và chỉ khi A không xảy ra.

Page 8: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

8

• Hợp (tổng) của hai biến cố A và B , ký hiệu là A B∪ (hoặc A B+ ) là biến cố xảy ra nếu có ít

nhất một biến cố nào đó trong các biến cố A hoặc B xảy ra. Nói cách khác : A B∪ là biến cố gồm

các điểm mẫu hoặc thuộc A hoặc thuộc B .

Định nghĩa hợp của n biến cố cũng được định nghĩa tương tự : 1 2

...n

A A A∪ ∪ ∪

• Giao (tích) của hai biến cố A và B , kí hiệu A B∩ (hoặc AB ) là biến cố xảy ra nếu cả A và

B cùng xảy ra. Nói cách khác A B∩ là biến cố gồm các điểm mẫu thuộc cả A và B .

Nếu A1, A2, …, An là các biến cố liên quan đến cùng một phép thử, thì giao (hay tích) của chúng,

ký hiệu là 1 2

...n

A A A∩ ∩ ∩ .

• Hai biến cố A và B được gọi là xung khắc nếu A B∩ = ∅ .

Ví dụ 11. A là biến cố “ra số chấm chẵn” khi gieo một con xúc xắc , thì A = “ra số chấm lẻ”

Ví dụ 12. Xét biến cố 2,4,6A = , biến cố 4,5,6B = và biến cố 1,2, 4,6C = là những tập

con của cùng không gian mẫu 1,2,3, 4,5,6Ω = . Khi đó:

+ Ta có A kéo theo C , tức là A C⊂

+ 1,3,5A = , 1,2, 3B = , 4,6A B∩ = , 2,4,5,6A B∪ = .

Ví dụ 13. Xét phép thử : T = gieo một con xúc xắc cân đối và các biến cố : :

iA "Xuất hiện i chấm",

:A "Xuất hiện chấm chẵn", :B "Xuất hiện chấm chia hết cho 3".

Khi đó +

2 4 6 3 6, .A A A A B A A= ∪ ∪ = ∪

+ 6.A B AB A∩ = =

+ Các biến cố : 1 2 6, ,...,A A A đôi một xung khắc.

Ví dụ 14. Có ba xạ thủ A, B, C cùng bắn vào một mực tiêu. Gọi : A là biến cố "xạ thủ A bắn trúng" B là biến cố "xạ thủ B bắn trúng" C là biến cố "xạ thủ C bắn trúng"

Khi đó: M ABC= là biến cố "cả ba xạ thủ bắn trúng" N ABC= là biến cố "cả ba xạ thủ bắn trượt" P A B C= ∪ ∪ là biến cố "có ít nhất một xạ thủ bắn trúng"

Q AB BC CA= ∪ ∪ là biến cố "có ít nhất hai xạ thủ bắn trúng"

R ABC ABC ABC= ∪ ∪ là biến cố "có đúng một xạ thủ bắn trúng" U AB BC CA= ∪ ∪ là biến cố "có nhiều nhất một xạ thủ bắn trúng" V ABC= là biến cố "chỉ có xạ thủ A bắn trúng".

Chú ý: Ta cũng có thể sử dụng sơ đồ Ven để biểu diễn quan hệ giữa các biến cố

Page 9: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

9

c. Một số hằng đẳng thức.

• Tính giao hoán: ,A B B A AB BA∪ = ∪ =

• Tính kết hợp: ( ) ( )A B C A B C A B C∪ ∪ = ∪ ∪ = ∪ ∪ ; ( ) ( )ABC AB C A BC= =

• Tính phân phối: ( ) ( ) ( ), ( ) ( )( ) A B C AC BC AB C A C B C∪ = ∪ ∪ = ∪ ∪

• , .A A A AA A∪ = =

• , , , .A A A A A A∪Ω = Ω Ω = ∪∅ = ∅ = ∅

• .A A=

• Luật De Morgan:

1 2 1 2n nA A A A A A∪ ∪ ∪ =⋯ ⋯

1 2 1 2n nAA A A A A= ∪ ∪ ∪⋯ ⋯

Về nhà:

Tự đọc Chương 1

Bài tập: Mục 2.1+2.2: Tr. 27; Mục 2.3: tr. 37

Đọc trước các Mục 2.4 đến 2.8 chuẩn bị cho Bài số 2: Xác suất. Quy tắc tính xác suất.

Page 10: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

10

Bài số 2

XÁC SUẤT . QUY TẮC TÍNH XÁC SUẤT

I. XÁC SUẤT CỦA MỘT BIẾN CỐ

1. Mở đầu về xác suất.

Việc biến cố ngẫu nhiên xảy ra hay không trong kết quả của một phép thử là điều không thể biết hoặc đoán trước được. Tuy nhiên bằng những cách khác nhau ta có thể định lượng khả năng xuất hiện của biến cố, đó là xác suất xuất hiện của biến cố. Xác suất của biến cố là con số đặc trưng khả năng khách quan xuất hiện biến cố đó khi thực hiện phép thử.

Dựa vào bản chất của phép thử (đồng khả năng) ta có thể suy luận về khả năng xuất hiện của biến cố, với cách tieps cận này ta có định nghĩa xác suất theo phương pháp cổ điển.

Khi thực hiện nhiều lần lặp lại độc lập một phép thử ta có thể tính được tần suất xuất hiện (số lần xuất hiện) của một biến cố nào đó. Tần suất thể hiện khả năng xuất hiện của biến cố, với cách tiếp cận này ta có định nghĩa xác suất theo thống kê.

Trường hợp ta biểu diễn không gian mẫu và các biến cố bởi các miền hình học có độ đo ta sẽ có định nghĩa xác suất theo quan điểm hình học. 2. Xác xuất của của một biến cố

Ta chỉ xét những phép thử mà không gian mẫu có hữu hạn phần tử: chằng hạn xét phép thử với không gian mẫu

1 2, ,...

ks s sΩ = .

Khi đó, với mỗi điểm mẫu (biến cố sơ cấp) is được gán tương ứng với một số thực

ip thỏa mãn

1

0;1

1

i

k

ii

p

p=

∈ =∑

, số thực ip được gọi là xác suất của điểm mẫu (biến cố sơ cấp)

is . Nếu ta có lý do để

tin rằng một điểm mẫu nào đó rất có khả năng xảy ra khi phép thử được tiến hành, xác suất được gán sẽ gần 1. Mặt khác, một xác suất gần 0 được gán cho một điểm mẫu mà dường như không xuất hiện. Trong nhiều phép thử, như tung một đồng xu hay một xúc xắc, tất cả những điểm mẫu có cùng khả năng xuất hiện cũng được gán các xác suất bằng nhau. Đối với những điểm bên ngoài không gian mẫu, tức là đối với các biến cố mà không thể xuất hiện, ta gán cho xác suất bằng 0 . Ta chú ý rằng, mỗi biến cố là tập con của không gian mẫu Ω , nên một biến cố A của phép thử là một tập gồm các điểm mẫu (biến cố sơ cấp), mỗi biến số sơ cấp trong A còn gọi là một khả năng thuận lợi cho .A

a. Định nghĩa. Xét phép thử với không gian mẫu Ω và A biến cố trong phép thử đó. Khi đó xác suất của biến cố A là tổng xác xuất của tất cả các diểm mẫu trong A , ký hiệu là ( )P A .

Từ định nghĩa ta có:

1. 0 ( ) 1P A≤ ≤ 2. ( ) ( ) 1P S P= Ω =

3. ( ) 0P ∅ = . Ví dụ 1. Một đồng xu được tung 2 lần. Xác suất để ít nhất một mặt ngửa xuất hiện là bao nhiêu? Giải: + Không gian mẫu đối với phép thử này là

Page 11: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

11

, , , SS SN NS NNΩ = . + Nếu đồng xu cân đối, mỗi kết cục như vậy có thể đồng khả năng xuất hiện. Do đó, ta gán một

xác suất w cho mỗi điểm mẫu. Khi ấy 1

4 1 .4

w w= → =

+ Nếu A biểu thị biến cố ít nhất một mặt ngửa xuất hiện, thì , , A SN NS NN=

+ Và 1 1 1 3

( ) .4 4 4 4

P A = + + =

Ví dụ 2. Một con súc sắc được đổ chì sao cho khả năng xuất hiện một chấm chẵn gấp 2 lần khả năng xuất hiện một chấm lẻ. Gọi E là biến cố số chấm nhỏ hơn 4 xuất hiện trong một lần tung xúc xắc, hãy tìm ( ) ?P E = Giải: + Không gian mẫu là 1,2, 3, 4,5,6Ω = .

+ Ta gán một xác suất w cho mỗi số chấm lẻ và một xác suất 2w cho mỗi số chấm chẵn.

+ Do tổng của các xác suất phải bằng 1 nên ta có 1

9 1 .9

w w= → =

+ Từ đó, các xác suất 1/9 và 2/9 được gán cho mỗi số chấm chẵn và lẻ tương ứng. + Do đó:

1 2 11,2,3) ( ) .

9 9 9E P E= → = + +

Ví dụ 3. Trong Ví dụ 16 gọi A là biến cố xuất hiện số chấm chẵn và cho B là biến cố xuất hiện số chấm chia hết cho 3. Hãy tìm ( )P A B∪ và ( )P A B∩ . Giải:

+ Ta có 2, 4,6, 3,6A B= = , từ đó 2, 3,4,6, 6A B A B∪ = ∩ = .

+ Do xác suất cho mỗi số chấm lẻ là 1

9 và mỗi số chấm chẵn

2

9, nên ta có

2 1 2 2 7( )

9 9 9 9 9P A B∪ = + + + = và

2( ) .

9P A B∩ =

Trường hợp không gian mẫu có hữu hạn phần tử và các biến cố sơ cấp đồng khả năng.

b. Định nghĩa xác suất theo lối cổ điển Giải sử phép thử có N biến cố sơ cấp đồng khả năng, trong đó biến cố A có chứa n

biến cố sơ cấp

đồng khả năng. Khi đó xác suất của biến cố A được xác định bởi: ( ) .n

P AN

=

Các bước tìm xác suất của một biến cố A : 1.Đếm số biến số sơ cấp đồng khả năng trong không gian mẫu: N 2. Đếm số biến số sơ cấp đồng khả năng trong biến cố :A n

3. Từ đó ( ) .n

P AN

=

Page 12: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

12

Ví dụ 4. Một đống kẹo trộn lẫn 6 chiếc bạc hà, 4 chiếc kẹo bơ và 3 chiếc chocolate. Nếu một người chọn ngẫu nhiên một trong những chiếc kẹo này, hãy tìm xác suất để được a. Một chiếc bạc hà; b. Một chiếc kẹo bơ hoặc một chocolate. Giải: Gọi ,M T và C là các biến cố mà người chọn được, tương ứngmột chiếc bạc hà, kẹo bơ, hoặc chocolate. Tổng số kẹo bằng 13 và tất cả đều đồng khả năng để chọn. a. Do 6 trong 13 chiếc là bạc hà, xác suất của biến cố M chọn được ngẫu nhiên một bạc hà là

6( )

13P M = .

b. Do 7 trong 13 chiếc kẹo là bơ hoặc chocolate, suy ra 7

( )13

P T C∪ = .

Ví dụ 5. Lấy ngẫu nhiêu 5 cây Tú Lơ Khơ trong bộ 52 cây. Hãy tìm xác suất để trong đó có 2 cây Át và 3 cây J . Giải: Gọi C là biến cố “Trong 5 cây có 2 cây Át và 3 cây J ”

+ Số cách chia riêng 2 cây từ 4 cây Át bằng: 4 4!

62 2!2!

= =

+ Số cách chia riêng 3 cây từ 4 cây J bằng : 4 4!

4.3 3!1!

= =

+ Theo quy tắc nhân ta có 6.4 24n = = trường hợp rút ra có 2 Át và 3 cây J . + Mà tổng số trường hợp lấy ngẫu nhiên 5 cây bài (tất cả đều đồng khả năng) là

52 52!

25989605 5!47 !

N = = =

.

+ Do đó xác suất của biến cố C là:

524( ) 0,9.10 .

2598960P C −= =

Hạn chế của định nghĩa xác suất theo lối cổ điển 1.Nó chỉ xét cho trường hợp không gian mẫu có hữu hạn các biến cố 2. Các biến cố sơ cấp trong không gian mẫu “đồng khả năng” Tuy nhiên không phải lúc nào không gian mẫu cũng thỏa mãn điều đó.

Trong thực tế, chúng ta thường phải tìm xác suất của những biến cố phức tạp, khi đó ta sẽ cố gắng biểu diễn biến cố đó theo những biến cố đơn giản và xác suất của một biến cố ban đầu sẽ dễ dàng hơn nếu ta dựa vào xác suất đã biết của các biến cố đơn giản hơn.. II. CÔNG THỨC CỘNG. Mục đích: Trong một phép thử, đã biết xác xuất của một số biến cố nào đó ta có thể tính xác xuất của biến cố hợp của chúng.

Page 13: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

13

1.Trường hợp các biến cố xung khắc.

Nếu Avà B là 2 biến cố xung khắc (tức là A B∩ = ∅ ) trong một phép thử thì ta có: ( ) ( ) ( )P A B P A P B∪ = + .

Hệ quả: i. Nếu

1 2, ,...,

nA A A là các biến cố đôi một xung khắc nhau trong cùng một phép thử thì ta có:

1 2 1 2( ... ) ( ) ( ) ... ( )

n nP A A A P A P A P A∪ ∪ ∪ = + + +

ii. Nếu

1 2, ,...,

nA A A là một phân hoạch của không gian mẫu Ω , thì:

P(1 2 1

( .... ) ( ) ... ( ) ( ) 1n n

P A A A P A P A P∪ ∪ ∪ = + + = Ω = .

iii. ( ) 1 ( )P A P A= − . Ví dụ 6. Có một lô hành gồm 10 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên không hoàn lại từ lô hàng ra 6 sản phẩm. Tìm xác suất để không có quá 1 phế phẩm trong 6 sản phẩm được lấy ra. Giải: Gọi

A là biến cố “không có phế phẩm trong 6 sản phẩm lấy ra” B là biến cố “có đúng 1 phế phẩm trong 6 sản phẩm lấy ra” C là biến cố “không có quá 1 phế phẩm trong 6 sản phẩm lấy ra”

+ Khi đó A và B là hai biến cố xung khắc

+ Xác suất của biến cố A là: 6

8

6

10

2( )

15

CP A

C= =

+ Xác suất của biến cố B là: 1 5

2 8

6

10

. 8( )

15

C CP B

C= =

+ Nhận thấy: C A B= ∪ do đó: 2

( ) ( ) ( )3

P C P A P B= + = .

2. Trường hợp tổng quát.

Page 14: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

14

Nếu A và B là hai biến cố tùy ý trong một phép thử thì ta có

( ) ( ) ( )( ) P A B P A P B P AB∪ = + − .

Với 3 biến cố , ,A B C ta có:

( ) ( ) ( )( ) ( ) – ( ) – ( ) ( ).P A B C P A P B P C P A B P B C P C A P ABC∪ ∪ = + + − ∩ ∩ ∩ +

Tương tự ta có thể nhận được công thức cộng xác suất trong trường hợp số biến cố tùy ý. Ví dụ 7. Xác suất để Hồng thi đỗ môn toán là 2/3 và xác suất để cô ta thi đỗ môn tiếng Anh là 4/9. Giả thiết rằng xác xuất để thi đỗ cả 2 môn là 1/4. Tìm xác suất để a) Hồng thi đỗ ít nhất một môn. b) Hồng không đỗ môn nào c) Hồng thi trượt ít nhật một môn d) Hồng thi đỗ đúng một môn Giải: Gọi: M là biến cố “thi đỗ môn Toán”,

E là biến cố “thi đỗ môn Tiếng Anh” , khi đó ME là biến cố “thi đỗ cả hai môn” A là biến cố “thi đỗ ít nhất một môn”, khi đó A M E= ∪ B là biến cố “không đỗ môn nào”, khi đó .B M E A= = C là biến cố “trượt ít nhất một môn”, khi đó C M E= ∪ D là biến cố “đỗ đúng một môn”, khi đó . .D M E M E= ∪

Theo giả thiết ta có: 2 4 1

( ) , ( ) , ( )3 9 4

P M P E P ME= = =

Do đó:

( ) ( ) ( ) ( ) ( )P A P M E P M P E P ME= ∪ = + − =2 4 1 31

3 9 4 36+ − = .

5( ) ( . ) ( ) 1 ( )

36P B P M E P A P A= = = − =

3( ) ( ) 1 ( )

4P C P M E P ME= ∪ = − =

Để ý rằng:A D ME= ∪ hơn nữa ( )D ME∩ = ∅ nên 11

( ) ( ) ( )18

P D P A P ME= − =

III. XÁC SUẤT CÓ ĐIỀU KIỆN VÀ CÔNG THỨC NHÂN XÁC SUẤT. 1. Xác suất có điều kiện. a. Định nghĩa: Xác suất của biến cố B được tính khi biết biến cố A nào đó đã xảy ra được gọi là xác suất có điều kiện và được ký hiệu là ( | )P B A . Ký hiệu ( | )P B A thường được đọc là “ xác suất để B xảy ra với điều kiện A đã xảy ra” hoặc đơn giản là “xác suất của B với điều kiện A ”.

Ví dụ 8. Một con xúc xắc được chế tạo sao cho khả năng xuất hiện một chấm chẵn gấp hai lần khả năng xuất hiện một chấm lẻ. Xét biến cố B nhận được số chính phương khi gieo một con xúc xắc đó.

Page 15: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

15

Từ không gian mẫu 1,2, 3, 4,5,6Ω = , với xác suất xuất hiện mỗi số chấm chẵn và lẻ tương ứng

là 1

9 và

2

9, do đó xác suất để B xảy ra là

1

3.

Bây giờ ta chỉ xét biến cố B trong phép tung con xúc sắc với số chấm xuất hiện lớn hơn 3. Lúc này ta xét không gian mẫu thu gọn 4,5,6A = là tập con của Ω . Ta cần tính xác suất của biến cố B liên quan đến không gian mẫu A . + Trước hết ta phải tính xác suất mới cho các phần tử của A . Khi gán xác suất w cho chấm lẻ

trong A và xác suất 2w cho hai chấm chẵn, ta có 1

5 1 .5

w w= → =

+ Trong không gian A , ta thấy B chỉ chứa phần tử 4. Ký hiệu biến cố này bởi |B A , khi đó

2| 4 ( | )

5B A P B A= → = .

Chú ý: Như vậy các biến cố có thể có xác suất khác nhau khi được xét trong các không gian mẫu khác nhau.

b. Công thức. Xác suất có điều kiện của B với điều kiện A , ký hiệu ( | )P B A , được xác định như sau:

( )( | )

( )

P A BP B A

P A

∩= nếu ( ) 0P A > .

Ví dụ 9. (xét lại Ví dụ 8) Một con xúc xắc được chế tạo sao cho khả năng xuất hiện một chấm chẵn gấp hai lần khả năng xuất hiện một chấm lẻ. Với biến cố 4,5,6A = , xét biến cố B nhận được số chính phương khi gieo một con xúc sắc.

Ta có không gian mẫu 1,2,3,4,5,6Ω = , với xác suất xuất hiện mỗi số chấm chẵn và lẻ

tương ứng là 1

9 và

2.

9

Dễ thấy : 2 1 2 5

( )9 9 9 9

P A = + + = , hơn nữa 4A B∩ = suy ra 2

( )9

P A B∩ = .

Khi đó theo công thức trên ta có:

2( ) 29( ) .

( ) 5 5

9

P A BP B A

P A

∩= = =

Ví dụ 10. Xác suất để một chuyến bay khởi hành đúng giờ là ( ) 0, 83P D = , xác suất để nó đến đúng giờ là ( ) 0, 82P A = , xác suất để nó khởi hành và đến đều đúng giờ là ( ) 0,78P D A∩ = . Tính xác suất để một chiếc máy bay: a) Đến đúng giờ biết rằng nó đã khởi hành đúng giờ; b) Khởi hành đúng giờ biết rằng nó sẽ đến đúng giờ. c) Đến đúng giờ biết rằng nó khởi hành không đúng giờ

Giải: a) Xác suất để một máy bay đến đúng giờ biết rằng nó đã khởi hành đúng giờ là:

Page 16: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

16

( ) 0,78( | ) 0,94

( ) 0,83

P D AP A D

P D

∩= = =

b) Xác suất để một máy bay khởi hành đúng giờ biết rằng nó đã đến đúng giờ là:

( ) 0,78( | ) 0,95

( ) 0,82

P D AP D A

P A

∩= = =

c) Xác suất để máy bay đến đúng giờ khi nóp khởi hành không đúng giờ là:

( ) 0, 82 0,78( | ) 0,24

( ) 0,17

P A DP A D

P D

∩ −= = =

c. Sự độc lập và phụ thuộc của các biến cố. Hai biến cố Avà B được gọi là độc lập với nhau nếu sự xuất hiện của B không có tác động gì đến khả năng xuất hiện của A . Ở đây sự xuất hiện của A là độc lập với sự xuất hiện của B .

Định nghĩa: Hai biến cố A và B trong một phép thử được gọi là độc lập với nhau khi và chỉ khi ( | ) ( )P B A P B= hoặc ( | ) ( )P A B P A= .

Trong trường hợp ngược lại ta nói A và B phụ thuộc nhau.

Điều kiện ( | ) ( )P B A P B= kéo theo ( | ) ( )P A B P A= và ngược lại.

Đối với phép thử là rút con bài ở trên , chúng ta đã chỉ ra rằng ( | ) ( ) 1 / 4P A B P A= = . Chúng ta cũng có thể thấy rằng ( | ) ( ) 1 / 13P A B P A= = . 2.Công thức nhân xác suất. Từ công thức xác suất có điều kiện ta nhận được quy tắc nhân quan trọng sau, nó cho phép ta tính xác suất để hai biến cố cùng xảy ra.

Nếu trong một phép thử, các biến cố Avà B có thể cùng xảy ra thì

( ) ( ) ( ) ( ) ( )P A B P A P B A P B P A B∩ = =

Hai biến cố Avà B là độc lập với nhau khi và chỉ khi ( ) ( ). ( ).P A B P A P B∩ =

Tổng quát:

Nếu trong một phép thử, các biến cố 1,...,

nA A có thể xảy ra thì:

1 2 1 2 1 1 2 1( ... ) ( ). ( | )... ( | ... ).

n k kP A A A P A P A A P A AA A

−∩ ∩ ∩ =

Nếu các biến cố 1,...,

nA A độc lập thì:

1 2 1 2( ... ) ( ). ( )... ( ).

n nP A A A P A P A P A∩ ∩ ∩ =

Ví dụ 11. Giả sử ta có một hộp chứa 20 chiếc cầu chì, trong đó có 5 chiếc bị hỏng. Nếu lấy ngẫu nhiên lần lượt 2 chiếc theo phương thức không hoàn lại, thì xác suất để cả hai chiếc đều bị hỏng bằng bao nhiêu? Giải: Gọi

A là biến cố “chiếc cầu chì thứ nhất bị hỏng” B là biến cố “chiếc cầu chì thứ hai bị hỏng”

Page 17: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

17

Khi đó A B∩ là biến cố A xảy ra và sau đó B cũng xảy ra, |B A là biến cố chiếc cầu chì thứ hai lấy ra là hỏng khi đã lấy được chiếc thứ nhất là hỏng.

Xác suất để lần lấy thứ nhất được chiếc cầu chì hỏng là 1

( )4

P A = .

Tiếp theo, xác suất để lấy được một cầu chì hỏng thứ hai từ bốn chiếc còn lại là: 4

( | )19

P B A = .

Do đó xác suất để lấy được (theo thứ tự) cả hai chiếc cầu chì hỏng là:

1 4 1( ) ( ) ( | )

4 19 19P AB P A P B A

= = = .

Ví dụ 12. Một thị trấn nhỏ có một chiếc xe cứu hỏa và một chiếc xe cấp cứu sẵn sàng dùng cho những trường hợp khẩn cấp. Xác suất để chiếc xe cứu hỏa sẵn có để dùng cho những trường hợp khẩn cấp là 0,98 và xác suất để chiếc xe cấp cứu khi được gọi là 0,92. Có một người bị thương do một tòa nhà đang cháy, tìm xác suất để cả chiếc xe cấp cứu và cứu hỏa đều sẵn sàng có thể dùng.

Giải: Gọi A và B lần lượt là biến cố chiếc máy cứu hỏa và chiếc xe cấp cứu sẵn có để dùng, khi đó A B∩ la biến cố cả hai xe đều sẵn sàng làm nhiệm vụ. Nhận thấy: A và B là hai biến cố độc lập do đó ta có:

( ) ( ). ( ) 0,98.0,92 0,9016.P AB P A P B= = = Ví dụ 13. Lấy liên tiếp 3 con bài từ một bộ bài theo phương thức không hoàn lại. Tìm xác suất để biến cố

1 2 3A A A∩ ∩ xảy ra , trong đó

1A là biến cố con bài thứ nhất là Át đỏ,

2A là biến cố con bài

thứ hai là 10 hoặc J , còn 3A là biến cố con bài thứ ba có số lớn hơn 3 nhưng bé hơn 7.

Giải: Ta có các biến cố

1A : biến cố con bài thứ nhất là át đỏ,

2A : biến cố con bài thứ hai là 10 hoặc J,

3A : biến cố con bài thứ ba có số lớn hơn 3 nhưng bé hơn 7.

Khi đó:

1 2 1 3 1 2

2 8 12( ) , ( | ) , ( | ) ,

52 51 50P A P A A P A AA= = =

và ta có:

1 2 3 1 2 1 3 1 2

2 8 12 8( ) ( ) ( | ) ( | ) . .

52 51 50 5525P A A A P A P A A P A AA∩ ∩ = = = .

Ví dụ 14. Hộp thứ nhất có 2 bi trắng và 10 bi đen. Hộp thứ hai có 8 bi trắng và 4 bi đen. Từ mỗi hộp lấy ra một viên bi. Tìm xác suất để: a) Cả 2 viên bi lấy ra đều trắng b) Một viên lấy ra là trắng, còn một viên là đen. Giải: Gọi T là biến cố “cả 2 viên bi lấy ra là trắng”

iT là biến cố lấy được bi trắng từ hộp thứ , 1,2i i =

iD là biến cố lấy được bi đen từ hộp thứ , 1,2.i i =

Page 18: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

18

A là biến cố một viên bi lấy ra là trắng còn một viên là đen Khi đó:

1 2,T T ,

1 2,D D là các biến cố đôi một độc lập;

1 2 2 1,TD T D cũng là hai biến cố độc lập.

Ta có 1 2

T T T= ∩ , 1 2 2 1

A TD T D= ∪

1 2

1 1 2 2

1 2( ) , ( ) ,

6 35 1

( ) 1 ( ) , ( ) 1 ( )6 3

P T P T

P D P T P D P T

= =

= − = = − =

a) Xác suất để cả 2 bi lấy ra đều trắng là:

1 2 1 2

1( ) ( ) ( ) ( ) .

9P T P TT P T P T= = =

b) Xác suất để một viên lấy ra là trắng còn một viên là đen

1 2 2 1 1 2 2 1

11( ) ( ) ( ( ) ( ) ( ) ( ) .

18P A P TD P T D P T P D P T P D= + = + =

IV.CÔNG THỨC XÁC SUẤT ĐẦY ĐỦ VÀ CÔNG THỨC BAYES. 1. Công thức xác suất đầy đủ.

Nếu các biến cố 1 2, ,...,

kB B B là một phân hoạch của không gian mẫu Ω (tức

1 2, ,...,

kB B B là

nhóm các biến cố đầy đủ đôi một xung khắc), trong đó ( ) 0i

P B ≠ với mọi 1,2,...,i k= thì với

biến cố A bất kì của Ω ta có:

P(A) = 1 1

( ) ( ) ( ) ( | ).k k

i i ii i

P A P B A P B P A B= =

= ∩ =∑ ∑

Phân hoạch không gian mẫu Ω Ví dụ 15. Trong một dây chuyền sản xuất, ba máy B1, B2, và B3 tạo ra 30%, 45%, và 25% sản phẩm tương ứng. Theo phép thử trước đây biết tỷ lệ phế phẩm được tạo bởi mỗi máy tương ứng là 2%, 3% và 2%. Chọn ngẫu nhiên 1 sản phẩm. Tính xác suất để nó là phế phẩm.

B1

B2

B3 B4

Bk

Bn

A

Page 19: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

19

Giải: Xét các biến cố sau: A : sản phẩm được chọn là phế phẩm

1B : sản phẩm được làm bởi máy B1: 1

( ) 0,3P B =

2B : sản phẩm được làm bởi máy B2: 2

( ) 0,45P B =

3B : sản phẩm được làm bởi máy B3: 3

( ) 0,25P B =

+ Khi đó: 1 2 3, ,B B B là họ các biến cố đầy đủ đôi một xung khắc

+ Áp dụng công thức xác suất đầy đủ ta có:

( ) ( ) ( ) ( ) ( ) ( ) ( )1 1 2 2 3 3 | | |P A P B P A B P B P A B P B P A B= + +

+ Ta lại có:

( ) ( )( ) ( )( ) ( )

1 1

2 2

3 3

| 0, 3. 0, 02 0, 006

| 0, 45.0, 03 0, 0135

| 0,25.0,02 0,005.

P B P A B

P B P A B

P B P A B

= =

= =

= =

+ Do đó

( ) 0, 006 0, 0135 0,005 0,0245.P A = + + =

2. Công thức Bayes. Công thức Bayes, mang tên của linh mục và nhà Toán học người Anh Thomas Bayes (1702 – 1761), là công thức ngược, cho phép tính xác suất có điều kiện ( | )P B A khi biết xác suất có điều kiện ( | )P A B và một số thông tin khác.

a) Dạng đơn giản nhất của công thức này là: Với A và B là hai biến cố bất kỳ với xác suất khác không, khi đó ta luôn có:

( | ) ( )( | ) .

( )

P A B P BP B A

P A=

Công thức trên là hệ quả trực tiếp từ công thức nhân xác suất:

( ) ( | ). ( ) ( | ). ( ).P A B P B A P A P A B P B∩ = = Công thức Bayes rất đơn giản nhưng nó có ý nghĩa rất sâu xa. Một trong những lỗi mà rất nhiều người mắc phải là lẫn lộn giữa ( | )P A B và ( | )P B A , coi hai con số đó như là bằng nhau. Nhưng Công thức Bayes cho thấy hai con số đó có thể chênh lệch nhau rất nhiều nếu như ( )P A và ( )P B chênh nhau rất nhiều.

Page 20: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

20

Kết hợp công thức trên với công thức xác suất đầy đủ cho ( )P A ta nhận được:

Định lý (Công thức Bayes tổng quát). Nếu các biến cố

1 2, ,...,

kB B B là một phân hoạch của không gian mẫu trong đó

( ) 0, 1,2,...,i

P B i k≠ = , thì với biến cố A ∈ Ω mà ( ) 0P A ≠ ta có:

P(Br|A) =

1 1

( ) ( ) ( | )( | )

( ) ( ) ( | )

r r r

r k k

i i ii i

P B A P B P A BP B A

P B A P B P A B= =

∩= =

∩∑ ∑ , với 1,2,..., .r k=

Ví dụ 16. Quay về Ví dụ 15, nếu chọn ngẫu nhiên một sản phẩm và thấy nó bị lỗi, thì xác suất để sản phẩm đó thuộc máy B3 bằng bao nhiêu?

Giải: + Sử dụng Công thức Bayes ta có

3 33

1 1 2 2 3 3

( ) ( | )( | )

( ) ( | ) ( ) ( | ) ( ) ( | )

P B P A BP B A

P B P A B P B P A B P B P A B=

+ +

+T hay các xác suất đã được tính trong Ví dụ 10 ta có

P(B3|A) = 3

0,005 10( | ) .

0, 006 0,0135 0,005 49P B A = =

+ +

Kết quả này cho ta thấy nếu sản phẩm bị lỗi được chọn thì chắc nó không được làm bởi máy 3B .

Về nhà:

Bài tập: Tr. 44, 53, 60

Đọc trước các Mục 3.1 đến 3.3 chuẩn bị cho Bài số 3:

Biến ngẫu nhiên một chiều và phân phối xác suất

Page 21: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

21

Bài số 3

BIẾN NGẪU NHIÊN MỘT CHIỀU VÀ PHÂN PHỐI XÁC SUẤT

I. BIẾN NGẪU NHIÊN MỘT CHIỀU Ví dụ 1: Xét quá trình kiểm tra ba bộ phận điện tử, N chỉ “ bộ phận không có lỗi ”, D chỉ “ bộ phận có lỗi ” . Khi đó không gian mẫu của phép thử đó là:

, , , , , , , NNN NND NDN DNN NDD DND DDN DDDΩ = Nếu ta quan tâm tới số bộ phận có lỗi trong ba bộ phận được kiểm tra, thì mỗi điểm mẫu trong không gian mẫu sẽ xác định một giá trị (duy nhất) trong các số: 0, 1, 2, 3. Như vậy, trong mỗi phép thử ngẫu nhiên, việc số hóa các điểm mẫu (quy tắc cho tương ứng mỗi điểm mẫu với một số thực) sẽ cho ta gặp nhiều thuận lợi trong việc mô tả, thống kê và đánh giá chúng. Và từ đó khái niệm biến ngẫu nhiên ra đời.

1.Định nghĩa: Biến ngẫu nhiên là một quy tắc cho tương ứng mỗi phần tử trong không gian mẫu với duy nhất một số thực.

Ký hiệu: Dùng chữ in hoa, ví dụ X , để kí hiệu một biến ngẫu nhiên và chữ thường tương ứng x để chỉ các giá trị của biến ngẫu nhiên X.

Số thực x mà tồn tại điểm mẫu s sao cho ( )X s x= được gọi là một giá trị mà X có thể

nhận. Tập tất cả các giá trị mà X có thể nhận được gọi là tập giá trị của X . Trong ví dụ kiểm tra các bộ phận điện tử ở trên, ta chú ý rằng biến ngẫu nhiên X có giá trị 2 đối với tất cả các phần tử trong tập con:

E = DDN, DND, NDD của không gian mẫu S, tức là mỗi giá trị có thể có của biến ngẫu nhiên X chỉ một biến cố, nó là tập con của không gian mẫu đối với phép thử đã cho. Ví dụ 2. Các đại lượng sau là biến ngẫu nhiên + Số chấm xuất hiện khi gieo một con xúc sắc + Tuổi thọ của một thiết bị đang hoạt động + Số khách hàng có mặt tại một siêu thị trong một đơn vị thời gian Ví dụ 3. Hai quả bóng được lấy lần lượt theo phương thức không hoàn lại từ một bình chứa 4 quả bóng đỏ (R ) và 3 quả bóng đen (B ) . Gọi Y là số bóng màu đỏ, khi đó các giá trị y của biến ngẫu nhiên Y là:

Không gian mẫu ( )i

Y s

1

:s RR

2

:s RB

3

:s BR

4

:s BB

2

1

1

0

Tập giá trị của biến ngẫu nhiên Y là 0;1;2 .

2. Phân loại biến ngẫu nhiên Từ tính chất của tập giá trị của biến ngẫu ngẫu nhiên, người ta chia các biến ngẫu nhiên thành hai loại:

Biến ngẫu nhiên X được gọi là biến ngẫu nhiên rời rạc nếu tập giá trị của nó là tập đếm được.

Page 22: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

22

Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu các giá trị của nó có thể lấp đầy một hay một số khoảng hữu hạn hoặc vô hạn trên trục số. Ví dụ 4. + Số chấm xuất hiện trên mặt con xúc sắc; sô học sinh vắng mặt trong buổi học : là các biến ngẫu nhiên rời rạc + Nhiệt độ không khí tại mỗi thời điểm nào đó; quãng đường mà một chiếc ô tô đi được với 5 lít xăng: là các biến ngẫu nhiên liên tục.

II. PHÂN PHỐI XÁC SUẤT CỦA BIẾN NGẪU NHIÊN MỘT CHIỀU

Xét phép thử gieo một đồng xu ba lần và phép thử gieo một con xúc sắc ba lần. Gọi X : = số lần xuất hiện mặt sấp khi gieo một đồng xu 3 lần, Y : = số lần ra 1 chấm khi gieo một con xúc sắc 3 lần. Nhận xét: + Tập giá trị có thể của ,X Y trùng nhau và bằng: 0,1,2, 3 .

+ Tuy nhiên P X i P Y i= ≠ = . Như vậy chỉ biết tập các giá trị có thể của một biến ngẫu nhiên là chưa đủ để xác định nó. Vì vậy, đối

với một biến ngẫu nhiên ta cần biết xác suất để nó nhận giá trị bất kỳ, hay nhận giá trị trong một

khoảng bất kỳ. Một hình thức cho phép làm điều đó được gọi là quy luật phân phối xác suất của

biến ngẫu nhiên. Từ đó, khi ta biết quy luật phân bố xác suất của một biến ngẫu nhiên thì ta sẽ nắm

được toàn bộ thông tin về biến ngẫu nhiên này.

Ta ký hiệu biến ngẫu nhiên X nhận giá x là X x= và xác suất để X nhận giá trị x là ( )P X x= . 1. Đối với biến ngẫu nhiên rời rạc.

Một biến ngẫu nhiên rời rạc nhận mỗi giá trị của nó với một xác suất nhất định. Trong trường

hợp tung đồng xu 3 lần, biến ngẫu nhiên X chỉ số lần xuất hiện mặt ngửa nhận giá trị 2 với xác suất 3/8 vì 3 trong 8 điểm mẫu đồng khả năng có kết quả là 2 ngửa, 1 sấp.

Đặt: ( ) ( )f x P X x= = , khi đó ( )f x chính là hàm của các giá trị của X a.Hàm xác suất của biến ngẫu nhiên rời rạc.

Cho X là biến ngẫu nhiên rời rạc có tập giá trị 1 2 3, , ,...x x x Hàm số thực ( )f x xác định trên ℝ

được gọi là hàm xác suất (hoặc phân phối xác suất) của X nếu thoả mãn các điều kiện sau:

1. ( ) 0f x ≥ với mọi x trong tập giá trị của X

2. ( ) 1i

ix

f x =∑

3. ( ) ( )i i

f x P X x= = .

Khi xét biến ngẫu nhiên rời rạc và có tập giá trị hữu hạn thì hàm phân phối xác suất hoàn

toàn xác định bởi bảng phân phối xác suất. Bảng phân phối xác xuất gồm hai hàng: + Hàng thứ nhất liệt kê các giá trị có thể

1 2, ,...,

nx x x của biến ngẫu nhiên X .

+ Hàng thứ hai liệt kê các xác xuất tương ứng 1 2, ,...,

np p p

Page 23: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

23

x 1x

2x …

nx

1( )P X x=

1p

2p …

np

Nếu biến ngẫu nhiên rời rạcX có tập giá trị hữu hạn 1 2, ,...,

nx x x thì các biến cố

1 2, ,...,

nX x X x X x= = = sẽ lập thành một nhóm biến cố đầy đủ xung khắc từng đôi một.

Do đó:

1

1n

ii

p=

=∑ .

Ví dụ 5. Một kiện hàng gồm 8 chiếc máy vi tính giống nhau trong đó có 3 chiếc bị lỗi. Một trường học mua ngẫu nhiên 2 trong những chiếc máy vi tính này, tìm phân phối xác suất của số chiếc bị lỗi. Giải: + Gọi X là biến ngẫu nhiên mà các giá trị X của nó là số máy vi tính bị lỗi trường học đó mua.

+ Khi đó tập giá trị của X là 0,1,2

0 2

3 5

2

8

10(0) ( 0)

28

C Cf P X

C= = = = ,

1 1

3 5

2

8

15(1) ( 1)

28

C Cf P X

C= = = = ,

2 0

3 5

2

8

3(2) ( 2)

28

C Cf P X

C= = = = .

+ Do đó bảng phân phối xác suất của X là:

x 0 1 2

( )f x 10

28

15

28

3

28

b. Hàm phân phối tích lũy.

Hàm phân phối tích lũy ( )F x của biến ngẫu nhiên rời rạc X với phân phối xác suất ( )f x là hàm số được xác định bởi:

( ) ( ) ( )t x

F x P X x f t≤

= ≤ =∑ với x−∞< <+∞ .

Ví dụ 6. Một đại lý ô tô bán một loại xe nhập ngoại trong đó có 50% được trang bị túi khí. Gọi X là số xe được trang bị túi khí trong 4 xe sẽ được bán ra. a. Tìm công thức của hàm phân phối xác suất của biến ngẫu nhiên X b. Từ đó hàm phân phối tích lũy của biến ngẫu nhiên X .

Giải: + Ta có tập giá trị của X là 0,1,2, 3,4 .

+ Vì xác suất để bán được một chiếc ô tô có trang bị túi khí là 0,5 nên số kết quả đồng khả năng trong không gian mẫu là 24 = 16.

Page 24: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

24

+ Do đó tất cả các xác suất đều có mẫu số là 16.

+ Số cách bán được x chiếc xe có trang bị túi khí và ( )4 x− chiếc xe không được trang bị túi

khí là 4

xC , trong đó 0,1,2,3,4x ∈ .

a. Do đó hàm phân phối xác suất ( ) ( )f x P X x= = là:

4( )16

xCf x = với x = 0, 1, 2, 3, 4.

b. Tacó: 1

(0)16

f = , 1

(1)4

f = , 3

(2)8

f = , 1

(3)4

f = , và 1

(4)16

f =

F(0) = f(0) = 1

16

F(1) = f(0) + f(1) = 5

16

F(2) = f(0) + f(1) + f(2) = 11

16

F(3) = f(0) + f(1) + f(2) + f(3) = 15

16

F(4) = f(0) + f(1) + f(2) + f(3) + f(4) = 1

+ Do đó:

0 khi 0

1 khi 0 1

165

khi 1 x 216( )11

khi 2 31615

khi 3 416

1 khi 4

x

x

F x

x

x

x

< ≤ < ≤ <= ≤ < ≤ < ≥

+ Để ý rằng:

11 5 3

(2) (2) (1)16 16 8

f F F= − = − = .

Chú ý: Ngoài ra ta cũng mô tả hàm phân phối xác suất dưới dạng biểu đồ bằng cách:

+ Vẽ các điểm (x, f(x)), sau đó nối các điểm này đến trục Ox bởi một đường nét đứt hoặc một đường liền nét ta được một biểu đồ hình cây.

+ Thay vì vẽ các điểm (x, f(x)), bằng vẽ các hình chữ nhật sao cho đáy của chúng có bề rộng bằng nhau và mỗi giá trị x được đặt chính giữa đáy, còn chiều cao của chúng bằng xác suất tương ứng được cho bởi f(x), các đáy được vẽ sao cho không có khoảng trống giữa các hình chữ nhật. Hình đó được gọi là một biểu đồ xác suất.

Page 25: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

25

Biểu đồ hình cây.

Biểu đồ xác suất

x 0 1 2 3 4

f(x)

6/16

5/16

4/16

3/16

2/16

1/16

0 1 2 3 4

f(x)

x

6/16

5/16

4/16

3/16

2/16

1/16

Page 26: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

26

Hàm phân phối tích lũy rời rạc

2. Đối với biến ngẫu nhiên liên tục.

Đối với biến ngẫu nhiên liên tục ta không thể trình bày phân phối xác suất của nó dưới dạng bảng vì tập giá trị của nó không thể viết được dưới dạng liệt kê. Xác suất để biến ngẫu nhiên liên tục nhận một giá trị cụ thể trong tập giá trị của nó thì bằng 0. Chẳng hạn xét biến ngẫu nhiên mà các giá trị của nó là chiều cao của tất cả những người trên 21 tuổi. Giữa hai giá trị bất kì, chẳng hạn 163,5 và 164,5 cm hay 163,99 và 164,01 cm có vô số các giá trị, một trong chúng là 164 cm. Vì vậy có thể coi xác suất để chọn ngẫu nhiên một người mà người đó cao đúng 164 cm là 0. Nhưng xác suất để chiều cao của người đó nằm trong khoảng (163 cm, 165 cm) lại khác 0. Do đó đối với biến ngẫu nhiên liên tục ta quan tâm tới xác suất để biến ngẫu nhiên nhận giá trị trong một khoảng hơn là nhận một giá trị xác định.

Chúng ta sẽ tập trung tính các xác suất để biến ngẫu nhiên liên tục nhận giá trị trong các khoảng khác nhau như P(a < X < b), P(W > c), … Chú ý rằng khi X là biến ngẫu nhiên liên tục thì:

( ) ( ) ( ) ( ).P a X b P a X b P X b P a X b< ≤ = < < + = = < < Do đó việc có tính đến điểm cuối của đoạn hay không là không quan trọng. Tuy nhiên khi X

là biến ngẫu nhiên rời rạc thì điều này không còn đúng nữa. Mặc dù không thể trình bày phân phối xác suất của biến ngẫu nhiên liên tục dưới dạng bảng

nhưng chúng ta có thể mô tả nó bằng một công thức, đó là một hàm của các giá trị của biến ngẫu nhiên liên tục X mà ta kí hiệu là ( )f x được gọi là hàm mật độ xác suất hay đơn giản là hàm mật độ của X. Do ta có thể sử dụng diện tích để mô tả xác suất và xác suất là một số dương nên hàm mật độ phải nằm trên toàn bộ trục x .

Dưới đây là một số hàm mật độ điển hình:

.

f(x)

x

b)

x

f(x)

a)

1

2

3 4 x

0

1

3/4

1/2

1/4

F(x)

Page 27: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

27

( )P a X b< < Một hàm mật độ xác suất được xây dựng sao cho phần hình phẳng được giới hạn bởi đồ thị

của nó, trục x và khoảng giá trị của X mà tại đó f(x) xác định có diện tích bằng 1. Tập giá trị của X là một khoảng hữu hạn, nhưng ta có thể mở rộng nó thành một tập số thực bằng cách cho f(x) = 0 tại tất cả các điểm trong những phần mở rộng của khoảng. Ở Hình trên, xác suất để X nhận giá trị trong khoảng (a, b) là diện tích hình phẳng giới hạn bởi đồ thị của hàm mật độ, trục x và các đường thẳng x = a, x = b, nó được tính bởi tích phân sau:

P(a < X < b) = ( )b

a

f x dx∫ .

a. Hàm mật độ xác suất.

Hàm mật độ xác suất ( )f x của biến ngẫu nhiên liên tục X là hàm số thực xác định trên tập số thực ℝ và thỏa mãn xác điều kiện sau: 1. ( ) 0f x ≥ , với x∀ ∈ ℝ

2. ( ) 1f x dx

+∞

−∞

=∫

3. P(a < X < b) = ( )b

a

f x dx∫ .

Ví dụ 7. Giả sử sai số của nhiệt độ phản ứng (đơn vị 0C) trong một thí nghiệm là biến ngẫu nhiên liên tục X có hàm mật độ xác suất

2

, 1 2( ) 3

0 , ( 1,2)

xx

f x

x

− < <= ∉ −

f(x)

x

d)

f(x)

x

c)

Page 28: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

28

a) Chứng minh ( )f x thỏa mãn điều kiện 2 của Định nghĩa. b) Tìm (0 1)P X< ≤ .

Giải:

a) Ta có:

22 2 3

1 1

( )3 9

x xf x dx dx

+∞

−∞ − −

= =∫ ∫ = 8 1

19 9+ = .

b) Đối với biến ngẫu nhiên liên tục việc có tính đến điểm cuối của đoạn hay không là không quan trọng nên ta có:

P(0 < X ≤ 1) =

11 2 3

0 03 9

x xdx =∫ =

1

9.

b. Hàm phân phối tích lũy.

Hàm phân phối tích lũy ( )F x của biến ngẫu nhiên liên tục X với hàm mật độ ( )f x là hàm thực được xác định bởi:

( ) ( ) ( )x

F x P X x f t dt

−∞

= ≤ = ∫ , với x−∞< <+∞ .

Từ định nghĩa ta có ngay: P( a < X < b ) = F(b) – F(a). Ví dụ 8. Tìm ( )F x với hàm mật độ của Ví dụ 7 và sử dụng nó để tính P( 0 < X 1≤ ). Giải:

+ Với -1 < x < 2 , ta có: F(x) =2 3

1 1

( )3 9

xx xt t

f t dt dt

−∞ − −

= =∫ ∫ = 3 1

9

x +.

+ Do đó : 3

0 , 1

1( ) , 1 2

91 , 2

x

xF x x

x

≤ += − < < ≥

+ Hàm phân phối tích lũy F(x) được biểu diễn bằng đồ thị như trong hình vẽ bên dưới.

P( 0 < X 1≤ ) = F(1) – F(0) = 2 1 1

9 9 9− = .

Page 29: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

29

3. Tính chất của hàm của hàm phân phối xác suất.

Hàm phân phối xác suất ( )F x của biến ngẫu nhiên X có các tính chất sau: i. 0 ( ) 1,F x x≤ ≤ ∀

ii. Hàm ( )F x là hàm không giảm, tức là 1 2 1 2

( ) ( )x x F x F x≤ ⇒ ≤

iii. lim ( ) 0; lim ( ) 1x x

F x F x→−∞ →+∞

= =

iv. Nếu ( )f x liên tục thì ta có: '( ) ( ),F x f x x= ∀ .

v. Tính liên tục phải: lim ( ) ( )x a

F x F a+→

= .

Ý nghĩa của hàm phân phối xác suất: Hàm phân phối tích lũy ( )F x phản ánh mức độ tập trung xác suất về bên trái của điểm x .

Về nhà:

Tự đọc: Mục 3.4

Bài tập: Tr. 75

Đọc trước các Mục 4.1, 4.2, 4.3, 5.3, 54. chuẩn bị cho Bài số 4 :

Đặc trưng của biến ngẫu nhiên. Phân phối nhị thức và siêu bội

F(x)

-1

1,0

0,8

0,6

0,4

0,2

0 1 2

Page 30: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

30

Bài số 4

ĐẶC TRƯNG CỦA BIÊN NGẪU NHIÊN

PHÂN PHỐI NHỊ THỨC VÀ PHÂN PHỐI SIÊU BỘI

I. KỲ VỌNG

Nếu tung hai đồng xu 16 lần và X là số mặt ngửa xuất hiện trong mỗi lần tung, thì các giá trị của X có thể là 0, 1 và 2. Giả sử rằng khi thực hiện xong phép thử ta thu được:

+ Số lần mặt ngửa không xuất hiện là 4 + Số lần chỉ có đúng một mặt ngửa xuất hiện là 7 + Số lần cả hai mặt ngửa đều xuất hiện là 5. Khi đó số mặt ngửa xuất hiện trung bình trong mỗi lần tung là

(0)(4) (1)(7) (2)(5)1,06.

16

+ +=

Đây là giá trị trung bình và không nhất thiết phải là kết quả của phép thử. Chẳng hạn, thu nhập trung bình một tháng của người bán hàng nào đó không hẳn bằng thu nhập ở một tháng cụ thể của người ấy.

Khi quan tâm tới biến ngẫu nhiên X nào đó, có những trường hợp ta muốn biết giá trị trung bình của biến ngẫu nhiên X là bao nhiêu? Giá trị trung bình của biến ngẫu nhiên ấy còn gọi là kỳ vọng của của nó.

1. Kỳ vọng của biến ngẫu nhiên.

Định nghĩa. a. Cho X là một biến ngẫu nhiên rời rạc với hàm phân phối xác suất là ( )f x . Khi đó kỳ

vọng (giá trị trung bình) của X là một số thực ký hiệu là ( )E X ( hoặc µ ) được xác định bởi

( ) ( )x

E X xf xµ = =∑

b. Cho X là một biến ngẫu nhiên liên tục với hàm mật độ xác suất là f(x). Khi đó kỳ vọng (giá trị trung bình) của X là một số thực ký hiệu là E(X) được xác định bởi:

( ) ( ) .E X xf x dxµ

+∞

−∞

= = ∫

Chú ý: a. Trường hợp biến ngẫu nhiên rời rạc: nếu tập giá trị 1 2

, ,..., ,...n

x x x của biến ngẫu nhiên là đếm

được nhưng có vô hạn phần tử thì kỳ vọng sẽ tồn tại nếu chuỗi 1

( )i i

i

x f x∞

=∑ hội tụ.

b. Trường hợp biến ngẫu nhiên liên tục: kỳ vọng sẽ tồn tại nếu tích phân ( )xf x dx

+∞

−∞∫ hội tụ.

c. Từ định nghĩa ta nhận thấy: Hai biến ngẫu nhiên có cùng phân phối xác suất thì sẽ có cùng kỳ vọng.

Page 31: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

31

Ví dụ 1. Một vị thanh tra chất lượng kiểm tra một lô hàng gồm 7 sản phẩm trong đó có chứa 4 chính phẩm và 3 phế phẩm. Ông ta lấy ra một mẫu gồm 3 sản phẩm. Hãy tìm giá trị trung bình của số chính phẩm trong mẫu.

Giải: + Đặt X là số sản phẩm tốt trong mẫu, khi đó phân phối xác suất của X là: 3

4 3

3

7

.( ) ; 0,1,2, 3.

x xC Cf x x

C

= =

+ Ta có: 1 12 18 4(0) , (1) , (2) , (3) .35 35 35 35

f f f f= = = =

+ Do đó:

1 12 18 4 12( ) (0) (1) (2) (3) 1,7.

35 35 35 35 7E Xµ

= = + + + = =

Ví dụ 2. Tung ngẫu nhiên ba đồng xu. Người chơi sẽ nhận được 5 USD nếu tất cả các đồng xu đều sấp hoặc đều ngửa, và người chơi sẽ mất 3 USD nếu trong ba đồng xu có cả đồng xu xuất hiện mặt sấp và đồng xu xuất hiện mặt ngửa. Người chơi hi vọng sẽ kiếm được bao nhiêu tiền?

Giải: + Không gian biến cố sơ cấp cho phép thử tung ba đồng xu một cách đồng thời (hay tương tung một đồng xu ba lần) là:

S = NNN, NNS, NSN, SNN, NSS, SNS, SSN, SSS + Các biến cố sơ cấp trong S là đồng khả năng nên khả năng xuất hiện của mỗi biến cố là 1/8:

NNS N N S1 1 1 1

( ) ( ) ( ) ( )2 2 2 8

P P P P = = =

+ Gọi Y là số tiền mà người chơi sẽ đạt được. Khi đó các giá trị mà biến ngẫu nhiên Y là:

5 USD nếu biến cố E1 = NNN, SSS xuất hiện: 1

1( )4

P E =

-3USD nếu biến cố E2 = NNS, NSN, SNN, NSS, SNS, SSN xuất hiện:

23( )

4P E = .

+ Từ đó người chơi sẽ hy vọng (trung bình) sẽ kiếm được số tiền là:

1 3( ) (5) ( 3) 1.

4 4E Yµ

= = + − = −

Ví dụ 3. Đặt X là tuổi thọ tính theo giờ của một thiết bị điện tử nào đó, X là một biến ngẫu nhiên. Giả sử hàm mật độ xác suất của X là:

3

20000, 100

( )0, 100

xf x x

x

>= ≤

Hãy tính tuổi thọ trung bình của thiết bị điện tử loại này.

Giải: + Tuổi thọ trung bình của thiết bị chính bằng kỳ vọng của biến ngẫu nhiên X và bằng:

3 2100 100

20000 20000( ) 200E X x dx dx

x xµ

+∞ +∞= = = =∫ ∫

+ Do đó, ta có thể hy vọng rằng loại thiết bị điện tử này có tuổi thọ trung bình là 200 giờ.

Page 32: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

32

2.Kỳ vọng của hàm các biến ngẫu nhiên.

Như ta đã biết, khi X là một biến ngẫu nhiên và ( )g g t= là một hàm nào đó thì ( )g X cũng là một biến ngẫu nhiên. Khi đó ( )g X có kỳ vọng là bao nhiêu?

Định lí 1. Cho X là biến ngẫu nhiên với phân phối xác suất là ( )f x và ( )g g t= là hàm số xác định trên miền giá trị của biến ngẫu nhiên X . Khi đó kỳ vọng của biến ngẫu nhiên ( )g X được xác định bởi:

( )[ ( )] ( ) ( )

g XE g X g x f xµ = =∑

, nếu X là biến ngẫu nhiên rời rạc,

( )[ ( )] ( ) ( )

g XE g X g x f x dxµ

+∞

−∞

= = ∫ , nếu X là biến ngẫu nhiên liên tục.

Ví dụ 4. Giả sử số lượng xe ôtô X đến cửa hàng rửa xe vào khoảng thời gian từ 4 giờ chiều đến 5 giờ chiều của một ngày thứ sáu khô ráo, là một biến ngẫu nhiên rời rạc có phân phối xác suất như sau:

Đặt g(X) = 2X - 1 là số tiền (tính theo USD), mà người chủ cửa hàng phải trả cho nhân công rửa xe. Người công nhân rửa xe hy vọng sẽ kiếm được bao nhiêu tiền trong khoảng thời gian nói trên?

Giải: Số tiến người công nhân rửa xe có thể hy vọng nhận được(trung bình) là:

USD

9

4

[ ( )] (2 - 1)

(2 1) ( )

1 1 1 1 1 1(7) (9) (11) (13) (15) (17)

12 12 4 4 6 6

12,67

x

E g X E X

x f x=

=

= −

= + + + + + =

Ví dụ 5. Cho X là biến ngẫu nhiên liên tục có hàm mật độ là:

khi

khi

2

, ( 1;2),( ) 3

0, ( 1;2) .

xx

f x

x

∈ −= ∉ −

Hãy tìm kỳ vọng của g(X) = 4X + 3. Giải: Theo Định lí 1, ta có

22 23 2

1 1

(4 3) 1( ( ))) (4 3) (4 3 ) 8.

3 3

x xE g X E X dx x x dx

− −

+= + = = + =∫ ∫

Chú ý: Định lý 1 cho phép ta tính kỳ vọng của biến ngẫu nhiên ( )g X mà không cần biết đến phân phối xác suất của biến ngẫu nhiên đó, ta chỉ cần biết thông tin về biến ngẫu nhiên X mà thôi.

x 4 5 6 7 8 9 P(X = x) 1

12

1

12

1

4

1

4

1

6

1

6

Page 33: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

33

3. Một số tính chất i) Với C là hằng: ( )E C C= ii) Tính chất tuyến tính:

+ ( ) ( ) ( )E X Y E X E Y+ = + + Với số thực k ta có: ( ) . ( )E kX k E X=

iii) Nếu X và Y là hai biến ngẫu nhiên độc lập thì ta có: ( ) ( ) ( ). ( )E XY E X Y E X E Y= ∩ = . iv) Tính đơn điệu: Nếu X Y≥ thì ( ) ( )E X E Y≥ . v) Nếu f là một hàm lồi và X là một biến ngẫu nhiên thì ta có:

( ( )) ( ( ))E f X f E X≥ . Áp dụng trong Ví dụ 3: Cho X là biến ngẫu nhiên liên tục có hàm mật độ là

khi

khi

2

, ( 1;2),( ) 3

0, ( 1;2) .

xx

f x

x

∈ −= ∉ −

Hãy tìm kỳ vọng của g(X) = 4X + 3.

+ Ta có: (4 3) 4 ( ) (3) 4 ( ) 3E X E X E E X+ = + = +

+ Mà 2 3

1

5( ) ( )

3 4

xE X xf x dx dx

+∞

−∞ −

= = =∫ ∫

+ Do đó: (4 3) 4 ( ) 3 8E X E X+ = + = .

II. PHƯƠNG SAI. Giá trị trung bình hay kỳ vọng của biến ngẫu nhiên X là một giá trị đặc biệt quan trọng trong

thống kê, nó chính là giá trị trung bình (theo xác suất) của biến ngẫu nhiên, nó phản ánh giá trị trung tâm của phân phối xác suất. Tuy nhiên, với chỉ với con số đó ta chưa thể biết được đầy đủ thông tin về phân phối xác suất của biến ngẫu nhiên. Nhiều khi ta quan tâm tới mức độ phân tán các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình.

Để đánh giá mức độ phân tán của biến ngẫu nhiên X nào đó xung quanh giá trị trung bình ( )E Xµ = của nó ta cần có cách đánh giá “độ lệch” giữa X và kỳ vọng ( )E Xµ = . Để ý rằng:

( ) ( ) 0E X E Xµ µ− = − = với mọi biến ngẫu nhiên X , nên ta sẽ không xét giá trị trung bình (kỳ vọng) của sai số mà sẽ quan tâm đến trung bình (kỳ vọng) của bình phương sai số, và đại lượng đó được gọi là phương sai: đó là số thực để đo sự phân tán

của biến ngẫu nhiên X và kí hiệu là Var( )X hoặc là 2

Xσ , hoặc là 2σ khi biến ngẫu nhiên đã rõ

ràng. 1. Phương sai và độ lệch chuẩn của biến ngẫu nhiên.

Định nghĩa: Cho X là biến ngẫu nhiên với phân phối xác suất ( )f x và kỳ vọng là µ . Phương sai của X là một số thực được xác định bởi:

2 2 2[( - ) ] ( - ) ( )x

E X x f xσ µ µ= =∑ , nếu X là rời rạc,

2 2 2[( - ) ] ( ) ( )E X x f x dxσ µ µ+∞

−∞= = −∫

, nếu X liên tục.

Căn bậc hai của phương sai là σ và được gọi là độ lệch chuẩn của biến ngẫu nhiên X.

Page 34: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

34

Ví dụ 6. Gọi X là biến ngẫu nhiên biểu thị số xe ôtô được sử dụng cho mục đích kinh doanh chính thức trong một ngày làm việc nào đó. Phân phối xác suất của X tại công ty A là:

X 1 2 3 f(x) 0,3 0,4 0,3

và tại công ty B là:

X 0 1 2 3 4 f(x) 0,2 0,1 0,3 0,3 0,1

Hãy chỉ ra rằng phương sai của phân phối xác suất tại công ty B là lớn hơn so với tại công ty A. Giải: + Tại công ty A, ta tính được

( ) (1)(0,3) (2)(0, 4) (3)(0, 3) 2,0E Xµ = = + + = + Khi đó

( ) ( ) ( )3

2 2 22 2

1

( 2) ( ) 1 2 (0, 3) 2 2 (0,4) 3 2 (0,3)

0,6.x

x f xσ=

= − = − + − + −

=

+ Tại công ty B, ta có

( )( ) 0 (0,2) (1)(0,1) (2)(0,3) (3)(0, 3) (4)(0,1)

2,0

E Xµ = = + + + +=

+ Khi đó

( ) ( ) ( ) ( ) ( )

42 2

02 2 2 2 2

( 2) ( )

0 2 (0,2) 1 2 (0,1) 2 2 (0,3) 3 2 (0,3) 4 2 (0,1) 1,6

x

x f xσ=

= −

= − + − + − + − + − =

Rõ ràng, phương sai của số ôtô được sử dụng cho những mục đích kinh doanh chính thức tại công ty B là lớn hơn công ty A. Sau đây là một công thức thường được sử dụng nhiều hơn trong việc tính toán để tìm số 2σ .

Định lí 3. Phương sai của biến ngẫu nhiên X có thể đươc xác định bởi công thức: 2 2 2( ) .E Xσ µ= −

Ví dụ 7. Gọi X là biến ngẫu nhiên biểu thị số thiết bị hỏng trong một hệ thống gồm 3 thiết bị được kiểm tra của một chiếc máy. Phân phối xác suất của X như sau:

X 0 1 2 3 f(x) 0,51 0,38 0,10 0,01

Hãy tính 2σ .

Giải: + Trước tiên, ta tính: 0,61.(0)(0,51) (1)(0, 38) (2)(0,10) (3)(0, 01)µ = + + + =

+ Ta lại có:

Page 35: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

35

2 2 2 2 2( ) (0) (0,51) (1) (0,38) (2) (0,10) (3) (0,01) 0,87.E X = + + + = + Vậy nên:

2 2 2 2( ) 0,87 (0,61) 0,4979.E Xσ µ= − = − = Ví dụ 8. Nhu cầu hàng tuần đối với Pepsi, theo đơn vị 1000 lít, tại một chuỗi các cửa hàng ở một địa phương nào đó, là một biến ngẫu nhiên liên tục X với hàm mật độ xác suất như sau

2( 1), (0;2)( )

0, (0;2)

x xf x

x

− ∈= ∉

Hãy tìm kỳ vọng và phương sai của X. Giải: + Kỳ vọng của biến ngẫu nhiên cần tìm là:

2

1

5( ) 2 ( 1) .

3E X x x dxµ = = − =∫

+ Ta có 2

2 2

1

17( ) 2 ( 1)

6E X x x dx= − =∫

+ Vậy nên: 2

2 2 2 17 5 1( ) .

6 3 18E Xσ µ

= − = − =

Chú ý. Phương sai hay độ lệch chuẩn chỉ có ý nghĩa khi ta so sánh hai hay nhiều phân phối có cùng đơn vị đo. Do đó, ta chỉ có thể so sánh phương sai của các biến ngẫu nhiên cùng loại, cùng có đơn vị đo. 2. Phương sai của hàm các biến ngẫu nhiên

Ta sẽ mở rộng khái niệm phương sai của một biến ngẫu nhiên cho hàm của biến ngẫu nhiên X . Giả sử ( )g g t= là hàm số xác định trên miền giá trị của biến ngẫu nhiên X , khi đó ( )g X cũng

là một biến ngẫu nhiên và phương sai của nó sẽ được kí hiệu là 2

( )g Xσ .

Định lý 4. Cho X là biến ngẫu nhiên với phân phối xác suất là ( )f x . Phương sai của biến ngẫu nhiên g(X) là:

2 2 2

( ) ( ) ( )[ ( ) - ] [ ( ) ] ( )

g X g X g Xx

E g X g x f xσ µ µ= = −∑ , nếu X là biến ngẫu nhiên rời rạc,

2 2 2

( ) ( ) ( )[ ( ) - ] [ ( ) - ] ( )

g X g X g XE g X g x f x dxσ µ µ

+∞

−∞= = ∫

, nếu X là biến ngẫu nhiên liên tục.

Ví dụ 9. Tính phương sai của biến ngẫu nhiên g(X) = 2X + 3, trong đó X là biến ngẫu nhiên với phân phối xác suất như sau

x 0 1 2 3 f(x) 1

4

1

8

1

2

1

8

Giải: + Tính kỳ vọng của biến ngẫu nhiên g(X) = 2X + 3 theo Định lý 1:

Page 36: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

36

3

2 30

(2 3) (2 3) ( ) 6.X

x

E X x f xµ+

=

= + = + =∑

+ Sử dụng Định lí 4, ta có:

22 2 2

2 3 2 3

32 2

0

[(2 3) - ] [(2 3) - 6] 2 3

= (4 12 9) (4 12 9) ( ) 4.

X X

x

E X E X E X

E X X x x f x

σ µ+ +

=

= + = + = −

− + = − + =∑

Thông thường, các quan sát thu được từ những thí nghiệm mang tính thống kê khác nhau đều có cùng kiểu đặc tính chung. Do đó các biến ngẫu nhiên liên kết với các phép thử, về bản chất, có thể được mô tả bởi cùng một phân phối xác suất vì thế có thể được biểu thị bởi chỉ một công thức. Như vậy, trong tính toán, ta chỉ cần một số phân phối xác suất quan trọng để mô tả nhiều biến ngẫu nhiên. III. Phân phối nhị thức và phân phối đa thức 1.Phân phối nhị thức. a. Phép thử Bernoulli.

Một thí nghiệm thường bao gồm nhiều phép thử được lặp đi lặp lại, mỗi phép thử với hai biến cố, ta có thể đặt tên cho chúng là biến cố thành công và biến cố thất bại. Chẳng hạn, khi rút (theo phương thức hoàn lại) các quân bài liên tiếp từ một bộ bài tú lơ khơ và mỗi lần rút được coi là thành công hay thất bại tuỳ thuộc vào việc quân bài rút được có phải là quân cơ hay không. Khi mỗi quân bài được hoàn lại và xáo cỗ bài trước khi rút quân tiếp theo, cả hai lần rút quân bài đều có các tính chất tương tự nhau, đó là các phép thử độc lập và xác suất thành công trong mỗi phép thử đều bằng nhau. Quá trình vừa được đề cập đến được gọi là quá trình Bernoulli và mỗi phép thử trong quá trình đó được gọi là phép thử Bernoulli. Định nghĩa. Phép thử Bernoulli là một quá trình thỏa mãn đồng thời các tính chất sau: 1. Một thí nghiệm gồm n phép thử cùng loại được lặp đi lặp lại. 2. Mỗi biến cố của một phép thử được phân loại theo biến cố thành công hoặc biến cố thất bại. 3. Xác suất thành công trong mỗi phép thử đều bằng nhau và được kí hiệu là p . 4. Các phép thử là độc lập.

b. Phân phối nhị thức. Định nghĩa. Số lần thành công X trong n phép thử Bernoulli được gọi là biến ngẫu nhiên nhị thức. Phân phối xác suất của BNN rời rạc này được gọi là phân phối nhị thức. Xác suất được kí hiệu là b(x; n; p) - bởi vì nó phụ thuộc vào số phép thử và xác suất thành công trong mỗi phép thử

Công thức tính: Cho phép thử Bernoulli với xác suất thành công là p và thất bại là 1q p= − . Phân phối xác suất của biến ngẫu nhiên nhị thức X (số lần thành công trong n phép thử độc lập), là

( ; , ) ( ) , 0,1,2,..., .x x n x

nb x n p P X x C p q x n−= = = =

Ví dụ 10. Xác suất để một loại bộ phận nào đó còn sống sau một cú va chạm là 3/4. Tìm xác suất để có đúng 2 trong 4 thành phần còn sống sau cú va chạm. Giải: + Bốn bộ phận tham gia vào cú va chạm đó cho ta bốn phép thử độc lập với xác suất

34

p = ,

Page 37: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

37

+ Đây là một phép thử Bernoulli với 34;4

n p= = và BNN rời rạc X có phân phối nhị

thức: 2 2

22

4 2

3 3 1 4! 3 27(2;4, ) . .

4 4 4 2!2! 1284b C

= = =

Chú ý:

1. Do p + q = 1 nên ta được: 0

( ; , ) 1n

x

b x n p=

=∑

2. Nhiều khi ta cần tính P(X < r) và P(a ≤ X ≤ b). Khi đó ta cần các kết quả đã được tính sẵn, các

tổng nhị thức: 0

( ; , ) ( ; , )r

x

B r n p b x n p=

=∑ đã được tính sẵn và ghi trong Bảng A.1 trong phần phụ lục,

với 1,2,...,20n = và các giá trị xác suất p từ 0,1 đến 0,9.

Ví dụ 11. Xác suất để một bệnh nhân sống sót sau khi mắc một loại bệnh hiếm thấy về máu là 0,4. Nếu biết rằng đã có 15 người mắc loại bệnh này, tìm xác suất để: a. Có ít nhất 10 người sống sót; b. Có từ 3 đến 8 người sống sót; c. Có đúng 5 người sống sót. Giải: Gọi X là số người sống sót. a. Xác suất để có ít nhất 10 người sống sót là:

9

0

( 10) 1 ( 10) 1 ( ;15, 0, 4) 1 0,9662

0, 0338.x

P X P X b x=

≥ = − < = − = −

=

b. Xác suất để có từ 3 đến 8 người sống sót là: 8 2

0 0

(3 8) ( ;15, 0, 4) ( ;15, 0,4) 0,9050 0, 0271

0,8779.x x

P X b x b x= =

≤ ≤ = − = −

=

∑ ∑

c. Xác suất để có đúng 5 người sống sót là:

5 4

0 0

( 5) (5;15, 0, 4) ( ;15, 0, 4) ( ;15, 0, 4)

0, 4032 0,2173 0,1859.x x

P X b b x b x= =

= = = −

= − =

∑ ∑

c.Tham số đặc trưng. Giá trị trung bình (kỳ vọng) và phương sai của phân phối nhị thức b(x; n, p) được xác định bởi:

npµ = và 2 npqσ =

2. Phân phối đa thức.

a. Định nghĩa. Phép thử nhị thức trở thành phép thử đa thức nếu mỗi phép thử có nhiều hơn hai kết quả. Khi đó phân phối xác suất của phép thử đa thức được gọi là phân phối đa thức.

Page 38: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

38

Ví dụ: + Sự phân loại sản phẩm của một dây chuyền sản xuất dựa vào việc sản phẩm nặng, nhẹ. + Việc rút lần lượt từng quân bài từ một bộ bài tú lơ khơ theo phương thức có hoàn lại và ta quan tâm đến việc rút được chất nào (rô, cơ, bích, nhép). Đó là các phép thử đa thức. Nếu một phép thử có k kết cục E1, E2, …,Ek với xác suất tương ứng là p1, p2,…, pk, thì phân phối đa thức sẽ cho ta xác suất để E1 xuất hiện

1x lần, E2 xuất hiện

2x lần,…,Ek xuất hiện

kx lần trong n

phép thử độc lập, trong đó : 1 2 kx x x n+ + + =⋯

Ta kí hiệu phân phối xác suất đồng thời này là : 1 2 1 2

( , ,..., ; , ,..., , )k k

f x x x p p p n

Dễ thấy, 1 2

1k

p p p+ + + =⋯ , vì các kết quả của phép thử phải là một trong k kết cục có thể.

Công thức tính: Nếu một phép thử có k kết cục E1, E2, …,Ek với xác suất tương ứng là p1, p2,…, pk, thì phân phối xác suất của các biến ngẫu nhiên

1 2, ,...,

kX X X biểu thị số lần xuất hiện của E1, E2,

…,Ek tương ứng, trong dãy n phép thử độc lập là 1 2 1 2, ,...,

1 2 1 2 1 2( , ,.., ; , ,..., , ) . ...k k

x x x x x x

k k n kf x x x p p p n C p p p=

trong đó 1 1

, 1k k

i ii i

x n p= =

= =∑ ∑ .

Ví dụ 12. Tung một cặp xúc xắc 6 lần, tính xác suất để: tổng số chấm xuất hiện là 7 hoặc 11 xuất hiện hai lần, số chấm trên hai con là như nhau xuất hiện một lần, và các trường hợp còn lại xuất hiện 3 lần.

Giải: + Ta có các biến cố,

E1 : tổng số chấm xuất hiện là 7 hoặc 11, khi đó 1 1

2( )9

p P E= =

E2: số chấm xuất hiện bằng nhau, khi đó 2 2

1( )6

p P E= =

E3: tổng số chấm xuất hiện không bằng 7, không bằng 11 và số chấm xuất hiện cũng không

bằng nhau, khi đó 3 3

2( )9

p P E= = .

+ Các giá trị này là như nhau ở cả 6 lần tung. + Dùng phân phối đa thức với x1 = 2, x2 = 1, và x3 = 3, ta được xác suất cần tìm

2 1 3

2,1,3

6

2 3

2 3

2 1 11 2 1 112,1, 3; , , ,6

9 6 18 9 6 18

6! 2 1 110,1127.

2!1!3! 69 18

f C =

= =

IV. PHÂN PHỐI SIÊU BỘI Các kiểu ứng dụng phân phối siêu bội tương tự như phân phối nhị thức: quan tâm đến việc

tính các xác suất của số lượng các kết cục rơi vào một kiểu đặc biệt. Trong trường hợp phân phối nhị thức: các phép thử là độc lập. Như vậy, chỉ dùng được phân

phối nhị thức khi mẫu được lấy từ tổng thể có số lượng đông đảo (bộ bài, các sản phẩm từ một dây chuyền sản xuất), việc lấy mẫu phải được tiến hành theo phương thức có hoàn lại.

Trong khi đó, phân phối siêu bội không đòi hỏi tính độc lập của các phép thử và do đó việc lấy mẫu là theo phương thức không hoàn lại.

Page 39: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

39

Phân phối siêu bội được áp dụng trong nhiều lĩnh vực, đặc biệt được sử dụng rộng rãi trong việc lấy mẫu chấp nhận, thí nghiệm điện tử, lấy mẫu kiểm tra để đảm bảo chất lượng. Rõ ràng, với nhiều lĩnh vực việc kiểm định đánh giá chất lượng rất tốn kém và phung phí khi ta phải phá bỏ đối tượng được kiểm tra và do đó không thể hoàn trả lại tổng thể. Vì thế, việc lấy mẫu không hoàn lại là cần thiết. Ví dụ: Rút quân bài từ bộ bài tú lơ khơ. Ta muốn tính xác suất để rút được 3 quân đỏ trong 5 quân bài được rút ngẫu nhiên từ bộ bài gồm 52 quân, phân phối nhị thức không thể áp dụng được, trừ khi mỗi quân bài được hoàn lại sau khi rút và quan sát sau đó xáo lại bài trước khi rút quân tiếp theo.

1. Định nghĩa. Khi chọn ngẫu nhiên một mẫu cỡ n từ N phần tử, ta quan tâm đến xác suất để chọn được x phần tử thành công. Phép thử kiểu này được gọi là phép thử siêu bội, nếu nó thỏa mãn hai tính chất sau: 1. Một mẫu cỡ n được chọn ngẫu nhiên theo phương thức không hoàn lại từ N phần tử. 2. Trong N phần tử đã định rõ k phần tử là thành công và N – k phần tử còn lại là thất bại. Số phần tử thành công X trong phép thử siêu bội được gọi là biến ngẫu nhiên siêu bội. Phân phối xác suất của biến ngẫu nhiên siêu bội được gọi là phân phối siêu bội và các giá trị của nó được kí hiệu là ( ) ( ; , , )P X x h x N n k= = .

Ví dụ 13. Một uỷ ban gồm 5 người được chọn ngẫu nhiên từ 3 nhà hóa học và 5 nhà vật lí. Tìm phân phối xác suất của số lượng nhà hoá học được chọn. Giải: + Gọi biến ngẫu nhiên X là số nhà hoá học trong uỷ ban nói trên: đây là BNN siêu bội.

+ Do đó: 5

3 5

5

8

( ;8,5, 3) ( ) , 0,1,2,3.x xC C

h x P X x xC

= = = =

+ Cụ thể:

0 5 1 4

3 5 3 5

5 5

8 82 3 3 2

3 5 3 5

5 5

8 8

1 15( 0) (0;8,5, 3) ; ( 1) (1;8,5, 3)

56 56

30 10( 2) (2;8,5, 3) ; ( 3) (3;8,5,3)

56 56

C C C CP X h P X h

C C

C C C CP X h P X h

C C

= = = = = = = =

= = = = = = = =

+ Dạng bảng của phân phối siêu bội của X là:

X 0 1 2 3 h(x;8,5,3) 1 15 30 10

56 56 56 56

2.Công thức tính: Phân phối xác suất của biến ngẫu nhiên siêu bộiX (biểu thị số thành công trong mẫu cỡ n được chọn ngẫu nhiên từ N phần tử) trong đó có k phần tử là thành công và N – k phần tử được đặt thất bại, được xác định bởi công thức:

( ; , , ) , 0,1,2,...,x n x

k N k

n

N

C Ch x N n k x n

C

−−= = .

Ví dụ 14. Mỗi lô gồm 40 sản phẩm được coi là chấp nhận được nếu chứa không quá 3 phế phẩm. Biện pháp lấy mẫu là chọn ngẫu nhiên 5 sản phẩm trong lô để kiểm tra và loại lô hàng nếu có một

Page 40: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

40

phế phẩm. Tính xác suất để có đúng 1 phế phẩm được tìm thấy trong mẫu nếu trong lô hàng có 3 phế phẩm? Giải: + Gọi X là số phế phẩm tìm thấy: đây là BNN siêu bội. + Sử dụng phân phối siêu bội với n = 5, N = 40, k = 3 và x =1 ta tìm được xác suất nhận được

một phế phẩm là : 1 4

3 37

5

40

(1;40,5, 3) 0, 3011.C C

hC

= =

3. Các tham số đặc trưng Trung bình (kỳ vọng) và phương sai của phân phối siêu bội h(x; N, n, k) được xác định bởi:

nk

Nµ = và 2 1 .

1

N n k kn

N N Nσ

− = − −

Ví dụ 15. Tìm trung bình và phương sai của biến ngẫu nhiên trong Ví dụ 14. Giải: + Trong Ví dụ 14 ta gọi X là số phế phẩm tìm thấy: đây là BNN siêu bội.

+ Khi đó áp dụng công thức với N = 40, n = 5, và k = 3 ta có: (5)(3) 3

0,37540 8

µ = = =

và : 2 40 5 3 3(5) 1 0, 3113

39 40 40σ

− = − =

Chú ý: Nếu N đã được chia thành k tập đôi một không giao nhau A1, A2, …, Ak với số lượng phần tử tương ứng là a1, a2, .., ak , thì phân phối xác suất đồng thời của các biến ngẫu nhiên X1, X2,…, Xk - số lượng phần tử của A1, A2,..,Ak tương ứng trong mẫu cỡ n - là

1 2

1 2

1 2 1 2

...( , ,..., ; , ,.., , , )

k

k

x x x

a a a

k k n

N

C C Cf x x x a a a N n

C=

trong đó 1

k

ii

x n=

=∑ và 1

k

ii

a N=

=∑ .

Về nhà:

Tự đọc các Mục 4.4

Bài tập: Tr. 107, 117, 140, 148

Đọc trước các Mục 6.1, 6.2, 6.3, 6.4, 8.1, 8.2, 8.4 chuẩn bị cho Bài số 5:

Phân phối chuẩn. Một số thống kê mẫu quan trọng.

Page 41: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

41

Bài số 5

PHÂN PHỐI CHUẨN.

MỘT SỐ THỐNG KÊ MẪU QUAN TRỌNG

I. PHÂN PHỐI CHUẨN Phân phối xác suất quan trọng nhất trong toàn bộ lĩnh vực thống kê là phân phối chuẩn. Đồ thị của nó, được gọi là một đường cong chuẩn: một đường cong có dạng hình quả chuông, nó miêu tả xấp xỉ nhiều hiện tượng xảy ra trong tự nhiên, trong công nghiệp và trong nghiên cứu. Các số đo vật lí trong một vùng như các thí nghiệm về khí tượng, các số đo về lượng mưa, và các số đo về các khâu của quá trình sản xuất, thông thường được giải thích bằng phân phối chuẩn.. Phân phối chuẩn thường được nhắc đến như là phân phối Gaussian, để tưởng nhớ đến Karl Friedrich Gauss (1777 - 1855), người cũng tìm thấy phương trình của đường cong chuẩn nhờ việc nghiên cứu các sai số trong việc lặp đi lặp lại các phép đo với một số lần như nhau.

1.Định nghĩa. Một biến ngẫu nhiên liên tục X có phân phối hình quả chuông được gọi là một biến ngẫu nhiên chuẩn. Mật độ của X được ký hiệu bởi ( ; , ).n x µ σ 2. Phân phối chuẩn.

Cho biến ngẫu nhiên chuẩn X , với kỳ vọng µ và phương sai 2 σ . Khi đó hàm mật độ của biến ngẫu nhiên X được xác định bởi:

2

2

( )

21

( ; , ) , , 3.14159... và 2.71828....2

x

n x e x e

µ

σµ σ πσ π

−−

= −∞< <+∞ = =

21 µµ =

x

Hình 4. Hai đường cong chuẩn với 21 µµ = và 21 σσ <

x

Hình 3. Hai đường cong chuẩn với 21 µµ < và 21 σσ =

σ

µ x

Hình 2. Đường cong chuẩn

Page 42: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

42

3. Tính chất của đường cong chuẩn.

1. Mode, là điểm trên trục hoành mà tại đó đường cong đạt giá trị lớn nhất, xảy ra tại .x µ= 2. Đường cong có trục đối xứng là đường thẳng đứng đi qua .µ 3. Đường cong có hai điểm uốn tại x µ σ= ± , lồi nếu Xµ σ µ σ− < < + và lõm nếu ngược

lại. 4. Đường cong tiệm cận với trục hoành nếu chúng ta cho x di chuyển dần xa khỏi giá trị trung

bình. 5. Tổng diện tích của phần bên dưới đường cong và bên trên trục hoành bằng 1.

4.Tham số đặc trưng. Nếu X là BNN chuẩn có hàm mật độ ( ; , )n x µ σ thì 2( ) ,

XE X µ σ σ= = .

5. Xác suất của BNN chuẩn

a.Công thức. Cho X là BNN chuẩn có hàm mật độ ( ; , )n x µ σ khi đó:

2 2

1 1

(1/2)[( )/ ]2

1 2

1( ) ( ; , )

2

x xx

x xP x X x n x dx e dxµ σµ σ

σ π

− −< < = =∫ ∫

b. Diện tích bên dưới đường cong chuẩn.

Bất kỳ phân phối xác suất liên tục hay hàm mật độ nào đều có đồ thị là một đường cong, mà diện tích vùng dưới của đường cong chắn bởi hai trục

1 2 và x x x x= = bằng xác suất để biến ngẫu

nhiên X nhận giá trị nằm giữa 1 2 và x x x x= = . Do đó, với đường cong chuẩn

2 2

1 1

(1/2)[( )/ ]2

1 2

1( ) ( ; , )

2

x xx

x xP x X x n x dx e dxµ σµ σ

σ π

− −< < = =∫ ∫

bằng diện tích của vùng bôi đen. Hình 6.

1 2

( )P x X x< < = diện

tích phần bôi đen Hình 7.

1 2( )P x X x< < của hai

đường cong chuẩn khác nhau

x

Hình 5 Hai đường cong chuẩn với 21 µµ < và 21 σσ <

Page 43: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

43

Nhận xét: Bây giờ ta thực hiện bởi phép chuyển: .X

σ

−= Khi đó X nếu nhận các giá trị trong

khoảng 1 2

( , )x x thì biến ngẫu nhiên Z sẽ nhận các giá trị trong khoảng

1 2

1 2 1 2( , ) : ,

x xz z z z

µ µ

σ σ

− −= = .

Từ đó, chúng ta có thể viết

2

1

22 2

1 1

(1/2)[( )/ ]2

1 2

/2

1 2

1( )

21

( ;0,1) ( ),2

xx

x

z zz

z z

P x X x e dx

e dz n z dz P z Z z

µ σ

σ π

π

− −

< < =

= = = < <

∫ ∫

ở đó chúng ta thấy Z là một phân phối chuẩn có trung bình bằng 0 và phương sai bằng 1. c. Phân phối tiêu chuẩn. Định nghĩa. Phân phối của biến ngẫu nhiên chuẩn có kỳ vọng bằng 0 và phương sai bằng 1 được gọi

là phân phối tiêu chuẩn: 2

21

( ;0,1) ,2

x

n x e xπ

−= −∞< <+∞

Như vậy ta có thể quy gọn tất cả các giá trị cần tra của diện tích phần bên dưới của đường cong chuẩn bất kỳ về làm một, đó là bảng tra của phân phối tiêu chuẩn. Bảng A.3 chỉ ra diện tích phần bên dưới đường cong tiêu chuẩn ứng với ( )P Z z< , với giá trị của z chạy từ -3.49 đến 3.49.

Hình 8. Phân phối chuẩn gốc và phân phối sau phép chuyển

Ví dụ 1. Cho phân phối chuẩn, tìm diện tích phần nằm bên dưới đường cong ở hình a. Ở bên phải số z = 1.84 và diện tích phần nằm bên dưới đường cong b. Giữa hai số z = - 1.97 và z = 0.86. Giải:

a. Diện tích phần nằm trong Hình 9 (a) ở bên phải số z = 1.84 bằng 1 trừ đi diện tích phần nằm bên trái số z = 1.84, bằng cách tra Bảng A.3 ta có diện tích phần cần tìm là 1 – 0.9671 = 0.0329.

b. Diện tích phần nằm trong Hình 9(b) ở giữa hai số z = - 1.97 và z = 0.86 bằng diện tích của phần nằm bên trái số z = 0.86 trừ đi diện tích phần nằm bên trái số z = -1.97. Từ Bảng A3 chúng ta tìm ra diện tích của phần hình cần tìm là 0.8051 – 0.0244 = 0.7807.

Page 44: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

44

Hình 9. Phần diện tích trong Ví dụ 1

Ví dụ 2. Cho một phân phối chuẩn có 50 và 10. µ σ= = Tìm xác suất để X nhận giá trị trong khoảng 45 và 62. Giải: Các giá trị z tương ứng với

1 245 và 62x x= = là

1 2

45 50 62 500.5 và 1.2.

10 10z z

− −= = − = =

Do đó, (45 62) ( 0.5 1.2).P X P Z< < = − < <

Hình 10. Phần diện tích trong Ví dụ 14

Xác suất ( 0.5 1.2)P Z− < < chính là diện tích của phần được tô đậm trong Hình 6.11. Diện tích của phần này có thể được tìm bằng cách trừ diện tích của phần bên trái z = 1.2 cho diện tích của phần bên trái z = - 0.5. Dùng Bảng A.3 chúng ta có:

( 0.5 1.2) ( 1.2) ( 0.5) 0.8849 0.3085 0.5764.P Z P Z P− < < = < − − = − = Ví dụ 3. Cho một phân phối chuẩn với 40 và 6,µ σ= = tìm giá trị của x tương ứng với

a. Phần hình nằm ở bên trái có diện tích 45% b. Phần hình nằm ở bên phải có diện tích 14%

Giải: a. Phần có diện tích 0,45, nằm ở bên trái giá trị x được tô đậm trong Hình 11(a). Điều này đòi hỏi chúng ta tìm giá trị của z sao cho diện tích phần bên trái z bằng 0.45.

+ Từ Bảng A.3 chúng ta thấy ( 0,13) 0, 45P Z <− = vì thế z = - 0, 13. + Do đó: (6).( 0,13) 40 39,22x = − + =

b. Trong Hình 11(b) chúng ta bôi đen phần ở bên phải giá trị x có diện tích bằng 0.14. Điều này đòi hỏi chúng ta tìm giá trị của z sao cho diện tích phần bên phải z bằng 0.14 và do đó diện tích phần ở bên trái z bằng 0.86.

+ Từ bảng A.3 chúng ta thấy ( 1, 08) 0,86P Z < = . + Do đó: 1,08z = và (6)(1, 08) 40 46,48.x = + =

Page 45: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

45

Hình 11. Phần diện tích trong Ví dụ 3

6. Xấp xỉ chuẩn của phân phối nhị thức.

Ta đã biết phân phối Poisson có thể được dùng để xấp xỉ cho phân phối nhị thức khi n đủ lớn và p rất gần với 0 hoặc 1. Cả phân phối Poisson và phân phối nhị thức đều là các phân phối rời rạc. Phân phối chuẩn sẽ là một xấp xỉ tốt đối với phân phối rời rạc khi các số liệu của phân phối rời rạc tạo nên một đường gấp khúc có hình dáng gần giống với một quả chuông.

Định lý. Nếu X là một BNN nhị thức với trung bình npµ = và phương sai 2 npqσ = , thì phân phối giới hạn của

,X np

Znpq

−= khi n →+∞ ,

là phân phối tiêu chuẩn chuẩn ( ;0,1)n z .

Chú ý: 1. Phân phối chuẩn với npµ = và 2 (1 )np pσ = − không chỉ là một xấp xỉ rất chính xác của phân phối nhị thức khi n lớn và p không quá gần với 0 và 1 mà nó còn là một xấp xỉ khá tốt ngay cả khi n nhỏ và p gần bằng 1/2.

2. Một cách nữa để xác định xem khi nào nên dùng xấp xỉ chuẩn là tính giá trị của np và nq : Nếu cả hai giá trị này đều lớn hơn hoặc bằng 5 thì kết quả xấp xỉ là tốt. Ví dụ 4. Một kì thi trắc nghiệm có 200 câu hỏi với 4 phương án trả lời cho mỗi câu trong đó chỉ có một phương án đúng. Với xác suất bằng bao nhiêu thì một sinh viên không có kiến thức về phần đó có thể trả lời đúng từ 25 đến 30 câu hỏi trong 80 câu hỏi lấy từ 200 câu hỏi trên.

Giải: +Xác suất để sinh viên trả lời đúng 1 câu trong 80 câu hỏi là 1/4. + Gọi X là số câu trả lời đúng của sinh viên, khi đó

30

25

(25 30) ( ;80,1 / 4).x

P X b x=

≤ ≤ =∑

+ Dùng đường cong chuẩn xấp xỉ với 80(1 / 4) 20npµ = = =

80(1 / 4)(3 / 4) 3.873,npqσ = = =

+ Ta cần tính diện tích của hình nằm giữa 1 2

24.5 và 30.5x x= = . Các giá trị z tương ứng là

1 2

24.5 20 30.5 201.16 và 2.71.

3.873 3.873z z

− −= = = =

Page 46: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

46

Hình 12. Phần diện tích trong Ví dụ 4

+ Xác suất trả lời đúng từ 25 đến 30 câu hỏi được cho bởi diện tích của phần bôi đen trong Hình 12. + Từ Bảng A.3 chúng ta có

30(25 30) ( ;80,1 / 4)

25(1.16 2.71) ( 2.71) ( 1.16)

0.9966 0.8770 0.1196.

P X b xx

P Z P Z P Z

≤ ≤ = ∑=

≅ < < = < − <= − =

Trong nhiều bài toán thực tế dẫn đến nghiên cứu một hay nhiều dấu hiệu định tính hoặc định lượng đặc trưng cho các phần tử của một tập hợp nào đó. Chẳng hạn, nếu muốn điều tra thu nhập bình quân của các gia đình ở Hà nội thì tập hợp cần nghiên cứu là các hộ gia đình, dấu hiệu nghiên cứu là thu nhập của từng gia đình. Để xử lý dấu hiệu cần nghiên cứu đôi khi người ta sử dụng phương pháp nghiên cứu toàn bộ, đó là điều tra toàn bộ các phần tử của tập hợp theo dấu hiệu cần nghiên cứu để rút ra kết luận cần thiết. Tuy nhiên trong thực tế việc áp dụng phương pháp này gặp một số khó khăn sau: + Do quy mô nghiên cứu quá lớn nên việc nghiên cứu toàn bộ đòi hỏi nhiều chi phí về vật chất và thời gian, hơn nữa nếu không kiểm soát được sẽ dẫn đến cồng chéo hoặc bỏ sót. + Nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợ cần nghiên cứu do đó không thể tiến hành toàn bộ được. Vì thế trong thực tế, phương pháp nghiên cứu toàn bộ thường chỉ áp dụng với các tập hợp có quy mô nhỏ, còn chủ yếu người ta sử dụng phương pháp không toàn bộ mà đặc trưng là phương pháp nghiên cứu chọn mẫu. II. TỔNG THỂ. MẪU. THỐNG KÊ 1. Tổng thể.

a. Định nghĩa. Khi nghiên cứu về một vấn đề người ta thường khảo sát trên một dấu hiệu nào đó, các dấu hiệu này thể hiện trên nhiều phần tử. Tập hợp các phân tử mang dấu hiệu được quan tâm được gọi là một tổng thể. Số lượng các phần tử trong một tổng thể được gọi là cỡ tổng thể. Mỗi phần tử có mặt trong tổng thể được gọi là một cá thể của tổng thể đó.

Ví dụ 5. Nếu có 600 sinh viên trong trường mà chúng ta phân chia theo loại máu, thì chúng ta nói rằng chúng ta có một tổng thể 600 người. Các số trên các thẻ trong một tầng, chiều cao của khu dân cư trong thành phố nhất định và chiều dài của cá trong một hồ nhất định là các ví dụ về các tổng thể có cỡ hữu hạn.

Page 47: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

47

Các quan sát thu được bằng cách đo áp suất khí quyển hàng ngày từ quá khứ đến tương lai hay tất cả các giá trị đo về độ sâu của hồ từ bất cứ vị trí nào có thể xác định được là các ví dụ về các tổng thể có cỡ vô hạn. b. Đặc trưng của tổng thể. Mỗi quan sát là một giá trị của một biến ngẫu nhiên X có phân phối xác suất ( )f x . Khi chúng ta nhắc đến một “hàm phân phối nhị thức”, một “phân phối chuẩn” hay, nói chung “hàm phân phối

( )f x ”, chúng ta chỉ ra rằng một hàm phân phối có các quan sát là các giá trị của một biến ngẫu nhiên có phân phối nhị thức, phân phối chuẩn hay phân phối xác suất ( )f x . Vì thế, trung bình mẫu và phương sai của một biến ngẫu nhiên hay phân phối xác suất cũng được xem là trung bình mẫu và phương sai của tổng thể tương ứng. 2. Mẫu. a. Định nghĩa. Việc từ tổng thể ta lấy ra một tập con nào đó được gọi là phép lấy mẫu. Mỗi tập con được lấy ra gọi là một mẫu. Số phần tử của mẫu được gọi là kích thước của mẫu.

b.Chú ý. + Vì từ mẫu suy ra kết luận cho tổng thể nên mẫu phải đại diện cho tổng thể. Thường thì chúng ta cố gắng chọn một mẫu bằng cách chọn các thành phần và thuận lợi nhất của tổng thể. Cách thực hiện như thế có thể dẫn đến các kết luận sai lầm liên quan đến tổng thể. Bất cứ quy trình lấy mẫu nào đưa ra các kết luận luôn ước tính quá cao hay ước tính quá thấp một số đặc tính của tổng thể đó được gọi là lấy mẫu chệch. Để loại bỏ khả năng bị chệch trong lấy mẫu, tốt nhất nên lựa chọn mẫu ngẫu nhiên sao cho các quan sát được thực hiện độc lập và ngẫu nhiên. + Việc lấy mẫu được tiến hành theo hai phương thức: lấy mẫu có hoàn lại và lấy mẫu không hoàn lại.

c. Mẫu ngẫu nhiên. Giả sử 1 2, ,...,

nX X X là n biến ngẫu nhiên độc lập và có cùng hàm phân phối

xác suất ( )f x . Khi đó chúng ta gọi 1 2

( , ,..., )n

X X X là một mẫu ngẫu nhiên có cỡ n từ tổng thể

( )f x và hàm phân phối xác suất đồng thời của chúng là:

1 2 1 2( , ,..., ) ( ) ( )... ( )

n nf x x x f x f x f x= .

Ví dụ 6. Kết quả điểm môn Toán của một lớp gồm 100 sinh viên được thông kê bởi bảng sau

Điểm 3 4 5 6 7 Số SV có điểm tương ứng 25 20 40 10 5

Gọi X là điểm môn Toán của một sinh viên được chọn ngẫu nhiên trong danh sách lớp thì X là một BNN có phân phối như sau

X 3 4 5 6 7 ( )P X x= 0,25 0,20 0,40 0,10 0,05

Chọn ngẫu nhiên 5 sinh viên trong danh sách lớp để xem điểm. Gọi

iX là điểm của sinh viên thứ i .

Khi đó ta có mẫu ngẫu nhiên kích thước 5n = được xây dựng từ biến ngẫu nhiênX đó là:

1 2 3 4 5( , , , , )X X X X X .

Page 48: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

48

3. Thống kê. Mục đích chính của chúng ta trong lựa chọn các mẫu chính là việc tìm ra các thông tin về các tham số chưa biết trong phân phối của tổng thể. Ví dụ, giả sử rằng chúng ta đang rút ra kết luận liên quan đến tỷ lệ người uống cà phê tại Mỹ chỉ yêu thích một nhãn hiệu nhất định. Có thể tiến hành đặt câu hỏi với mọi người Mỹ uống cà phê để tính toán được giá trị thông số p đại diện cho tỷ lệ tổng thể. Hoặc chúng ta có thể lựa chọn một mẫu ngẫu nhiên lớn và tỷ lệ p người trong mẫu này yêu thích cùng một nhãn hiệu cà phê để tính toán. Giá trị p bây giờ được dùng để đưa ra kết luận liên quan đến tỷ lệ thực p . Khi đó p là một hàm của các giá trị quan sát được trong mẫu ngẫu nhiên; vì nhiều mẫu ngẫu nhiên có thể lấy từ cùng một tổng thể, chúng ta sẽ dự đoán p thay đổi theo từng

mẫu. Điều đó có nghĩa là p là một giá trị của một hàm ký hiệu là P . Một hàm của các quan sát được gọi là một thống kê.

a. Định nghĩa Một hàm của biến ngẫu nhiên trong mẫu ngẫu nhiên được gọi là một thống kê. b. Một số thống kê quan trọng. i.Trung bình mẫu ngẫu nhiên.

Định nghĩa. Nếu 1 2

( , ,..., )n

X X X là một mẫu ngẫu nhiên có cỡ n , khi đó trung bình mẫu được xác

định bằng thống kê:

1

n

ii

X

Xn

==∑

Chú ý. + Vì

1 2, ,...,

nX X X là các BNN nên X cũng là một BNN

+ Mẫu ngãu nhiên X sẽ có giá trị 1

n

ii

x

xn

==∑

khi

iX có giá trị , 1,2,...,

ix i n= .

Ví dụ 7. Một thanh tra thực phẩm kiểm tra một mẫu ngẫu nhiên 7 hộp cá ngừ mang cùng nhãn hiệu để xác định phần trăm các tạp chất lạ. Các số liệu sau đây đã được ghi lại: 1,8; 2,1; 1,7; 1,6; 0,9; 2,7 và 1,8. Hãy tính trung bình mẫu mẫu.

Giải: + Giá trị x thu được của thống kê X là: 1,8 2,1 1,7 1,6 0,9 2,7 1,8

1, 8%7

x+ + + + + +

= =

ii.Median mẫu (trung vị mẫu)

Page 49: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

49

Định nghĩa. Nếu 1 2

( , ,..., )n

X X X là một mẫu ngẫu nhiên cỡ n , được sắp xếp theo thứ tự tăng dần

của độ lớn, khi đó median mẫu được xác định bởi thống kê:

1

2

12 2

, khi le

, khi chan2

n

n n

X n

X X X

n

+

+

= +

Ví dụ 8. Số tàu nước ngoài đến cảng biển phía đông vào 7 ngày được lựa chọn ngẫu nhiên là 8, 3, 9, 5, 6, 8 và 5. Tìm median. Giải: + Bố trí các quan sát theo trật tự tăng theo độ lớn, chúng ta có: 3 5 5 6 8 8 9

+ Và từ đó X = 6. iii. Mode

Định nghĩa. Nếu 1 2, ,...,

nX X X không nhất thiết khác nhau hoàn toàn, biểu diễn một mẫu ngẫu

nhiên có cỡ n . Khi đó mode M là giá trị của mẫu mà xảy ra thường xuyên nhất hoặc có tần số lớn nhất. Mode có thể không tồn tại và khi nó tồn tại không nhất thiết là giá trị duy nhất.

Ví dụ 9. Nếu các đồ tặng của một mẫu ngẫu nhiên các cư dân của Fairway Forest cho Hiệp hội phổi Virginia được ghi nhận là 9, 10, 5, 9, 9, 7, 8, 6, 10 và 11 đô la, khi đó mode là 9m = đô la, đó là giá trị xảy ra với tần số cao nhất. Ví dụ 10. Số lượng phim mà một tổng thể ngẫu nhiên 12 học sinh trung học đã tham gia đóng tháng vừa rồi được ghi nhận như sau: 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1 và 4. Trong trường hợp này, có hai mode 2 và 4, vì cả 2 và 4 đều xảy ra với tần số cao nhất. Phân phối được xác định là phân phối hai mốt. Nhận xét. + Trung bình mẫu là phương pháp đo được sử dụng phổ biến nhất để xác định vị trí trung tâm trong thống kê. Điểm yếu duy nhất đối với trung bình mẫu đó chính là nó có thể bị ảnh hưởng ngược lại do các giá trị cực trị. + Mode là tiêu chí thường được chú ý trong các bài toán kinh tế: Để bán được lượng hàng hóa lớn thì người bán hang nên quan tâm tới thị hiếu của số đông, chẳng hạn năm nay kiểu áo khoác nào được ưa chuộng. 3. Biên độ biến thiên của mãu ngẫu nhiên.

Định nghĩa. Khoảng biến thiên(Biên độ mẫu) của một mẫu ngẫu nhiên 1 2, ,...,

nX X X được xác

định bằng thống kê ( ) (1)n

X X− trong đó ( )n

X và (1)

X tương ứng là các giá trị quan sát lớn nhất và

nhỏ nhất trong mẫu.

Biên độ mẫu có thể là một đơn vị đo kém về độ biến đổi, nhất là nếu cỡ của mẫu hay tổng thể lớn. Phương pháp này chỉ xem xét các giá trị cực trị và không cho chúng ta biết về phân phối các giá trị ở giữa. Để khắc phục điều đó, chúng ta sẽ đi xem xét một giá trị đo độ biến đổi, đó là phương sai mẫu: xem xét vị trí của mỗi quan sát liên quan đến trung bình mẫu.

Page 50: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

50

4. Phương sai mẫu.

Định nghĩa. Cho 1 2

( , ,..., )n

X X X là mẫu ngẫu nhiên cỡ n với trung bình mẫu làX . Khi đó phương

sai mẫu được xác định bởi thống kê:

2

2 1

( )

1

n

ii

X X

Sn

=

−=

Với mỗi mẫu cụ thể thì 2S sẽ nhận giá trị

2

2 1

( )

1

n

ii

x x

sn

=

−=

∑.

Ví dụ 11. So sánh giá cà phê ở 4 cửa hiệu tạp phẩm được lựa chọn ngẫu nhiên tại San Diego cho thấy các mức tăng từ tháng trước là 12, 15, 17 và 20 cent cho mỗi túi một pound. Tìm phương sai của mẫu ngẫu nhiên các mức tăng giá. Giải: + Tính trung bình mẫu mẫu, chúng ta thu được:

12 15 17 2016

4x cent

+ + += =

+ Vì thế,

42

2 2 2 22 1

2 2 2 2

( 16)(12 16) (15 16) (17 16) (20 16)

3 3( 4) ( 1) (1) (4) 3

3 4

ii

x

s =

−− + − + − + −

= =

− + − + += =

Nếu x là một số thập phân được làm tròn, chúng ta sẽ tích lũy một sai số lớn khi sử dụng công thức phương sai mẫu của Định nghĩa trên. Để tránh điều này, chúng ta thường sử dụng công thức như trong định lý sau:

Định lý. Nếu 2S là phương sai của một mẫu ngẫu nhiên cỡ n , khi đó: 2

2

1 12

( 1)

n n

i ii i

n X X

Sn n

= =

− =

∑ ∑

Ví dụ 12. Tìm phương sai của số liệu 3, 4, 5, 6, 6 và 7 biểu diễn số cá hồi bắt được bằng một mẫu ngẫu nhiên của các ngư dân trong ngày 19 tháng 7 năm 1996 tại hồ Muskoka.

Giải. + Ta có: 6 6

2

1 1

171, 31, 6i i

i i

x x n= =

= = =∑ ∑ .

+ Do đó: 2

2 (6)(171) (31) 13

(6)(5) 6s

−= =

5. Độ lệch tiêu chuẩn mẫu.

Định nghĩa. Độ lệch tiêu chuẩn mẫu ký hiệu bằng S là căn số bậc hai dương của phương sai mẫu.

Page 51: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

51

II. PHÂN PHỐI XÁC SUẤT CỦA CÁC THỐNG KÊ CƠ BẢN. 1.Phân phối của trung bình mẫu.

Phân phối mẫu quan trọng đầu tiên được xem xét là phân phối của trung bình mẫuX . Giả sử một biến ngẫu nhiên của n các quan sát được lấy từ một tổng thể tuân theo phân phối chuẩn có kỳ vọng µ và phương sai σ2. Mối quan sát , 1,2,...,

iX i n= của mẫu ngẫu nhiên khi đó sẽ có cùng

phân phối chuẩn như tổng thể đang xét. Vì thế, trung bình mẫu:

1 2...

nX X X

Xn

+ + +=

có kỳ vọng: ...

X n

µ µ µµ µ

+ + += =

và phương sai: 2 2 2 2

2

2

...x nn

σ σ σ σσ

+ + += =

Nếu lấy mẫu từ một tổng thể phân phối không xác định, cả hữu hạn và vô hạn, phân phối mẫu của X

vẫn gần chuẩn với giá trị trung bình µ và phương sai 2

n

σ miễn là cỡ mẫu lớn. Kết quả này là một hệ

quả trực tiếp của định lý sau đây, còn gọi là định lý giới hạn trung tâm.

Định lý giới hạn trung tâm. Nếu X là giá trị trung bình của một mẫu ngẫu nhiên có kích thước n lấy từ tổng thể có giá trị trung bình µ và phương sai hữu hạn 2σ , khi đó giới hạn phân phối dạng của

/

XZ

n

µ

σ

−=

là phân phối chuẩn ( ;0,1)n z khi n →∞ .

Chú ý. + Phép xấp xỉ chuẩn đối với X nói chung sẽ tốt nếu 30n ≥ . Nếu 30n < mức xấp xỉ sẽ chỉ tốt nếu tổng thể không quá khác so với phân phối chuẩn.

+ Nếu tổng thể có phân phối chuẩn, thì phân phối của trung bình mẫu X sẽ có phân phối chuẩn. Ví dụ 13. Một công ty điện sản xuất các loại bóng điện có tuổi thọ được phân phối gần chuẩn, với giá trị trung bình gần bằng 800 giờ và độ lệch tiêu chuẩn 40 giờ. Tìm xác suất mà một biến ngẫu nhiên 16 bóng sẽ có tuổi thọ trung bình chưa đến 775 giờ.

Giải: + Phân phối của trung bình mẫuX sẽ xấp xỉ chuẩn với 800Xµ = và 40 / 16 10

Xσ = = .

+ Xác suất cần tìm được cho trong miền gạch chéo trong hình vẽ dưới đây.

Page 52: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

52

+ Tương ứng với 775x = , chúng ta nhận thấy rằng

775 8002.5

10z

−= = −

+ Và vì thế: ( 775) ( 2.5) 0.0062P X P Z< = <− = Chú ý. Một ứng dụng rất quan trọng của định lý giới hạn trung tâm là quá trình xác định các giá trị thích hợp của giá trị trung bình lý thuyết µ . Các chủ đề như kiểm tra giả thiết, ước lượng, kiểm tra chất lượng và các chủ đề khác tận dụng được định lý giới hạn trung tâm. Ví dụ sau đây biểu diễn cách sử dụng định lý giới hạn trung tâm xét về mối liên hệ đó. Ví dụ 14. Một quá trình sản xuất quan trọng sản xuất ra các linh kiện xy lanh cho ngành sản xuất ô tô. Điều quan trọng là quá trình này sản xuất ra các linh kiện có giá trị trung bình của đường kính xi lanh bằng 5 milimét. Các Kỹ sư có các phỏng đoán giá trị trung bình lý thuyết là 5.0 milimét. Một thử nghiệm được tiến hành trong đó 100 linh kiện được sản xuất bằng quá trình được lựa chọn ngẫu nhiên và đường kính được đo trên mỗi linh kiện. Mọi người nhận thấy rằng độ lệch tiêu chuẩn tổng

thể 0,1σ = . Thử nghiệm cho thấy đường kính trung bình mẫu 5, 027x = mi-li-mét. Liệu thông tin mẫu này có bác bỏ lại phỏng đoán của kỹ sư hay không? Giải. Thông tin có hỗ trợ hay bác bỏ lại phỏng đoán của các kỹ sư phụ thuộc vào việc sản phẩm thử

nghiệm thu được ( 5.027x = ) có lớn hơn so với giá trị được nhận định ( 5,0µ = ) hay không. Nói

cách khác, liệu có thường xuyên thu được 5.027x ≥ với 100n = nếu giá trị trung bình lý thuyết là 5,0µ = ?

+ Nếu xác suất này cho ta kết quả rằng 5.027x = không vô lý thì dự đoán không bị bác bỏ. + Nếu xác suất này rất thấp, thì dữ liệu không ủng hộ dự đoán rằng 5,0µ = là đúng. + Xác suất mà chúng ta chọn để tính toán xác định bởi:

( 5) 0, 027P X − >

+ Ta có:

55 0,027 ( 5) 0,027 ( ) 0, 027 2 2,7

0,1 / 100

XP X P X P X Pµ

− − ≥ = − ≥ + − ≤− = ≥

Ở đây chúng ta tiêu chuẩn hóa đơn giản X theo dịnh lý giới hạn trung tâm.

+ Nếu dự đoán 5,0µ = là đúng, 5

0.1 / 100

X − có phân phối ( ;0,1)N z . Vì thế

52 2,7 2 2,7 2(0, 0035) 0, 007

0,1 / 100

XP P Z

− ≥ = ≥ = =

Page 53: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

53

+ Như vậy sự kiện x lệch khỏi vị trí trung bình 0,027 mi-li-mét chỉ xảy ra 7 lần trong 1000 lần thử nghiệm.

+ Do vậy thử nghiệm này có x =5.027 chắc chắn không ủng hộ cho dự đoán 5,0µ = của các kỹ sư. 2. Phân phối của hiệu hai trung bình mẫu.

Giả sử rằng chúng ta có hai tổng thể, tổng thể đầu tiên có giá trị trung bình

1µ và phương sai

2

1σ và tổng thể thứ hai có giá trị trung bình

2µ và phương sai

2σ .

Lấy 1

X là trung bình của một mẫu ngẫu nhiên có cỡ 1n được lựa chọn từ tổng thể đầu tiên, và

thống kê 2

X là trung bình của một mẫu ngẫu nhiên với cỡ 2n được lựa chọn từ tổng thể thứ hai, độc

lập với mẫu từ tổng thể đầu tiên. Khi đó ta có thể kết luận gì về phân phối lấy mẫu của độ chênh lệch

1 2X X− ?

Theo Định lýgiá trị trung tâm, các biến 1

X và 2

X đều được phân phối gần chuẩn với các giá

trị trung bình 1µ và

2µ , các phương sai 2

1 1/ nσ và 2

2 2/ nσ tương ứng.

Và ta có thể kết luận rằng 1 2

X X− có phân phối có giá trị trung bình: A B

A BX Xµ µ µ

−= −

và phương sai: 1 2

1 22 1 2

1 2

.X X n n

σ σσ

−= +

Từ đó ta có:

Định lý. Nếu các mẫu độc lập có kích thước 1n và

2n được lấy ngẫu nhiên từ hai tổng thể, rời rạc

hoặc liên tục, có các giá trị trung bình 1µ và

2µ , các phương sai 2

1σ và 2

2σ , khi đó phân phối của

các thống kê mẫu của các sự sai khác giữa hai giá trị trung bình: 1 2

X X− , được phân phối xấp

xỉ chuẩn có giá trị trung bình và phương sai bằng: 1 2X X

µ µ µ−= − và

1 2

2 22 1 2

1 2X X n n

σ σσ

−= +

Do đó 1 2 1 2

2 2

1 1 2 2

( ) ( )

( / ) ( / )

X XZ

n n

µ µ

σ σ

− − −=

+

có phân phối xấp xỉ phân phối tiêu chuẩn ( ;0,1)n z .

Chú ý. + Nếu cả hai

1n và

2n lớn hơn hoặc bằng 30, thì phương pháp xấp xỉ chuẩn cho phân phối

của 1 2

X X− rất tốt bất kể hình dạng của hai tổng thể.

+ Tuy nhiên, thậm chí khi 1n và

2n nhỏ hơn 30, phép xấp xỉ chuẩn tương đối tốt ngoại trừ khi các

tổng thể không hề bất thường.

+ Rõ ràng, nếu cả hai tổng thể là chuẩn, khi đó 1 2

X X− có phân phối chuẩn với mọi cỡ 1n và

2n .

3. Phân phối t.

Page 54: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

54

Định nghĩa. Giả sử Z là một biến ngẫu nhiên tiêu chuẩn và V là biến ngẫu nhiên 2χ có v bậc tự do.

Nếu Z và V độc lập, khi đó phân phối của biến ngẫu nhiên T , trong đó /

ZT

V v=

được xác

định bởi: 2

( 1)/2( 1) / 2

( ) (1 ) , - 1( / 2)

vv t

h tvv vπ

− + Γ + = + ∞ < <∞Γ

Phân phối này được gọi là phân phối t có v bậc tự do.

Tổng quát. Giả sử X1 , X2 , …, Xn là các biến ngẫu nhiên độc lập, cùng phân phối chuẩn với giá trị trung bình µ và độ lệch chuẩn σ . Đặt

Khi đó biến ngẫu nhiên /

XT

S n

µ−= có một phân phối t với 1nυ = − bậc tự do.

Về nhà:

Tự đọc Mục 6.4; 6.7; 6.9; 6.10; 8.3

Bài tập: Tr. 178; 231, 246

Đọc trước các Mục từ 9.1 đến 9.3 chuẩn bị cho Bài số 6:

Bài toán ước lượng trung bình của một mẫu

22

1 1

( ) và s

1

n n

i i

i i

X X XX

n n= =

−= =

−∑ ∑

Page 55: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

55

Bài số 6

BÀI TOÁN ƯỚC LƯỢNG TRUNG BÌNH CHO MỘT MẪU

Quy luật phân bố xác suất của các thống kê đặc trưng mẫu phản ánh mối liên hệ chặt chẽ giữa các tham số của mẫu với các tham số của dấu hiệu nghiên cứu tương ứng của tổng thể. Lý thuyết Thống kê sử dụng hai phương pháp sau: Suy diễn thống kê: Nếu đã biết quy luật phân bố xác suất cũng như các tham số đặc trưng của tổng thể thì có thể sử dụng các kết quả trên để suy đoán về tính chất của một mẫu ngẫu nhiên rút ra từ tổng thể đó. Chẳng hạn nếu biết dấu hiệu nghiên cứu X có phân bố chuẩn ( ; , )n x µ σ thì thống

kê /

XZ

n

µ

σ

−= có phân phối chuẩn tắc ( ;0,1)n z .

Quy nạp thống kê: Sử dụng các phương pháp thống kê dể từ các đặc trưng mẫu suy ra các đặc trưng của tổng thể. Chính vì vậy, các phương pháp thống kê giải quyết được nhiều bài toán thực tế, có thể giúp cho các nhà nghiên cứu tìm ra quy luật của tồng thể, giúp các nhà hoạch định chính sách dư đoán sự phát triển trong tương lai, đề ra các quyết định chấp nhận hoặc bác bỏ các giả thuyết nào đó. Nếu dấu hiệu nghiên cứu của tổng thể có thể xem như một biến ngẫu nhiên và giả sử bằng lý thuyết đã xác định được dạng phân bố xác suất của nó thì vấn đề xác định các tham số của đặc trưng của tổng thể sẽ quy về bài toán xác định các tham số đặc trưng của quy luật phân bố xác suất của biến ngẫu nhiên .X Chẳng hạn, nếu đã biết dấu hiệu nghiên cứu của tổng thể có phân bố chuẩn

(.; , )n µ σ thì bài toán đặt ra là phải ước lượng các tham số là kỳ vọng µ và phương sai 2σ , hai tham số này cũng chính là trung bình và phương sai của tổng thể. Giả sử BNN có tham số θ chưa biết. Ước lượng tham số θ là dựa vào mẫu ngẫu nhiên

1 2( , ,..., )

nX X X ta đưa ra thống kê θ để ước lượng(dự đoán) θ . Ước lượng gồm:

i.Ước lượng điểm: chỉ ra 0

θ θ= nào đó để ước lượng θ .

ii. Ước lượng khoảng: chỉ ra một khoảng ˆ ˆ( , )L Uθ θ chứa θ sao cho ˆ ˆ( ) 1

L UP θ θ θ α< < = −

cho trước (1 α− goi là độ tin cậy của ước lượng). I. ƯỚC LƯỢNG ĐIỂM

1. Định nghĩa. Một ước lượng điểm cho tham số tổng thể θ là một giá trị θ của một thống kê ∧

Θ . Chú ý. Thực chất ta đã dùng một giá trị θ dể thay thế cho giá trị của tham số θ chưa biết của tổng

thể, thông thường giá trị được chọn này là giá trị cụ thể của một thống kê ∧

Θ nào đó của mẫu ngẫu

nhiên. Ví dụ như giá trị x của thống kê X , được tính toán từ một mẫu cỡ n , là một ước lượng điểm của tham số trung bình tổng thể µ .

Cùng một mẫu ngẫu nhiên ta có thể xây dựng được nhiều thống kê ∧

Θ khác nhau để ước lượng cho tham số tổng thể θ . Một ước lượng cũng có thể có sai số khi ước lượng tham số chung. Đối với một mẫu cụ thể, có thể thu được một ước lượng chính xác hơn của µ bằng cách sử dụng

trung vị mẫu Xɶ là một ước lượng. Vì vậy ta cần lựa chọn thống kê tốt nhất để ước lượng cho tham số θ dựa vào các tiêu chuẩn sau:

Page 56: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

56

2. Ước lượng không chệch. Các tính chất kỳ vọng nào của một hàm quyết định “tốt” ảnh hưởng đến quyết định lựa chọn ước lượng của chúng ta?

Lấy ∧

Θ là một ước lượng có giá trị θ là một ước lượng điểm có tham số chung chưa xác định θ.

Chắc chắn chúng ta mong muốn phân bố lẫy mẫu của ∧

Θcó số trung bình bằng tham số được ước lượng. Một ước lượng có tính chất này được xem là không chệch.

Định nghĩa. Một thống kê ∧

Θ được xem là ước lượng không chệch cho tham số θ nếu:

( ) (*)Eµ θ∧

Θ= Θ =

Ví dụ 1 . Biểu diễn 2S là một ước lượng không chệch có tham số 2σ . Giải: + Chúng ta viết

2 2

i1 1

2 2

1 1

2 2

1

( ) [(X - )-(X- )]

( ) 2( ) ( ) ( )

( ) ( )

n n

ii i

n n

i ii in

ii

X X

X X X n X

X n X

µ µ

µ µ µ µ

µ µ

= =

= =

=

− =

= − − − − + −

= − − −

∑ ∑

∑ ∑

+ Nên

2

2 2 21

1

2 2

1

( )1

( ) ( ) ( )1 1

1 ( )

1 i

n

nii

ii

n

X Xi

X X

E S E E X nE Xn n

nn

µ µ

σ σ

=

=

=

= = − − − − −

= −−

∑∑

+ Tuy nhiên: 2 2

Xσ σ= đối với i=1, 2, …, n và

22

X n

σσ = .

+ Vì thế: 2

2 2 21( ) ( ) .

1E S n n

n n

σσ σ= − =

3. Ước lượng hiệu quả. Điều kiện (*) của ước lượng không chệch có nghĩa rằng trung bình các giá trị của θ bằng giá trị θ . Từng giá trị của θ có thể sai lệch rất lớn so với θ . Vì vậy ta tìm ước lượng không chệch sao cho độ sai lệch trên là bé nhất.

Nếu ∧

Θ 1 và ∧

Θ 2 là hai ước lượng không lệch của cùng tham ẩn chung θ, chúng ta sẽ lựa chọn

ước lượng mà phân bố mẫu của nó có phương sai nhỏ hơn. Vì thế, nếu ^ ^

1 2

2 2σ σΘ Θ< chúng ta nói rằng

Θ 1 là ước lượng hơn ước lượng ∧

Θ 2 đối với tham số θ .

Page 57: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

57

Định nghĩa. Ước lượng không chệch có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng một mẫu ngẫu nhiên được gọi là ước lượng hiệu quả.

Có nhiều tình huống trong đó sẽ thích hợp hơn khi xác định một khoảng trong đó chúng ta kỳ

vọng để xác định giá trị của tham số. Khoảng như thế được gọi là ước lượng khoảng. II.ƯỚC LƯỢNG KHOẢNG. 1. Mô tả. Các ước lượng điểm có nhược điểm là khi kích thước mẫu bé thì ước lượng điểm có thể sai lệch khá nhiều so với giá trị tham số cần ước lượng. Mặt khác phương pháp trên cũng không thể đánh giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Do đó, khi kích thước mẫu bé người ta thường dung ước lượng khoảng.

Một ước lượng khoảng của một tham số tổng thể θ là một khoảng ˆ ˆL Uθ θ θ< < , trong đó ˆ

và ˆUθ phụ thuộc vào giá trị của thống kê

Θ đối với một mẫu xác định và phân bố mẫu của ∧

Θ .

Các mẫu khác nhau sẽ sinh ra các giá trị ∧

Θ khác nhau và vì thế ta nhận được các giá trị khác

nhau của ˆLθ và ˆ

Uθ : và đây cũng chính là các giá trị của các biến ngẫu nhiên tương ứng L

Θ và U

Θ .

Từ phân bố mẫu của ∧

Θ , ta có thể xác định được ˆLθ và ˆ

Uθ sao cho:

Uˆ ˆ ( ) 1L

P θ θ θ α< < = −

tức là, với 0 1α< < , chúng ta có xác suất của một lựa chọn mẫu ngẫu nhiên sinh ra một khoảng chứa θ là (1 )α− .

+ Khoảng U

ˆ ˆLθ θ θ< < được tính toán từ mẫu được chọn và được gọi là khoảng tin cậy

( )1 .100%α− ,

+ Đại lượng 1 α− : gọi là hệ số tin cậy hay độ tin cậy

+ Các điểm cuối ˆLθ và ˆ

Uθ : tương ứng là các giới hạn tin cậy dưới và giới hạn tin cậytrên .

+ ˆ ˆU Lθ θ− gọi là độ dài khoảng tin cậy.

Do đó: khi 0, 05α = chúng ta có khoảng tin cậy 95% . khi 0,01α = chúng ta thu được khoảng tin cậy rộng hơn bằng 99%. 2. Ước lượng trung bình. Giả sử trung bình của tổng thể ( )E Xµ = chưa biết. Ta tìm khoảng

1 2( , )µ µ chứa µ sao cho:

1 2( ) 1P µ µ µ α< < = − với (1 )100%α− là độ tin cậy cho trước.

Trường hợp 1. Khoảng tin cậy của µ ; khi biết σ Nếu x là số trung bình của một mẫu ngẫu nhiên kích thước n trong một tổng thể có phương sai đã

biết 2σ , một khoảng tin cậy ( )1 100%α− đối với µ được xác định bằng

/2 /2,x z x z

n nα α

σ σµ− < < +

trong đó /2

là giá trị tạo nên một diện tích / 2α sang bên phía phải của nó, tức 2

( )2

P Z zα

α> = .

Page 58: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

58

Các mẫu khác nhau sẽ sinh ra các giá trị khác nhau của x và vì thế sinh ra các ước lượng khoảng tin cậy khác nhau của tham số μ. Ví dụ 2. Hàm lượng kẽm trung bình thu hồi được từ một mẫu các giá trị đo kẽm tại 36 điểm đo khác nhau được xác định là 2,6g/mili lít. Xác định các khoảng tin cậy 95% và 99% cho mật độ kẽm trung bình ở sông. Giả thiết độ lệch tiêu chuẩn tổng thể là 0,3. Giải. + Ước lượng điểm của µ là 2,6x = + Giá trị z sinh ra một diện tích 0,025 sang bên phải và vì thế sinh ra một diện tích 0,975 sang bên trái, là

0,0251,96z = (Bảng A.3).

+ Vì thế, khoảng tin cậy 95% là: 0,3 0, 3

2,6 (1,96)( ) 26 (1,96)( )36 36

µ− < < + ,

hay là 2,50 2,70µ< < . + Để xác định khoảng tin cậy 95%, chúng ta tìm giá trị z sinh ra một diện tích 0,005 sang bên phải và 0,995 sang bên trái. Vì vậy, sử dụng Bảng A.3 ta được:

0,0052,575z = , và khoảng tin cậy 99% là:

0, 3 0, 32,6 (2,575)( ) 2,6 (2,575)( )

36 36µ− < < +

hay là: 2,47 2,73µ< < .

Nhận xét. Nếu µ là giá trị tâm của khoảng , thì khi đó x ước lượng µ không bị lỗi. Tuy nhiên, hầu hết thì x sẽ không chính xác bằng µ và ước lượng điểm có lỗi. Cỡ sai số sẽ là giá trị tuyệt đối có chênh lệch giữa µ và x và chúng ta có thể đạt đến độ tin cậy (1 )100%α− rằng độ chênh lệch này

sẽ không quá /2

/z nασ .

Định lý 1. Nếu x được sử dụng để ước lượng µ , khi đó với độ tin cậy ( )1 100%α− ta có sai số sẽ

không vượt quá /2

/z nασ .

Trong Ví dụ 2., chúng ta 95% tin cậy rằng số trung bình mẫu x =2,6 khác số trung bình chân thực µ theo một lượng nhỏ hơn 0,1 và 99% tin cậy rằng độ chênh lệch nhỏ hơn 0,13.

Page 59: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

59

Thông thường, chúng ta đều muốn biết mẫu cần lớn như thế nào để đảm bảo sai số khi ước lượng µ

sẽ nhỏ hơn một lượng e cụ thể. Theo Định lý 1, ta phải chọn n sao cho /2

/z n eασ = . Giải đẳng

thức này thu được công thức sau đây của n .

Định lý 2. Nếu x được sử dụng là một ước lượng của µ , khi đó với độ tin cậy ( )1 100%α− ta nói

rằng sai số sẽ không vượt quá một lượng cụ thể e khi kích thước là:

/2 2( )z

ne

ασ

=

theo quy tắc làm tròn đến toàn bộ số tiếp theo.

Theo nguyên tắc này, chúng ta có thể chắc chắn rằng độ tin cậy không bao giờ được thấp dưới

( )1 100%α− .

Ví dụ 3. Trong Ví dụ 2, một mẫu cần lớn bao nhiêu nếu chúng ta muốn tin cậy 95% rằng ước lượng µ giảm nhỏ hơn 0,05?

Giả. + Độ lệch chuẩn tổng thể là 0,3σ = . Khi đó, theo Định lý 2:

2

(1.96)(0.3)138,3

0.05n = =

+ Vì thế, chúng ta có thể tin cậy 95% rằng một mẫu ngẫu nhiên có cỡ 139 sẽ cho ước lượng x khác µmột lượng nhỏ hơn 0,05.

Trường hợp 2: Khoảng tin cậy choµ khi chưa biết σ với cỡ mẫu nhỏ( 30n < )

Nếu x và s là số trung bình và độ lệch chuẩn của mẫu ngẫu nhiên được rút ra từ biến ngẫu nhiên

của chuẩn có phương sai 2σ chưa xác định, khoảng tin cậy ( )1 100%α− cho µ là:

/2 /2

s sx t x t

n nα α

µ− < < +

trong đó /2

là giá trị t với 1v n= − bậc tự do, sinh ra một diện tích bằng / 2α bên phía phải của

nó, tức là tức 2

( )2

P T tα

α> = .

Chú ý. + Đối với trường hợp σ đã biết, chúng ta sử dụng định lý giới hạn trung tâm. + Đối với σ chưa biết, chúng ta sử dụng phân phối lấy mẫu của biến ngẫu nhiên T. + Tìm

2

thông qua Bảng A4.

Ví dụ 4. Các hàm lượng của 7 container axit sulfuric là 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 và 9.6 lít. Tìm khoảng tin cậy 95% cho giá trị trung bình của tất cả các container đó, giả sử có phân phối chuẩn ước lượng.

Page 60: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

60

Giải. + Trung bình mẫu và độ lệch chuẩn là: 10.0x = và 0,283s =

+ Sử dụng Bảng A.4, chúng ta xác định được 0.025

2,447t = đối với 6v = bậc tự do.

+ Vì thế khoảng tin cậy 95% cho µ là:

0.283 0.28310.0 (2.477)( ) 10.0 (2.447)( )

7 7µ− < < +

tức là: 9,74 10,26µ< < .

Trường hợp 3. Khoảng tin cậy của µ khi chưa biết σ với cỡ mẫu lớn( 30n > ) Nếu x là số trung bình của một mẫu ngẫu nhiên kích thước 30n > trong một tổng thể có phương

sai chưa biết 2σ , một khoảng tin cậy ( )1 100%α− đối với µ được xác định bằng

/2 /2,

s sx z x z

n nα α

µ− < < +

trong đó /2

là giá trị tạo nên một diện tích / 2α sang bên phía phải của nó, tức 2

( )2

P Z zα

α> = .

Về nhà:

Tự đọc: Mục 9.5; 9.6

Bài tập: Tr. 278

Đọc trước các Mục từ 9.7 đến 9.10 chuẩn bị cho Bài số 7:

Bài toán ước lượng trung bình cho hai mẫu. Ước lượng tỷ lệ

Page 61: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

61

Bài số 7

BÀI TOÁN ƯỚC LƯỢNG TRUNG BÌNH CHO HAI MẪU. ƯỚC LƯỢNG TỶ LỆ

I. ƯỚC LƯỢNG HIỆU HAI KỲ VỌNG

Nếu chúng ta có hai tổng thể có các giá trị trung bình 1µ và

2µ , các phương sai 2

1σ và 2

2σ ,

ước lượng điểm về hiệu giữa 1µ và

2µ được sinh ra bởi thống kê

1 2X X− .

Mục tiêu ta cần thiết lập được khoảng tin cậy (1 )100%α− đối với 1 2

.µ µ−

Trường hợp 1: Khoảng tin cậy cho 1 2

µ µ− khi biết 2

1σ và 2

Nếu 1x và 2x là các giá trị trung bình của các mẫu ngẫu nhiên độc lập có kích thước 1n và

2n từ

các tổng thể có các phương sai đã biết 2 2

1 2 và σ σ , khoảng tin cậy ( )1 100%α− đối với

1 2 µ µ− là:

2 2 2 2

1 2 1 22 2 1 2

/2 1 2 /2

1 2 1 2

( ) ( )x x z x x zn n n nα α

σ σ σ σµ µ− − + < + < + + +

trong đó /2

được xác định bởi 2

( )2

P Z zα

α> = .

Ví dụ 1. Tiến hành một thí nghiệm với hai loại động cơ A và B để so sánh số dặm đi dược trên mỗi gallon xăng. Trong 50 thí nghiệm đã được tiến hành có sử dụng loại động cơ A và 75 thí nghiệm được tiến hành cho động cơ B. Xăng sử dụng và các điều kiện khác không đổi. Lượng tiêu thụ trung bình đối với động cơ A là 36 dặm mỗi gallon và đối với loại máy B là 42 dặm mỗi gallon. Xác định một khoảng tin cậy 96% trên

B Aµ µ− , trong đó

Bµ và

Aµ là lượng tiêu thụ chuẩn tổng thể đối với

máy B và A. Giả thiết rằng độ lệch chuẩn tổng thể là 6 và 8 cho lần lượt máy A và B.

Giải: + Ước lượng điểm của là x 42 36 6B AB A

xµ µ− − = − = .

+ Xác định 0,02

2, 05z = từ Bảng A.3. Vì thế, khoảng tin cậy 96% là

1 2

64 36 64 366 2.05 6 2.05

75 50 75 50µ µ− + < + < + +

tức là: 3,43 8,57B Aµ µ< − < .

Trường hợp 2: Khoảng tin cậy cho 2 2

1 2 1 2; µ µ σ σ− = chưa biết

1 2;σ σ

Nếu 1 2 à x v x là các giá trị trung bình của các mẫu ngẫu nhiên độc lập kích thước 1n và n2, từ các

tổng thể chuẩn ước lượng có các phương sai chưa biết nhưng cân bằng, một khoảng tin cậy (1-α)% cho

1 2µ µ− được xác định bằng

1 2 1 2/2 1 2 /2

1 2 1 2

1 1 1 1( ) ( )

p px x t S x x t s

n n n nα αµ µ− − + < − < − + +

trong đó /2

là giá trị t với 1 2

2v n n= + − bậc tự do, sinh ra một diện tích / 2α sang bên phải,

và : 2 2

1 1 2 2

1 2

( 1) ( 1)

2p

n s n ss

n n

− + −=

+ −.

Page 62: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

62

Ví dụ 2. Hai trạm lấy mẫu độc lập được lựa chọn cho việc nghiên cứu, một được đặt tại hạ lưu tính từ điểm xả của mỏ axit và trạm còn lại được đặt tại thượng lưu. Đối với 12 mẫu được thu thập hàng

tháng tại trạm hạ lưu, danh mục đa dạng loài có giá trị trung bình 1 3.11x = và độ lệch chuẩn

10.771s = , trong khi đó 10 mẫu thu thập hàng tháng tại trạm đầu nguồn có giá trị danh mục trung

bình 2 2.04x = và độ lệch chuẩn 2

0.448s = . Tìm một khoảng tin cậy 90% cho độ lệch giữa các kỳ

vọng tổng thể và cho hai trạm này, giả thiết tổng thể được phân bố chuẩn có các phương sai bằng nhau. Giải. + Gọi

1 2 và µ µ biểu diễn các kỳ vọng tổng thể cho danh mục đa dạng loài ở trạm đầu nguồn và

hạ lưu. Chúng ta muốn xác định một khoảng tin cậy 90% cho 1 2-µ µ .

+ Ước lượng điểm 1 2-µ µ của chúng ta là

1 2 3,11 2, 04 1,07x x− = − =

+ Ước lượng chung của 2

ps của phương sai 2σ là

2 2 2 22 1 1 2 2

1 2

( 1) ( 1) (11)(0.771 ) (9)(0.448 )

2 12 10 2p

n s n ss

n n

− + − += =

+ − + −

Lấy căn bình phương, chúng ta thu được ps =0.646. Sử dụng α=0.1, chúng ta xác định được trong

Bảng A.4 rằng 0.05

1.725t = đối với 1 2

2 20v n n= + − = bậc tự do. Vì thế, khoảng tin cậy 90% của

1 2-µ µ là:

1 2

1 1 1 11.07 (1.725)(0.646) - 1.07 (1.725)(0.646)

12 10 12 10µ µ− + < < + +

được rút gọn thành 0,593<1 2-µ µ <1,547.

Trường hợp 3: Khoảng tin cậy 1 2µ µ− , chưa biết

1 2,σ σ với cỡ mẫu lớn ( 30n > )

Nếu 2

1 1 và sx , 2

2 2 và sx là các số trung bình và phương sai của các mẫu độc lập kích thước lớn

1n

và 2n rút ra từ các phân phối xấp xỉ chuẩn với các phương sai chưa biết, khoảng tin cậy xấp xỉ

( )1 100%α− ước lượng cho 1 2-µ µ là

2 2 2 2

1 2 1 21 2 1 2

/2 1 2 /2

1 2 1 2

( ) - ( )s s s s

x x z x x zn n n nα α

µ µ− − + < < − + +

trong đó /2

là giá trị được xác định bởi 2

( )2

P Z zα

α> = .

II. ƯỚC LƯỢNG CHO MỘT TỶ LỆ.

1.Định nghĩa. Giả sử tổng thể được chia làm hai loại phần tử. Tỷ lệ phần tử có dấu hiệu ℑ là p

chưa biết. Ước lượng tỷ lệ là chỉ ra khoảng 1 2

( , )p p chứa p sao cho 1 2

( ) 1P p p p α< < = − .

Page 63: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

63

Một ước lượng điểm có tỷ lệ p trong một phép thử nhị thức được xác định bằng thống kê ˆ /P X n= , trong đó X là số các thành công trong n lần thử nghiệm. Vì thế, tỷ lệ mẫu ˆ /p x n= sẽ được dùng làm ước lượng điểm của tham số p. Ký hiệu thất bại trong thử nghiệm nhị thức là 0 và thành công là 1, số thành công x có thể được hiểu là tổng n các giá trị chỉ bao gồm các số 0 và số 1, và p chỉ là trung bình mẫu của n các

giá trị này. Vì thế, theo Định lý giới hạn trung tâm, với n đủ lớn P có phân bố chuẩn tắc với kỳ vọng là:

ˆ( )p

X npE P E p

n nµ

= = = =

và phương sai 2

2 2ˆ / 2 2

x

X mP

npq pq

nn n

σσ σ= = = =

vì thế, chúng ta có thể kết luận rằng: /2 /2

( ) 1P z Z zα α

α− < < = −

trong đó ˆ

/

P pZ

pq n

−=

và /2

là giá trị của biểu đồ chuẩn trên đó chúng ta có thể xác định được một diện tích α/2. Thay

cho Z, chúng ta viết

/2 /2

ˆ1

/

P pP z z

pq nα α

α

− − < < = −

Nhân mỗi số hạng của bất đẳng thức với /pq n , và sau đó trừ với P và nhân với -1, chúng ta thu

được:

/2 /2

ˆˆ ˆˆˆ ˆ ˆ ˆ1 ; 1pq pq

P P z p P z q pn nα α

α − < < + = − = −

Khi n lớn, rất ít sai số xảy ra khi thay thế ước lượng điểm ˆ /p x n= cho p dưới dấu căn. Khi đó chúng ta có thể viết

/2 /2

ˆˆ ˆˆˆ ˆ 1pq pq

P P z p P zn nα α

α − < < + −

Đối với mẫu ngẫu nhiên có cỡ n , tỷ lệ mẫu ˆ /p x n= được xác định và khoảng tin cậy (1 )100%α− đối với p cũng được xác định. 2. Khoảng tin cậy đối với p khi mẫu cỡ lớn.

Định lý 1. Nếu p là tỷ lệ của các thành công trong một mẫu ngẫu nhiên có kích thước n và ˆ ˆ1q p= − , khoảng tin cậy (1 )100%α− cho tham số p được xác định bởi

/2 /2

ˆˆ ˆˆˆ ˆ

pq pqp z p p z

n nα α− < < +

trong đó /2

là giá trị sao cho: 2 2

P Z zα

α > = .

Page 64: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

64

Chú ý. + Khi n nhỏ, tỷ lệ p chưa biết nhưng gần 0 hoặc 1, thì khoảng tin cậy được xác định sẽ không chính xác. + Tuy nhiên, nếu cả ˆ ˆ hay np nq lớn hơn hoặc bằng 5 thì ta vẫn nhận được kết quả tốt. Phương pháp xác định khoảng tin cậy cho tham số p cũng có thể áp dụng khi phân bố nhị thức được sử dụng để ước lượng phân bố siêu bội, nghĩa là khi n tương đối nhỏ so với N . Ví dụ 3. Trong một mẫu ngẫu nhiên 500N = gia đình có ti vi tại thành phố Hamilton, Canada, xác định được rằng 340X = đăng ký HBO. Tìm khoảng tin cậy 95% cho tỷ lệ các gia đình trong thành phố này đăng ký sử dụng HBO. Giải. Ước lượng điểm của p là ˆ 340 / 500 0,68.p = =

+ Sử dụng Bảng A.3, chúng ta xác định được rằng 0,25

1,96z = , vì thế, khoảng tin cậy 95% cho p

(0.68)(0.32) (0.68)(0.32)0.68 196 0.68 1.96

500 500p− < < +

tức là: 0,64 0,72p< < . Nhận xét. Nếu p là giá trị tâm của khoảng tin cậy (1 )100%α− , khi đó p ước lượng p không có sai số. Tuy nhiên, thường thì p sẽ không chính xác bằng p và ước lượng điểm có sai số. Cỡ sai số này sẽ là sai số dương tách p và p , và chúng ta có thể tin cậy (1 )100%α− rằng sai số này sẽ không

vượt quá /2

ˆˆpqz

nα.

§Þnh lý 2. NÕu p lµ mét −íc l−îng cña p , với độ tin cậy (1 )100%α− chóng ta cã thÓ kh¼ng ®Þnh

r»ng sai sè cña −íc l−îng kh«ng v−ît qu¸ /2

ˆˆpqz

nα, tức là

/2

ˆˆˆ

pqp p z

nα− ≤ .

B©y giê cần x¸c ®Þnh mét mÉu cÇn cã ®é lín lµ bao nhiªu ®Ó ®¶m b¶o sai sè p p− khi −íc

l−îng p sÏ kh«ng nhá h¬n gi¸ trÞ e.

§Þnh lý 3. NÕu p lµ −íc l−îng cña p với độ tin cậy (1 )100%α− sai số p p− sÏ nhá h¬n gi¸

trÞ x¸c ®Þnh e khi kÝch th−íc mÉu gÇn b»ng 2

2

ˆˆ.

pqn z

eα=

Page 65: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

65

VÝ dô 4. Trong VÝ dô 3 cÇn mÉu lớn bao nhiêu nếu chúng ta muốn độ tin cậy 95% sao cho ước

lượng p p− của p nằm trong khoảng 0,02?

Giải. Chúng ta coi 500 gia đình là một mẫu ngẫu nhiên cã −íc l−îng điểm pɵ = 0,68 . Khi ®ã theo

ĐÞnh lý 3:

2

2

(1.96) (0.68).(0.32)2090.

(0.02)n = =

V× thÕ, nÕu c¨n cø vµo −íc l−îng của p trªn mét biÕn ngÉu nhiªn cã kÝch th−íc 2090, chóng ta cã thÓ

tin t−ëng 95% r»ng tû lÖ mÉu sÏ kh«ng kh¸c so víi tû lÖ ch©n thùc mét kho¶ng lín h¬n 0,02.

Ta vẫn có thể đưa ra cỡ của mẫu mà trong công thức tính không cần đến q như trong Định lý sau:

§Þnh lý 4. NÕu p là một −íc l−îng cña pvới độ tin cậy (1 )100%α− , khi đó sai sè p p e− ≤ khi

kÝch th−íc mÉu lµ

2

/2

2.

4

zn

e

α=

VÝ dô 5. Trong VÝ dô 2 cÇn mét mÉu lín đến cỡ nào nếu chúng ta muốn có độ tin cậy ít nhất 95%và

ước lượng p p− cña chóng ta n»m trong kho¶ng 0,02?

Giải. Chúng ta cã thÓ tin cËy 95% r»ng tû lÖ mÉu nµy sÏ kh«ng kh¸c so víi tû lÖ ch©n thùc lín h¬n

0,02 nÕu chóng ta lùa chän mÉu kÝch th−íc.

( )( )

2

2

1.962401.

4 (0.02)n = =

III. ƯỚC LƯỢNG CHO HIỆU HAI TỶ LỆ

1. Bài toán: Xét hai tổng thể 1Ω và

2Ω mà mỗi phần tử trong các tổng thể đó đều có thể mang dấu

hiệu ℑ . Gọi 1 2;p p tương ứng là tỷ lệ các cá thể mang dấu hiệu đang xét trong hai tổng thể đó. Ta sẽ

tìm khoảng tin cậy (1 )100%α− cho 1 2p p− .

Page 66: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

66

2. Khoảng tin cậy cho 1 2p p− khi cỡ mẫu lớn

NÕu p 1vµ p 2 lµ tû lÖ thµnh c«ng trong c¸c mÉu ngÉu nhiªn cã cỡ n1 vµ n2 t−¬ng øng. Đặt

1 1 2 2ˆ ˆ ˆ ˆ1 ; 1q p q p= − = − . Kho¶ng tin cËy víi ®é tin cËy (1 )100%α− cho sù sai kh¸c

1 2p p−

®−îc x¸c ®Þnh b»ng c«ng thøc:

( ) 1 2 2 2

1 2 /2 1 2

1 1

ˆ ˆ ˆ ˆˆ ˆ

p q p qp p z p p

n nα− − + < − ( ) 1 1 2 2

1 2 /2

1 2

ˆ ˆ ˆ ˆˆ ˆ

p q p qp p z

n nα< − + + ,

trong ®ã /2

lµ gi¸ trÞ z sinh ra một diÖn tÝch2α vÒ bªn phÝa ph¶i, tức là

2

.2

P Z zα

α > =

Chú ý. Nếu 1 2( , )

. 0

p p a b

a b

− ∈ < ta sẽ không so sánh tỷ lệ của tổng thể này với tỷ lệ của tổng thể kia.

VÝ dô 6. Xét sự thay ®æi nhÊt ®Þnh trong qu¸ tr×nh s¶n xuÊt.. C¸c mÉu thu ®−îc sö dông c¶ qu¸ tr×nh

míi vµ qu¸ tr×nh hiÖn t¹i ®Ó x¸c ®Þnh liệu qu¸ tr×nh míi cã hiÖu qu¶ h¬n hay kh«ng. Giả sử 75 trong

sè 1500 linh kiÖn trong quy tr×nh hiÖn t¹i ®−îc x¸c ®Þnh cã lçi vµ 80 trong sè 2000 linh kiÖn cña qu¸

tr×nh míi ®−îc x¸c ®Þnh cã lçi. T×m kho¶ng tin cËy 90% cho sai sè ch©n thùc trong phÇn c¸c s¶n

phÈm bÞ lçi gi÷a qu¸ tr×nh hiÖn t¹i vµ qu¸ tr×nh míi.

Giải. LÊy 1p vµ

2p lµ c¸c tû lÖ ch©n thùc cña c¸c thiÕt bÞ cã lçi cho c¸c quy tr×nh hiÖn t¹i vµ míi

t−¬ng øng. Khi ®ã 1 2

75 80ˆ ˆ0,05; 0, 04

1500 2000p p= = = = vµ −íc l−îng ®iÓm

1 2p p− b»ng.

1 2ˆ ˆ 0,05 0,04 0,01p p− = − =

Sử dụng Bảng A.3, chúng ta xác định được 0,05

1,645z = . Vì vậy thay vào công thức ta được

khoảng tin cậy 90% là:

( ) ( )1 2

0.5 (0.95 0.04 (0.96)0.01 1.645

1500 2000p p− + < −

(0.05)(0.95) (0.04)(0.96)0.01 1.645

1500 2000< + +

Rót gän thµnh 1 2

0,0017 0,0217p p− < − < . V× kho¶ng nµy chứa gi¸ trÞ 0, cho nªn qu¸ tr×nh míi

kh«ng gi¶m nhiÒu vÒ tû lÖ c¸c s¶n phÈm cã lçi so víi ph−¬ng ph¸p hiÖn ®¹i.

Về nhà: Tự đọc: Mục Mục 9.11; 9.12; 9.13; 9.14 Ôn tập chuẩn bị Kiểm tra giữa kỳ Bài tập: Tr. 290; 299 Đọc trước các Mục từ 10.1 đến 10.7 chuẩn bị cho Bài số 8:

Kiểm định giả thuyết về trung bình cho một mẫu

Page 67: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

67

Bài số 8 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

KIỂM ĐINH GIẢ THUYẾT VỀ TRUNG BÌNH CHO MỘT MẪU

Một dạng khác của quy nạp thống kê là kiểm định giả thiết thống kê. Đây là một phương pháp quan trọng cho ta phép giải quyết nhiều bài toán trong thực tế. Nội dung của kiểm định giả thuyết thống kê là dựa vào mẫu cụ thể và các quy tắc hay thủ tục quyết định dẫn đến bác bỏ hay chấp nhận giả thuyết của tổng thể. I. MỘT SỐ KHÁI NIỆM 1.Giả thuyết thống kê. Khi nghiên cứu về các lĩnh vực nào đó trong thực tế, ta thường đưa ra những nhận xét khác nhau về các đối tượng quan tâm. Những nhận xét như vậy có thể đúng, có thể sai và chúng được gọi là các giả thuyết.

Định nghĩa 1. Một giả thuyết thống kê là một sự xác nhận hay phỏng đoán liên quan tới một hay nhiều tổng thể.

Sự đúng hay sai của một giả thuyết thống kê không thể biết được một cách chắc chắn, trừ khi ta khảo sát được toàn bộ tập hợp. Điều này tất nhiên là không khả thi trong đa số các trường hợp. Thay vào đó, ta lấy một mẫu ngẫu nhiên từ tập hợp được quan tâm và sử dụng dữ liệu có trong mẫu để đưa ra bằng chứng mà theo đó ta chấp nhận hoặc không chấp nhận giả thuyết. Bằng chứng từ mẫu mà mâu thuẫn với giả thuyết sẽ đưa đến việc bác bỏ giả thuyết; ngược lại, bằng chứng phù hợp với giả thuyết sẽ đưa đến việc chấp nhận nó. Ví dụ 1. Nghiên cứu tuổi thọ trung bình của một số loài, gọi X là tuổi thọ trung bình của loài Khủng long, Y là tuổi thọ trung bình của loài Rùa. Một nhà Khoa học đưa ra nhận định sau:

( ) 70E X = , ( ) 200E Y = , đó là các giả thuyết thống kê. Vì dấu hiệu nghiên cứu có thể xem là các BNN gốc, do đó giả thuyết thống kê là giả thiết về dạng phân bố xác suất. Nếu phân bố của BNN gốc được đặc trưng bởi các tham số (như trung bình, phương sai,…) thì giả thuyết thống kê là giả thiết về tham số của phân bố đó. Đối với bài toán có hai dấu hiệu nghiên cứu thì giả thuyết thống kê có thể là giả thiết về sự độc lập của chúng hoặc so sánh các tham số đặc trưng của chúng.

Định nghĩa 2. Thủ tục mà qua những thông tin về mẫu ta có thể đưa ra những bằng chứng để chấp nhận hoặc bác bỏ giả thuyết thống kê được gọi là kiểm định giả thuyết (kiểm định thống kê).

Giả thuyết đưa ra kiểm định ký hiệu là 0

H : đây là giả thuyết ta muốn bảo vệ hoặc bác bỏ.

Ngoài giả thuyết 0

H ta cần định ra một giả thuyết cạnh tranh với 0

H được ký hiệu là 1

H và gọi là

đối thuyết. Đối thuyết 1

H sẽ được chấp nhận khi 0

H bị bác bỏ, và ngược lại.

Chú ý. Đối thuyết 1

H không nhất thiết là phủ định của giả thuyết 0

H . Chẳng hạn

+ Giả thuyết 0

H : nhu cầu của thị trường về một loại hàng hóa là 1000µ = đơn vị/tháng.

+ Nếu ta nghi ngờ nhu cầu này không đúng thì đối thuyết 1

H là 1000µ ≠ .

+ Nhưng do tiếp thị tốt và có chính sách hậu mãi tốt và người ta nghĩ rằng nhu cầu về mặt hang này sẽ tăng thi đối thuyết

1H lại là 1000µ > .

Từ đó ta có:

Page 68: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

68

a. Kiểm định một phía: nếu xảy ra một trong các trường hợp sau: i. Giả thuyết

0H đưa ra kiểm định có dạng:

0θ θ=

còn đối thuyết 1

H có dạng: 0

θ θ< ( hoặc 0

θ θ> ).

ii. Giả thuyết kiểm định có dạng: 0

θ θ≤ (hoặc 0

θ θ≥ )

còn đối thuyết 1

H tương ứng có dạng: 0

θ θ> (hoặc 0

θ θ< ).

b.Kiểm định hai phía: nếu giả thuyết 0

H đưa ra kiểm định có dạng 0

θ θ=

còn đối thuyết 1

H có dạng 0

θ θ≠ .

Quy tắc kiểm định: dựa trên hai nguyên lý sau:

1. Nguyên lý xác suất nhỏ: “ Nếu một biến cố có xác suất rất nhỏ thì trong một hay vài phép thử thì biến cố đó coi như không xảy ra” 2. Phương pháp phản chứng: “Để bác bỏ giả thiết A thì ta giả sử rằng giả thiết A là đúng, và sau đó dẫn tới điều vô lý.

2. Tiêu chuẩn kiểm định giả thuyết thống kê

Giả sử ta cần nghiên cứu tham số θ của biến ngẫu nhiên X , người ta cần đưa ra giả thuyết cần kiểm định

0H :

0θ θ= .

Từ BNN gốc của tổng thể, lập mẫu ngẫu nhiên cỡ n : 1 2

W ( , ,..., )n

X X X= , ta chọn thống

kê: 1 2 0

ˆ ˆ( , ,..., ; )n

X X X θΘ = Θ .

Nếu 0

H đúng thì thống kê Θ sẽ có phân phối xác suất hoàn toàn xác định. Khi đó thống kê

Θ được gọi là tiêu chuẩn kiểm định giả thuyết 0

H .

3. Miền bác bỏ giả thuyết Sau khi đã chọn tiêu chuẩn kiểm định Θ , với α bé cho trước (thông thường 0, 01;0, 05α ∈ )

và với điều kiện 0

H là đúng, ta có thể tìm được miền Wα

sao cho Θ nhận giá trị trong miền Wα

với xác suất bằng α , tức là: ˆ( W )Pα

αΘ ∈ = .

Khi đó miền Wα

được gọi là Miền bác bỏ giả thuyết 0

H , và α được gọi là Mức ý nghĩa của kiểm

định(hay còn gọi là cỡ của miền bác bỏ). + Miền còn lại gọi là Miền chấp nhận giả thuyết

0H .

+ Số nằm giữa miền bác bỏ và miền chấp nhận được gọi là: Giá trị tới hạn 4.Giá trị quan sát Thực hiện phép thử đối với mẫu ngẫu nhiên

1 2W ( , ,..., )

nX X X= ta được mẫu cụ thể:

1 2w ( , ,..., )

nx x x= .

Tính giá trị cụ thể của Θ tại 1 2

w ( , ,..., )n

x x x= ta được 0 1 2

ˆ( , ,..., )n

x x xθ = Θ .

Khi đó 0θ được gọi là giá trị quan sát.

Page 69: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

69

+ Nếu 0

θ ∈ thì bác bỏ giả thiết 0

H và thừa nhận đối thuyết 1

H .

+ Nếu 0

θ ∉ thì giả thuyết 0

H được chấp nhận.

5. Sai lầm loại I, sai lầm loại II.

Khi kiểm định giả thuyết thống kê, ta có thể mắc một trong hai loại sai lầm sau: i. Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ giả thuyết

0H trong khi

0H là đúng. Xác suất

mắc phải sai lầm loại I bằng: 0

ˆ( | )P W Hα

αΘ ∈ = .

ii. Sai lầm loại II: là sai lầm mắc phải khi ta thừa nhận giả thuyết 0

H trong khi 0

H là sai. Điều

này xảy ra giá trị quan sát 0 1 2

ˆ( , ,..., )n

x x xθ = Θ không thuộc miền bác bỏ Wα

.

Xác suất mắc phải sai lầm loại II bằng: 1

ˆ( | )P W Hα

βΘ ∉ = .

Xác suất của biến cố đối của sai lầm loại II: 1

ˆ( | ) 1P W Hα

βΘ ∈ = − gọi là lực lượng kiểm

định.

Chú ý. + Sai lầm loại I sinh ra do kích thước mẫu quá nhỏ, do phương pháp lấy mẫu,… + Nếu muốn giảm xác suất sai lầm loại I thi ta sẽ làm tăng xác suất sai lầm loại II và ngược lại. + Đối với một tiêu chuẩn kiểm định θ và với mức ý nghĩa α ta có thể tìm được vô số miền bác bỏ W

α. Thường ngưới ta ấn định trước xác suất sai lầm loại I (tức cho trước mức ý nghĩa α )

chọn miền bác bỏ Wα

nào đó có xác suất sai lầm loại II nhỏ nhất.

Các khả năng có thể xảy ra trong kiểm định giả thuyết: Thực tế Quyết định

0H đúng

0H sai

Bác bỏ 0

H Sai lầm loại I Xác suất bằng α

Quyết định đúng Xác suất bằng 1 β−

Không bác bỏ 0

H Quyết định đúng Xác suất bằng 1 α−

Sai lầm loại II Xác suất bằng β

6. Thủ tục kiểm định giả thuyết thống kê + Xác định tham số cần quan tâm, phát biểu giả thuyết

0H và đối thuyết

1H .

+ Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n . + Chọn tiêu chuẩn kiểm định Θ và xác định quy luật phân bố xác suất của Θ với điều kiện giải thiết

0H đúng.

+ Với mức ý nghĩa α , xác định miền bác bỏ Wα

tốt nhất tùy thuộc vào đối thuyết 1

H .

+ Từ mẫu cụ thể, tính giá trị quan sát của tiêu chuẩn kiểm định 0 1 2

ˆ( , ,..., )n

x x xθ = Θ .

+ Tùy thuộc vào quan hệ giữa giá trị quan sát của tiêu chuẩn kiểm định và miền bác bỏ mà dẫn tới kết luận:

1. Nếu 0

θ ∈ thì bác bỏ giả thuyết 0

H và thừa nhận đối thuyết 1

H .

2. Nếu 0

θ ∉ thì giả thuyết 0

H được chấp nhận.

Page 70: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

70

Chú ý.

i. Đối với kiểm định hai phía: 0 0

1 0

:

:

H

H

θ θ

θ θ

= ≠, miền bác bỏ

0H có dạng ( ; ] [ ; )W a a

α= −∞ − ∪ +∞

ii. Đối với kiểm định một phía: 0 0

1 0

:

:

H

H

θ θ

θ θ

= >, miền bác bỏ giả thuyết

0H có dạng W [ ; )a

α= +∞

iii. Đối với kiểm định một phía: 0 0

1 0

:

:

H

H

θ θ

θ θ

= <, miền bác bỏ có dạng W ( ; ]a

α= −∞ −

Ở đây a là giá trị giới hạn

Ví dụ 2. Một hãng sản xuất loại ngũ cốc nào đó khẳng định lượng chất béo trung bình trong ngũ cốc không vượt quá 1,5 miligam. Phát biểu giả thuyết và đối thuyết được dùng trong kiểm định yêu cầu này và xác định vị trí miền bác bỏ giả thiết. Giải. Khẳng định của nhà sản xuất: + Bị bác bỏ chỉ khi 1,5µ > miligam + Được chấp nhận nếu 1,5µ ≤ miligam. Từ việc giả thuyết luôn chỉ rõ một giá trị cụ thể của tham số, ta sẽ kiểm định:

0: 1,5H µ =

1

: 1,5H µ > .

Việc chấp nhận 0

H không có nghĩa là chính xác 1,5µ = ; nhưng phần nào có nghĩa là ta không đủ

bằng chứng để chấp nhận 1

H . Ta có bài toán kiểm định một phía, dấu lớn hơn cho thấy miền bác bỏ

nằm hoàn toàn ở đuôi bên phải của phân phối của thống kê tiêu chuẩn.

Ví dụ 3. Một đại lý nhà đất khẳng định rằng 60% số nhà riêng đang được xây dựng ngày nay là có 3 phòng ngủ. Để kiểm tra khẳng định này, một lượng lớn căn nhà mới xây dựng được kiểm tra, tỉ lệ nhà có 3 phòng ngủ được ghi lại và sử dụng trong thống kê tiêu chuẩn của ta. Phát biểu giả thuyết và đối thuyết của kiểm định; xác định vị trí của miền bác bỏ. Giải. Nếu thống kê tiêu chuẩn thực chất là cao hơn hoặc thấp hơn 0,6p = thì ta bác bỏ khẳng định của đại lý. Do đó ta có thể đặt giả thuyết:

0: 0,6H p =

1

: 0,6H p ≠ .

Đối thuyết cho thấy đây là bài toán kiểm định hai phía, với miền bác bỏ nằm đều ở cả hai đuôi của

phân phối của P - thống kê tiêu chuẩn của chúng ta. II. KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH CHO MỘT MẪU

Xét tổng thể với biến ngẫu nhiên X có trung bình ( )E Xµ = chưa biết. Ta cần kiểm định giả thuyết:

0 0

1 0

:

:

H

H

µ µ

µ µ

= ≠

Đây là bài toán kiểm định hai phía. Ta sẽ xét các trường hợp sau:

Page 71: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

71

1.Trường hợp 1: biết phương sai 2σ và 30n ≥ (nếu 30n < thì X phải có p.phối chuẩn 2( ; , )n x µ σ )

+ Từ tổng thể rút ra một mẫu ngẫu nhiên kích thước n : 1 2

W ( , ,..., )n

X X X=

+ Xét thống kê: 0

/

XZ

n

µ

σ

−= : là tiêu chuẩn kiểm định giả thuyết. Ta biết rằng, với giả thuyết

0H

là 0

µ µ= , thì 0

/

XZ

n

µ

σ

−= có phân phối chuẩn tắc ( ; 0,1)N z .

+ Từ đối thuyết 1

H chọn miền bác bỏ hai phía: 2 2

( ; ] [ ; )z zα α

−∞ − ∪ +∞ trong đó:

0/2 /2

1/

XP z z

nα α

µα

σ

− − < < = − Tìm

2zα

dựa vào Bảng A.3

+ Tính 0

/

xz

n

µ

σ

−= rồi đưa ra kết luận.

Ví dụ 4. Một nhà sản xuất dụng cụ thể thao đưa ra một loại dây câu mới, họ khẳng định trọng lượng trung bình dây có thể chịu là 8 kg, với độ lệch chuẩn là 0,5 kg. Để kiểm định giả thuyết 8µ = kg với đối thuyết 8µ ≠ kg, 50 dây ngẫu nhiên được kiểm tra và trọng lượng trung bình dây có thể chịu là 7,8 kg. Hãy kiểm định khẳng định của nhà sản xuất với mức ý nghĩa 0,01. Giải. + Ta có

0: 8H µ = kg và

1: 8H µ ≠ kg.

+ Mức ý nghĩa: 0, 01α = .

+ Tiêu chuẩn kiểm định: 0

/

XZ

n

µ

σ

−=

+ Miền tiêu chuẩn: 2,575z < − hoặc 2,575z > với 0

/

xz

n

µ

σ

−= .

+ Tính toán: 7,8x = ; 0,5σ = do đó 7,8 8

2,830,5. 50

z−

= =− .

6. Kết luận: Bác bỏ 0

H và kết luận trọng lượng trung bình dây có thể chịu là khác 8kg, và thực tế

là nhỏ hơn 8 kg.

Page 72: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

72

Chú ý: Trong trường hợp này, đối với bài toán kiểm định một phía ta cũng có thủ tục tương tự, tuy nhiên khi xác định miền bác bỏ cần lưu ý như sau

Đối với bài toán kiểm định một phía: 0 0

1 0

:

:

H

H

µ µ

µ µ

= > , ta bác bỏ 0H nếu

αzz > .

Còn đối với bài toán kiểm định một phía 0 0

1 0

:

:

H

H

µ µ

µ µ

= < ta bác bỏ 0H nếu

αzz −< .

Ví dụ 5. Một mẫu ngẫu nhiên gồm 100 giấy báo tử ở Mỹ cho thấy tuổi thọ trung bình là 71,8 năm. Giả sử độ lệch chuẩn là 8,9 năm; có thể cho rằng tuổi thọ trung bình hiện nay là hơn 70 năm không? Cho biết mức ý nghĩa là 0,05. Giải. Đây là bài toán kiểm định một phía. + Ta có

0: 70H µ = năm;

1: 70H µ > năm.

+ Từ giả thiết ta có mức ý nghĩa : 0,05α = .

+ Tiêu chuẩn kiểm định: 0

/

XZ

n

µ

σ

−=

+ Từ đối thuyết 1

H chọn miền bác bỏ một phía: ( ; )zα+∞ trong đó:

0 1/

XP Z z

µα

σ

− = < = −

Miền bác bỏ là: 1, 645z > hay là (1, 645; )+∞

+ Tính toán: 71,8x = năm, 8,9σ = năm, 71,8 70

2,02 (1,645; )8,9. 100

z−

= = ∈ +∞ .

+ Kết luận: Bác bỏ 0

H và kết luận tuổi thọ trung bình hiện nay là hơn 70 năm.

2. Trường hợp 2: chưa biết 2σ và cỡ mẫu lớn ( 30n ≥ )

Ta vẫn xét tiêu chuẩn kiểm định tương tự trường hợp 1, chỉ cần thay σ bởi s và khi đó

0

/

XZ

S n

µ−= .

Page 73: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

73

Và khi đó với mức ý nghĩa α , từ

0/2 /2

1/

XP z z

s nα α

µα

− − < < = −

ta sẽ xác định được miền bác bỏ là: /2 /2

W ( ; ] [ ; )z zα α α= −∞ − ∪ +∞ .

3. Trường hợp 3: Chưa biết 2σ , cỡ mẫu 30n < , tổng thể có phân phối chuẩn.

+ Trong trường hợp này ta cần xét tiêu chuẩn kiểm định là: 0

/

XT

S n

µ−= .

+ Với giả thiết đúng thì T có phân phối Student với 1v n= − bậc tự do

+ Với mức ý nghĩa α thì từ: 0/2, 1 /2, 1

1/

n n

XP t t

S nα α

µα− −

− − < < = −

xác định được miền bác bỏ: /2, 1 /2, 1

( ; ] [ ; )n n

t tα α− −

−∞ − ∪ +∞ , trong đó /2, 1ntα −

xác định bởi Bảng A4.

+ Tính 0

/

xt

s n

µ−= rồi đưa ra kết luận.

Chú ý. Trong trường hợp này, đối với kiểm định một phía ta cũng có thủ tục tương tự, tuy nhiên miền bác bỏ cần lưu ý như sau:

Đối với bài toán kiểm định một phía 0 0

1 0

:

:

H

H

µ µ

µ µ

= > , ta bác bỏ 0H nếu , 1n

t tα −> .

Còn đối với bài toán kiểm định một phía 0 0

1 0

:

:

H

H

µ µ

µ µ

= < , ta bác bỏ 0H nếu , 1n

t tα −< − .

Ví dụ 6. Một báo cáo khẳng định mỗi máy hút bụi tiêu thụ khoảng 46 kWh / 1 năm. Từ một mẫu gồm 12 gia đình được nghiên cứu, cho thấy máy hút bụi tiêu thụ trung bình 42 kWh mỗi năm với độ lệch chuẩn 11,9 kWh. Liệu có thể nói, với mức ý nghĩa 0,05; trung bình máy hút bụi tiêu thụ ít hơn 46 kWh mỗi năm hay không? Giả sử mật độ của số kWh là chuẩn.

Giải. Đây là bài toán kiểm định một phía + Ta có

0: 46H µ = kWh và

1: 46H µ < kWh.

+ Mức ý nghĩa: 0,05α = .

+ Miền bác bỏ: 1,796t < − với 0

/

xt

s n

µ−= , v = 11 bậc tự do,

tức là ta có miền bác bỏ: ( ; 1, 796)−∞ −

+ Tính toán: 42x = , 11,9; 12s n= = . Do đó:

42 46

1,1611,9. 12

t−

= =− ; ( 1,16) 0,135P P T= < − =

Page 74: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

74

nhận thấy 1,16 ( ; 1, 796)− ∉ −∞ −

+ Kết luận: Không bác bỏ 0

H và kết luận trung bình lượng điện mà mỗi máy hút bụi tiêu thụ

trong năm ít hơn không đáng kể so với 46 kWh.

Về nhà: Tự đọc: Bài tập: Tr. 333; 351(từ bài 1 đến 11) Đọc trước các Mục từ 10.8 đến 10.13 chuẩn bị cho Bài số 9 :

Kiểm định giả thuyết về trung bình cho hai mẫu. Kiểm định giả thuyết về tỷ lệ.

Page 75: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

75

Bài số 9

KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH CHO HAI MẪU.

KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ

I. KIỂM ĐỊNH VỀ HIỆU HAI TRUNG BÌNH Xét hai tổng thể và . Gọi và là hai BNN đo đặc tính chung của các cá thể lần lượt

trong hai tổng thể có kỳ vọng (chưa biết) và phương sai tương ứng là: và . Từ hai BNN

xây dựng hai mẫu ngẫu nhiên độc lập với cỡ lần lượt là .

Xét bài toán kiểm định (hai phía) giả thuyết về hiệu hai kỳ vọng:

, ở đây là số đã biết.

Đây là bài toán kiểm định hai phía, các bước trong thủ tục tương tự như đã xét trong bài toán kiểm định về một trung bình, chỉ cần lưu ý tới công thức chon tiêu chuẩn kiểm định. Ta xét các trường hợp sau:

1.Trường hợp 1: Biết và với cỡ mẫu đủ lớn.

Khi đó tiểu chuẩn kiểm định:

Với giả thiết là đúng thì có phân phối chuẩn tắc, kết hợp với mức ý nghĩa ta sẽ xác định

được miền bác bỏ: , trong đó được xác định từ Bảng A3.

2. Trường hợp 2: Chưa biết và nhưng , cỡ mẫu nhỏ, hai BNN có phân phối

chuẩn.

Khi đó tiêu chuẩn kiểm định: , với

Với giả thiết là đúng thì có phân phối Student bậc tự do.

Giả thuyết hai phía không bị bác bỏ khi: ,

hay miền bác bỏ là .

3. Trường hợp 3: Chưa biết và nhưng biết 2 2

1 2σ σ≠ , hai BNN có phân phối chuẩn.

Khi đó chỉ tiêu kiểm định:

Với giả thiết đúng thì có phân phối xấp xỉ Student với bậc tự do xác định bởi:

1X

2X

1 2,µ µ 2 2

1 2,σ σ

1 2,n n

0 1 2 0

1 1 2 0

:

:

H d

H d

µ µ

µ µ

− = − ≠0d

2

1σ 2

1 2 0

2 2

1 2

1 2

( )X X dZ

n n

σ σ

− −=

+

0H Z α

/2 /2( ; ] [ ; )z z

α α−∞ − ∪ +∞

/2zα

2

1σ 2

2σ 2 2 2

1 2σ σ σ= =

1 2 0

1 2

( )

1 / 1 /p

X X dT

S n n

− −=

+

2 22 1 1 2 2

1 2

( 1) ( 1)

2p

S n S nS

n n

− + −=

+ −

0H T

1 22v n n= + −

1 2 1 2/2, 2 /2, 2n n n nt t tα α+ − + −

− < <

1 2 1 2/2; 2 /2; 2( ; ] [ ; )

n n n nt tα α+ − + −

−∞ − ∪ +∞

2

1σ 2

1 2 0

2 2

1 2

1 2

( )'

X X dT

S S

n n

− −=

+

'T

Page 76: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

76

.

Thủ tục kiểm định sẽ không bác bỏ khi:

tức là miền bác bỏ là:

Ví dụ 1. Một thí nghiệm được thực hiện nhằm so sánh mức độ mài mòn của hai loại kim loại khác nhau: 12 miếng kim loại A được kiểm tra bằng cách đưa vào máy đo độ mài mòn còn 10 miếng kim loại B được kiểm tra tương tự. Trong mỗi trường hợp, độ sâu của sự mài mòn được ghi lại. Mẫu ứng với kim loại A có trung bình mài mòn là 85 đơn vị, với độ lệch mẫu bằng 4; trong khi mẫu ứng với kim loại B có trung bình là 81 và độ lệch mẫu là 5. Có thể kết luận, với mức ý nghĩa 0,05, rằng mức độ mài mòn của kim loại A hơn kim loại B là khác 2 đơn vị được không? Giả sử các mật độ đều xấp xỉ chuẩn với phương sai bằng nhau. Giải. Đặt là kỳ vọng cho độ mài mòn của hai kim loại A và B

+ Khi đó ; .

+ Mức ý nghĩa: .

+ Tiêu chuẩn kiểm định: , bậc tự do .

+ Miền bác bỏ: .

+ Tính toán: , , .

, , .

Do đó: ,

+ Kết luận: Không bác bỏ . Ta không thể kết luận rằng mức độ mài mòn của kim loại A hơn

kim loại B là khác 2 đơn vị. Chú ý. Ta cũng có thủ tục tương tự đối với bài toán kiểm định một phía, nhưng với lưu ý khi xác định miền bác bỏ. Xem kỹ Bảng 10.2 trong Giáo trình

II. KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT TỶ LỆ 1. Khái niệm. Giả sử một tổng thể có hai loại phần tử: có tính chất ℑ và không có tính chất ℑ , trong đó tỷ lệ phần tử có tính chất ℑ là

0p chưa biết. Bài toán kiểm định giả thuyết:

0 0:H p p=

với đối thuyết 1

H gọi là bài toán kiểm định tỷ lệ.

Ta sẽ xét bài toán kiểm định giả thuyết tỷ lệ số lần thành công trong phép thử nhị thức bằng giá trị cụ thể nào đó. Tức là, ta kiểm định giả thuyết

0 0:H p p= với p là tham số trong phân phối

nhị thức. Đối thuyết có thể là một phía hoặc hai phía:

0 0,p p p p< > hoặc

0p p≠ .

2 2 2

1 1 2 2

2 2 2 2

1 1 1 2 2 2

( / / )

[( / ) / ( 1)] [( / ) / ( 1)]

s n s nv

s n n s n n

+=

− + −

0H

/2, /2,'

v vt t tα α

− < <

/2; /2;( ; ] [ ; ).

v vt tα α

−∞ − ∪ +∞

1 2,µ µ

0 1 2: 2H µ µ− =

1 1 2: 2H µ µ− ≠

0,05α =

1 2 0

1 2

( )

1 / 1 /p

X X dT

S n n

− −=

+1 2

2 20v n n= + − =

0,05;20 0,05;201,725 ; 1,725t t t t<− = > =

185x =

14s =

112n =

281x =

25s =

210n =

11.16 9.254,478

12 10 2ps

+= =

+ −(85 81) 2

1, 044, 478. 1 / 12 1 / 10

t− −

= =+

0H

Page 77: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

77

2. Đối với mẫu cỡ lớn.

Với n lớn, ta cần dùng phương pháp xấp xỉ. Khi giá trị giả thuyết 0p rất gần 0 hoặc 1, ta sử

dụng phân phối Poisson với tham số 0

npµ = .

Tuy nhiên, xấp xỉ phân phối chuẩn với tham số 0

npµ = và 2

0 0np qσ = thường được sử

dụng nhiều hơn cho trường hợp n lớn và nó chính xác ngay cả khi 0p không gần 0 hoặc 1.

Nếu ta dùng xấp xỉ phân phối chuẩn tắc để kiểm định 0

p p= được cho bởi:

0

0 0

x npz

np q

−= ,

0 01q p= −

là giá trị của biến ngẫu nhiên chuẩn hóa 0

0 0

X npZ

np q

−= .

Khi đó:

a. Đối với bài toán kiểm định hai phía: 0 0

:H p p=

1 0

:H p p≠

tại mức ý nghĩa α , miền bác bỏ là: /2 /2

( ; ) ( ; )z zα α

−∞ − ∪ +∞ trong đó 2

được xác định bởi:

2( )

2P Z z

αα> = .

b. Đối với bài toán kiểm định một phía: 0 0

:H p p=

1 0

:H p p<

tại mức ý nghĩa α , miền bác bỏ là ( ; )zα

−∞ − trong đó zα

được xác định bởi:

( )P Z zα

α> = .

c. Đối với bài toán kiểm định một phía: 0 0

:H p p= ,

1 0

:H p p>

tại mức ý nghĩa α , miền bác bỏ là ( ; )zα+∞ trong đó z

α được xác định bởi:

( )P Z zα

α> = .

Ví dụ 2. Một loại thuốc an thần thường được dùng được tin là chỉ có tác động tới 60 % người sử dụng. Kết quả thử nghiệm loại thuốc mới trên 100 người trưởng thành cho thấy 70 người nhận được

Page 78: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

78

tác dụng. Có thể tin được hay không rằng loại thuốc mới tốt hơn loại thường dùng? Sử dụng mức ý nghĩa 0, 05 .

Giải: Gọi p là tỷ lệ người chịu sự tác động của loại thuốc mới.

Xét bài toán kiểm định giả thuyết: 0

: 0,6H p = .

với đối thuyết 1

:H 0,6p > .

Tại mức ý nghĩa: 0,05α = ta có:

+ Miền bác bỏ: 0,05

( ; )z +∞ trong đó 0,05z được xác định bởi:

0,05( ) 0, 05P Z z> = , tra bảng A3 ta được

0,051,645z =

Nên miền bác bỏ: (1, 645; )+∞ .

+ Tiêu chuẩn kiểm định giả thuyết: 0

0 0

X npZ

np q

−= .

Tính toán:

100, 70n x= = ; 0

100.0,6 60np = = và:

70 60

2,04 1,645100.0,6.0,4

z−

= = >

+ Kết luận: Bác bỏ 0

H , tức là loại thuốc mới là tốt hơn.

III. KIỂM ĐỊNH HIỆU HAI TỶ LỆ

Xét bài toán kiểm định giả thuyết rằng: hai tỷ lệ hoặc hai tham số nhị thức là bằng nhau. Tức là ta muốn kiểm định giả thuyết

0 1 2:H p p=

với một trong các đối thuyết 1 2p p< ,

1 2p p> hoặc

1 2p p≠ .

Điều này tương đương với giả thuyết 0 1 2

: 0H p p− =

và các đối thuyết 1 2

0p p− < , 1 2

0p p− > hoặc 1 2

0p p− ≠ .

Thống kê mà ta dựa vào để kiểm định là biến ngẫu nhiên 1 2

ˆ ˆP P− . Các mẫu độc lập cỡ 1 2,n n

được chọn ngẫu nhiên từ hai phân phối nhị thức và tỷ lệ thành công 1 2

ˆ ˆ,P P cho hai mẫu được tính

toán.

Trong xây dựng khoảng tin cậy cho 1 2,p p , ta chú ý rằng, với

1 2,n n đủ lớn, ước lượng điểm

1 2ˆ ˆP P− xấp xỉ phân phối chuẩn với trung bình:

1 2

ˆ ˆ 1 2P Pp pµ

−= − và phương sai

1 2

2 1 1 2 2ˆ ˆ

1 2

P P

p q p q

n nσ−= + .

Page 79: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

79

Do đó, miền chấp nhận và tiêu chuẩn có thể được thành lập dựa vào biến ngẫu nhiên chuẩn hóa:

1 2 1 2

1 1 1 2 2 2

ˆ ˆ( ) ( )

( / ) ( / )

P P p pZ

p q n p q n

− − −=

+.

Khi 0

H đúng, ta đặt 1 2p p p= = và

1 2q q q= = thì công thức trên trở thành:

1 2

1 2

ˆ ˆ

[(1 / ) (1 / )]

P PZ

pq n n

−=

+.

Để tính Z, ta phải ước lượng được các tham số p và q trong dấu căn. Gộp chung dữ liệu từ cả hai mẫu, ước lượng gộp chung cho tỷ lệ p là:

1 2

1 2

ˆx x

pn n

+=

+,

với 1 2,x x là số lần thành công trong mỗi mẫu. Thay p cho p và ˆ ˆ1q p= − cho q , giá trị z để kiểm

định 1 2p p= được xác định qua công thức:

1 2

1 2

ˆ ˆ

ˆ [(1 / ) (1 / )]

p pz

pq n n

−=

+.

Khi đó miền bác bỏ:

+ Với đối thuyết 1 2p p≠ tại mức ý nghĩa α , miền bác bỏ là

/2 /2( ; ) ( ; )z z

α α−∞ − ∪ +∞ .

+ Với đối thuyết 1 2p p< , miền bác bỏ là ( ; )z

α−∞ − .

+ Với đối thuyết 1 2p p> , miền bác bỏ là ( ; )z

α+∞ .

Ví dụ 3. Một cuộc bỏ phiếu được đưa ra để xác định vị trí xây dựng một nhà máy hóa chất ở trong trị trấn hay ở ngoại vi thị trấn. Có 120 trên 200 cử tri trong thị trấn đồng ý xây dựng nhà máy trong thị trấn và 240 trên 500 cử tri ở ngoại vi đồng ý với đề xuất này. Liệu có thể cho rằng tỷ lệ cử tri trong thị trấn đồng ý với đề xuất lớn hơn tỷ lệ cử tri ở ngoại vi đồng ý hay không? Sử dụng mức ý nghĩa 0,025.

Giải: Gọi 1 2,p p tương ứng là tỷ lệ cử tri trong thị trấn và ở ngoại vi đồng ý với đề xuất.

Ta xét bài toán kiểm định: 0 1 2

:H p p= .

1

:H1 2p p> .

Với mức ý nghĩa: α =0,025, ta có miền bác bỏ là: (2,24; )+∞ .

Tính toán với: : 11

1

120ˆ 0,6

200

xp

n= = = 2

2

2

240ˆ 0,48

500

xp

n= = =

1 2

1 2

120 240ˆ 0,51

200 500

x xp

n n

+ += = =

+ +.

Page 80: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

80

Do đó: 0,6 0,48

2,9 2,240,51.0, 49.[(1 / 200) (1 / 500)]

z−

= = >+

Kết luận: Bác bỏ 0

H , chấp nhận tỷ lệ cử tri trong thị trấn đồng ý với đề xuất lớn hơn tỷ lệ cử tri ở

ngoại vi đồng ý.

Về nhà:

Tự đọc: các Mục từ 10.13 đến 10.17

Bài tập: Tr. 351 (từ bài 11 đến 32) ; 360

Đọc trước các Mục từ 11.1 đến 11.3 chuẩn bị cho Bài số 13 :

Hồi quy tuyến tính đơn

Page 81: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

81

Bài số 10

HỒI QUY TUYẾN TÍNH ĐƠN.

PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI TIỂU

I.BIẾN NGẪU NHIÊN HAI CHIỀU.

1. Định nghĩa. Cho hai biến ngẫu nhiên X, Y. Cặp (có thứ tự) hai biến ngẫu nhiên (X,Y) được gọi là

một biến ngẫu nhiên hai chiều..

X, Y được gọi là các thành phần của biến ngẫu nhiên hai chiều (X, Y). Chú ý: Ta thấy rằng có thể xảy ra các trường hợp sau:

+ X và Y cùng là biến ngẫu nhiên rời rạc + X và Y cùng là biến ngẫu nhiên liên tục + X là biến ngẫu nhiên rời rạc còn Y là biến ngẫu nhiên liên tục + X là biến ngãu nhiên liên tục còn Y là biến ngẫu nhiên rời rạc.

Tuy nhiên trong chương trình của chúng ta chỉ xét hai trường hợp i. X và Y cùng là biến ngẫu nhiên rời rạc: khi đó ( , )X Y được gọi là biến ngẫu nhiên hai

chiều rời rạc. ii. X và Y cùng là biến ngẫu nhiên liên tục: khi đó ( , )X Y được gọi là biến ngẫu nhiên hai

chiều liên tục. 2. Một số ví dụ. Ví dụ 1. Đo lượng kết tủa P và thể tích V của khí bay ra từ một thí nghiệm hóa học, ta có một không gian mẫu 2 chiều gồm các kết quả (P, V): Khi đó ( , )P V là biến ngẫu nhiên hai chiều liên tục. Ví dụ 2. Xét độ rắn H và độ bền T của đồng cán nguội, ta có một không gian mẫu 2 chiều gồm các kết quả ( , )H T : Khi đó ( , )H T là biến ngẫu nhiên hai chiều liên tục. Biến ngẫu nhiên (X,Y) nhận giá trị (x,y), tức là đồng thời ta có X nhận giá trị là x và Y nhận giá trị y, tập giá trị của (X,Y) có thể được biểu diễn hình học bởi các điểm trên mặt phẳng toạ độ Oxy. Ví dụ 3. Tung đồng thời hai con xúc sắc và ta quan tâm đến X : số chấm xuất hiện trên xúc sắc thứ nhất, Y : số chấm xuất hiện trên mặt con xúc sắc thứ hai. Khi đó ( , )X Y là biến ngẫu nhiên hai chiều rời rạc, trong trường hợp này tập giá trị của ( , )X Y là

( , ) 1, 2,..., 6; 1, 2,3,..., 6i j i j= = .

Chú ý: Trong một nghiên cứu để xác định khả năng thành công của các sinh viên ở bậc đại học dựa trên kết quả học tập ở bậc trung học ta có thể phải sử dụng không gian mẫu 3 chiều, gồm điểm kiểm tra năng khiếu, xếp loại ở bậc phổ thông và điểm trung bình cuối năm đầu ở bậc đại học. Và khi đó ta cũng có thể định nghĩa biến ngẫu nhiên n chiều ( 3n ≥ ) một cách tương tự. 2. Phân phối xác suất

Điều ta quan tâm là quy luật phân bố xác suất của biến ngẫu nhiên. Nhớ lại rằng, khi xét các biến ngẫu nhiên một chiều: đối với biến ngẫu nhiên rời rạc, phân bố xác suất được xác định thông

Page 82: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

82

qua hàm xác suất của chúng; còn đối với biến ngẫu nhiên liên tục thì phân bố xác suất được xác định bởi hàm mật độ xác suất.

a.Đối với biến ngẫu nhiên rời rạc Định nghĩa. Cho X, Y là hai biến ngẫu nhiên rời rạc thì hàm phân phối xác suất đồng thời của chúng là một hàm hai biến ( , )f x y được xác định bởi

( , ) ;f x y P X x Y y= = = .

Ví dụ 4. Kểm tra một chiếc ti vi, gọi X là tuổi (làm tròn đến năm) và Y là số đèn điện tử bị hỏng của chiếc ti vi đó, thế thì (5,3) ( 5; 3)f P X Y= = = và đó là xác suất để chiếc ti vi 5 tuổi cần 3 đèn điện tử mới. Nhận xét. Hàm ( , )f x y là phân phối xác suất đồng thời của các biến ngẫu nhiên rời rạc X và Y nếu:

1. f(x, y) ≥ 0, ∀ (x, y) 2. ∑∑ =

x y

yxf 1),(

3. Với miền A tùy ý trong mặt phẳng Oxy ta có P[(X, Y) ∈ A] = ( , )A

f x y∑∑ .

Tương tự như đối với biến ngẫu nhiên một chiều, khi ( , )X Y là biến ngẫu nhiên hai chiều rời rạc (tức là X và Y là các biến ngẫu nhiên rời rạc), ta thường biểu diễn phân bố xác suất dưới dạng Bảng phân phối xác suất (đồng thời) như sau:

Y X

1y 2y … k

y …

1x 1 1( , )f x y 1 2( , )f x y … 1 2( , )f x y …

2x 2 1( , )f x y 2 2( , )f x y … 2( , )

kf x y …

… … …

kx 1( , )

kf x y 2( , )

kf x y … ( , )

k kf x y …

… … … … …

Ví dụ 5. Chọn ngẫu nhiên hai chiếc ruột bút bi từ 1 hộp gồm 3 ruột bút xanh lơ, 2 ruột bút đỏ, 3 ruột bút màu vàng. Gọi X là số ruột bút xanh lơ được rút ra , Y là số ruột bút đỏ được chọn, tìm

a) Phân phối xác suất đồng thời ( , )f x y . b) P[(X, Y) ∈ A] trong đó A là miền (x, y) | x + y ≤ 1.

Giải: + Miền giá trị của ( , )X Y là: (0,0);(0,1);(1,0);(1,1);(0,2);(2,0)

+ (0,1)f là xác suất để chọn được một ruột bút đỏ và một ruột bút màu vàng.

+ Tổng số cách chọn 2 ruột bút từ 8 chiếc là 28C = 28.

+ Số cách chọn một ruột bút đỏ từ 2 ruột bút đỏ và một ruột bút xanh lá cây từ 3 ruột bút xanh lá cây là: 1

312 C.C = 6.

Page 83: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

83

+ Do đó 6 3

(0,1)28 14

f = .

a) Giả sử ta: rút được x ruột bút màu xanh từ 3 ruột bút: có 3x

C khả năng

rút được y ruột bút màu đỏ từ 2 ruột bút: có 2y

C khả năng

khi đó rút được (2 )x y− − ruột bút màu vàng: có 23

x yC

− − khả năng

Do vậy hàm xác suất đồng thời là:

23 2 3

28

( , )x y x y

C C Cf x y

C

− −

= với x = 0, 1, 2; y = 0, 1, 2; 0 ≤ x + y ≤ 2

Hay là:

23 2 3

28

, ( , ) ( , ) | 0 , 2, 0 2( , )

0 , ( , ) ( , ) | 0 , 2, 2

x y x yC C Cx y i j i j i j

Cf x y

x y i j i j i j

− −∈ ≤ ≤ ≤ + ≤

= ∈ ≤ ≤ + >

Ta có thể biểu diễn xác suất đồng thời như trong Bảng dưới đây. Chú ý rằng tổng các xác suất luôn bằng 1.

Y X

0 1 2 Tổng hàng

0 328 3

14 128 5

14

1 928 3

14 1528

2 328 3

28

Tổng cột 1528 3

7 128 1

b) Dễ thấy: P[(X, Y) ∈ A] = P(X + Y ≤ 1) = f(0, 0) + f(0,1) + f (1, 0) = 14

9

28

9

14

3

28

3=++ .

b. Đối với biến ngẫu nhiên liên tục. Khi X, Y là các biến ngẫu nhiên liên tục thì hàm mật độ đồng thời ( , )f x y là một hàm hai biến có đồ thị là một mặt cong nằm phía trên mặt phẳng Oxy . Khi đó với A là một miền nào đó trong Oxy thì [( , ) ]P X Y A∈ có giá trị bằng thể tích của khối trụ cong có đáy dưới là A và đáy trên là mặt cong ( , )f x y .

Định nghĩa. Hàm f(x, y) được gọi là hàm mật độ xác suất đồng thời của các biến ngẫu nhiên liên tục X và Y nếu:

1. f(x, y) ≥ 0, ( , )x y∀

2. ∫ ∫+∞

∞−

+∞

∞−

= 1),( dxdyyxf

3. [( , ) ]P X Y A∈ ( , )A

f x y dxdy= ∫∫ với A là miền tùy ý trong mặt phẳng Oxy .

Page 84: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

84

Ví dụ 6. Một công ty kẹo phân phối các hộp kẹo sôcôla tổng hợp với các loại nhân kem, nhân bơ cứng và nhân quả hạnh nhân được phủ cả sôcôla đen và sôcôla trắng. Chọn ngẫu nhiên một hộp, gọi X, Y lần lượt là tỷ lệ sôcôla trắng nhân kem và sôcôla đen nhân kem. Giả sử hàm mật độ đồng thời của X, Y là:

2

(2 3 ), ( , ) :0 1; 0 1( , ) 5

0, ( , )

x y x y D x yf x y

x y D

+ ∈ ≤ ≤ ≤ ≤

= ∉

Tìm P[(X, Y) ∈ A] trong đó 1 1 1

( , ) | 0 ;2 4 2

A x y x y

= < < < <

.

Giải: Ta có P[(X, Y) ∈ A] = P(0 < X < 2

1,

4

1 < Y <

2

1) ( , )

A

f x y dxdy= ∫∫

= ∫ ∫ +2

1

4

1

2

1

0

)32(5

2dxdyyx = dy

x

xxyx

05

6

5

2 212

1

4

1

2

=

=

+∫

= 41

2122

1

4

1 10

3

105

3

10

1

+=

+∫

yydy

y =

160

13

16

3

4

1

4

3

2

1

10

1=

+−

+ .

3.Phân phối biên duyên

Bây giờ nếu đã biết phân phối xác suất đồng thời ( , )f x y của biến ngẫu nhiên hai chiều ( , )X Y , liệu ta có thể xác định được phân phối xác suất của các biến ngẫu nhiên thành phần hay không?

Định nghĩa. Biến ngẫu nhiên hai chiều ( , )X Y rời rạc có hàm phân phối xác suất đồng thời là ( , )f x y . Khi đó: phân phối biên duyên của X và Y được xác định bởi:

g(x) = ∑y

)y,x(f và h(y) = ∑x

yxf ),( .

Biến ngẫu nhiên hai chiều ( , )X Y liên tục có hàm mật độ xác suất đồng thời là ( , )f x y . Khi đó: phân phối biên duyên của X và Y được xác định bởi

g(x) = ∫∞

∞−

dyyxf ),( và h(y) = ∫∞

∞−

dxyxf ),( .

Mô tả đối với biến ngẫu nhiên rời rạc:

Page 85: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

85

Từ Bảng phân phối xác xuất đồng thời:

Y X

1y 2y … k

y … Tổng theo hàng

1x 1 1( , )f x y 1 2( , )f x y … 1 2( , )f x y …

1p

2x 2 1( , )f x y 2 2( , )f x y … 2( , )

kf x y …

2p

… … …

kx 1( , )

kf x y 2( , )

kf x y … ( , )

k kf x y …

kp

… … … … …

Tổng theo cột

1q 2q k

q 1

X 1x 2x …

kx … ( ) ( , )

j

j

g x f x y=∑

( )i

P X x= 1p 2p k

p i

i

p∑

Y

1y 2y … k

y … ( ) ( , )i

i

h y f x y=∑

( )jP Y y= 1q 2q k

q j

j

q∑

Ví dụ 7. Tìm phân phối biên duyên của X và Y biết phân phối xác suất đồng thời của chúng được cho trong Bảng sau:

Y X

0 1 2

0 328 3

14 128

1 928 3

14

2 328

Giải: Ta có bảng:

Y X

0 1 2 Tổng hàng

0 328 3

14 128 5

14

1 928 3

14 1528

2 328 3

28

Tổng cột 1528 3

7 128 1

Khi đó: ta có phân phối biên duyên của X là:

Page 86: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

86

P(X = 0) = g(0) = ∑=

2

0

),0(y

yf = f(0, 0) + f(0, 1) + f(0, 2)

= 14

5

28

1

14

3

28

3=++ .

P(X = 1) = g(1) = ∑=

2

0

),1(y

yf = f(1, 0) + f(1, 1) + f(1, 2)

= 28

150

14

3

28

9=++ .

P(X = 2) = g(2) = ∑=

2

0

),2(y

yf = f(2,0) + f(2,1) + f(2,2)

= 28

300

28

3=++ .

X 0 1 2

( ) ( )i

g x P X x= = 514 15

28 328

Tương tự, phân phối biên duyên của Y là:

Y 0 1 2 ( ) ( )jh y P Y y= = 15

28 37 1

28

Ví dụ 8. Tìm phân phối biên duyên g(x) và h(y) với hàm mật độ đồng thời (trong Ví dụ 6) được cho bởi:

2(2 3 ), ( , ) :0 1; 0 1

( , ) 50, ( , )

x y x y D x yf x y

x y D

+ ∈ ≤ ≤ ≤ ≤

= ∉

Giải: Theo định nghĩa 1 2

0

12 4 6 4 3( , ) (2 3 ) , [0;1]

( ) 05 5 10 5

0 , [0;1]

yxy y xf x y dy x y dy x

g x y

x

−∞

= += + = + = ∈

= =

∫ ∫

Tương tự, 1

0

2 2(1 3 )( , ) (2 3 ) , [0;1]

( ) 5 5

0 , [0;1]

yf x y dx x y dx y

h y

y

−∞

+= + = ∈

=

∫ ∫

Chú ý: Các phân phối biên duyên g(x) và h(y) thực sự là phân phối xác suất của các biến X và Y tương ứng vì nó thỏa mãn tất cả các điều kiện trong các Định nghĩa của Bài 3. Ví dụ, trong trường hợp liên tục:

∫ ∫∫∞

∞−

∞−

∞−

== 1),()( dydxyxfdxxg

và P(a < X < b) = P(a < X < b, -∞ < Y < ∞)

Page 87: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

87

= ∫ ∫ ∫∞

∞−

=

b

a

b

a

dxxgdydxyxf )(),( .

4. Phân phối xác suất có điều kiện Với hai biến cố ngẫu nhiên một chiều A và B ta đã có công thức tính xác suất có điều kiện như sau:

P(B | A) = )(

)(

AP

BAP ∩, P(A) > 0

O Nếu coi A là biến cố X = x, B là biến cố Y = y trong đó X và Y là các biến ngẫu nhiên rời rạc thì ta có:

P(Y = y | X = x) = )(

),(

)(

),(

xg

yxf

xXP

yYxXP=

=

==, g(x) > 0

O Hàm )(

),(

xg

yxf được gọi là phân phối xác suất có điều kiện. Ta có thể dùng nó để tính các xác

suất có điều kiện.

Định nghĩa. Giả sử ( , )X Y biến ngẫu nhiên hai chiều rời rạc hoặc liên tục. Phân phối có điều kiện của biến ngẫu nhiên Y với điều kiện X = x được xác định bởi:

( )( , )

, ( ) 0( )

f x yf y x g x

g x= > .

Phân phối có điều kiện của biến ngẫu nhiên X với điều kiện Y = y được xác định bởi:

f(x | y) = ( )( , )

, ( ) 0.( )

f x yf x y h y

h y= >

O Xác suất để biến ngẫu nhiên rời rạc X lấy giá trị trong khoảng (a,b) khi đã biết biến ngẫu

nhiên rời rạc Y = y là: P(a < X < b | Y = y) = ∑

x

yxf )|( ,

trong đó tổng được lấy trên tất cả các giá trị của X nằm giữa a và b. O Khi X và Y liên tục thì:

P(a < X < b | Y = y) = ∫b

a

dxyxf )|( .

Ví dụ 9. Xét tiếp Ví dụ 7, tìm phân phối có điều kiện của X với điều kiện Y = 1 và dùng nó để xác định P(X = 0 | Y = 1). Giải: Chúng ta cần tìm f(x | y), trong đó y = 1.

+ Ta có: h(1) = ∑=

=++=2

0 7

30

14

3

14

3)1,(

x

xf

f(x | 1) = )1,(3

7

)1(

)1,(xf

h

xf= , x = 0, 1, 2.

+ Do đó: f(0 | 1) = 2

1

14

3.

3

7)1,0(

3

7==f , f(1 | 1) =

2

1

14

3.

3

7)1,1(

3

7==f

f(2 | 1) = 00.37

)1,2(37

==f .

Page 88: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

88

+ Vậy phân phối có điều kiện của X với điều kiện Y = 1 là:

+ Từ đó: P(X = 0 | Y = 1) = f(0 | 1) = 2

1.

Như vậy nếu biết một trong hai ruột bút được chọn có màu đỏ thì xác suất để chiếc ruột bút còn lại

không có màu xanh lơ là 2

1.

Ví dụ 10. Biến ngẫu nhiên hai chiều (X,Y), trong đó X là sự thay đổi nhiệt độ, Y là tỷ lệ thay đổi quang phổ mà một nguyên tử tạo ra, có hàm mật độ đồng thời như sau:

<<<

=,0

10,10),(

2yxxy

yxf

a) Tìm hàm mật độ biên duyên g(x), h(y) và hàm mật độ có điều kiện f(y|x). b) Tìm xác suất để sự thay đổi quang phổ lớn hơn một nửa tổng số giá trị quan sát, biết nhiệt độ

tăng 0,25 đơn vị. Giải:

a) Theo định nghĩa ta có:

.10,1

3

)1(3

1010

)(

),()|(

10,50

510),()(

10),1(3

101

3

1010),()(

3

2

3

2

422

0

2

331

2

<<<−

=

==

<<==

====

<<−==

====

∫∫

∫∫∞

∞−

∞−

yxx

y

xx

xy

xg

yxfxyf

yyx

yxyxdxxydxyxfyh

xxxxy

yxydyxydyyxfxg

y

x

b) Do đó

P(Y > 2

1| X = 0,25) = ∫ ∫ =

−==

1

2

1

1

2

13

2

9

8

25,01

3)25,0|( dy

ydyxyf .

Ví dụ 11 Cho hàm mật độ đồng thời

×∉

<<<<+

=

)1,0()2,0(),(,0

10,20,4

)31(),(

2

yx

yxyx

yxf

Tìm g(x), h(y), f(x | y) và P(31

|21

41

=<< YX ).

Giải: Theo định nghĩa ta có:

x 0 1 2 f(x | 1)

2

1

2

1

0

tại các điểm khác

Page 89: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

89

.10,2

31

0

2

8

3

84

)31(),()(

20,20

1

444

)31(),()(

22

0

2222

1

0

32

<<+

==

=

+=

+==

<<==

=

+=

+==

∫∫

∫∫∞

∞−

∞−

yy

x

xyxxdx

yxdxyxfyh

xx

y

yxyxydy

yxdyyxfxg

Do đó:

20,2

2)31(

4

)31(

)(

),()|( 2

2

<<=+

+

== xx

y

yx

yh

yxfyxf

và ∫ ==

=<<

2

1

4

1 64

3

23

1|

2

1

4

1dx

xYXP .

II. HỒI QUY TUYẾN TÍNH

1. Kỳ vọng có điều kiện. a. Đối với biến ngẫu nhiên rời rạc. Kỳ vọng có điều kiện của BNN rời rạc Y với điều kiện X x= được xác định bởi:

1

( | ) ( ; )n

i iY xi

E Y x y P X x Y yµ=

= = = =∑ .

Kỳ vọng có điều kiện của BNN rời rạc X với điều kiện Y y= được xác định bởi:

1

( | ) ( ; )n

i iX yi

E X y x P X x Y yµ=

= = = =∑ .

b. Đối với biến ngẫu nhiên liên tục. Kỳ vọng có điều kiện của BNN liên tục Y với điều kiện X x= được xác định bởi:

( | ) ( | )Y x

E Y x yf y x dyµ

+∞

−∞

= = ∫ ,

Kỳ vọng có điều kiện của BNN liên tục X với điều kiện Y y= được xác định bởi:

( | ) ( | )X y

E X y xf x y dxµ

+∞

−∞

= = ∫

trong đó: ( | ) ( , )f y x f x y= với x không đổi

( | ) ( , )f x y f x y= với y không đổi. 2. Hàm hồi quy

a.Định nghĩa. Hàm hồi quy của Y đối với X được định nghĩa là |

( )Y x

y f x µ= = .

Tương tự, hàm hồi quy của X đối với Y được định nghĩa là |

( )X y

x f y µ= = .

Page 90: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

90

Khi đó với mỗi ix ta có biến ngẫu nhiên |

iY x sẽ có kỳ vọng

|i

Y xµ và phương sai 2

|i

Y xσ ;

đường nối các điểm |

( ; )i

i i Y xx y µ= được gọi là đường hồi quy(đường hồi quy thực nghiệm)

Trong thực tế ta thường phải giải các bài toán liên quan đến tập hợp các biến khi đã biết giữa chúng có một mối quan hệ nào đó; chẳng hạn gặp hai biến ngẫu nhiên ,X Y có mối quan hệ với nhau, trong đó việc khảo sát biến ngẫu nhiên X thì đơn giản trong khi khảo sát Y lại vô cùng khó thậm chí không thể khảo sát được. Ta muốn tìm được mói liên hệ nào đó giữa X và Y để khi biết các thông tin về X thì có thể dự đoán được .Y Lúc này phương pháp thống kê trở thành phương pháp tốt nhất để ước lượng mối quan hệ giữa các biến, và do đó ta cần sử dụng phân tích đường hồi quy tuyến tính và nhận được biểu đồ dữ liệu. Thông thường, có một biến phụ thuộc, hoặc biến ngẫu nhiên Y , không được kiểm soát trong thực nghiệm. Biến ngẫu nhiên này phụ thuộc vào một hoặc nhiều biến hồi quy độc lập, ví dụ như

1 2, ,...,

kx x x , được đo với sai số không đáng kể và chúng được kiểm soát trong thực nghiệm. Do đó,

các biến độc lập 1 2, ,...,

kx x x không phải là các biến ngẫu nhiên, vì vậy không có tính chất phân phối.

Sự phù hợp về quan hệ đối với một tập hợp dữ liệu thực nghiệm được đặc trưng bởi một phương trình dự đoán gọi là phương trình hồi quy. Trong trường hợp chỉ có một biến Y và một biến x , bài toán trở thành hồi quy của Y theo x .

Trong bài này, ta sẽ thảo luận về hồi quy tuyến tính đơn, tức chỉ xét đến trường hợp có một biến hồi quy.

Đối với k biến độc lập, ta xét hồi quy của Y theo 1 2, ,...,

kx x x , ta biểu diễn mẫu thử ngẫu

nhiên có cỡ mẫu n bằng tập hợp ( , ); 1,2,...,i ix y i n= . Nếu lấy thêm mẫu thử sử dụng chính xác

những giá trị tương tự của x , ta cũng phải kỳ vọng rằng các giá trị của y cũng thay đổi. Vì vậy, giá

trị iy trong cặp sắp thứ tự ( , )

i ix y là một giá trị của biến ngẫu nhiên

iY nào đó.

Thuật ngữ hồi quy tuyến tính có nghĩa là Y x

y µ= có quan hệ tuyến tính với x theo

phương trình hồi quy tổng thể:

Y xxµ α β= +

trong đó α và β gọi là các hệ số hồi quy và chúng được ước lượng từ dữ liệu mẫu.

Giả sử ước lượng của α và β lần lượt bằng a và b thì ta ta có thể ước lượng Y x

y µ=

theo hồi quy mẫu thử y hoặc đường hồi quy phù hợp (hoặc đường hồi quy thực nghiệm): y a bx= + .

Đường hồi quy phù hợp và đường hồi quy thực được biểu diễn trên biểu đồ phân tán. Ta kỳ vọng đường hồi quy mẫu sẽ có mức độ trùng khớp cao với đường hồi quy giả thiết chưa biết khi ta biết trước một lượng lớn dữ liệu. 2. Hồi quy tuyến tính đơn.

Ta sẽ xây dựng quy trình tìm ước lượng của các hệ số hồi quy α và β sao cho có thể sử dụng phương trình hồi quy để dự đoán hoặc ước lượng kỳ vọng có điều kiện hoặc giá trị ngẫu nhiên riêng lẻ cho một giá trị cụ thể của biến độc lập x .

Trường hợp đường hồi quy tuyến tính, trong đó chỉ có một biến hồi quy độc lập x và một biến

ngẫu nhiên phụ thuộc Y , dữ liệu có thể được biểu diễn bằng cặp quan sát ( , ); 1,2,...,i ix y i n= .

Nếu ta giả thiết rằng tất cả các số trung bình i

Y xµ nằm trên một đường thẳng, mỗi biến ngẫu nhiên

iY

có thể được mô tả bằng mô hình hồi quy tuyến tính đơn:

Page 91: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

91

ii i i iY xY E x Eµ α β= + = + +

trong đó, sai số ngẫu nhiên iE , sai số mô hình, cần phải có giá trị trung bình bằng 0.

Mỗi cặp quan sát ( , ); 1,2,...,i ix y i n= trong mẫu thử thỏa mãn phương trình:

i i iy xα β ε= + + ,

trong đó iε là giá trị được tính toán bởi

iE khi

iY nhận giá trị

iy . Phương trình trên có thể được

coi là mô hình cho quan sát đơn iy .

Tương tự, sử dụng đường hồi quy ước lượng hoặc đường hồi quy phù hợp y a bx= + ,

mỗi cặp quan sát thỏa mãn quan hệ:

i i iy a bx e= + +

trong đó ˆi i ie y y= − được gọi là phần dư và mô tả sai số trong mức độ phù hợp của mô hình tại

điểm dữ liệu thứ i .

Hiện giờ α và β là các tham số chưa biết. Đường hồi quy phù hợp y a bx= +

là ước lượng của đường được tạo ra bởi mô hình thống kê. Hãy để ý là ta chưa biết gì về đường

Y xxµ α β= + ngoài việc nó là một khái niệm đơn giản về cách dữ liệu được tạo ra trong một quá

trình cụ thể. Trên thực tế, phép thể hiện của iE , cụ thể là

iε , không bao giờ được quan sát; tuy

nhiên, phần dư ie vẫn được quan sát.

III. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI TIỂU. 1. Khái niệm.

Ta phải tìm a và b, các ước lượng của α và β sao cho tổng các bình phương của phần dư là nhỏ nhất. Tổng các bình phương của phần dư thường được gọi là tổng các bình phương của sai số xung quanh đường hồi quy và được ký hiệu là SSE. Quy trình cực tiểu hóa để ước lượng các tham số được gọi là phương pháp bình phương tối tiểu.

Như vậy, ta phải tìm a và b để cực tiểu hóa:

2 2 2

1 1 1

ˆ( ) ( )n n n

i i i i ii i i

SSE e y y y a bx= = =

= = − = − −∑ ∑ ∑

Lấy đạo hàm của SSE theo a và b ta có:

Page 92: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

92

1

1

( )2 ( ) 0

( )2 ( ) 0

n

i iin

i i ii

SSEy a bx

a

SSEy a bx x

b

=

=

∂ = − − − = ∂∂ = − − − = ∂

Sắp xếp lại các số hạng, ta được phương trình (gọi là phương trình chuẩn tắc):

1 1

2

1 1 1

n n

i ii i

n n n

i i i ii i i

na b x y

a x b x x y

= =

= = =

+ = + =

∑ ∑

∑ ∑ ∑

Giải hệ phương trình để tìm ra công thức tính cho a và b .

2. Ước lượng các hệ số hồi quy

Với mẫu ( , ); 1,2,...,i ix y i n= các ước lượng bình phương tối thiểu a và b của hệ số hồi

quy α và β xác định bởi công thức sau:

1 1 1 1

22

2

11 1

( )( )

( )

n n n n

i i i i i ii i i i

nn n

ii i

ii i

n x y x y x x y y

b

x xn x x

= = = =

== =

− − − = =

− −

∑ ∑ ∑ ∑

∑∑ ∑

1 1 .

n n

i ii i

y b x

a y bxn

= =

−= = −∑ ∑

Ví dụ 1. Ước lượng đường hồi quy cho dữ liệu của tập hợp chính trong Bảng sau.

Bảng: Thước đo chất rắn và nhu cầu ô xy sinh hoá Phần trăm chất

rắn, x (%) Nhu cầu oxy sinh

hoá, y (%) Phần trăm chất

rắn, x (%) Nhu cầu oxy sinh

hoá, y (%) 3 5 36 34 7 11 37 36

11 21 38 38 15 16 39 37 18 16 39 36 27 28 39 45 29 27 40 39 30 25 41 41 30 35 42 40 31 30 42 44 31 40 43 37 32 32 44 44 33 34 45 46 33 32 46 46

Page 93: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

93

34 34 47 49 36 37 50 51 36 38

Giải. Ta có

33

1

1104i

i

x=

=∑ , 33

1

1124i

i

y=

=∑ , 33

1

41355i i

i

x y=

=∑ , 33

2

1

41086I

i

x=

=∑

+ Nên

2

33 41355 1104 11240,903643

33 41086 1104b

× − ×= =

× −

và 1124 0,903643 1104

3,82963333

a− ×

= =

+ Do đó, đường hồi quy ước lượng được cho bởi công thức: ˆ 3,8296 0,9036y x= + ,

trong đó các hệ số được làm tròn đến bốn chữ số thập phân. + Với 3x = và 50x = ta được các giá trị dự đoán ˆ 6,5y = và ˆ 49y = . Đường hồi quy mẫu được vẽ bằng cách nối những cặp điểm này bằng một đường thẳng. Sử dụng đường hồi quy của Ví dụ 1, ta có thể dự đoán mức giảm nhu cầu ô xy hóa học là 31% khi tổng lượng chất rắn giảm 30%. Mức giảm 31% về nhu cầu ô xy hóa có thể được hiểu như một ước lượng của số trung bình của tập hợp chính

30Yµ hoặc như ước lượng của quan sát mới khi

mức giảm tổng lượng chất rắn là 30%. Tuy nhiên, các ước lượng đó đều có sai số. Ngay cả khi thí nghiệm được kiểm soát để giữ tổng lượng chất rắn ở mức 30%, ta khó có thể đo được mức giảm nhu cầu ô xy sinh hóa chính xác bằng 30%. Trên thực tế, dữ liệu gốc được ghi trong Bảng trên cho thấy mức giảm 25% và 35% về nhu cầu ô xy sinh hóa đo được khi mức giảm tổng lượng chất rắn giữ ở 30%. 2. Tính chất các ước lượng bình phương tối tiểu (tự đọc)

Về nhà: Tự đọc: Bài tập: Tr. 388 Ôn tập kiểm tra hết môn học chuẩn bị cho: Tổng kết môn học

Page 94: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

94

TỔNG KẾT MÔN TOÁN 5

I. XÁC SUẤT CỔ ĐIỂN. BIẾN NGẪU NHIÊN MỘT CHIỀU 1. Phân hoạch. Tổ hợp.

Công thức 1: Ta phân hoạch một tập gồm n phần tử thành k ngăn sao cho:

có 1n phần tử trong ngăn thứ nhất,

có 2n phần tử trong ngăn thứ hai,...

có kn phân tử trong ngăn thứ k

Khi đó số cách phân hoạch là:

1 2 1 2

!

, ,..., ! ! !r k

n n

n n n n n n

= ⋯

trong đó 1 2

...k

n n n n+ + + = .

Công thức 2: Số các tổ hợp của n phần tử phân biệt được tạo ra khi lấy r phần tử cùng một lúc là

!

!( )!k

n

n nC

r r n r

= = −

2. Biến cố

Các bước tìm xác suất(theo lối cổ điển) của một biến cố A : 1. Đếm số biến số sơ cấp đồng khả năng trong không gian mẫu: N 2. Đếm số biến số sơ cấp đồng khả năng trong biến cố :A n

3. Từ đó ( ) .n

P AN

=

a.Công thức cộng. Trường hợp các biến cố xung khắc.

Nếu A và B là 2 biến cố xung khắc (tức là A B AB∩ = = ∅ ) trong một phép thử thì ta có: P(A∪B) = P(A) + P(B)

Trường hợp tổng quát.

Nếu A và B là hai biến cố tùy ý trong một phép thử thì ta có P(A∪B) = P(A) + P(B) – P(AB)

b.Xác suất có điều kiện. Công thức nhân Xác suất có điều kiện. Công thức: Xác suất có điều kiện của B với điều kiện A, ký hiệu P(B|A), được xác định như sau:

( )( | )

( )

P A BP B A

P A

∩= nếu P(A) > 0.

Công thức nhân xác suất.

Page 95: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

95

Nếu trong một phép thử, các biến cố A và B có thể cùng xảy ra thì

( ) ( ) ( ) ( ) ( )P A B P A P B A P B P A B∩ = =

Hai biến cố A và B là độc lập với nhau khi và chỉ khi P(A ∩ B) = P(A).P(B).

c.Công thức xác suất đây đủ. Công thức Bayes Công thức xác suất đầy đủ.

Nếu các biến cố B1,B

2, …, B

k là một phân hoạch của không gian mẫu S (tức là

1 2, ,...,

kB B B là

nhóm các biến cố đầy đủ đôi một xung khắc), trong đó P(Bi) ≠0 với mọi i = 1, 2, …, k thì với biến

cố A bất kì của S ta có:

P(A) = 1

( )k

ii

P B A=

∩∑ = 1

( ) ( | ).k

i ii

P B P A B=∑

Công thức Bayes. Cho phép tính xác suất có điều kiện ( | )P B A khi biết xác suất có điều kiện

( | )P A B và một số thông tin khác.

a) Dạng đơn giản nhất của công thức này là: Với A và B là hai biến cố bất kỳ với xác suất khác không, khi đó ta luôn có:

( | ) ( )( | ) .

( )

P A B P BP B A

P A=

Định lý (Công thức Bayes tổng quát). Nếu các biến cố B

1,B

2, …, B

k là một phân hoạch của không gian mẫu S (tức là

1 2, ,...,

kB B B là nhóm các biến cố đầy đủ đôi một xung khắc), trong đó P(B

i) ≠0 với mọi i = 1, 2,

…, k, thì với biến cố A bất kì của S mà P(A) ≠0 ta có:

P(Br|A) =

1

( )

( )

r

k

ii

P B A

P B A=

∩∑ =

1

( ) ( | )

( ) ( | )

r r

k

i ii

P B P A B

P B P A B=∑

3 . Biến ngẫu nhiên một chiều i. Đối với biến ngẫu nhiên rời rạc. Đặt: ( ) ( )f x P X x= = , khi đó ( )f x chính là hàm của các giá trị của X Hàm xác suất của biến ngẫu nhiên rời rạc.

Cho X là biến ngẫu nhiên rời rạc có tập giá trị 1 2 3, , ,...x x x Hàm số thực ( )f x xác định trên ℝ

được gọi là hàm xác suất (hoặc phân phối xác suất) của X nếu thoả mãn các điều kiện sau:

4. ( ) 0f x ≥ với mọi x trong tập giá trị của X

Page 96: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

96

5. ( ) 1i

ix

f x =∑

6. ( ) ( )i i

f x P X x= = .

Hàm phân phối tích lũy.

Hàm phân phối tích lũy ( )F x của biến ngẫu nhiên rời rạc X với phân phối xác suất ( )f x là hàm số được xác định bởi:

( ) ( ) ( )t x

F x P X x f t≤

= ≤ =∑ với x−∞< <+∞ .

ii. Đối với biến ngẫu nhiên liên tục. Hàm mật độ xác suất.

Hàm mật độ xác suất ( )f x của biến ngẫu nhiên liên tục X là hàm số thực xác định trên tập số thực ℝ và thỏa mãn xác điều kiện sau: 1. ( ) 0f x ≥ , với x∀ ∈ ℝ

2. ( ) 1f x dx

+∞

−∞

=∫

3. P(a < X < b) = ( )b

a

f x dx∫ .

Hàm phân phối tích lũy.

Hàm phân phối tích lũy ( )F x của biến ngẫu nhiên liên tục X với hàm mật độ ( )f x là hàm thực được xác định bởi:

( ) ( ) ( )x

F x P X x f t dt

−∞

= ≤ = ∫ , với x−∞< <+∞ .

4. Kỳ vọng. a. Kỳ vọng của biến ngẫu nhiên.

Định nghĩa. a. Cho X là một biến ngẫu nhiên rời rạc với hàm phân phối xác suất là ( )f x . Khi đó kỳ

vọng (giá trị trung bình) của X là một số thực ký hiệu là ( )E X ( hoặc µ ) được xác định bởi

( ) ( )x

E X xf xµ = =∑

b. Cho X là một biến ngẫu nhiên liên tục với hàm mật độ xác suất là f(x). Khi đó kỳ vọng (giá trị trung bình) của X là một số thực ký hiệu là E(X) được xác định bởi:

( ) ( ) .E X xf x dxµ

+∞

−∞

= = ∫

Page 97: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

97

b.Kỳ vọng của hàm các biến ngẫu nhiên.

Định lí 1. Cho X là biến ngẫu nhiên với phân phối xác suất là ( )f x và ( )g g t= là hàm số xác định trên miền giá trị của biến ngẫu nhiên X . Khi đó kỳ vọng của biến ngẫu nhiên ( )g X được xác định bởi:

( )[ ( )] ( ) ( )

g XE g X g x f xµ = =∑

, nếu X là biến ngẫu nhiên rời rạc,

( )[ ( )] ( ) ( )

g XE g X g x f x dxµ

+∞

−∞

= = ∫ , nếu X là biến ngẫu nhiên liên tục.

5. Phương sai và độ lệch chuẩn a. Phương sai và độ lệch chuẩn của biến ngẫu nhiên.

Định nghĩa: Cho X là biến ngẫu nhiên với phân phối xác suất ( )f x và kỳ vọng là µ . Phương sai của X là một số thực được xác định bởi:

2 2 2[( - ) ] ( - ) ( )x

E X x f xσ µ µ= =∑ ,nếu X là rời rạc,

2 2 2[( - ) ] ( ) ( )E X x f x dxσ µ µ+∞

−∞= = −∫

,nếu X liên tục.

Căn bậc hai của phương sai là σ và được gọi là độ lệch chuẩn của biến ngẫu nhiên X.

Định lí . Phương sai của biến ngẫu nhiên X có thể đươc xác định bởi công thức:

2 2 2( ) .E Xσ µ= −

b. Phương sai của hàm các biến ngẫu nhiên

Ta sẽ mở rộng khái niệm phương sai của một biến ngẫu nhiên cho hàm của biến ngẫu nhiên X . Giả sử ( )g g t= là hàm số xác định trên miền giá trị của biến ngẫu nhiên X , khi đó ( )g X cũng

là một biến ngẫu nhiên và phương sai của nó sẽ được kí hiệu là 2

( )g Xσ .

Định lý 4. Cho X là biến ngẫu nhiên với phân phối xác suất là ( )f x . Phương sai của biến ngẫu nhiên g(X) là:

2 2 2

( ) ( ) ( )[ ( ) - ] [ ( ) ] ( )

g X g X g Xx

E g X g x f xσ µ µ= = −∑ , nếu X là biến ngẫu nhiên rời rạc,

2 2 2

( ) ( ) ( )[ ( ) - ] [ ( ) - ] ( )

g X g X g XE g X g x f x dxσ µ µ

+∞

−∞= = ∫

, nếu X là biến ngẫu nhiên liên tục.

III.BÀI TOÁN ƯỚC LƯỢNG THAM SỐ Một số thống kê quan trọng. i.Trung bình mẫu ngẫu nhiên.

Page 98: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

98

Định nghĩa. Nếu

1 2( , ,..., )

nX X X là một mẫu ngẫu nhiên có cỡ n , khi đó trung bình mẫu được xác định

bằng thống kê:

1

n

ii

X

Xn

==∑

ii.Median mẫu (trung vị mẫu)

Định nghĩa. Nếu 1 2

( , ,..., )n

X X X là một mẫu ngẫu nhiên cỡ n , được sắp xếp theo thứ tự tăng dần

của độ lớn, khi đó median mẫu được xác định bởi thống kê:

1

2

12 2

, khi le

, khi chan2

n

n n

X n

X X X

n

+

+

= +

iii. Mode

Định nghĩa. Nếu 1 2, ,...,

nX X X không nhất thiết khác nhau hoàn toàn, biểu diễn một mẫu ngẫu

nhiên có cỡ n . Khi đó mode M là giá trị của mẫu mà xảy ra thường xuyên nhất hoặc có tần số lớn nhất. Mode có thể không tồn tại và khi nó tồn tại không nhất thiết là giá trị duy nhất.

iv. Phương sai mẫu.

Định nghĩa. Cho 1 2

( , ,..., )n

X X X là mẫu ngẫu nhiên cỡ n với trung bình mẫu làX . Khi đó phương

sai mẫu được xác định bởi thống kê:

2

2 1

( )

1

n

ii

X X

Sn

=

−=

Với mỗi mẫu cụ thể thì 2S sẽ nhận giá trị

2

2 1

( )

1

n

ii

x x

sn

=

−=

∑.

Định lý. Nếu 2S là phương sai của một mẫu ngẫu nhiên cỡ n , khi đó: 2

2

1 12

( 1)

n n

i ii i

n X X

Sn n

= =

− =

∑ ∑

3.Phân phối của các thống kê cơ bản.

Page 99: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

99

a.Phân phối của trung bình mẫu. Trung bình mẫu: 1 2...

nX X X

Xn

+ + +=

có kỳ vọng: ...

X n

µ µ µµ µ

+ + += = và phương sai:

2 2 2 22

2

...x nn

σ σ σ σσ

+ + += = .

Định lý giới hạn trung tâm. Nếu X là giá trị trung bình của một mẫu ngẫu nhiên có kích thước n lấy từ tổng thể có giá trị trung bình µ và phương sai hữu hạn 2σ , khi đó giới hạn phân phối dạng của

/

XZ

n

µ

σ

−=

là phân phối chuẩn ( ;0,1)n z khi n →∞ .

b. Phân phối của hiệu hai trung bình mẫu.

Định lý. Nếu các mẫu độc lập có kích thước 1n và

2n được lấy ngẫu nhiên từ hai tổng thể, rời rạc

hoặc liên tục, có các giá trị trung bình 1µ và

2µ , các phương sai 2

1σ và 2

2σ , khi đó phân phối của

các thống kê mẫu của các sự sai khác giữa hai giá trị trung bình: 1 2

X X− , được phân phối xấp

xỉ chuẩn có giá trị trung bình và phương sai bằng:

1 2X Xµ µ µ−= − và

1 2

2 22 1 2

1 2X X n n

σ σσ

−= +

Do đó

1 2 1 2

2 2

1 1 2 2

( ) ( )

( / ) ( / )

X XZ

n n

µ µ

σ σ

− − −=

+

có phân phối xấp xỉ phân phối tiêu chuẩn ( ;0,1)n z .

4.Bài toán ước lượng trung bình ( kỳ vong). a.Ước lượng một trung bình. Giả sử trung bình của tổng thể ( )E Xµ = chưa biết. Ta tìm khoảng

1 2( , )µ µ chứa µ sao cho:

1 2( ) 1P µ µ µ α< < = − với 1 α− là độ tin cậy cho trước.

Trường hợp 1. Khoảng tin cậy của µ ; khi biết σ

Nếu x là số trung bình của một mẫu ngẫu nhiên kích thước n trong một tổng thể có phương sai đã

biết 2σ , một khoảng tin cậy ( )1 100%α− đối với µ được xác định bằng

/2 /2,x z x z

n nα α

σ σµ− < < +

trong đó /2

là giá trị tạo nên một diện tích / 2α sang bên phía phải của nó, tức 2

( )2

P Z zα

α> = .

Page 100: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

100

Định lý 1. Nếu x được sử dụng để ước lượng µ , khi đó với độ tin cậy ( )1 100%α− ta có sai số sẽ

không vượt quá /2

/z nασ .

Định lý 2. Nếu x được sử dụng là một ước lượng của µ , khi đó với độ tin cậy ( )1 100%α− ta nói

rằng sai số sẽ không vượt quá một lượng cụ thể e khi kích thước là: /2 2( )z

ne

ασ

= theo quy tắc làm

tròn đến toàn bộ số tiếp theo.

Trường hợp 2: Khoảng tin cậy choµ khi chưa biếtσ , cỡ mẫu nhỏ

Nếu x và s là số trung bình và độ lệch chuẩn của mẫu ngẫu nhiên được rút ra từ biến ngẫu nhiên của

chuẩn có phương sai 2σ chưa xác định, khoảng tin cậy ( )1 100%α− cho µ là:

/2 /2

s sx t x t

n nα α

µ− < < +

trong đó /2

là giá trị t với 1v n= − bậc tự do, sinh ra một diện tích bằng / 2α bên phía phải của

nó, tức là tức 2

( )2

P T tα

α> = .

Trường hợp 3. Khoảng tin cậy của µ khi chưa biết σ với cỡ mẫu lớn( 30n > ) Nếu x là số trung bình của một mẫu ngẫu nhiên kích thước 30n > trong một tổng thể có phương

sai chưa biết 2σ , một khoảng tin cậy ( )1 100%α− đối với µ được xác định bằng

/2 /2,

s sx z x z

n nα α

µ− < < +

trong đó /2

là giá trị tạo nên một diện tích / 2α sang bên phía phải của nó

b. Ước lượng hiệu hai kỳ vọng.

Nếu chúng ta có hai tổng thể có các giá trị trung bình 1µ và

2µ , các phương sai 2

1σ và 2

2σ ,

ước lượng điểm về hiệu giữa 1µ và

2µ được sinh ra bởi thống kê

1 2X X− .

Mục tiêu ta cần thiết lập được khoảng tin cậy (1 )100%α− đối với 1 2

.µ µ−

Trường hợp 1: Khoảng tin cậy cho 1 2

µ µ− khi biết 2

1σ và 2

Nếu 1x và 2x là các giá trị trung bình của các mẫu ngẫu nhiên độc lập có kích thước 1n và

2n từ

các tổng thể có các phương sai đã biết 2 2

1 2 và σ σ , khoảng tin cậy ( )1 100%α− đối với

1 2 µ µ− là:

2 2 2 2

1 2 1 22 2 1 2

/2 1 2 /2

1 2 1 2

( ) ( )x x z x x zn n n nα α

σ σ σ σµ µ− − + < − < − + +

trong đó /2

được xác định bởi 2

( )2

P Z zα

α> = .

Page 101: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

101

Trường hợp 2: Khoảng tin cậy cho 2 2

1 2 1 2; µ µ σ σ− = chưa biết

1 2;σ σ .

Nếu 1 2 à x v x là các giá trị trung bình của các mẫu ngẫu nhiên độc lập kích thước 1n và n2, từ các

tổng thể chuẩn ước lượng có các phương sai chưa biết nhưng cân bằng, một khoảng tin cậy

( )1 100%α− cho 1 2µ µ− được xác định bằng

1 2 1 2/2 1 2 /2

1 2 1 2

1 1 1 1( ) ( )

p px x t S x x t s

n n n nα αµ µ− − + < − < − + +

trong đó /2

là giá trị t với 1 2

2v n n= + − bậc tự do, sinh ra một diện tích / 2α sang bên phải, và

2 2

1 1 2 2

1 2

( 1) ( 1)

2p

n s n ss

n n

− + −=

+ −.

Trường hợp 3: Khoảng tin cậy μ1-μ2 với σ σ1 2≠ và chưa biết

1 2,σ σ

Nếu 2

1 1 và sx , 2

2 2 và sx là các số trung bình và phương sai của các mẫu độc lập kích thước nhỏ n1 và

n2 rút ra từ các phân phối xấp xỉ chuẩn với các phương sai chưa biết và không bằng nhau, khoảng tin

cậy xấp xỉ ( )1 100%α− ước lượng cho 1 2-µ µ là

2 2 2 2

1 2 1 21 2 1 2

/2 1 2 /2

1 2 1 2

( ) - ( )s s s s

x x t x x tn n n nα α

µ µ− − + < < − + +

trong đó /2

là giá trị t với

2 2 2

1 2 2

2 2 2 2

1 1 1 2 2 2

( / / )

[(s /n ) /(n -2)]+[((s /n ) /(n -2)]

s n s nv

+=

bậc tự do, sinh ra một diện tích α/2 bên phía phải.

6. Bài toán ước lượng tỷ lệ a.Ước lượng một tỷ lệ. Khoảng tin cậy đối với p khi mẫu cỡ lớn.

Định lý 1.

Nếu p là tỷ lệ của các thành công trong một mẫu ngẫu nhiên có kích thước n và ˆ ˆ1q p= − , khoảng

tin cậy ( )1 100%α− cho tham số p được xác định bởi

/2 /2

ˆˆ ˆˆˆ ˆ

pq pqp z p p z

n nα α− < < +

trong đó /2

là giá trị sao cho: 2 2

P Z zα

α > = .

Page 102: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

102

§Þnh lý 2.

NÕu p lµ mét −íc l−îng cña p , với độ tin cậy ( )1 100%α− chóng ta cã thÓ kh¼ng ®Þnh r»ng sai sè

cña −íc l−îng kh«ng v−ît qu¸ /2

ˆˆpqz

nα, tức là

/2

ˆˆˆ

pqp p z

nα− ≤ .

§Þnh lý 3.

NÕu p lµ −íc l−îng cña p với độ tin cậy ( )1 100%α− , sai số p p− sÏ nhá h¬n gi¸ trÞ x¸c

®Þnh e khi kÝch th−íc mÉu gÇn b»ng 2

2

ˆˆ.

pqn z

eα=

§Þnh lý 4.

NÕu p là một −íc l−îng cña p với độ tin cậy ( )1 100%α− , khi đó sai sè p p e− ≤ khi kÝch th−íc

mÉu lµ

2

/2

2.

4

zn

e

α=

b.Ước lượng hiệu hai tỷ lệ

Khoảng tin cậy cho p1 – p2 khi cỡ mẫu lớn

NÕu p 1vµ p 2 lµ tû lÖ thµnh c«ng trong c¸c mÉu ngÉu nhiªn cã cỡ n1 vµ n2 t−¬ng øng. Đặt

1 1 2 2ˆ ˆ ˆ ˆ1 ; 1q p q p= − = − . Kho¶ng tin cËy víi ®é tin cËy ( )1 100%α− cho sù sai kh¸c

1 2p p−

®−îc x¸c ®Þnh b»ng c«ng thøc:

( ) 1 2 2 2

1 2 /2 1 2

1 1

ˆ ˆ ˆ ˆˆ ˆ

p q p qp p z p p

n nα− − + < − ( ) 1 1 2 2

1 2 /2

1 2

ˆ ˆ ˆ ˆˆ ˆ

p q p qp p z

n nα< − + + ,

trong ®ã /2

lµ gi¸ trÞ z sinh ra một diÖn tÝch2α vÒ bªn phÝa ph¶i, tức là

2

.2

P Z zα

α > =

IV. BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT Thủ tục kiểm định giả thuyết thống kê + Xác định tham số cần quan tâm, phát biểu giả thuyết

0H và đối thuyết

1H .

+ Từ tổng thể nghiên cứu lập mẫu ngẫu nhiên kích thước n . + Chọn tiêu chuẩn kiểm định Θvà xác định quy luật phân bố xác suất của Θ với điều kiện giải thiết

0H đúng.

Page 103: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

103

+ Với mức ý nghĩa α , xác định miền bác bỏ Wα

tốt nhất tùy thuộc vào đối thuyết 1

H .

+ Từ mẫu cụ thể, tính giá trị quan sát của tiêu chuẩn kiểm định 0 1 2

ˆ( , ,..., )n

x x xθ = Θ .

+ Tùy thuộc vào quan hệ giữa giá trị quan sát của tiêu chuẩn kiểm định và miền bác bỏ mà dẫn tới kết luận:

1. Nếu 0

θ ∈ thì bác bỏ giả thuyết 0

H và thừa nhận đối thuyết 1

H .

2. Nếu 0

θ ∉ thì giả thuyết 0

H được chấp nhận.

Chú ý.

i. Đối với kiểm định hai phía: 0 0

1 0

:

:

H

H

θ θ

θ θ

= ≠, miền bác bỏ

0H có dạng ( ; ] [ ; )W a a

α= −∞ − ∪ +∞

ii. Đối với kiểm định một phía: 0 0

1 0

:

:

H

H

θ θ

θ θ

= >, miền bác bỏ giả thiết

0H có dạng ( ; )W a

α= +∞

iii. Đối với kiểm định một phía: 0 0

1 0

:

:

H

H

θ θ

θ θ

= <, miền bác bỏ có dạng ( ; )W a

α= −∞

Ở đây a là giá trị giới hạn

A.KIỂM ĐỊNH VỀ TRUNG BÌNH (KỲ VỌNG) 1.Kiểm định giả thuyết về một trung bình

Xét tổng thể với biến ngẫu nhiên X có trung bình ( )E Xµ = chưa biết. Ta cần kiểm định giả thiết:

0 0

1 0

:

:

H

H

µ µ

µ µ

= ≠

Đây là bài toán kiểm định hai phía. Ta sẽ xét các trường hợp sau:

a.Trường hợp 1: biết phương sai 2σ và 30n ≥ (nếu 30n < thì X phải có p.phối chuẩn 2( ; , )n x µ σ )

+ Từ tổng thể rút ra một mẫu ngẫu nhiên kích thước n : 1 2

W ( , ,..., )n

X X X=

+ Xét thống kê: 0

/

XZ

n

µ

σ

−= : là tiêu chuẩn kiểm định giả thuyết. Ta biết rằng, với giả thuyết

0H

là 0

µ µ= , thì 0

/

XZ

n

µ

σ

−= có phân phối chuẩn tắc ( ;0,1)N z .

+ Từ đối thuyết 1

H chọn miền bác bỏ hai phía: 2 2

( ; ] [ ; )z zα α

−∞ − ∪ +∞ trong đó:

0/2 /2

1/

XP z z

nα α

µα

σ

− − < < = − Tìm

2zα

dựa vào Bảng A.3

+ Tính 0

/

xz

n

µ

σ

−= rồi đưa ra kết luận.

Page 104: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

104

Chú ý: Trong trường hợp này, đối với bài toán kiểm định một phía ta cũng có thủ tục tương tự, tuy nhiên khi xác định miền bác bỏ cần lưu ý như sau

Đối với bài toán kiểm định một phía: 0 0

1 0

:

:

H

H

µ µ

µ µ

= > , ta bác bỏ

0H nếu z z

α> .

Còn đối với bài toán kiểm định một phía 0 0

1 0

:

:

H

H

µ µ

µ µ

= < ta bác bỏ

0H nếu z z

α<− .

b. Trường hợp 2: chưa biết 2σ và cỡ mẫu 30n ≥ .

Ta vẫn xét tiêu chuẩn kiểm định tương tự trường hợp 1, chỉ cần thay σ bởi s và khi đó

0

/

XZ

S n

µ−= .

c. Trường hợp 3: Chưa biết 2σ , cỡ mẫu 30n < , tổng thể có phân phối chuẩn.

+ Trong trường hợp này ta cần xét tiêu chuẩn kiểm định là: 0

/

XT

S n

µ−= .

+ Với giả thiết đúng thì T có phân phối Student với 1v n= − bậc tự do

+ Với mức ý nghĩa α thì từ: 0/2, 1 /2, 1

1/

n n

XP t t

S nα α

µα

− −

− − < < = −

Ta xác định được miền bác bỏ: /2, 1 /2, 1

( ; ] [ ; )n n

t tα α− −−∞ − ∪ +∞ , trong đó

/2, 1ntα −

xác định bởi Bảng

A4.

+ Tính 0

/

xt

s n

µ−= rồi đưa ra kết luận.

Chú ý. Trong trường hợp này, đối với kiểm định một phía ta cũng có thủ tục tương tự, tuy nhiên miền bác bỏ cần lưu ý như sau:

Đối với bài toán kiểm định một phía 0 0

1 0

:

:

H

H

µ µ

µ µ

= > , ta bác bỏ

0H nếu

, 1nt t

α −> .

Còn đối với bài toán kiểm định một phía 0 0

1 0

:

:

H

H

µ µ

µ µ

= < , ta bác bỏ

0H nếu

, 1nt t

α −<− .

2.Kiểm định giả thuyết về hiệu hai trung bình. Xét bài toán kiểm định (hai phía) giả thuyết về hiệu hai kỳ vọng:

0 1 2 0

1 1 2 0

:

:

H d

H d

µ µ

µ µ

− = − ≠, ở đây

0d là số đã biết.

Đây là bài toán kiểm định hai phía, các bước trong thủ tục tương tự như đã xét trong bài toán kiểm định về một trung bình, chỉ cần lưu ý tới công thức chon tiêu chuẩn kiểm định. Ta xét các trường hợp sau:

Page 105: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

105

a.Trường hợp 1: Biết 2

1σ và 2

2σ với cỡ mẫu đủ lớn.

Khi đó tiểu chuẩn kiểm định: 1 2 0

2 2

1 2

1 2

( )X X dZ

n n

σ σ

− −=

+

Với giả thiết 0

H là đúng thì Z có phân phối chuẩn tắc, kết hợp với mức ý nghĩa α ta sẽ xác định

được miền bác bỏ: /2 /2

( ; ] [ ; )z zα α

−∞ − ∪ +∞ , trong đó /2

được xác định từ Bảng A3.

b. Trường hợp 2: Chưa biết 2

1σ và 2

2σ nhưng 2 2 2

1 2σ σ σ= = , hai BNN có phân phối chuẩn.

Khi đó tiêu chuẩn kiểm định: 1 2 0

1 2

( )

1 / 1 /p

X X dT

S n n

− −=

+, với

2 22 1 1 2 2

1 2

( 1) ( 1)

2p

S n S nS

n n

− + −=

+ −

Với giả thiết 0

H là đúng thì T có phân phối Student 1 2

2v n n= + − bậc tự do.

Giả thuyết hai phía không bị bác bỏ khi: 1 2 1 2

/2, 2 /2, 2n n n nt t tα α+ − + −

− < < ,

hay miền bác bỏ là 1 2 1 2

/2; 2 /2; 2( ; ] [ ; )

n n n nt tα α+ − + −

−∞ − ∪ +∞ .

c. Trường hợp 3: Chưa biết 2

1σ và 2

2σ nhưng 2 2

1 2σ σ≠ , hai BNN có phân phối chuẩn.

Khi đó tiêu chuẩn kiểm định: 1 2 0

2 2

1 2

1 2

( )'

X X dT

S S

n n

− −=

+

Với giả thuyết đúng thì 'T có phân phối xấp xỉ Student với bậc tự do xác định bởi: 2 2 2

1 1 2 2

2 2 2 2

1 1 1 2 2 2

( / / )

[( / ) / ( 1)] [( / ) / ( 1)]

s n s nv

s n n s n n

+=

− + −.

Thủ tục kiểm định sẽ không bác bỏ 0

H khi:

/2, /2,'

v vt t tα α

− < <

Tức là miền bác bỏ là:

/2; /2;( ; ] [ ; ).

v vt tα α

−∞ − ∪ +∞

Chú ý. Ta cũng có thủ tục tương tự đối với bài toán kiểm định một phía, nhưng với lưu ý khi xác định miền bác bỏ. Xem trong Bảng sau:

Bài Toán kiểm định Tiêu chuẩn kiểm định Miền bác bỏ

0 1 2 0

1 1 2 0

:,

:

H d

H d

µ µ

µ µ

− = − <đã biết 1 2

,σ σ

1 2 0

2 2

1 1 2 2

( )

( / ) ( / )

x x dz

n nσ σ

− −=

+

z zα

<−

0 1 2 0

1 1 2 0

:,

:

H d

H d

µ µ

µ µ

− = − >đã biết 1 2

,σ σ 1 2 0

2 2

1 1 2 2

( )

( / ) ( / )

x x dz

n nσ σ

− −=

+

z zα

>

Page 106: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

106

0 1 2 0

1 1 2 0

:,

:

H d

H d

µ µ

µ µ

− = − < 1 2σ σ= chưa biết

1 2 0

1 2

( );

(1 / ) (1 / )p

x x dt

s n n

− −=

+

1 22v n n= + −

2 2

1 1 2 2

1 2

( 1) ( 1)

2p

n s n ss

n n

− + −=

+ −

t tα

<−

0 1 2 0

1 1 2 0

:,

:

H d

H d

µ µ

µ µ

− = − >1 2σ σ= chưa

biết

1 2 0

1 2

( );

(1 / ) (1 / )p

x x dt

s n n

− −=

+

1 22v n n= + −

2 2

1 1 2 2

1 2

( 1) ( 1)

2p

n s n ss

n n

− + −=

+ −

t tα

>

0 1 2 0

1 1 2 0

:,

:

H d

H d

µ µ

µ µ

− = − < 1 2σ σ≠ chưa biết

1 2 0

2 2

1 1 2 2

( )'

( / ) ( / )

x x dt

s n s n

− −=

+ 2 2 2

1 1 2 2

2 2 2 2

1 1 2 2

1 2

( / / )

( / ) ( / )

1 1

s n s nv

s n s n

n n

+=

+− −

't tα

<−

0 1 2 0

1 1 2 0

:,

:

H d

H d

µ µ

µ µ

− = − >1 2σ σ≠ chưa

biết

1 2 0

2 2

1 1 2 2

( )'

( / ) ( / )

x x dt

s n s n

− −=

+ 2 2 2

1 1 2 2

2 2 2 2

1 1 2 2

1 2

( / / )

( / ) ( / )

1 1

s n s nv

s n s n

n n

+=

+− −

't tα

>

C. KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ

1. Kiểm định một tỷ lệ đối với cỡ mẫu lớn

+ Tiêu chuẩn kiểm định: 0

0 0

X npZ

np q

−=

+ Để kiểm định 0 0

:H p p= , ta có giá trị quan sát được cho bởi: 0

0 0

x npz

np q

−= ,

0 01q p= −

Khi đó:

Đối với bài toán kiểm định hai phía: 0 0

:H p p= ; 1 0

:H p p≠

tại mức ý nghĩa α , miền bác bỏ là: /2 /2

( ; ) ( ; )z zα α

−∞ − ∪ +∞ trong đó 2

được xác định bởi:

2( )

2P Z z

αα> = .

Page 107: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

107

Đối với bài toán kiểm định một phía: 0 0

:H p p=

1 0

:H p p<

tại mức ý nghĩa α , miền bác bỏ là ( ; )zα

−∞ − trong đó zα

được xác định bởi:

( )P Z zα

α> = .

Đối với bài toán kiểm định một phía: 0 0

:H p p= ,

1 0

:H p p>

tại mức ý nghĩa α , miền bác bỏ là ( ; )zα+∞ trong đó z

α được xác định bởi:

( )P Z zα

α> = .

2. Kiểm định hiệu hai tỷ lệ với cỡ mẫu lớn

Xét bài toán kiểm định giả thuyết rằng: hai tỷ lệ hoặc hai tham số nhị thức là bằng nhau. Tức là ta muốn kiểm định giả thuyết

0 1 2:H p p=

với một trong các đối thuyết 1 2p p< ,

1 2p p> hoặc

1 2p p≠ .

+ Tiêu chuẩn kiểm định: 1 2

1 2

ˆ ˆ

ˆ [(1 / ) (1 / )]

P PZ

pq n n

−=

+.

trong đó: 1 2

1 2

ˆx x

pn n

+=

+, với

1 2,x x là số lần thành công trong mỗi mẫu, ˆ ˆ1 .q p= −

G/trị quan sát z để k/định 1 2p p= xác định bởi: 1 2

1 2

ˆ ˆ

ˆ [(1 / ) (1 / )]

p pz

pq n n

−=

+.

Khi đó miền bác bỏ:

+ Với đối thuyết 1 2p p≠ tại mức ý nghĩa α , miền bác bỏ là

/2 /2( ; ) ( ; )z z

α α−∞ − ∪ +∞ .

+ Với đối thuyết 1 2p p< , miền bác bỏ là ( ; )z

α−∞ − .

+ Với đối thuyết 1 2p p> , miền bác bỏ là ( ; )z

α+∞ .

V. HỔI QUY TUYẾN TÍNH 1. Kỳ vọng có điều kiện. a. Đối với biến ngẫu nhiên rời rạc. Kỳ vọng có điều kiện của BNN rời rạc Y với điều kiện X x= được xác định bởi:

Page 108: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

108

1

( | ) ( ; )n

i iY xi

E Y x y P X x Y yµ=

= = = =∑ .

Kỳ vọng có điều kiện của BNN rời rạc X với điều kiện Y y= được xác định bởi:

1

( | ) ( ; )n

i iX yi

E X y x P X x Y yµ=

= = = =∑ .

b. Đối với biến ngẫu nhiên liên tục.

Kỳ vọng có điều kiện của BNN liên tục Y với điều kiện X x= được xác định bởi:

( | ) ( | )Y x

E Y x yf y x dyµ

+∞

−∞

= = ∫ ,

Kỳ vọng có điều kiện của BNN liên tục X với điều kiện Y y= được xác định bởi:

( | ) ( | )X y

E X y xf x y dxµ

+∞

−∞

= = ∫

trong đó: ( | ) ( , )f y x f x y= với x không đổi

( | ) ( , )f x y f x y= với y không đổi. 2.Ước lượng tham số hồi quy.

+ Phương trình hồi quy tổng thể: Y x

xµ α β= +

+ Giả sử ước lượng của α và β lần lượt bằng a và b thì ta ta có thể ước lượng Y x

y µ=

theo đường hồi quy phù hợp (hoặc đường hồi quy thực nghiệm): y a bx= + . + Ta cần tìm a và b: các ước lượng của α và .β

Công thức:

Với mẫu ( , ); 1,2,...,i ix y i n= các ước lượng bình phương tối thiểu a và b của hệ số hồi

quy α và β xác định bởi công thức sau:

1 1 1 1

22

2

11 1

( )( )

( )

n n n n

i i i i i ii i i i

nn n

ii i

ii i

n x y x y x x y y

b

x xn x x

= = = =

== =

− − − = =

− −

∑ ∑ ∑ ∑

∑∑ ∑

1 1 .

n n

i ii i

y b x

a y bxn

= =

−= = −∑ ∑

Page 109: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

109

MỘT SỐ ĐỀ TỰ LUYỆN

ĐỀ SỐ 1

Câu 1. Một công ty sản xuất ra 23 loại sản phẩm bình dân, 20 loại sản phẩm trung cấp và 15 loại sản phẩm cao cấp. Công ty đó chọn ngẫu nhiên 30 loại sản phẩm để đem đi triển lãm. Tính xác suất để loại nào cũng có sản phẩm được chọn? Câu 2. Tỷ lệ người được trả lời thư chào hàng qua Email là một biến ngẫu nhiên liên tục X có hàm

mật độ 2( 2)

, (0;1)( ) 5

0 , (0;1)

xx

f xx

+∈

= ∉

.

Hỏi tỷ lệ trung bình người được trả lời thư và độ lệch chuẩn của X là bao nhiêu? Câu 3. Chiều cao của một mẫu ngẫu nhiên 50 sinh viên đại học cho thấy có giá trị trung bình 174.5cm và độ lệch chuẩn 6.9cm. a) Xác định khoảng tin cậy 98% cho chiều cao trung bình của tất cả sinh viên đó; b) Chúng ta có thể khẳng định điều gì với độ tin cậy 98% về sai số của ước lượng nếu chúng ta ước lượng chiều cao trung bình của tất cả các sinh viên là 174.5cm Câu 4. Bệnh A có thể được chữa khỏi bởi một trong hai loại thuốc B hoặc C. Công ty sản xuất thuốc B tuyên bố: tỉ lệ bệnh nhân khỏi bệnh do dùng thuốc của họ là 85%. Qua thử nghiệm cho thấy, trong số 250 bệnh nhân mắc bệnh A và dùng thuốc B thì 210 người khỏi bệnh; 200 bệnh nhân mắc bệnh A và dùng thuốc C thì 175 người khỏi bệnh.

a) Hiệu quả của loại thuốc B có đúng như họ quảng cáo không, với mức ý nghĩa 5%? b) Với mức ý nghĩa 1%, có thể cho rằng hiệu quả của 2 loại thuốc B và C là như nhau không?

Câu 5. Lượng chất rắn thoát ra từ một loại vật liệu xác định khi phơi nhiễm trong giai đoạn sấy khô với những khoảng thời gian khác nhau được thể hiện trong bảng dưới đây:

x (giờ) y (gram)

4,4 13,1 4,5 9,0 4,8 10,4 5,5 13,8 5,7 12,7 5,9 9,9 6,3 13,8 6,9 16,4 7,5 17,6 7,8 18,3

Xác định ước lượng của đường hồi quy tuyến tính tổng thể |Y xµ để dự đoán lượng chất rắn thoát ra

Page 110: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

110

ĐỀ SỐ 2

Câu 1. Trong hộp có 6 quả cầu vàng được đánh số từ 1 đến 6; 5 quả cầu đỏ được đánh số từ 1 đến 5; 4 quả cầu xanh được đánh số từ 1 đến 4. Lấy ngẫu nhiên 3 quả cầu. Tìm xác suất để 3 quả cầu ấy khác màu và khác số.

Câu 2. Cho X là biến ngẫu nhiên liên tục có hàm mật độ 2; 1

( ) .0 ; 1

kx

f x xx

= <

Xác định hằng số k và tính ( 5)P X ≥ . Câu 3. TÝnh kho¶ng tin cËy 98% tû lÖ s¶n phÈm cã lçi trong mét quá tr×nh khi x¸c ®Þnh ®−îc r»ng mét mÉu cã kÝch th−íc 100 th× cã 8 s¶n phÈm bÞ lçi.

CÇn mét mÉu lín bao nhiªu nÕu chóng ta muèn tin cËy 98% r»ng tû lÖ mÉu cña chóng ta n»m trong kho¶ng 0,05 tØ lÖ thËt sù c¸c s¶n phÈm cã lçi.

Câu 4. Cơ thể người cần khoảng 220 miligam natri một ngày. Khảo sát 20 loại suất ăn của một hãng, người ta thấy lượng natri trung bình trong đó là 244 miligam, với độ lệch chuẩn mẫu là 24,5 miligam. Với mức ý nghĩa 0,05; có thể nói lượng natri trung bình trong các suất ăn của hãng này là lớn hơn 220 miligam không? Giả sử phân phối của lượng natri là chuẩn.

Câu 5. Số liệu sau đưa ra điểm số môn Hóa của 12 sinh viên mới ngẫu nhiên tại một trường cao đẳng xác định phụ thuộc vào điểm số của các sinh viên này qua bài kiểm tra hệ số thông minh khi họ đang học sinh năm cuối của trường phổ thông.

Sinh viên Điểm kiểm tra, x Điểm môn Hóa, y 1 65 85 2 50 74 3 55 76 4 65 90 5 55 85 6 70 87 7 65 94 8 70 98 9 55 81

10 70 91 11 50 76 12 55 74

a. Xác định ước lượng của đường hồi quy tuyến tính tổng thể |Y xµ

Page 111: Lý thuyÕt Lý thuyÕt X¸C SUÊT THèX¸C SUÊT THèX¸C SUÊT THèNG …€¦ · Bài gi ảng Môn Toán 5- Xác su ... n cách th ực hi ện giai đoạn th ứ nh ất Có

Bài giảng Môn Toán 5- Xác suất Thống kê Tiến sỹ: Nguyễn Hữu Thọ 2014 -2015

111

ĐỀ SỐ 3

Câu 1. Một xạ thủ bắn vào bia với xác suất trúng điểm 10, 9, 8 lần lượt là 0,1; 0,2; 0,25 và xác suất trúng điểm nhỏ hơn 8 là 0,45. Người đó bắn 3 viên đạn. Tính xác suất để số điểm đạt được ít nhất là 28 điểm. Câu 2. Chỉ số IQ của 600 người nộp đơn xin học ở một trường đại học có phân phối chuẩn với trung bình là 115 và độ lệch chuẩn là 12. Nếu trường đại học đó đòi hỏi chỉ số IQ phải đạt ít nhất là 95. Hỏi có bao nhiêu sinh viên sẽ bị loại trong đợt xét tuyển hồ sơ theo tiêu chí trên? Câu 3. Một nghiên cứu được tiến hành để xác định liệu phương pháp xử lý có ảnh hưởng như thế nào đến lượng kim loại bị ăn mòn trong quá trình tẩy rỉ. Một mẫu ngẫu nhiên gồm 200 miếng được nhúng trong bể 24 giờ , thu được giá trị trung bình 12.2 mili mét kim loại bị ăn mòn và độ lệch chuẩn 1.1 mili mét. Một mẫu thứ hai gồm 200 miếng được đưa ra xử lý, sau 24 giờ nhúng trong bể thu được độ ăn mòn trung bình 9.1 mili mét kim loại, có độ lệch chuẩn 0.9 mili mét. Tính toán ước lượng khoảng tin cậy 95% cho hiệu số giữa các giá trị trung bình. Phương pháp xử lý đó có thể giảm được lượng trung bình kim loại bị lấy đi hay không? Câu 4. Thống kê sản lượng hàng tháng của một nhà máy sản xuất đồ chơi trong 16 tháng sử dụng máy cũ và 11 tháng sử dụng máy ép nhựa mới cho thấy (đơn vị tính: nghìn sản phẩm): Máy cũ 99,2 94,5 93,8 102,7 89,2 98,3 101,4 125,8 96,6 89,9 97,2 94 87,3 101,6 89,7 89,7 Máy mới 96,5 105,4 91,2 85 79,6 91,1 87,7 90,2 95,6 90 93,8 Với mức ý nghĩa 5%, hãy kiểm tra xem sự thay đổi máy móc có làm thay đổi sản lượng hàng tháng của nhà máy hay không?

Câu 5 . Để nghiên cứu khả năng chịu đựng của một loại côn trùng đối với một loại hóa chất X (đơn

vị mg ), người ta phun hóa chất đó tại nơi ở của loại côn trùng đó những lượng hóa chất khác nhau

và quan sát thời gian sồng Y (đơn vị ngày) của chúng và thu được kết quả

Lượng hóa chất X 1 2 3 4 5 6

Thời gian sống Y 35 25 27 13 7 11

Tìm phương trình đường hồi quy tuyến tính thực nghiệm của Y theo X .

Về nhà: Làm đề cương Ôn tập

Chúc các em Ôn thi và Thi đạt kết quả cao!