50
Chap 7-1 Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chapter 7 Sampling and Sampling Distributions Statistics for Business and Economics 6 th Edition

Chon mau va phan phoi chon mau

Embed Size (px)

Citation preview

Page 1: Chon mau va phan phoi chon mau

Chap 7-1Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc.

Chapter 7

Sampling and Sampling Distributions

Statistics for Business and Economics

6th Edition

Page 2: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-2

Chapter Goals

After completing this chapter, you should be able to: Describe a simple random sample and why sampling is

important Explain the difference between descriptive and inferential

statistics Define the concept of a sampling distribution Determine the mean and standard deviation for the

sampling distribution of the sample mean, Describe the Central Limit Theorem and its importance Determine the mean and standard deviation for the

sampling distribution of the sample proportion, Describe sampling distributions of sample variances

X

Page 3: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-3

Descriptive statistics Collecting, presenting, and describing data

Inferential statistics Drawing conclusions and/or making decisions

concerning a population based only on sample data

Tools of Business Statistics

Page 4: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-4

A Population is the set of all items or individuals of interest Examples: All likely voters in the next election

All parts produced todayAll sales receipts for November

A Sample is a subset of the population Examples: 1000 voters selected at random for interview

A few parts selected for destructive testing

Random receipts selected for audit

Populations and Samples

Page 5: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-5

Population vs. Sample

a b c d

ef gh i jk l m n

o p q rs t u v w

x y z

Population Sample

b c

g i n

o r u

y

Page 6: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-6

Why Sample?

Less time consuming than a census

Less costly to administer than a census

It is possible to obtain statistical results of a sufficiently high precision based on samples.

Page 7: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-7

Simple Random Samples

Every object in the population has an equal chance of being selected

Objects are selected independently

Samples can be obtained from a table of random numbers or computer random number generators

A simple random sample is the ideal against which other sample methods are compared

Page 8: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-8

Trình bày quan điểm về đặc tính của tổng thể dựa trên kết quả phân tích đặc tính của mẫu

Số thống kê mẫu Tham số tổng thể (biết) suy diễn (không biết, nhưng có thể

ước lượng bằng mẫu)

Sample Population

Suy diễn thống kê

Page 9: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-9

Suy diễn thống kê

Ước lượng Ví dụ: ước lượng trung bình trọng

lượng tổng thể bằng trung bình trọng lượng mẫu

Kiểm định giả thuyết Ví dụ: dùng chứng cứ thu thập

được từ mẫu để kiểm định lời tuyên bố rằng trung bình trọng lượng tổng thể là 120kg

Rút ra kết luận hoặc ra quyết định về tổng thể dựa vào kết quả mẫu

Page 10: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-10

Phân phối chọn mẫu

Phân phối chọn mẫu là phân phối của tất cả các giá trị số thống kê có thể nhận với 1 mẫu có kích thước nhất định rút ra từ tổng thể

Page 11: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-11

Chapter Outline

Sampling Distributions

Sampling Distribution of

Sample Mean

Sampling Distribution of

Sample Proportion

Page 12: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-12

Phân phối chọn mẫu củaTrung bình mẫu

Sampling Distributions

Sampling Distribution of

Sample Mean

Sampling Distribution of

Sample Proportion

Page 13: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-13

Tạo phân phối chọn mẫu

Giả sử có 1 tổng thể như sau…

Kích thước tổng thể N=4

Biến ngẫu nhiên X là tuổi

của các cá nhân trong tổng thể

Giá trị của X:

18, 20, 22, 24 (tuổi)

A B C D

Page 14: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-14

.25

0 18 20 22 24

A B C D

phân phối đều

P(x)

x

(continued)

Các số đo tổng hợp cho phân phối tổng thể:

Tạo phân phối chọn mẫu

214

24222018

N

Xμ i

2.236N

μ)(Xσ

2i

Page 15: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-15

1st 2nd Observation Obs 18 20 22 24

18 18,18 18,20 18,22 18,24

20 20,18 20,20 20,22 20,24

22 22,18 22,20 22,22 22,24

24 24,18 24,20 24,22 24,24

16 mẫu có thể rút ra từ tổng thể(lấy mẫu

có hoàn lại)

Xét tất cả các mẫu có kích thước n = 2

1st 2nd Observation Obs 18 20 22 24

18 18 19 20 21

20 19 20 21 22

22 20 21 22 23

24 21 22 23 24

(continued)Tạo phân phối chọn mẫu

16 trung bình mẫu

Page 16: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-16

1st 2nd Observation Obs 18 20 22 24

18 18 19 20 21

20 19 20 21 22

22 20 21 22 23

24 21 22 23 24

Phân phối chọn mẫu của trung bình mẫu

18 19 20 21 22 23 240

.1

.2

.3 P(X)

X

Phân phối trung bình mẫu

16 trung bình mẫu

_

Tạo phân phối chọn mẫu(continued)

(không còn là pp đều )

_

Page 17: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-17

Các số đo tổng hợp cho phân phối chọn mẫu này

Tạo phân phối chọn mẫu(continued)

μ2116

24211918

N

X)XE( i

1.5816

21)-(2421)-(1921)-(18

N

μ)X(σ

222

2i

X

Page 18: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-18

So sánh pp tổng thể với pp mẫu

18 19 20 21 22 23 240

.1

.2

.3 P(X)

X 18 20 22 24

A B C D

0

.1

.2

.3

Tổng thể N = 4

P(X)

X _

1.58σ 21μXX2.236σ 21μ

Trung bình mẫu n = 2

_

Page 19: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-19

Giá trị kỳ vọng của trung bình mẫu

Coi X1, X2, . . . Xn tượng trưng cho một ngẫu nhiên rút từ tổng thể

Giá trị trung bình mẫu của các giá trị quan sát được được định nghĩa là

n

1iiX

n

1X

Page 20: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-20

Sai số chuẩn của số trung bình

Các mẫu khác nhau (nhưng cùng kích thước) rút từ 1 tổng thể sẽ cho các giá trị trung bình khác nhau

Số đo khuynh hướng thay đổi của số trung bình từ mẫu này sang mẫu khác là Sai số chuẩn của số trung bình

Sai số chuẩn của số trung bình giảm khi kích thước mẫu gia tăng

n

σσ

X

Page 21: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-21

Nếu tổng thể thường

Nếu tổng thể theo phân phối thường với 2 tham

số μ và σ, phân phối chọn mẫu của cũng sẽ

là thường với 2 số thống kê

and

X

μμX

n

σσ

X

Page 22: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-22

Giá trị Z cho phân phối chọn mẫu

Giá trị Z cho phân phối chọn mẫu của

where: = sample mean

= population mean

= population standard deviation

n = sample size

Xμσ

n

σμ)X(

σ

μ)X(Z

X

X

Page 23: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-23

Thừa số điều chỉnh tổng thể hữu hạn

Áp dụng thừa số điều chỉnh tổng thể hữu hạn nếu 1 phần tử trong tổng thể không thể được chọn

nhiều hơn 1 lần trong 1 mẫu (lấy mẫu không hoàn lại)

kích thước mẫu lớn hơn 5% tổng thể

khi đó :

or

1N

nN

n

σσ

X

V(X ) =σ 2

n

N − n

N −1

Page 24: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-24

Thừa số điều chỉnh tổng thể hữu hạn

khi kích thước mẫu lớn hơn 5% tổng thể

1NnN

n

σ

μ)X(Z

Page 25: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-25

Normal Population Distribution

Normal Sampling Distribution (has the same mean)

Tính chất phân phối chọn mẫu

(i.e. không chệch )xx

x

μμx

μ

Page 26: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-26

Tính chất phân phối chọn mẫu

Lấy mẫu có hoàn lại

khi n tăng

giảmMẫu lớn hơn

Mẫu nhỏ hơn

x

(continued)

μ

Page 27: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-27

Khi tổng thể không theo pp thường

Áp dụng Định lý giới hạn trung tâm:

Kể cả khi tổng thể không theo pp thường ,

…pp của trung bình mẫu của tổng thể vẫn tương

đương pp thường nếu kích thước mẫu đủ lớn

Properties of the sampling distribution:

andμμx

n

σσx

Page 28: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-28

n↑

Định lý giới hạn trung tâm

As the sample size gets large enough…

the sampling distribution becomes almost normal regardless of shape of population

x

Page 29: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-29

Population Distribution

Sampling Distribution (becomes normal as n increases)

Central Tendency

Variation

x

x

Larger sample size

Smaller sample size

If the Population is not Normal(continued)

Sampling distribution properties:

μμx

n

σσx

μ

Page 30: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-30

How Large is Large Enough?

For most distributions, n > 25 will give a sampling distribution that is nearly normal

For normal population distributions, the sampling distribution of the mean is always normally distributed

Page 31: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-31

Ví dụ

Tổng thể: μ = 8 , σ = 3. Chọn mẫu ngẫu nhiên kích thước n = 36.

Xác suất trung bình mẫu giữa 7.8 và 8.2 là bao nhiêu?

Page 32: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-32

Ví dụ

Solution:

Even if the population is not normally distributed, the central limit theorem can be used (n > 25)

… so the sampling distribution of is approximately normal

… with mean = 8

…and standard deviation

(continued)

x

0.536

3

n

σσx

Page 33: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-33

Example

Solution (continued):(continued)

P(7.8 < σX

< 8.2) = P7.8 - 83

36

<σX -σ

σn

<8.2 - 83

36

⎜ ⎜

⎟ ⎟

= P(-0.4 < Z < 0.4 )

Z7.8 8.2 -0.4 04

Sampling Distribution

Standard Normal Distribution .1915

+.1915

Population Distribution

??

??

?????

??? Sample Standardize

8μ 8μX 0μz xX

Page 34: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-34

Khoảng tin cậy

Goal: Xác định khoảng giá trị nhiều khả năng chứa đựng trung bình mẫu, khi biết trung bình và phương sai tổng

By the Central Limit Theorem, we know that the distribution of X is approximately normal if n is large enough, with mean μ and standard deviation

Coi zα/2 là giá trị z sao phần đuôi phải của pp thường có diện

tích bằng α/2 (i.e., khoảng giá trị - zα/2 đến zα/2 có xác suất 1 – α)

Thì

là khoảng chứa X với xác suất1 – α

X/2σzμ

Page 35: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-35

Sampling Distributions ofSample Proportions

Sampling Distributions

Sampling Distribution of

Sample Mean

Sampling Distribution of

Sample Proportion

Page 36: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-36

Tỷ lệ tổng thể, P

P = tỷ lệ tổng thể có đặc tính ta quan tâm

Tỷ lệ mẫu ( ) cho ta ước lượng P

0 ≤ ≤ 1

0 ≤ ≤ 1

tuân theo pp nhị thức, nhưng xấp xỉ thường khi nP(1 – P) > 9€

ˆ P =X

n=

number of items in the sample having the characteristic of interest

sample size

Page 37: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-37

Phân phối chọn mẫu của P

Tính xấp xỉ bằng pp thường

Tính chất:

and

(where P = population proportion)

Sampling Distribution

.3

.2

.1 0

0 . 2 .4 .6 8 1

p)PE( ˆ

σ ˆ P

2 = VX

n

⎝ ⎜

⎠ ⎟=

P(1− P)

n

^

)PP( ˆ

Page 38: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-38

Giá trị Z cho tỷ lệ

nP)P(1

PP

σ

PPZ

P

ˆˆ

ˆ

Chuẩn hóa thành Z với công thức:P̂

Page 39: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-39

Ví dụ

Nêu tổng thể người đi bầu cử ủng hộ Ông A là

P = 0.4, xác suất mẫu cỡ 200 cho kết quả giữa

0w4 và 0.45 là?

i.e.: if P = .4 and n = 200, what is

P(.40 ≤ ≤ .45) ?P̂

Page 40: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-40

Ví dụ

if P = .4 and n = 200, what is

P(.40 ≤ ≤ .45) ?

(continued)

.03464200

.4).4(1

n

P)P(1σ

P

ˆ

1.44)ZP(0

.03464

.40.45Z

.03464

.40.40P.45)PP(.40

ˆ

Tìm :

Chuyển sang pp thường chuẩn:

Pσ ˆ

Page 41: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-41

Ví dụ

Z.45 1.44

.4251

Standardize

Sampling DistributionStandardized

Normal Distribution

if p = .4 and n = 200, what is

P(.40 ≤ ≤ .45) ?

(continued)

dùng Bảng thường chuẩn: P(0 ≤ Z ≤ 1.44) = .4251

.40 0

Page 42: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-42

Sampling Distributions ofSample Proportions

Sampling Distributions

Sampling Distribution of

Sample Mean

Sampling Distribution of

Sample Proportion

Sampling Distribution of

Sample Variance

Page 43: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-43

Sample Variance

Let x1, x2, . . . , xn be a random sample from a population. The sample variance is

the square root of the sample variance is called the sample standard deviation

the sample variance is different for different random samples from the same population

n

1i

2i

2 )x(x1n

1s

Page 44: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-44

Sampling Distribution ofSample Variances

The sampling distribution of s2 has mean σ2

If the population distribution is normal, then

If the population distribution is normal then

has a 2 distribution with n – 1 degrees of freedom

22 σ)E(s

1n

2σ)Var(s

42

2

2

σ

1)s-(n

Page 45: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-45

The Chi-square Distribution

The chi-square distribution is a family of distributions, depending on degrees of freedom:

d.f. = n – 1

Text Table 7 contains chi-square probabilities

0 4 8 12 16 20 24 28 0 4 8 12 16 20 24 28 0 4 8 12 16 20 24 28

d.f. = 1 d.f. = 5 d.f. = 15

2 22

Page 46: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-46

If the mean of these three values is 8.0, then X3 must be 9 (i.e., X3 is not free to vary)

Degrees of Freedom (df)

Here, n = 3, so degrees of freedom = n – 1 = 3 – 1 = 2

(2 values can be any numbers, but the third is not free to vary for a given mean)

Idea: Number of observations that are free to vary after sample mean has been calculated

Example: Suppose the mean of 3 numbers is 8.0

Let X1 = 7

Let X2 = 8

What is X3?

Page 47: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-47

A commercial freezer must hold a selected temperature with little variation. Specifications call for a standard deviation of no more than 4 degrees (a variance of 16 degrees2).

A sample of 14 freezers is to be tested

What is the upper limit (K) for the sample variance such that the probability of exceeding this limit, given that the population standard deviation is 4, is less than 0.05?

Chi-square Example

Page 48: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-48

Finding the Chi-square Value

Use the the chi-square distribution with area 0.05 in the upper tail:

probability α = .05

213

2

213

= 22.36

= 22.36 (α = .05 and 14 – 1 = 13 d.f.)

2

22

σ

1)s(n χ Is chi-square distributed with (n – 1) = 13

degrees of freedom

Page 49: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-49

Chi-square Example

0.0516

1)s(nPK)P(s 2

13

22

χSo:

(continued)

213 = 22.36 (α = .05 and 14 – 1 = 13 d.f.)

22.3616

1)K(n

(where n = 14)

so 27.521)(14

)(22.36)(16K

If s2 from the sample of size n = 14 is greater than 27.52, there is strong evidence to suggest the population variance exceeds 16.

or

Page 50: Chon mau va phan phoi chon mau

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-50

Chapter Summary

Introduced sampling distributions

Described the sampling distribution of sample means For normal populations

Using the Central Limit Theorem

Described the sampling distribution of sample proportions

Introduced the chi-square distribution

Examined sampling distributions for sample variances

Calculated probabilities using sampling distributions