21
Wyklad 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkladzie normalnym Magdalena Frąszczak Wroclaw, 08.03.2017r Magdalena Frąszczak Wyklad 3 Testowanie hipotez statystycznych o wartości średniej

Wyk ad 3 Testowanie hipotez statystycznych o wartosci ...theta.edu.pl/wp-content/uploads/2011/10/Wyk3TH.pdf · Wykład 3 Testowanie hipotez statystycznych o wartości średniej i

Embed Size (px)

Citation preview

Wykład 3Testowanie hipotez statystycznych o wartościśredniej i wariancji z populacji o rozkładzie

normalnym

Magdalena Frąszczak

Wrocław, 08.03.2017r

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Model 1

Testowanie hipotez dla średniej w rozkładzie normalnym ze znanąwariancją

Niech X = (X1,X2, . . . ,Xn)′ oznacza próbę z rozkładu normalnegoN (µ, σ2), zakładamy, że σ2 jest znane. Testujemy hipotezę:

H0 : µ = µ0

Przy możliwych alternatywach:

H1 : µ 6= µ0H2 : µ < µ0H3 : µ > µ0

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Model 1

Statystyka testowa

Statystyka testowa postaci:

Z =X̄ − µ0σ

√n,

ma standardowy rozkład normalny N(0, 1).

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Model 1

Obszar odrzucenia hipotezy zerowej

Zbiór krytyczny przyjmuje postać (w zależności od alternatywy):

C1 : (−∞,−u1−α2 ] ∪ [u1−α2 ,∞) dla alternatywy H1C2 : (−∞,−u1−α] dla alternatywy H2C3 : [u1−α,∞) dla alternatywy H3

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.1

W pewnym dużym zakładzie cukierniczym norma technicznaprzewiduje średnio 85s. na spakowanie do kartonu 50 zajączkówwielkanocnych. Wiadomo, że czas wykonywania tego zadania jestzmienną losową o rozkładzie normalnym z odchyleniemstandardowym równym 15s. W związku z częstymi skargamirobotników na zbytnie zaniżanie norm fabrycznych, wykonanopomiary czasu pakowania zajączków u 200 losowo wybranychrobotników, otrzymując średni czas pakowania na poziomie 87s.Czy na poziomie istotności 0.05 można przyznać racjępracownikom?

Dane:σ = 15X̄ = 87n = 200

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.1 - c.d

TestujemyH0 : µ = 85H1 : µ > 85

Statystyka testowa przyjmuje wartość:

Z =X̄ − µ0σ

√n =

87− 8515

√200 = 1.885618

Zbiór krytyczny jest postaci: C : [u0.95,∞) = [1.64,∞)Wartość statystyki testowej mieści się w zbiorze krytycznym, azatem odrzucamy hipotezę zerową, zatem pracownicy mają rację.

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.2

Dla danych z przykładu 3.1 wyznaczyć moc testu.

Przy prawdziwości alternatywy statystyka testowa:

Z =X̄ − µ0σ

√n =

X̄ − µ1σ

√n+

µ1 − µ0σ

√n

∼ N(µ1 − µ0

σ

√n, 1)

Stąd

β(µ1) = Pµ1(Z > u1−α) = Pµ1

(X̄−µ1σ

√n + µ1−µ0

σ

√n ­ u1−α

)=

1− Φ(u1−α − µ1−µ0

σ

√n)

= 1− Φ(u0.95 − 87−8515

√200)

=

1− 0.404 = 0.596

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.2

Dla danych z przykładu 3.1 wyznaczyć moc testu.

Przy prawdziwości alternatywy statystyka testowa:

Z =X̄ − µ0σ

√n =

X̄ − µ1σ

√n+

µ1 − µ0σ

√n ∼ N

(µ1 − µ0

σ

√n, 1)

Stąd

β(µ1) = Pµ1(Z > u1−α) = Pµ1

(X̄−µ1σ

√n + µ1−µ0

σ

√n ­ u1−α

)=

1− Φ(u1−α − µ1−µ0

σ

√n)

= 1− Φ(u0.95 − 87−8515

√200)

=

1− 0.404 = 0.596

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Model 2

Testowanie hipotez dla średniej w rozkładzie normalnym znieznaną wariancją

Niech X = (X1,X2, . . . ,Xn)′ oznacza próbę z rozkładu normalnegoN (µ, σ2), gdzie parametry µ i σ2 są nieznane.Testujemy hipotezę:

H0 : µ = µ0

Przy możliwych alternatywach:

H1 : µ 6= µ0H2 : µ < µ0H3 : µ > µ0

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Model 2

Statystyka testowa

Statystyka testowa postaci:

T =X̄ − µ0

S

√n − 1,

przy prawdziwości H0 ma rozkład studenta z n − 1 stopniamiswobody.

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Model 2

Obszar odrzucenia hipotezy zerowej

Zbiór krytyczny przyjmuje postać (w zależności od alternatywy):

C1 : (−∞,−t1−α2 (n − 1)] ∪ [t1−α2 (n − 1),∞) dla alternatywy H1C2 : (−∞,−t1−α(n − 1)] dla alternatywy H2C3 : [t1−α(n − 1),∞) dla alternatywy H3

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.3

Szacuje się, że dzieci w wieku 3-5 lat przesypiają w trakcie dobyokoło 12 godzin. W celu zweryfikowania tej hipotezyprzeprowadzono badania na grupie 240 dzieci mierząc ich dobowyczas snu. W wyniku eksperymentu otrzymano, że średnia z czasusnu w badanej grupie wyniosła 11.2 h z odchyleniem standardowymS = 1.5h. Czy na poziomie istotności 0.01 możemy obalić hipotezęo średnim czasie snu, na rzecz alternatywy, że dzieci sypiają krócej?

Dane:X̄ = 11.2S = 1.5n = 240

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.3 - c.d.

TestujemyH0 : µ = 12H1 : µ < 12

Statystyka testowa przyjmuje wartość:

T =X̄ − µ0

S

√n − 1 =

11.2− 121.5

√239 = −8.245

Zbiór krytyczny jest postaci: C : (−∞,−t0.99(239)] = (−∞,−2.34]Wartość statystyki testowej mieści się w zbiorze krytycznym, azatem odrzucamy hipotezę zerową, zatem dzieci sypiają krócej niż12h.

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Testowanie hipotez dla wariancji w rozkładzie normalnym

Niech X = (X1,X2, . . . ,Xn)′ oznacza próbę z rozkładu normalnegoN (µ, σ2), gdzie parametry µ i σ2 są nieznane.Testujemy hipotezę:

H0 : σ = σ0

Przy możliwych alternatywach:

H1 : σ 6= σ0H2 : σ < σ0H3 : σ > σ0

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Statystyka testowa

Statystyka testowa jest postaci:

T =nS2

σ20,

gdzie S2 oznacza obciążony estymator wariancji. Przyprawdziwości H0 statystyka testowa ma rozkład Chi kwadrat zn − 1 stopniami swobody.

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Obszar odrzucenia hipotezy zerowej

Zbiór krytyczny przyjmuje postać (w zależności od alternatywy):

C1 : (0, χ2α2

(n − 1)] ∪ [χ21−α2(n − 1),∞) dla alternatywy H1

C2 : (0, χ2α(n − 1)] dla alternatywy H2C3 : [χ21−α(n − 1),∞) dla alternatywy H3

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.4

W pewnej firmie zatrudniającej 200 osób przypuszcza się. żewariancja zarobków pracowników nie jest znacząco różna od 18000,zbadano zarobki losowo wybranych 80 pracowników i takodchylenie standardowe w tej próbie wyniosło 140 zł. Czy napoziomie istotności 0.05 przypuszczenie zarządu można uznać zaprawdziwe?

Dane:n = 80S = 140S2 = 19600

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.4 - c.d.

TestujemyH0 : σ2 = 18000H1 : σ2 6= 18000

Statystyka testowa przyjmuje wartość:

T =nS2

σ20=

156800018000

= 87.1

Zbiór krytyczny jest postaci:C : (0, χ20.25(79)] ∪ [χ20.75(79),∞) = (0, 56.3089] ∪ [105.4728,∞)Wartość statystyki testowej nie mieści się w zbiorze krytycznym, azatem nie mamy podstaw do odrzucenia hipotezy zerowej.

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Przykład 3.5 - Pakiet R

Czas rozwiązywania jednego zadania na egzaminie z matematykijest zmienną losową o rozkładzie normalnym z nieznaną wariancją.Przeprowadzający egzamin zaplanował na rozwiązanie jednegozadania 10 minut. Studenci są przekonani, że zaplanowany czasjest zbyt krótki. Dla 7 losowo wybranych studentów zmierzono czasrozwiązywania przez nich zadania otrzymując następujące wyniki:16.0, 19.5, 7.5, 11.0, 9.0, 15.5, 11.0. Czy na poziomie istotnościα = 0.05 przekonanie studentów można uznać za słuszne?

TestujemyH0 : µ = 10H1 : µ > 10

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Pakiet R

x<-c(16.0, 19.5, 7.5, 11.0, 9.0, 15.5, 11.0)t.test(x, alternative=’greater ’, mu=10)

One Sample t-test

data: xt = 1.7103, df = 6, p-value = 0.06903alternative hypothesis: true mean is greater than 1095 percent confidence interval:9.620619 Infsample estimates:mean of x12.78571

Zatem wartość statystyki testowej to T = 1.6273, p = 0.069 > 0.05 = α,a zatem nie mamy podstaw do odrzucenia hipotezy zerowej,założony przez wykładowcę czas jest wystarczający.

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym

Literatura:

Bartoszewicz J.,Wykłady ze statystyki matematycznej, PWN,Warszawa 1989.

M. Krzyśko,Statystyka matematyczna, Wyd. UAM, Poznań2004.

R. Zieliński,Siedem wykładów wprowadzających do statystykimatematycznej, PWN, Warszawa 1990.

Magdalena Frąszczak Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym