40
1 8-1: Oversikt 2 8-2: Grunnleggende hypotesetesting 3 Section 8-3: Å teste påstander om andeler 4 Section 8-5: Teste en påstand om gjennomsnittet

8-2: Grunnleggende hypotesetesting Section 8-3: Å teste ...home.bi.no/a0710194/Teaching/BI-Mathematics/MET-3431/2012/notater9.pdf · Testobservatoren(eng: test statistic) beregnes

Embed Size (px)

Citation preview

1 8-1: Oversikt

2 8-2: Grunnleggende hypotesetesting

3 Section 8-3: Å teste påstander om andeler

4 Section 8-5: Teste en påstand om gjennomsnittet

Definisjoner

HypoteseEn hypotese er en påstand om noe i en populasjonEn hypotesetest er en standard prosedyre for å teste om enhypotese er sann eller ikke.

ExampleHypotese: Andelen iPhone brukere på BI er p = 0.23Hypotesetest for en andel:

1 Hent inn en representativ stikkprøve

2 Beregn andelen iPhone brukere i stikkprøven

3 Bruk denne andelen til å avgjøre om hypotesen p = 0.23 er

sann

4 Detaljer om dette kommer i seksjon 8-3...

Hypotesetesting

Rare event ruleVi har en hypotese om noe. Vi antar den er sann.Vi observerer noe i stikkprøven som ser uvanlig utKonklusjon: Da er det noe galt med hypotesen, og vi avgjør atden er usann.

Hypotesetest = BeslutningsregelDu må velge en av to konkurrerende hypoteser.

Nullhypotesen H0 inneholder alltid =Alternativhypotesen H1 inneholder <, > eller �=

Du må velge H0 eller H1. Du antar H0 er sannBeslutningsgrunnlaget er stikkprøven.Dersom stikkprøven ser "uvanlig"ut, så velger vi H1

Dersom stikkprøven ikke er uvanlig, så velger vi H0

Fiktivt eksempel: FemiPower

ExampleSelskapet FemiPower selger piller til kvinner som prøver å bligravide.Selskapet påstår at pillene øker sjansen for å få en jente

For å teste om FemiPower gir økt sjanse til jente så gir vi pillene tilflere kvinner, og 100 av disse blir gravide. Som utgangspunkt antarvi at FemiPower ikke virker. (Nullhypotesen)

Bruk sunn fornuft. Hva vil du konkludere med i disse toscenariene:

1 52 av 100 kvinner fikk jente?

2 91 av 100 kvinner fikk jente?

Scenarie 1; 52 av 100 er jenter

52 av 100 er jenterNullhypotesen er at FemiPower ikke virker.

Da vil vi normalt forvente omkring 50 jenterVi fikk 52, noe som er nær 50, og det kan lett skje ved entilfeldighet.Antagelsen om ingen effekt ser ut til å være korrektDet er ikke tilstrekkelig grunnlag til å hevde at FemiPower

virker

Scenarie 2; 91 av 100 er jenter

91 av 100 er jenterNullhypotesen er at FemiPower ikke virker.

Da skal det utrolig mye til at 91 av 100 babyer er jenter! Vikan forklare dette på to måter

1 En ekstremt uvanlig ting har skjedd, eller

2 FemiPower virker

Det ekstremt usannsynlige i 91 av 100 jenter tyder på atFemiPower virkerDet er tilstrekkelig grunnlag til å hevde at FemiPower virker

Grunnleggende begreper Kapittel 8

NullhypoteseAlternativ hypoteseTestobservatorKritisk område og Kritisk verdiSignifikansnivåp-verdiType I og Type II feil

Gjør en innsats for å forstå disse ordene.

Postbanken eksempel

Exampleµ er gjennomsnittet på spørsmålet Anbefale for alle kunderLedelsen: Hvis µ < 7.0⇒ sett inn tiltak for å øke µ

I fila Bank2008 : x = 6.4 for 91 kunderNullhypotesen er at gjennomsnittet i populasjonen er µ = 7.0Må tiltak iverksettes, mao. er µ < 7?Vi må finne ut om det er uvanlig at 91 kunder gir etgjennomsnitt x = 6.4 når µ = 7Sannsynligheten viser seg (se senere) å være 2.3% for å få 6.4eller lavere dersom µ = 7Dette er så uvanlig at vi må anta at µ < 7.0Nullhypotesen forkastes: Iverksett tiltak!

Hva er nullhypotesen og hva er alternativhypotesen ?

H0 og H1

Hypotesene er alltid påstander om parametere som µ og p.Skriv påstanden ned på symbolsk formSkriv også ned på symbolsk form det motsatte av påstandenLa H1 være den av påstandene som ikke inneholder =

Den andre påstanden skrives nå med = og den blirnullhypotesen H0

Figur 8-2 i boka

Hvis du selv vil vise at en påstand er sann, så formuler den som H1med <, > eller �=

H0 H1= <> �=

Hva er nullhypotesen og hva er alternativhypotesen ?

ExampleHer er to påstander.

Andelen studenter som sykler til skolen er mer enn 0.5Gjennomsnittshøyden til volleyballspillere i eliten er 189 cm

Skriv opp hypotesene for hver påstand.

Svar:H0 : p = 0.5, H1 : p > 0.5H0 : µ = 189, H1 : µ �= 189.

Testobservator

Testobservatoren brukes til å velge H0 eller H1

Testobservatoren(eng: test statistic) beregnes ifra stikkprøvenDen er beregnet under forutsetning av at H0 er sann

ExampleFor å teste hypoteser om andelen bruker vi testobservatorenz = p̂−p0q

p0(1−p0)n

Av n = 880 studenter bruker 56% lesesalen ukentligVi forutsetter at H0 : p = 0.5 er sann. Da blir testobservatorenz = 0.56−0.5q

0.5(1−0.5)880

= 3.56 Vi vet at en z-verdi på 3.56 er ’uvanlig’.

Stikkprøve andelen på 56% er derfor signifikant forskjellig fra50% (figur neste side)Vi konkluderer med at mer enn halvparten bruker lesesalenukentlig

Forkastningsområdet (eng: critical region) er de verdiene tiltestobservatoren som gjør at vi må forkaste nullhypotesen.

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Critical Region, Critical Value, Test Statistic

Testens signifikansnivå α

Signifikansnivået angis med α

Det er sannsynligheten for at testobservatoren havner iforkastningsområdet dersom H0 er sannAnalogi til rettssal: Sannsynligheten for at en uskyldig blirdømtVanlige valg er α = 0.1, α = 0.5 og α = 0.01.

Kritisk verdiEn kritisk verdi separerer forkastningsområdet fra de verdier avtestobservatoren som ikke resulterer i å forkaste H0

I figuren på forrige side er kritisk verdi z = 1.645

Tosidig hypotesetest

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Two-tailed Test

H0: =

H1: !

" likt fordelt i de to halene

til forkastningsområdet

Betyr mindre enn eller større enn

Høyresidig hypotesetest

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Right-tailed Test

H0: =

H1: >

Mot høyre

Venstresidig hypotesetest

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Left-tailed Test

H0: =

H1: <

Mot venstre

p-verdien

p-verdienAntar at H0 er sannRegner ut testobservatoren for testenp-verdien er sannsynligheten for å få en verdi påtestobservatoren som er minst like uvanlig som den du fikkNullhypotesen forkastes hvis p-verdien er mindre ennsignifikansnivået

To metoder for hypotesetesting

HypotesetestingKonklusjonen av testen er enten

1 Forkast nullhypotesen, eller

2 Ikke forkast nullhypotesen

Den tradisjonelle metoden1 Forkast nullhypotesen dersom testobservatoren er i

forkastningsområdet2 Ikke forkast nullhypotesen dersom testobservatoren ikke er i

forkastningsområdet

p-verdi metoden1 p-verdien er mindre enn signifikansnivået α → Forkast H0

2 p-verdien er større enn signifikansnivået α → Ikke forkast H0

p-verdi metoden

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Comprehensive Hypothesis Test –P-Value Method

Tradisjonell metode

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Comprehensive Hypothesis Test – Traditional Method

Bestemme p-verdien

Dersom H1 er tosidig, er p-verdien arealet i to halerDersom H1 er ensidig, er p-verdien arealet i en hale

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Procedure for Finding P-ValuesFigur 8-6

Eksempel A

ExampleSignifikansnivået er α = 0.05 og vi skal teste påstanden om atandelen p > 0.25. Stikkprøven gir testobservatoren z = 1.18

SpørsmålEr testen en- eller tosidig?Finn p-verdienKom til en konklusjon om nullhypotesen H0

SvarHøyresidig test. A2: arealet til høyre for z = 1.18 er 0.1190p-verdien 0.1190 er større enn α = 0.05p verdien er relativt stor, så dette kunne ha skjedd ved entilfeldighetVi har ikke grunnlag til å forkaste H0 : p = 0.25

Eksempel B

ExampleSignifikansnivået er α = 0.05 og vi skal teste påstanden om atandelen p �= 0.25. Stikkprøven gir testobservatoren z = 2.34

SpørsmålEr testen en- eller tosidig?Finn p-verdienKom til en konklusjon om nullhypotesen H0

SvarTosidig test. A2: arealet til høyre for z = 2.34 er 0.0096p-verdien 2 · 0.0096 = 0.0192 er mindre enn α = 0.05p verdien er relativt liten, så dette kunne ikke ha skjedd ved entilfeldighetVi har grunnlag til å forkaste H0 : p = 0.25

Type I og Type II feil

En hypotesetest kan gi feil konklusjon. Det kan skje på to måter.

Type I feilH0 er egentlig sann, men du forkaster H0

α - signifikansnivået- er sannsynligheten for å begå en type Ifeil.

Type II feilH0 er egentlig gal, men du forkaster ikke H0

β er symbolet for sannsynligheten for en Type II feil, også kalttestens styrke (eng: power)

Type I og Type II feil

Fire ting kan skje når du tester en hypotese:

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Type I and Type II Errors

Oppsummering

Vi har diskutert:Null- og alternativ hypoteserTestobservatorSignifikansnivåp-verdiBeslutningsregel (tradisjonell og p-verdi metoden)Type I og II feil

Testen for en andel i populasjonen

Notasjonn: størrelsen på stikkprøvenp̂: andelen i stikkprøvenp: andelen i populasjonen, ifølge nullhypotesenq = 1− p

Forutsetninger for testenStikkprøven er et tilfeldig utvalgBetingelser for binomialfordeling holder (section 5-3)np ≥ 5 og n(1− p) ≥ 5

Testobservatoren for test om en andel

Testobservator

z =p̂ − p�p(1−p)

n

er tilnærmet normalfordelt når forutsetningene på forrige sideholder.

ExampleI en spørreundersøkelse oppgir 56% av 880 studenter at debruker lesesalen ukentligStudentavisa OUTSIDE skriver i en overskrift at flere ennhalvparten av BI studentene bruker lesesalen ukentligHar OUTSIDE grunnlag for denne påstanden?H0 : p = 0.5 og H1 : p > 0.5. Høyresidig test

Vi bruker p-verdi metoden:1 np = 880 · 0.5 = 440 ≥ 5 and n(1− p) = 880 · 0.5 = 440 ≥ 52 p̂ = 0.56 Testobservator er z = 0.56−0.5q

0.5(1−0.5)880

= 3.56

3 Tabel A2: Arealet til venstre for z = 3.56 er 0.99994 p-verdien er 1− 0.9999 = 0.0001, mye lavere enn α = 0.055 OUTSIDE har grunnlag for påstanden sin

Lesesal eksempel

p-verdien er svært liten, så nullhypotesen forkastes.

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Example: An article distributed by the Associated Press included these results from a nationwide survey: Of 880 randomly selected drivers, 56% !

H0: p = 0.5

H1: p > 0.5

" = 0.05

z = 3.56

Lesesal eksempel; Tradisjonell metode

ExampleVi kan også bruke tradisjonell metode:

1 En høyrehalet test, så α = 0.05 forkastningsområdet ligger ihøyre hale

2 Den kritiske verdien er da z = 1.6453 p̂ = 0.56 Testobservator er

z =0.56− 0.5�

0.5(1−0.5)880

= 3.56

4 Siden testobservatoren z = 3.56 er større enn den kritiskeverdien z = 1.645, så forkaster vi H0

5 Det er tilstrekkelig grunnlag til å si at andelen er over 0.5

ExampleVi kan også bruke tradisjonell metode:

1 En høyrehalet test, så α = 0.05 forkastningsområdet ligger ihøyre hale

2 Den kritiske verdien er da z = 1.6453 p̂ = 0.56 Testobservator er

z =0.56− 0.5�

0.5(1−0.5)880

= 3.56

4 Siden testobservatoren z = 3.56 er større enn den kritiskeverdien z = 1.645, så forkaster vi H0

5 Det er tilstrekkelig grunnlag til å si at andelen er over 0.5

Bank2008.jmp

Example1 En leder i Sparebank1 påstår at andelen kunder med

universitetsutdannelse er mer enn 50 %2 I stikkprøven har 48 av 91 universitetsutdannelse3 H0 : p = 0.5 versus H1 : p > 0.5. Vi tester på α = 0.05 nivået4 p̂ = 0.527 Testobservator er

z =0.527− 0.5�

0.5·0.591

= 0.52

5 Siden testen er ensidig, er p-verdien arealet i halen fraz = 0.52 og oppover Tabell A2: 0.70. Den kritiske verdien erda 1− 0.7 = 0.3

6 Siden p-verdien er større enn α = 0.05, konkluderer vi med atdet ikke er tilstrekkelig grunnlag til å forkaste H0

z-testen for én andel

ExampleStortingsvalget 2009: FrP fikk 26.5 % i Rogaland2010 meningsmåling: av 186 av 784 ville stemt FrPEr det en signifikant forskjell fra 2009? Signifikansnivå α = 0.1

SvarTosidig test med hypotesene H0 : p = 0.265 vs H1 : p �= 0.265.Testobservator er

z =186784 − 0.265

�0.265(1−0.265)

784

= −1.76

Tabell A2: arealet til venstre for z = −1.76 er 0.0392 så p-verdiener 2 · 0.0392 = 0.0784 . p-verdien mindre enn 0.1: Det er grunnlagtil å hevde at FrP sin oppslutning er endret

FrP eksempel

p-verdien er 0.0784, dvs. arealet i de to halene. Sidensignifikansnivået var satt til α = 0.1 så forkastes H0.

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Standard Normalfordeling

x

dnor

m(x

, 0, 1

)

Hypotesetest for gjennomsnittet

ForutsetningerVi forutsetter at:

Stikkprøven er tilfeldigDataene er normalfordelt, eller at n > 30

HypoteseneNullhypotesen er at gjennomsnittet i populasjon µ er enspesifikk verdiAlternativhypotesen kan være tosidig ( �=), eller ensidig (< eller>)

Testobservator

t =x − µ

s/√

n

er t-fordelt med n − 1 frihetsgrader. Kritiske verdier i Tabell A3

Tabell A3For hypotesetest om en andel er p-verdi metoden enklest.Tabell A2 gir p-verdier.For hypotesetest om gjennomsnitt er det bedre medtradisjonell metode, der testingen skjer med kritiske verdierTabell A3 gir kritiske verdier og forkastningsområdetDersom testobservatoren er mer ekstrem enn den kritiskeverdien, så forkastes H0

Copyright © 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.

Example: Assuming that neither software nor a TI-83 Plus calculator is available, use Table A-3 to find a range of values for the P-value corresponding to the given results.

Hypotesetest for gjennomsnittet

ExampleTenk deg følgende 3 situasjoner. Bruk tabell A3 til å avgjøre om H0forkastes

1 Venstresidig test. n = 12, α = 0.05 og testobservatoren ert = −2.01

2 En høyresidig test med n = 12, α = 0.1 og t = 1.223 En tosidig test med n = 12 og α = 0.01 og t = −3.45

Svar1 Kritisk verdi er t = 1.796. Forkastningsområdet er fra −1.796

og ned. Vår t-verdi ligger her. Konklusjon: Vi forkaster H0

2 Kritisk verdi er t = 1.363. Dvs at forkastningsområdet er fra1.363 og opp. Vår t-verdi ligger ikke her. Behold H0

3 Kritisk verdi t = 3.106.Forkastningsområdet er utenfor±3.106. Forkaster H0

Hypotesetest for gjennomsnittet

ExampleTenk deg følgende 3 situasjoner. Bruk tabell A3 til å avgjøre om H0forkastes

1 Venstresidig test. n = 12, α = 0.05 og testobservatoren ert = −2.01

2 En høyresidig test med n = 12, α = 0.1 og t = 1.223 En tosidig test med n = 12 og α = 0.01 og t = −3.45

Svar1 Kritisk verdi er t = 1.796. Forkastningsområdet er fra −1.796

og ned. Vår t-verdi ligger her. Konklusjon: Vi forkaster H0

2 Kritisk verdi er t = 1.363. Dvs at forkastningsområdet er fra1.363 og opp. Vår t-verdi ligger ikke her. Behold H0

3 Kritisk verdi t = 3.106.Forkastningsområdet er utenfor±3.106. Forkaster H0

ExamplePå side 9 så vi at p-verdien var 0.023 for en venstresidig testav H0 : µ = 7.0 versus H1 : µ < 7.0. Vi brukte JMP til å finnedet ut.Vi skal nå gjøre testen uten JMP, ved å bruke A3. Vi brukerα = 0.05Postbanken har x = 6.410 og s = 2.753 for 91kunderTestobservator er da t = 6.41−7.0

2.753/√

91= −2.02

Tabell A3 med 91− 90 frihetsgrader gir da kritisk verdi 1.662Vi forkaster H0: Det er grunnlag for å hevde at µ < 7 ipopulasjonen

Arealet er p-verdien. JMP gir at dette er 0.023.

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

Students t med df=90

x

dt(x

, df =

90)