16
1 Föreläsning 8 732G60 Statistiska metoder

Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

1

Föreläsning 8 732G60

Statistiska metoder

Page 2: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Dagens föreläsning

o Chi-två-test

• Analys av enkla frekvenstabeller

• Analys av korstabeller (tvåvägs-tabeller)

• Problem med detta test

o Fishers exakta test

2

732G60

Page 3: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av enkla frekvenstabeller Introduktion med hjälp av exempel

I en undersökning med totalt 180 slumpmässigt utvalda personer

så frågades vilken matbutik de utvalda handlar på i störst

utsträckning.

Svaren fick följande fördelning.

3

732G60

Matbutik Antal svarande

ICA 68

Coop 56

Willys 20

Hemköp 36

Page 4: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av enkla frekvenstabeller Introduktion

Med hjälp av ett chi-två-test kan frekvenstabeller analyseras

djupare. T.ex. kan det undersökas om det finns ett mönster i hur

undersökningsdeltagarna har svarat, eller om det kan anses vara

slumpmässigt.

Chi-två-test är en variant av hypotesprövning, med ett ytterligare

steg.

1. Formulera hypoteser

2. Bestäm signifikansnivå

3. Beräkna förväntade frekvenser

4. Beräkna testvariabel

5. Undersök om nollhypotesen kan förkastas eller inte

4

732G60

Page 5: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av enkla frekvenstabeller Formulera hypoteser

Vid ett chi-två-test så uttryck hypoteserna i ord och inte med hjälp

av beteckningar som vi har gjort tidigare.

Hypoteserna kan uttryckas olika beroende på vad som undersöks,

men grundtanken är att nollhypotesen (H0) ska vara att det t.ex.

inte finns ett mönster, att det är slumpmässigt eller liknande.

Mothypotesen (H1) säger att det finns ett mönster, att det inte är

slumpmässigt etc.

5

732G60

Page 6: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av enkla frekvenstabeller Beräkna förväntade frekvenser

Efter att hypoteserna har formulerats beräknas de förväntade

frekvenserna (E).

Dessa förväntade frekvenser är antalet svarande på de olika

alternativen, givet att H0 är sann.

Allmänt kan de förväntade frekvenserna uttryckas på följande sätt:

𝐸 = 1

𝑘∗ 𝑛

Där k är antalet svarsalternativ (kategorier) och n är antalet i

undersökningen.

6

732G60

Page 7: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av enkla frekvenstabeller Testvariabel

När de förväntade frekvenserna har räknats fram kan testvariabeln

beräknas.

𝜒𝑜𝑏𝑠2 =

𝑂 − 𝐸 2

𝐸

Denna testvariabel jämförs med ett kritiskt värde ur chi-två-

fördelningen (tabell 4). Det kritiska värdet har k – 1 frihetsgrader,

där k är antalet svarsalternativ (kategorier).

H0 förkastas när testvariabeln är större än det kritiska värdet.

7

732G60

Page 8: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av enkla frekvenstabeller Exempel

Vi återgår till undersökningen gällande matbutiker.

Utred om det finns något mönster i vilken butik kunderna väljer,

eller om man kan anse att de väljer butik slumpmässigt.

8

732G60

Matbutik Antal svarande

ICA 68

Coop 56

Willys 20

Hemköp 36

Totalt 180

Page 9: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av korstabeller Introduktion

I en korstabell så visas (oftast) två variabler samtidigt. Med hjälp av

ett chi-två-test så kan man utreda om det finns något samband

eller beroende mellan dessa två variabler.

Antag att man i matbutiksundersökningen delade upp de svarande

i åldersgrupper (yngre och äldre).

9

732G60

Matbutik Åldersgrupp

Yngre Äldre

ICA 28 40

Coop 21 35

Willys 12 8

Hemköp 24 12

Totalt 85 95

Page 10: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av korstabeller Formulera hypoteser

Chi-två-test för en korstabell utförs på samma sätt som chi-två-test

för en enkel frekvenstabell.

Hypoteserna formuleras dock lite annorlunda. Grundtanken är att

H0 säger att det inte finns något samband eller beroende mellan de

två variablerna. Mothypotesen H1 säger då motsatsen, att det finns

ett samband/beroende.

Så hypoteserna kan exempelvis formuleras enligt:

𝐻0: 𝐷𝑒𝑡 𝑓𝑖𝑛𝑛𝑠 𝑖𝑛𝑔𝑒𝑡 𝑠𝑎𝑚𝑏𝑎𝑛𝑑 𝑚𝑒𝑙𝑙𝑎𝑛 𝑋 𝑜𝑐ℎ 𝑌

𝐻1: 𝐷𝑒𝑡 𝑓𝑖𝑛𝑛𝑠 𝑒𝑡𝑡 𝑠𝑎𝑚𝑏𝑎𝑛𝑑 𝑚𝑒𝑙𝑙𝑎𝑛 𝑋 𝑜𝑐ℎ 𝑌

10

732G60

Page 11: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av korstabeller Förväntade frekvenser, testvariabel

Även här beräknas förväntade frekvenser (E), vilket är antalet som

bör vara i de olika cellerna givet att H0 är sann.

Dessa beräknas enligt:

𝐸 = 𝑟𝑎𝑑𝑠𝑢𝑚𝑚𝑎 ∗𝑘𝑜𝑙𝑢𝑚𝑛𝑠𝑢𝑚𝑚𝑎

𝑡𝑜𝑡𝑎𝑙𝑎 𝑎𝑛𝑡𝑎𝑙𝑒𝑡

Dessa används för att beräkna testvariabeln:

𝜒𝑜𝑏𝑠2 =

𝑂 − 𝐸 2

𝐸

Testvariabeln jämförs med kritiskt värde från chi-två-fördelningen.

Detta kritiska värde har (𝑟 − 1)(𝑘 − 1) frihetsgrader, där r är antalet

rader och k är antalet kolumner.

H0 förkastas om testvariabeln är större än det kritiska värdet.

11

732G60

Page 12: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Analys av korstabeller Exempel

Undersök om det finns ett beroende mellan matbutik och

åldersgrupp med hjälp av ett chi-två-test.

12

732G60

Matbutik Åldersgrupp

Yngre Äldre

ICA 28 40

Coop 21 35

Willys 12 8

Hemköp 24 12

Totalt 85 95

Page 13: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Chi-två-test Problem med detta test

För att kunna genomföra ett chi-två-test ska dessa två

förutsättningar vara uppfyllda:

o Max 20 % av de förväntade frekvenserna får vara mindre än 5

o Ingen förväntad frekvens får vara mindre än 1

Om dessa förutsättningar inte uppfylls så ska man inte genomföra

ett chi-två-test.

För att komma runt detta problem kan man ibland använda sig av

logisk sammanslagning. Det innebär att man, om möjligt, slår

ihop två eller fler kategorier till en kategori.

13

732G60

Page 14: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Chi-två-test Logisk sammanslagning, exempel

Vid en undersökning så fick de tillfrågade betygssätta en viss

variabel på en skala 1-5. De tillfrågade delades upp på variabeln

kön.

14

732G60

1 2 3 4 5

Kvinnor 1 7 30 6 7

Män 4 9 41 4 2

1 - 2 3 4 - 5

Kvinnor 8 30 13

Män 13 41 6

Page 15: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Fishers exakta test

Om det inte är möjligt att använda sig av logisk sammanslagning

kan man använda sig av Fishers exakta test.

I kursboken finns exempel på hur beräkningar för detta test görs

vid en korstabell med fyra celler (två rader, två kolumner).

Det går även att tillämpa detta på större korstabeller, men det är

väldigt tunga beräkningar och vi överlåter till datorerna att göra

detta.

15

732G60

Page 16: Föreläsning 8 - IDA732G60/Forelasning 8.pdf · Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda:

Tack för idag!

Nästa tillfälle:

Laboration 4, onsdag 13/3 10-12, PC1-2

16