43
Bioestadística FMCS Reus URV Curs 2012-13 1 Relació entre dues variables qualitatives amb dues o més categories. Prova de Chi quadrat ( 2 )

Relació entre dues variables qualitatives amb dues o més categories

  • Upload
    isha

  • View
    55

  • Download
    1

Embed Size (px)

DESCRIPTION

Relació entre dues variables qualitatives amb dues o més categories. Prova de Chi quadrat (  2 ). Relació entre dues variables qualitatives amb dues categories. Distribució de freqüències: - PowerPoint PPT Presentation

Citation preview

Page 1: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 1

Relació entre dues variables qualitatives amb dues o més categories.

Prova de Chi quadrat (2)

Page 2: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 2

Distribució de freqüències: una variable qualitativa amb dues categories

(binaria) es descriu completament amb el percentatge o la freqüència de una de las categories i el número total de individus.

Relació entre dues variables qualitatives amb dues categories

Page 3: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 3

Sexe: home/dona 30% o 57 homes i n = 190. 70% o 133 dones.

Obesitat: si/no 16% o 180 obesos i n = 1125. 84% o 945 no obesos.

Ingesta energètica insuficient: si/no 12% o 521 ingesta insuficient i n = 4342. 88% o 3821 ingesta no insuficient.

Descripció de la informació de variables qualitatives amb dues categories

Sexe: home/dona 30% o 57 homes i n = 190.

Obesitat: si/no 16% o 180 obesos i n = 1125.

Ingesta energètica insuficient: si/no 12% o 521 ingesta insuficient i n = 4342.

Page 4: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 4

Distribució de freqüències: una variable qualitativa amb k (més de dues)

categories es descriu completament amb el percentatge o la freqüència de k-1 de les categories i el nombre total d’individus.

Relació entre dues variables qualitatives amb més de dues categories.

Page 5: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 5

12’6% o 32 Alt

Descripció de la informació de variables qualitatives amb més de dues categories

Nivell socioeconòmic: Baix/Mig baix/ Mig alt/Alt 11’9% o 30 Baix o n =253 35’2% o 89 Mig baix 40’3% o 102 Mig alt

Page 6: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 6

S’utilitza en estudis comparatius i en aquest cas la distribució teòrica de les categories de la variable d’interès (dependent) és desconeguda. No obstant, suposem que las mostres que desitgem comparar procedeixen de poblacions no diferents (Ho) i per tant aquesta distribució teòrica es pot estimar a partir de la suma de les mostres.

Chi quadrat (2) per la comparació de vàries distribucions observades.

Page 7: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 7

Els càlculs es basen en la següent taula tipus:

La taula té f files i c columnesofc = freqüències observades; efc = freqüències esperades

Independent Total

c=1 c=2 c=3

Dependentf=3 o31/e31 o32/e32 o33/e33 n 3.

f=2 o21/e21 o22/e22 o23/e23 n 2.

f=1 o11/e11 o12/e12 o13/e13 n 1.

Total n.1 n.2 n.3 n

Page 8: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 8

Condicions d’aplicació: efc 5Graus de llibertat: (c - 1)(f - 1) c = columnes; f =

files

nn n

e.cf.

fc

Freqüència esperada (efc):

Page 9: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 9

Es calcula l’estadístic de contrast 2, mitjançant la fórmula:

∑∑-c

1c

f

1f

2

efc

)efco( fcχ2

Page 10: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 10

Ho: Les distribucions de les categories de la variable dependent NO SÓN DIFERENTS entre les diferents categories de la variable independent.

 

H1: Les distribucions de les categories de la variable dependent SÓN DIFERENTS entre les diferents categories de la variable independent.

Formulació de les hipòtesis HHoo i H i H11

Page 11: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 11

Exemple 1: Comparació de tres distribucions observades

En un període de 18 anys d’estudi, dels 2594 homes de l’estudi de Framingham (Massachusetts) en van morir 465. D’aquestos, 81 no havien fumat mai, 51 havien deixat de fumar (exfumadors) i 333 eren fumadors.

Ens preguntem si existeix una associació entre l’hàbit de fumar i el risc de morir, és a dir, si a la POBLACIÓ les distribucions de mortalitat (morts/no morts) SÓN DIFERENTS entre les tres categories de fumadors.

Page 12: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 12

Hipòtesis nul·la: les distribucions de la mortalitat NO SÓN DIFERENTS entre les tres categories de fumadors.

Hipòtesis alternativa: les distribucions de la mortalitat SÓN DIFERENTS entre les tres categories de fumadors.

Hipòtesis HHipòtesis Hoo i H i H11

Page 13: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 13

197'0=1693333=p;157'0=325

51=p;141'0=57681=p FEXNF

Freqüències observades a la mostra

Tabac Mortalitat No

Fumadors Ex

fumadors

Fumadors TOTAL

Morts 81 51 333 465 Vius 495 274 1360 2129 Total 576 325 1693 2594

Page 14: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 14

Tabac

Resposta No fumadors

Ex fumadors

Fumadors

TOTAL

Morts 81/103’3 51/58’3 333/303’5 465 Vius 495/472’7 274/266’7 1360/1389’5 2129 Total 576 325 1693 2594

443'102

c

1c

f

1f

2 )χ

∑∑-(

fc

fcfceeo

Freqüències observades/esperades a la mostra

(3-1)(2-1) = 2 gll = (c -1)(f – 1) =

Page 15: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 15

Percentatge esperat de morts i vius en no fumadors, ex fumadors i fumadors

Tabac Mortalitat no

fumadors ex

fumadors

fumadors TOTAL

morts 103’3 (17’9%)

58’3 (17’9%)

303’5 (17’9%)

465

vius 472’7 (82’1%)

266’7 (82’1%)

1389’5 (82’1%)

2129

Total 576 325 1693 2594

Page 16: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 16

Percentatge esperat de no fumadors, ex fumadors i fumadors en morts y vius:

Tabac Mortalitat no

fumadors ex

fumadors

fumadors TOTAL

morts 103’3 (22’2%)

58’3 (12’5%)

303’5 (65’3%)

465

vius 472’7 (22’2%)

266’7 (12’5%)

1389’5 (65’3%)

2129

Total 576 325 1693 2594

Page 17: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 17

Probabilitats g de ll 0’10 0’05 0’01 0’001 1 2’706 3’841 6’635 10’827 2 4’605 5’991 9’210 13’815 3 6’251 7’815 11’345 16’266 4 …

NS SIG SIG SIG p>0’10 p<0’10 p<0’05 p<0’01 p<0’001

El nostre resultat 2 = 10’443 correspon a un grau de significació p<0’01 (exactament 0’005), per tant refusem Ho i concloem que la distribució de la mortalitat és diferent entre les tres categories de fumadors.

Grau de significació de la prova Chi quadrat (2)

Page 18: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 18

Mida de la mostra per comparar dues proporcions observades

Nombre d’individus necessaris per identificar com a significativa una comparació de dues proporcions observades

Page 19: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 19

Mida de la mostra per comparar dues proporcions observades

BA

BBAAβα2

ppp1pp1pzp1p2z

----

2

n

n = nombre d’individus necessaris a cada grup z = valor de z corresponent al risc fixat z = valor de z corresponent al risc fixat pA = valor de la proporció esperada al grup A pB = valor de la proporció esperada al grup B pA-pB = valor mínim de la diferencia que es vol

detectar p = mitjana ponderada de les proporcions pA i pB

Page 20: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 20

Valors Zα i Zβ

Page 21: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 21

Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potència del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 40% i l’altre del 50%?

Exemple 1:

5'04'0

5'015'04'014'0842'045'0145'0*296'12

----

2

n

45'387 = n

BA

BBAAβα2

ppp1pp1pzp1p2z

----

2

n

Page 22: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 22

Exemple 2

Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potència del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 5% i l’altre del 20%?

BA

BBAAβα2

ppp1pp1pzp1p2z

----

2

n

2'005'0

2'012'005'0105'0842'0125'01125'0*296'12

2

n

14'75 n

Page 23: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-13 23

Risc I Risc II Uni/Bi pA pB N0'05 0'2 Bi 5 20 750'05 0'2 Bi 10 20 1990'05 0'2 Bi 45 60 1730'05 0'01 Uni 5 20 1490'05 0'01 Uni 10 20 3970'05 0'01 Uni 45 60 345

Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral; pA i pB = proporcions esperades als grups A i B

Mida de la mostra per comparar dues proporcions observades

Page 24: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 24

Prova d’hipòtesi de comparació de dues reparticions observades utilitzant la prova de 2

Exercici

Page 25: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 25

Utilitzant les dades de l’exemple “Efecte de hàbit de fumar de la mare sobre el retard mental dels fills” decidiu si hi ha diferències significatives (A LA POBLACIÓ) en la freqüència de retard mental entre els nascuts de part eutòcic i els nascuts de part distòcic.

Page 26: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 26

Els càlculs es basen en la següent taula tipus:Independent Total

c=1 c=2 c=3

Dependentl=3 o31/e31 o32/e32 o33/e33 n 3.

l=2 o21/e21 o22/e22 o23/e23 n 2.

l=1 o11/e11 o12/e12 o13/e13 n 1.

Total n.1 n.2 n.3 n

La taula té l línies i c columnesolc = freqüències observades; elc = freqüències esperades

Page 27: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 27

 

  

Variable ? Total

Variable ?

Total 40

La taula te 2 línies i 2 columnesfreqüència observada

Page 28: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 28

 

  

Tipus de part Total

Eutòcicobs

Distòcicobs

Retard mental Si 20

No 20

Total 22 18 40

La taula te 2 línies i 2 columnesfreqüència observada

Page 29: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 29

 

  

Tipus de part Total

Eutòcicobs

Distòcicobs

Retard mental Si 8 12 20

No 14 6 20

Total 22 18 40

La taula te 2 línies i 2 columnesfreqüència observada

Page 30: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 30

Condicions d’aplicació: elc 5Graus de llibertat: (c - 1)(l - 1) c = columnes; l =

línies

Freqüència esperada (elc):

nn.c*.nlelc

Page 31: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 31

Graus de llibertat: (2-1)(2-1)= 1Condicions d’aplicació: elc 5

11=40

22 *20=e11

Freqüència esperada (elc):

Page 32: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 32

 

  

Tipus de part Total

Eutòcicobs/esp

Distòcicobs/esp

Retard mental Si 8/11 12/9 20

No 14/11 6/9 20

Total 22 18 40

La taula te 2 línies i 2 columnesfreqüència observada/freqüència esperada

Page 33: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 33

Es calcula l’estadístic de contrast 2, mitjançant la fórmula:

∑ ∑-c

c

l

l elc)elco( lc

1 1

2

2

Page 34: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 34

Es calcula l’estadístic de contrast 2

( ) ( ) ( ) ( ) 636'3=9+11+9+11= 961114912118χ2222

2 ----

Graus de llibertad: (2-1)*(2-1) = 1

Page 35: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 35

Càlcul de la p Àrea en l’extrem superior

gl 0’10 0’05 0’01 0’001 1 2’71 3’84 6’63 10’83 2 4’61 5’99 9’21 13’82 3 6’25 7’81 11’34 16’27

NS SIG SIG SIG p>0’10 p<0’10 p<0’05 p<0’01 p<0’001

El nostre resultat 2 = 3’636 correspon a un grau de significació p>0.05 (exactament 0’056), per tant no refusem la Ho i concloem que la freqüència de retard mental no és diferent entre els nascuts de parts eutòcics i distòcics

Page 36: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 36

Càlcul del nombre d’individus necessaris (mida de la mostra) per la comparació de dues proporcions observades

Exercici

Page 37: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 37

Quants individus necessitarem incloure en una mostra per estimar (per identificar com a significativa) amb una prova d’hipòtesi bilateral, una confiança del 95% (risc = 0’05) i una potencia del 80% ( = 0’20), a) dues proporcions que esperem que siguin una

del 15% i l’altre del 35%?b) dues proporcions que esperem que siguin del

40% i 45% respectivament?c) dues proporcions que esperem que siguin 55% i

80% respectivament?

Page 38: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 38

Mantenint constants (com en l’enunciat) la resta de criteris:

Calcula el nombre d’individus necessaris però en el cas d’una prova d’hipòtesi unilateral.

Calcula el nombre d’individus necessaris però per una prova amb una potencia del 90% ( = 0’10)

Page 39: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 39

Mida de la mostra per comparar dues proporcions observades

BA

BBAAβα2

ppp1pp1pzp1p2z

----

2

n

n = nombre d’individus necessaris a cada grup z = valor de z corresponent al risc fixat z = valor de z corresponent al risc fixat pA = valor de la proporció esperada al grup A pB = valor de la proporció esperada al grup B pA-pB = valor mínim de la diferencia que es vol

detectar p = mitjana ponderada de les proporcions pA i pB

Page 40: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 40

Valors Zα i Zβ

Page 41: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 41

Quants individus necessitarem incloure en una mostra per comparar amb una prova d’hipòtesi bilateral, una confiança del 95% i una potencia del 80% [ = 0’20], dues proporcions que esperem que siguin una proporció del 15% i l’altre del 35%?

35'015'0

235'0135'015'0115'0842'025'0125'0*296'1

----

2 n

41'72 = n

Page 42: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 42

Risc I Risc II Uni/Bi pA pB N0'05 0'2 Bi 15 35 720'05 0'2 Bi 40 45 15320'05 0'2 Bi 55 80 540'05 0'2 Uni 15 35 570'05 0'2 Uni 40 45 12060'05 0'2 Uni 55 80 42

Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral

Mida de la mostra (N) per comparar dos grups amb dues proporcions observades pA i pB

Page 43: Relació entre dues variables qualitatives  amb dues o més categories

Bioestadística FMCS Reus URV Curs 2012-2013 43

Risc I Risc II Uni/Bi pA pB N0'05 0'2 Bi 15 35 720'05 0'2 Bi 40 45 15320'05 0'2 Bi 55 80 540'05 0'1 Bi 15 35 960'05 0'1 Bi 40 45 20530'05 0'1 Bi 55 80 72

Risc I = risc ; Risc II = risc ; Uni= unilateral; Bi = Bilateral

Mida de la mostra (N) per comparar dos grups amb dues proporcions observades pA i pB