Anova 1 Factor

Embed Size (px)

Citation preview

  • 8/16/2019 Anova 1 Factor

    1/31

    Biometría 22015

    Anova de 1 factor: supuestos,tabla de anova, comparaciones,

    magnitud del efecto e IC.

  • 8/16/2019 Anova 1 Factor

    2/31

    Problema 4 

    Segregación de aa

    Anemia

    ¿La segregación de ciertos aa produce anemia?

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    3/31

  • 8/16/2019 Anova 1 Factor

    4/31

    GRUPO I  GRUPO II  GRUPO III  GRUPO IV 20 mmol

    prolina 

    mezcla aa – 

    pro 

    mezcla aa +

    pro 

    Suero fisio 

    6.47 

    5.42 

    6.09 

    5.83 

    6.27 5.95 

    6.04 

    6.35 

    5.60 

    5.80 

    6.09 

    5.94 

    5.75 

    5.51 

    6.34 5.65 

    6.42 

    6.04 

    5.51 

    5.44 

    5.61 

    5.40 

    5.26 

    4.99 

    5.44 5.13 

    5.21 

    5.52 

    4.79 

    4.92 

    7.35 

    7.11 

    6.99 

    6.72 

    7.16 6.85 

    6.94 

    7.25 

    6.51 

    6.65 

    Modelo Lineal:

    ijiij y        

    # de glóbulos rojos de la rata j sometida

    al tratamiento i

    # de glóbulos rojos promedio de la población

    de ratas wistar

    efecto del tratamiento “i” sobre el # de

    glóbulos rojos promedio

    “error”: variabilidad natural entre

    ratas, errores de medición, etc.

    Yij =

    µ =

    α i =

    Єij =

    ¿subíndices? i= j=

    TP 2. Diseños y ANOVA

    Diseño utilizado: DCA

  • 8/16/2019 Anova 1 Factor

    5/31

    Ho: μI = μII = μ III = μ IV = μ Ha: Alguna μi ≠ μ 

    Ho: αi = 0

    Ha: Algún αi ≠ 0 

    ANOVA DE 1 FACTOR

    Hipótesis

    Hipótesis

    TP 2. Diseños y ANOVA

    ¿La segregación de ciertos aa produce anemia?

  • 8/16/2019 Anova 1 Factor

    6/31

    Descripción Gráfica y analítica de los datos

    Medidas resumen

    grupo Variable n Media D.E. Var(n-1) CV Mín Máx

    G_I GR 10 5,98 0,33 0,11 5,55 5,42 6,47

    G_II GR 10 5,87 0,35 0,12 5,99 5,44 6,42

    G_III GR 10 5,23 0,27 0,07 5,18 4,79 5,61

    G_IV GR 10 6,95 0,27 0,07 3,92 6,51 7,35

    G_I G_II G_III G_IV

    grupo

    0,00

    1,87

    3,74

    5,61

    7,48

       G   R

    G_I G_II G_III G_IV

    grupo

    0,00

    1,78

    3,57

    5,35

    7,13

       G   R

    Presencia

    de datos

    atípicos?

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    7/31

    Supuestos para la validez del modelo

    ij  independientes ~ N (0, σ)

     u.e. Independientes - Muestreo aleatorio

    - Asignación aleatoria de u.e.

      Distribución Normal de la v.a para cada subpoblación

     Homogeneidad de varianzas de las subpoblaciones.

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    8/31

    ANOVA: SUPUESTOS

    u.e. Independientes - Muestreo aleatorio- Asignación aleatoria de u.e.

    Suponemos que las ratas fueron extraídas

    al azar y que la asignación de las ratas a

    cada tratamiento se hizo al azar.

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    9/31

    ANOVA: SUPUESTOS

    • Para probar los supuestos necesitamoscalcular los

    RESIDUOS (RDUO)

    RESIDUOS ESTUDENTIZADOS (RE)

    RESIDUOS ABSOLUTOS (RABS)

    VALORES PREDICHOS (PRED)

    TP 2. Diseños y ANOVA

    * Formula descrita en el manual de

    InfoStat

  • 8/16/2019 Anova 1 Factor

    10/31

     Residuos … un ejemplo para repasar el cálculo 

    • Calcule el residuo para la 3ra. observación del grupo II

    e 23 = 5.75 –  5.87 = -0.12 milGR/mm3

    GRUPO I GRUPO II GRUPO III GRUPO IV

    20 mmol

    prolina

    mezcla aa –

    pro

    mezcla aa +

    pro

    Suero fisio

    6.47 6.09 5.61 7.355.42 5.94 5.40 7.11

    6.09 5.75 5.26 6.99

    5.83 5.51 4.99 6.72

    6.27 6.34 5.44 7.16

    5.95 5.65 5.13 6.85

    6.04 6.42 5.21 6.94

    6.35 6.04 5.52 7.25

    5.60 5.51 4.79 6.51

    5.80 5.44 4.92 6.65 y..

     yi. 5.98 5.87 5.23 6.95 6.01

    n 10 10 10 10

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    11/31

      Distribución Normal de la v.a. para cada subpoblación

    Es equivalente a decir que los errores aleatorios se distribuyen normalmente

    Método gráfico

    4,52 5,26 6,01 6,75 7,50

    Cuantiles de una Normal(6,0077,0,47848)

    4,52

    5,26

    6,01

    6,75

    7,50

       C  u  a  n   t   i   l  e  s  o   b  s  e  r  v  a   d  o  s   (   G   R   )

    n= 40 r= 0,988 (GR)

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    12/31

    Distribución Normal de la v.a. para cada subpoblación

    Método analítico: Prueba de Shapiro-Wilks

    Ho: los errores del modelo ajustan a una distribución normal

    H1:los errores del modelo NO ajustan a una distribución normal

    NO RECHAZO Ho. No encontramos evidencias en contra de la normalidad

    (corriendo el riesgo de cometer un error de Tipo II)

    TP 2. Diseños y ANOVA

    Shapiro-Wilks (modificado) 

    Variable n Media D.E. W* p (una cola) 

    RDUO_HEMATOCRITO 40 0.00 0.30 0.95 0.2193 

  • 8/16/2019 Anova 1 Factor

    13/31

    Homogeneidad de varianzas de las subpoblaciones.

    Método gráfico

    5,14 5,62 6,09 6,56 7,04

    PRED_GR

    -0,62

    -0,31

    -0,01

    0,30

    0,61

         R     D     U     O_

         G     R

    G_IIIG_I

    G_II G_IV

    • La dispersión

    dentro de cada

    grupo tiene que

    ser similar

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    14/31

    Homogeneidad de varianzas de las subpoblaciones.

    Método AnalíticoHo: las varianzas de las 4 subpoblaciones son homogéneas con respecto a la

    cantidad de glóbulos rojos. σ2 i. = σ2

    Ha: las varianzas de las 4 subpoblaciones NO son homogéneas con respecto a la

    cantidad de globulos rojos. Alguna σ2 i. ≠ σ2 

    NO RECHAZO Ho. Podemos suponer que la variabilidad de las 4 subpoblaciones

    no difiere (corriendo el riesgo de cometer un error de Tipo II)

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    15/31

    Análisis de la varianza

    Variable N R² R² Aj CV

    GR 40 0,816 0,801 5,139

    Cuadro de Análisis de la Varianza (SC tipo III)

    F.V. SC gl CM F p-valor

    Modelo 15,230 3 5,077 53,269

  • 8/16/2019 Anova 1 Factor

    16/31

    ¿Cómo decidimos si nos quedamos con Ho ó con Ha?

    Resolución del ANOVA• Comparamos la variabilidad que observamos ENTRE

    tratamientos con la observada DENTRO de los tratamientos

    GRUPO I GRUPO II GRUPO III GRUPO IV

    20 mmol

    prolina

    mezcla aa –

    pro

    mezcla aa +

    pro

    Suero fisio

    6.47 6.09 5.61 7.35

    5.42 5.94 5.40 7.11

    6.09 5.75 5.26 6.99

    5.83 5.51 4.99 6.72

    6.27 6.34 5.44 7.16

    5.95 5.65 5.13 6.85

    6.04 6.42 5.21 6.94

    6.35 6.04 5.52 7.25

    5.60 5.51 4.79 6.51

    5.80 5.44 4.92 6.65 y..

     yi. 5.98 5.87 5.23 6.95 6.01

    n 10 10 10 10

    Variabilidad

    DENTRO de lostratamientos

    Variabilidad

    ENTRE tratamientos

    Var. ENTRE = Var. DENTRO => No rechazo Ho

    Var. ENTRE > Var. DENTRO => Rechazo Ho

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    17/31

    Fuente deVariación

    Suma deCuadrados

    Grados delibertad

    CuadradosMedios

    F p-valor

    Grupo )(   y yiin  

    2 a-1 SC / GL CMgruposCMerror

    Error )( iij  y y   2

    n – 

     a SC / GL

    Total )(   y y ji

    2 n - 1

    TP 2. Diseños y ANOVA

    10x[(5.98-6.01) 2 +(5.87-6.01) 2 +(5.23-6.01) 2 +(6.95-6.01) 2] =

    10x[(-0.03) 2 +(-0.14) 2 +(-0.78) 2 +(0.94) 2] = 15.125

    Construcción de la Tabla de ANOVA.

    Práctica de cálculo de SC a mano

  • 8/16/2019 Anova 1 Factor

    18/31

    • Conclusión biológica: 

    • Conclusión estadística: Conclusiones

    G_I G_II G_III G_IV

    grupo

    0,00

    1,87

    3,74

    5,61

    7,48

       G   R

     

    • ¿Todos los tratamientos difieren

    entre si o solo algunos?

    COMPARACIONES

    Rechazo Ho con una probabilidad de cometer error tipo I de 5%.Algún αi ≠ 0 

    La concentración media de glóbulos rojos de ratas Wistar es afectada por

    alguno de los tratamientos aplicados (nivel de significación de 0,05).

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    19/31

    Comparaciones

    •  A priori conocimientos previos del investigador. Pueden

    detectar diferencias que el ANOVA no detecte.

    Contrastes ortogonales

    Bonferroni

    •  A posteriori sólo si el ANOVA dio significativo:

    Tukey

    Dunnet

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    20/31

     

    Contrastes ortogonales  Tabla ANOVA propia 

     Bonferroni

    Tukey

     Dunnet

    TP 2. Diseños y ANOVA

    Se calcula una DMS que se compara conel valor obtenido del contraste

  • 8/16/2019 Anova 1 Factor

    21/31

     

     Bonferroni

    Tukey 

    TP 2. Diseños y ANOVA

    in

    CMerror Q DMS  GLerror   ,

  • 8/16/2019 Anova 1 Factor

    22/31

     Métodos a priori

    • Contrastes Ortogonales (un ejemplo)¿Los tratamientos con “prolina” difieren del resto? 

    ¿El tratamiento con “prolina” sóla, difiere del de “aa+prolina”? 

    Ho1: µ GI + µ GIII = µ GII + µ GIV

    Ho2: µ GI = µ GIII 

    1 f  2

     f  =1µGI + 1µGIII- 1µGII -1µGIV=0

    =1µGI - 1µGIII=0

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    23/31

    •  Contrastes Ortogonales

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    24/31

    Conclusiones

    • Los tratamientos con prolina difieren de la mezcla de aa

    sin prolina y el suero (Contraste 1)

    • Los tratamientos con prolina y mezcla aa + prolina

    difieren entre si (Contraste 2)

    => La prolina sola no sería la responsable de la anemiaobservada

    Contrastes Ortogonales

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    25/31

     Métodos a posteriori

    • Método de TukeySe comparan todos los pares de medias posibles

    En este caso:

    Ho1: µ GI = µ GII

    Ho2: µ GI = µ GIII

    Ho3: µ GI = µ GIV

    Ho4: µ GII = µ GIII

    Ho5: µ GII = µ GIV

    Ho6: µ GIII = µ GIV 6

    5

    4

    3

    2

    1

     f  

     f  

     f  

     f  

     f  

     f  

    0

    0

    0

    0

    0

    0

    GIV GIII 

    GIV GII 

    GIII GII 

    GIV GI 

    GIII GI 

    GII GI 

      

      

      

      

      

      

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    26/31

    G_III G_II G_I G_IV

    grupo

    0,00

    1,79

    3,57

    5,36

    7,14

       G   R

     A

    B   B

    C

     A

    B   B

    C

     Métodos a posteriori

    Método de Tukey 

    Test:Tukey Alfa=0,05 DMS=0,37Error: 0,0953 gl: 36

    grupo Medias n E.E.

    G_III 5,23 10 0,10 A

    G_II 5,87 10 0,10 B

    G_I 5,98 10 0,10 B

    G_IV 6,95 10 0,10 C

    Letras distintas indican diferencias significativas(p

  • 8/16/2019 Anova 1 Factor

    27/31

    TP 2. Diseños y ANOVA

    • Estimación de la varianza residual

      Se estima a partir del CMerror  

     Recordar que CM error: Variación natural o no

    controlada, estima σ 2 

    •  Coeficiente de variación (CV)

    01,6

    09.0

    .. y

    CMerror 

  • 8/16/2019 Anova 1 Factor

    28/31

    Estimación de la magnitud del efecto: Estimación puntual

    • Estimación del efecto del tratamiento III

    El tratamiento de “mezcla de aa + pro” disminuye la cantidadde glóbulos rojos en sangre de ratas Wistar respecto al suero

    fisiológico en promedio 24,78 %.

    El tratamiento de “mezcla de aa + pro”  disminuye la cantidad

    de glóbulos rojos en sangre de ratas Wistar respecto al suero

    fisiológico en promedio en 1,726 millonesGR/mm3 sangre.

    TP 2. Diseños y ANOVA

    78,24100*953,6

    953,623,5100*  

    GIV 

    GIV GIII 

     y

     y y

    726,1953,6227,5   GIV GIII    y y

  • 8/16/2019 Anova 1 Factor

    29/31

     EE VC  x x *21  

    ¿Cómo construimos un IC para la diferencia de medias?

     En el caso de nuestro problema …. 

    TP 2. Diseños y ANOVA

  • 8/16/2019 Anova 1 Factor

    30/31

    • IC para la magnitud del máximo efecto (Tratamiento III )

    ialfaGLerror    nCMerror Q /*726.1 ,

    La adición de “aa+pro” en suero de ratas Wistar produceuna disminución promedio entre 1,37 y 2,79 millones de

    GR/mm3 respecto al suero fisiológico con una confianza

    del 95%. 

    TP 2. Diseños y ANOVA

    DMS= 0,353

    37.1;79.2%95    IC 

  • 8/16/2019 Anova 1 Factor

    31/31

    Redacción de Materiales y Métodos

    estadísticos

    TP 2. Diseños y ANOVA

    Los datos fueron analizados mediante un ANOVA  de una vía,

    con el tipo de suero administrado como único factor con 4 niveles 

    (grupos I a IV descritos anteriormente). Se realizaron

    comparaciones a posteriores utilizando el método de tukey, con una

    tasa de error global del 5%. Todos los análisis fueron realizados

    con el programa InfoStat (citar).