Comparaciones Múltiples

  • Upload
    che

  • View
    42

  • Download
    0

Embed Size (px)

DESCRIPTION

DISEÑOS

Citation preview

  • Comparaciones Mltiples

    Cuando se realiza un experimento, y se utiliza el modelo I, el investigador siempre est

    interesado en determinar si existe o no diferencia significante de comparaciones entre

    dos medias de la variable respuesta con diferentes tratamientos. Estas comparaciones

    pueden ser planeadas o no antes del experimento. Las pruebas de comparaciones ms

    usadas son:

    1) Prueba de t y DMS o DLS (Diferencia Mnima o Limite Significante)(Para

    comparaciones planeadas).

    2) Prueba de Tukey (Para muchas comparaciones planeadas o comparaciones no

    planeadas).

    3) Prueba de Dunnett (para comparar con un tratamiento testigo o control).

    4.) Prueba de t y F con contrastes.

    5) Prueba de Scheffe (para funciones lineales de media o para contraste y

    comparaciones no planeadas).

    6) Prueba de Bonferroni (para pocas comparaciones entre en m pares).

    7) La prueba de Hsu con el mejor tratamiento (cuando se desea que el mejor o el

    conjunto de los mejores tratamiento sea seleccionado)

    Prueba de t y Diferencia Mnima o Lmite Significante (DMS o DLS)

    Esta prueba puede realizarse si se cumple las siguientes condiciones:

    a) Esta prueba es vlida para comparaciones planeadas. Es decir, cuando las comparaciones entre dos medias de la variable respuesta con diferentes

    tratamientos han sido planeados de antemano, antes de realizar el experimento.

    b) La prueba de F en el ANVA debe resultar significante.

    c) Los ij es una variable aleatoria independiente distribuida normalmente con

    media cero y variancia comn 2 .

    Prueba de t

    Planteamiento de hiptesis

    Caso Bilateral Unilateral a la derecha Unilateral a la izquierda

    0 : i iH k 0 : i iH k 0 : i iH k

    :a i iH k :a i iH k :a i iH k

    Para i i , , 1, 2, ,i i t

    Nivel de significacin

    Estadstica de prueba

    ~ /

    i i

    i ic GLE

    Y Y

    Y Y kt t

    S

    0H es verdadera

    donde :

  • GLE = Grados de libertad del error

    1 1

    i iY Y

    i i

    S CMEn n

    Criterio de decisin

    Decisin Caso Bilateral Unilateral a la

    derecha

    Unilateral a la

    izquierda

    Se acepta 0H

    , 1 ,2 2

    cGLE GLE

    t t t

    1 ,c GLEt t ,c GLEt t

    Se rechaza 0H

    , 1 ,2 2

    c cGLE GLE

    t t o t t

    1 ,c GLEt t ,c GLEt t

    Diferencia mnima o lmite de significacin (DMS o DLS)

    0 : i iH

    :a i iH

    Para i i , , 1, 2, ,i i t

    Nivel de significacin

    En la prueba de t se acepta 0H si

    , 1 ,2 2

    cGLE GLE

    t t t

    , 1 ,2 2i i

    i i

    GLE GLEY Y

    Y Yt t

    S

    1 , 1 ,2 2

    i i i ii iY Y Y Y

    GLE GLE

    t S Y Y t S

    1 ,2

    i ii i Y Y

    GLE

    Y Y t S

    Y se rechaza 0H si

    1 ,2

    i ii i Y Y

    GLE

    Y Y t S

    Entonces si definimos

    1 ,

    2

    ,i iY YGLE

    DMS i i t S

    o 1 ,

    2

    ,i iY YGLE

    DLS i i t S

    Luego, un criterio para examinar si existe diferencia significativa entre comparaciones

    de dos medias de la variable respuestas de diferentes tratamientos se puede usar este

    criterio de la diferencia mnima o lmite significante , ,DMS i i o DLS i i . Esto es, se rechaza 0H si

  • ,i iY Y DMS i i o ,i iY Y DLS i i

    Para i i , , 1, 2, ,i i t

    Ejemplo: Para el ejemplo de tiempo de coagulacin, suponga se ha planeado comparar

    las verdaderas media de los tiempos de coagulacin que se obtiene con la dieta A y la

    dieta C, use la prueba de t para realizar esta comparacin a un nivel de significacin

    0.05 .

    0 : A CH

    :a A CH

    0.05

    1 1 1 1

    5.6 1.52754 6A C

    Y Y

    A C

    S CMEn n

    61 684.5826

    1.5275A C

    A Cc

    Y Y

    Y Yt

    S

    0.025,20 2.086t y 0.975,20 2.086t , como 0.975,20ct t , se rechaza 0H

    Ejemplo Si se planeo realizar todas las comparaciones en el ejemplo de coagulacin a

    un nivel de significacin 0.05 , use la prueba de DMS. Luego, se tiene:

    0 : i iH

    :a i iH Para i i , , , , ,i i A B C D

    i A D B C

    .iY 61 61 66 68

    in 4 8 6 6

    Comparaciones i iY Y i iY YS 0.975,20, i iY YDMS i i t S

    C-A 7 1.5275 3.1864 *

    C-D 7 1.2780 2.6659 *

    C-B 2 1.3663 2.8501 ns

    B-A 5 1.5275 3.1864 *

    B-D 5 1.2780 2.6659 *

    D-A 0 1.4491 3.0228 ns

    *=significativo , ns= no significativo

    Prueba de t con R > coag tiempo dieta pairwise.t.test(tiempo,dieta,p.adjust.method="none")

  • Pairwise comparisons using t tests with pooled SD

    data: tiempo and dieta

    a b c

    b 0.00380 - -

    c 0.00018 0.15878 -

    d 1.00000 0.00086 2.3e-05

    P value adjustment method: none

    Las comparaciones mltiples afectan las tasas de error

    Para probar la hiptesis

    0 : i jH

    1 : i jH para i j , , 1, 2, ,i j t

    se utiliza la estadstica

    0

    2 1 1

    i j

    i j

    y yt

    sr r

    (1)

    Siendo 2s CME , el nivel de significacin o probabilidad de error tipo I para una sola

    prueba es una tasa de error con respecto a la comparacin , C , es el riesgo que se estn

    dispuestos a correr en una sola comparacin .

    Si se tienen t tratamientos entonces se pueden hacer 1 2t t comparaciones por pares. Por ejemplo si se tienen cuatro tratamientos: A, B, C, D, entonces se puede hacer

    4 3 / 2 6 pares posibles de comparaciones: (A,B), (A,C), (A,D), (B,C), (B,D), (C,D), Si se prueban los 6 pares existe la posibilidad de cometer 0, 1, 2, 3, 4, 5 o 6 errores de

    tipo I, si las medias poblacionales son iguales.

    Con la posibilidad de hasta 6 errores tipo I para 6 pruebas, se puede emplear otra forma

    de error tipo I basada en el riesgo acumulado asociado con la familia de prueba en

    estudio. La familia es el conjunto de comparaciones por pares como para el ejemplo del prrafo anterior. El riesgo acumulado asociado con una familia de comparaciones se

    conoce como la tasa de error tipo I con respecto al experimento, E . Es el riesgo de

    cometer al menos un error tipo I en la familia de comparaciones en el experimento.

    Para una familia de pruebas independientes, se puede evaluar la tasa de error tipo I con

    respecto al experimento. Sin embargo, no todas las pruebas son independientes con la

    ecuacin dado en (1), ya que 2s CME en el denominador es la misma, y en el numerador de cada prueba contiene la misma media que en algunos otros estadsticos

    0t .

  • Aunque las pruebas en la familia descrita no son independientes, se puede evaluar el

    lmite superior para el valor del error tipo I con respecto al experimento, si se suponen

    pruebas independientes. Suponiendo que las hiptesis nulas son ciertas para cada una de

    las 1

    2

    t tn

    pruebas, la probabilidad de un error tipo I para cualquier prueba sola es

    C ( la tasa respecto a la comparacin) con 1 C como la probabilidad de una decisin correcta. La probabilidad de cometer x errores tipo I est dada por la distribucin Binomial como:

    1n xx

    C C

    nP x

    x

    (2)

    para 0,1, ,x n errores tipo I. La probabilidad de no cometer error tipo I es:

    0 1n

    CP X (3)

    La probabilidad de cometer al menos un error tipo I ( 1, 2, ,x n ) es

    1 1 0P x P x , o sea

    1 1n

    E C (4)

    La probabilidad E es el riesgo de cometer al menos un error tipo I entre las n

    comparaciones independientes. Es el lmite superior de la tasa de error tipo I con

    respecto al experimento, para n pruebas en un conjunto de medias de variables respuestas con diferentes tratamientos.

    La relacin

    1/

    1 1n

    C E (5)

    Expresa la tasa de error tipo I con respecto a la comparacin como una funcin de la

    tasa de error tipo I con respecto al experimento o familiar.

    En la siguiente tabla se muestra la relacin entre la tasa de error tipo I del Experimento

    o familiar y la tasa de error tipo I de la comparacin

    N C cuando 0.05E E cuando 0.05C

    1 0.050 0.050

    2 0.098 0.025

    3 0.143 0.017

    4 0.185 0.013

    5 0.226 0.010

    10 0.401 0.005

    Para el caso del ejemplo de comparacin de las medias de los tiempos de coagulacin si

    se fija una tasa de error tipo I 0.05C para cada comparacin, la tasa de error tipo I

  • para el experimento ser de 6

    1 1 .05 0.265E y si se fija una tasa de error tipo I

    para el experimento de 0.05E , la tasa de error tipo I para la comparacin ser de 1/61 (1 0.05) 0.009C

    Nota: la prueba t y DMS o DLS es recomendable para una sola comparacin planeada

    Prueba de Tukey-Cramer (Tukey HSD)

    Esta prueba fue propuesta por Tukey(1949), quien desarroll un procedimiento que

    proporciona una tasa con respecto al experimento en el sentido fuerte, para las

    comparaciones por pares de todas las medias de la variable respuestas sujetos

    tratamiento diferentes, que se usa para obtener intervalos de confianza simultneos de

    100 1 % . La prueba se le conoce por varios nombres, entre ellas diferencia honestamente significativa.

    Para aplicar esta prueba slo es necesario que los ij sea una variable aleatoria

    independiente distribuida normalmente con media cero y variancia comn 2 . Es decir no se necesita que las comparaciones sean previamente planeadas y que la prueba de F

    en el ANVA resulte significativa.

    Para realiza la prueba de Tukey se procede de la siguiente manera:

    Planteamiento de hiptesis

    0 : i iH

    :a i iH Para i i , , 1, 2, ,i i t

    Nivel de significacin

    Clculo del Valor Crtico:

    1

    ,2 i i

    Y Yw q t GLE S

    donde:

    ,q t GLE =amplitud estudiantizada para la prueba de Tukey t = nmero de tratamiento a comparar

    GLE = Grados de libertad del error

    1 1i iY Y

    i i

    S CMEn n

    Se rechaza 0H a un nivel de significacin , si

    i iY Y w

    Ejemplo Use la prueba de Tukey para realizar todas comparaciones en el ejemplo de

    coagulacin a un nivel de significacin 0.05 .

  • i A D B C

    .iY 61 61 66 68

    in 4 8 6 6

    0.05 4,20 3.96q

    0 : i iH

    :a i iH Para i i , , , , ,i i A B C D

    Comparaciones i iY Y i iY YS 0.05

    14,20

    2 i iY Y

    w q S

    C-A 7 1.5275 4.2770 *

    C-D 7 1.2780 3.5784 *

    C-B 2 1.3663 3.82564 ns

    B-A 5 1.5275 4.2770 *

    B-D 5 1.2780 3.5784 *

    D-A 0 1.4491 4.0575 ns

    *=significativo , ns= no significativo

    Con el paquete R

    Para realizar esta pruebas con el lenguaje R bajar del CRAN los paquetes multcomp y

    mvtnorm. Esto puede realizarse directamente usando el Men para el caso que tuviera

    Internet. Ente caso ir a Package y dentro de esto a la opcin Install package(s) from

    CRAN. Para el caso que no tuviera internet, se puede ir al CRAN y bajar los archivos

    zip en www.cran.r-project/bin/windows, guardar estos archivos en una carpeta, luego ir

    al menu de R a Package y dentro de este ir a la opcin Install package(s) from local zip

    files buscar la carpeta e instalar estos paquetes. Una vez instalado esto queda grabado en

    una librera. Para usar estos paquetes primero instalar mediante la opcin de Menu en

    Packages e ir a la opcin Load Packages y leer primero mvtnorm luego hacer lo mismo con multcomp. > coag mod summary(mod)

    Df Sum Sq Mean Sq F value Pr(>F)

    dieta 3 228.0 76.0 13.571 4.658e-05 ***

    Residuals 20 112.0 5.6

    > library(multcomp)

    > cht summary(cht)

    Simultaneous Tests for General Linear Hypotheses

    Multiple Comparisons of Means: Tukey Contrasts

    Fit: aov(formula = Tiempo ~ dieta, data = coag)

    Linear Hypotheses:

  • Estimate Std. Error t value Pr(>|t|)

    B - A == 0 5.000e+00 1.528e+00 3.273 0.01832 *

    C - A == 0 7.000e+00 1.528e+00 4.583 < 0.001 ***

    D - A == 0 -1.071e-14 1.449e+00 -7.39e-15 1.00000

    C - B == 0 2.000e+00 1.366e+00 1.464 0.47487

    D - B == 0 -5.000e+00 1.278e+00 -3.912 0.00433 **

    D - C == 0 -7.000e+00 1.278e+00 -5.477 < 0.001 ***

    ---

    Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

    (Adjusted p values reported -- single-step method)

    Con otro comando en R

    > coag mod TukeyHSD(mod,"dieta")

    Tukey multiple comparisons of means

    95% family-wise confidence level

    Fit: aov(formula = Tiempo ~ dieta, data = coag)

    $dieta

    diff lwr upr p adj

    B-A 5.000000e+00 0.7245544 9.275446 0.0183283

    C-A 7.000000e+00 2.7245544 11.275446 0.0009577

    D-A -1.421085e-14 -4.0560438 4.056044 1.0000000

    C-B 2.000000e+00 -1.8240748 5.824075 0.4766005

    D-B -5.000000e+00 -8.5770944 -1.422906 0.0044114

    D-C -7.000000e+00 -10.5770944 -3.422906 0.0001268

    Prueba de Dunnett (comparaciones de todas las medias de la variable respuesta,

    excepto la de control, con la media de la variable respuesta obtenido con un tratamiento

    control o testigo)

    Tratamiento testigo o control: Es un tratamiento estndar, cuya efectividad es conocida.

    Este tratamiento se usa cuando la efectividad de los tratamientos en estudio es no

    conocido o cuando la efectividad general de los tratamientos bajo estudio es conocido

    pero no es consistente bajo todas las condiciones.

    Ejemplo: En un experimento para comparar el efecto de tres nuevos aditivos para

    gasolina, el tratamiento de control puede ser sin aditivo.

    Procedimiento: Para realizar la comparacin de todas las medias de la variable respuesta

    al cual se aplicaron tratamientos diferente al testigo con la media de la variable

    respuesta con el tratamiento testigo se usa la prueba de Dunnett. Para aplicar esta prueba

    requiere:

    a) Las comparaciones deben ser planeada

    b) Los ij sea una variable aleatoria independiente distribuida normalmente con

    media cero y variancia comn 2 .

    0 1: iH

    1:a iH , para 2, ,i t

  • Donde: 1 = es la media de la variable respuesta con el tratamiento testigo o de control

    Nivel de significacin

    Valor Crtico:

    1

    , ,i

    Dunnet Y Yd t t GLE S

    , para 2, ,i t

    donde :

    , ,Dunnett t GLE = t de Dunnett con un nivel de significacin . t = nmero de tratamiento a comparar

    GLE = Grados de libertad del error

    1 1i iY Y

    i i

    S CMEn n

    Se rechaza 0H aun nivel de significacin , si

    1iY Y d , para 2, ,i t

    Ejemplo: Suponga que el tratamiento A es el testigo. Use la prueba de Dunnett para

    realizar la comparacin entre media de tratamiento testigo con el resto a un nivel de

    significacin 0.05 .

    0 : i AH

    :a i AH , para , ,i B C D

    0.05

    0.05,3,20 2.54Dunnettt

    Comparaciones i iY Y i iY YS 0.05,4,20 i ADunnett Y Yd t S

    D-A 0 1.4491 3.6807 ns

    C-A 7 1.5275 3.8799 *

    B-A 5 1.5275 3.8799 *

    *=significativo , ns= no significativo

    Usando el paquete R > library(multcomp)

    > coag mod cdu summary(cdu)

    Simultaneous Tests for General Linear Hypotheses

    Multiple Comparisons of Means: Dunnett Contrasts

  • Fit: aov(formula = Tiempo ~ dieta, data = coag)

    Linear Hypotheses:

    Estimate Std. Error t value Pr(>|t|)

    B - A == 0 5.000e+00 1.528e+00 3.273 0.00955 **

    C - A == 0 7.000e+00 1.528e+00 4.583 < 0.001 ***

    D - A == 0 -1.071e-14 1.449e+00 -7.39e-15 1.00000

    ---

    Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

    (Adjusted p values reported -- single-step method)

    Prueba de t y F con Contraste(solo caso balanceado)

    Contraste: Son subconjunto de funciones lineales de los totales o de las medias

    estimadas de la variable respuestas de todos los tratamientos. De esta manera si se tiene

    t tratamiento, de modo que cada tratamiento est igualmente repetido n veces en el

    experimento, entonces un contraste se define:

    . .

    1 1

    t t

    i i i i

    i i

    Q C Y nC Y

    , con 1

    0t

    i

    i

    C

    Contrastes Ortogonales:

    Dos contrastes: 1 1 . 1 .1 1

    t t

    i i i i

    i i

    Q C Y n C Y

    y 2 2 . 2 .1 1

    t t

    i i i i

    i i

    Q C Y n C Y

    son ortogonales

    si

    1

    1

    0t

    i

    i

    C

    , 21

    0t

    i

    i

    C

    y 1 21

    0t

    i i

    i

    C C

    Nota: En un experimento con t tratamiento y dado un contraste base entonces se puede

    formar t-1 contrastes ortogonales.

    Media y variancia de un contraste: Sea . .1 1

    t t

    i i i i

    i i

    Q C Y n C Y

    , entonces la media del

    contraste est dado por:

    . . .1 1 1 1

    t t t t

    i i i i i i i i

    i i i i

    E Q E C Y E n C Y n C E Y n C

    1

    t

    i i

    i

    E Q n C

    y la variancia est dado por:

    2

    2 2 2 2 2 2

    . .

    1 1 1 1

    t t t t

    i i i i i i

    i i i i

    Var Q Var n C Y n C Var Y n C n Cn

    2 21

    t

    i

    i

    Var Q n C

  • Distribucin Muestral de un contraste:

    Si los ij sea una variable aleatoria independiente distribuida normalmente con media

    cero y variancia comn 2 , entonces

    2 2

    . .

    1 1 1 1

    ~ ,t t t t

    i i i i i i

    i i i i

    Q C Y n Y N n C n C

    Luego

    .

    1 1

    22

    1

    ~ 0,1

    t t

    i i i i

    i i

    t

    i

    i

    C Y C

    Z N

    Cn

    Adems se sabe que:

    2

    2~

    GLE

    GLE CME

    Tambin se puede demostrar que para este caso las variables

    .

    1 1

    22

    1

    ~ 0,1

    t t

    i i i i

    i i

    t

    i

    i

    C Y C

    Z N

    Cn

    y

    2

    GLE CME

    Son variables aleatorias independientes. Entonces

    2~

    GLE

    GLE

    Zt t

    GLE

    Luego

    .

    1 1

    22

    .1 1 1

    2

    21

    t t

    i i i i

    i i

    t t t

    i i i i ii i i

    t

    i

    i

    C Y C

    C C Y Cn

    tGLE CME CME

    Cn

    GLE

  • .

    1 1

    2

    1

    ~

    t t

    i i i i

    i i

    GLEt

    i

    i

    C Y C

    t tCME

    Cn

    Para realizar la prueba de t y F que se dan a continuacin se necesita las siguientes

    condiciones:

    a) Los contraste deben ser planeados antes de realizar el experimento

    b) Los ij sea una variable aleatoria independiente distribuida normalmente con

    media cero y variancia comn 2 .

    Prueba de t con contraste:

    Suponga que se desea probar una de las siguientes Hiptesis

    Caso Bilateral Unilateral a la derecha Unilateral a la izquierda

    0

    1

    :t

    i i

    i

    H C k

    01

    :t

    i i

    i

    H C k

    01

    :t

    i i

    i

    H C k

    1

    :t

    a i i

    i

    H C k

    1

    :t

    a i i

    i

    H C k

    1

    :t

    a i i

    i

    H C k

    a un nivel de significacin

    Estadstica de Prueba

    .

    10

    2

    1

    ~ /

    t

    i i

    i

    GLEt

    i

    i

    C Y k

    t t HCME

    Cn

    es verdadera

    Luego, se tiene los siguientes criterios de decisin

    Decisin Caso Bilateral Unilateral a la

    derecha

    Unilateral a la

    izquierda

    Se acepta 0H , 1 ,

    2 2

    cGLE GLE

    t t t

    1 ,c GLEt t ,c GLEt t

    Se rechaza 0H , 1 ,

    2 2

    c cGLE GLE

    t t o t t

    1 ,c GLEt t ,c GLEt t

  • Ejemplo: Suponga que se tiene cuatro fertilizantes que se desea comparar, con tal

    motivo se realiz un experimento bajo un DCA con cinco repeticiones por tratamiento,

    de la cual se obtuvo los siguientes resultados:

    Fertilizante

    T1 T2 T3 T4

    .iY 73.8 74.2 69.0 71.8

    10.4SCE Luego 10.4

    0.6516

    CME

    Supngase que se ha planeado realizar la siguiente prueba:

    0 2 3 4: 2 1H

    1 2 3 4: 2 1H

    2 222 74.2 69 71.8 1

    7.4730280.65

    2 1 15

    ct

    > pvalue pvalue

    [1] 6.634694e-07.

    La prueba result altamente significativa, se puede afirmar que la media del rendimiento

    obtenido con el fertilizante 2 supera en ms de una unidad a la media de los

    rendimientos obtenidos con los fertilizantes 3 y 4.

    Prueba de F con contraste:

    Suponga que se desea probar la Hiptesis

    0

    1

    : 0t

    i i

    i

    H C

    1

    : 0t

    a i i

    i

    H C

    a un nivel de significacin

    Estadstica de Prueba:

    2

    .

    12

    2.

    12 101,

    2

    1

    ~ /

    t

    i i

    i

    t t

    i i ii i

    GLEt

    i

    i

    n C Y

    C Y C

    F t F HCME CME

    Cn

  • Se sabe que 2

    1,GLE GLEt F , entonces la prueba de t para este caso es equivalente a usar

    la siguiente estadstica

    Si se hace

    2

    1

    2

    1

    t

    i i

    i

    t

    i

    i

    n C Y

    SCQ

    C

    =Suma de cuadrado de contraste, entonces se puede usar la

    siguiente estadstica de prueba:

    01,~ /c GLESCQ

    F F HCME

    es verdadera

    Luego, se rechaza oH a un nivel de significacin , si 1 ,1,c GLEF F

    Prueba de F con contrastes ortogonales

    Si se planeado comparar t-1 funciones de medias de la variable respuestas con estos t

    tratamientos resultante de t-1 contrastes ortogonales : 1 2 1, , , tQ Q Q , se puede

    demostrar que

    1 2 1tSCTrat SCQ SCQ SCQ

    Luego se puede tener el siguiente cuadro de ANVA

    Fuente de

    Variacin

    SC GL CM Fc

    Entre Tratamiento SCTrat GLTrat CMTrat /CMTrat CME

    1Q 1SCQ 1 1SCQ 1 /SCQ CME

    2Q 2SCQ 1 2SCQ 2 /SCQ CME

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    1tQ 1tSCQ 1 1tSCQ 1 /tSCQ CME

    Dentro de

    Tratamiento SCE GLE CME

    Total SCTotal . 1n

    Este cuadro de ANVA permite probar las siguientes pruebas de hiptesis:

  • 01

    : 0t

    li i

    i

    H C

    versus 1

    : 0t

    a li i

    i

    H C

    , para 1, 2, , 1l t

    donde : 1

    0t

    li

    i

    C

    y 1

    0t

    li l i

    i

    C C

    , para l l y , 1, 2, , 1l l t

    para el cual se utiliza la siguiente estadstica:

    01,~ /ll

    c GLE

    SCQF F H

    CME , para 1, 2, , 1l t

    Ejemplo:

    En el ejemplo del fertilizante se sabe adems que los fertilizantes 3 y 4 poseen un

    componente K que no poseen los fertilizantes 1 y 2. Se ha planeado antes de realizar el

    experimento comparar ( 1T y 2T ) versus ( 3T y 4T ). Obtenga todos los contrastes

    ortogonales. Realice las pruebas de hiptesis correspondientes a un nivel de

    significacin 0.05

    Matriz de contraste

    Fertilizante

    Coeficientes T1 T2 T3 T4

    1iC -1 -1 1 1

    2iC -1 1 0 0

    3iC 0 0 -1 1

    Contrastes ortogonales

    1 1. 2. 3. 4.Q Y Y Y Y

    2 1. 2.Q Y Y

    3 3. 4.Q Y Y

    Hiptesis:

    ( 1T y 2T ) versus ( 3T y 4T )

    0 3 4 1 2: 0H contra 3 4 1 2: 0aH

    1T versus 2T

    0 2 1: 0H contra 2 1: 0aH

    3T versus 4T

    0 4 3: 0H contra 4 3: 0aH

  • 2

    21 .

    1

    1 2 2 2 22

    1

    1

    5 73.8 74.2 69.0 71.864.8

    1 1 1 1

    t

    i i

    i

    t

    i

    i

    n C Y

    SCQ

    C

    2

    22 .

    1

    2 2 22

    2

    1

    5 73.8 74.20.4

    1 1

    t

    i i

    i

    t

    i

    i

    n C Y

    SCQ

    C

    2

    23 .

    1

    3 2 22

    3

    1

    5 69.0 71.819.6

    1 1

    t

    i i

    i

    t

    i

    i

    n C Y

    SCQ

    C

    Contraste SC GL CM Fc

    ( 1T y 2T ) versus ( 3T y 4T ) 64.80 1 64.80 99.69**

    1T versus 2T 0.4 1 0.4 0.62 ns

    3T versus 4T 19.6 1 19.6 30.15**

    Residual 10.4 16 0.65

    **= altamente Significativo, ns = no significativo 0.90,1,16 3.05F , 0.95,1,16 4.49F ,

    0.99,1,16 8.53F

    > vp sce r=5

    > ct scc1 scc1

    [,1]

    [1,] 64.8

    > ct2 scc2 scc2

    [,1]

    [1,] 0.4

    > ct3 scc3 scc3

    [,1]

    [1,] 19.6

    > tr gle gle

    [1] 16

    > cme fuente gl

  • > SC CM Fc Fc1 pvalue1 pvalue data.frame(fuente,gl,SC,CM,Fc,pvalue)

    fuente gl SC CM Fc pvalue

    1 Q1 1 64.8 64.80 99.6923 0

    2 Q2 1 0.4 0.40 0.6154 0.4442

    3 Q3 1 19.6 19.60 30.1538 0

    4 Residuals 16 10.4 0.65

    Prueba de Scheffe

    Es una prueba que permite realizar pruebas sobre cualquier funcin estimable de

    medias de la variable respuesta de todos los tratamientos. Esto quiere decir que se

    puede realizar infinitas pruebas simultneas aunque en la prctica se realice un nmero

    finito de pruebas simultneas. Inclusive esta prueba es vlida para comparaciones

    sugeridas por los datos. Luego, las hiptesis son sobre las siguientes funciones lineales

    de parmetros:

    1

    t

    i i

    i

    L C

    donde 1

    0t

    i

    i

    C

    Para aplicar esta prueba se requiere que los ij son variables aleatorias independientes

    distribuidas normalmente con media cero y variancia comn 2 .

    Para probar las siguientes hiptesis

    0

    1

    : 0t

    i i

    i

    H C

    contra

    1

    : 0t

    a i i

    i

    H C

    Nivel de significacin

    Se utiliza el siguiente valor crtico de la prueba

    1 ,t 1,1 GLELVCS S t F

    donde:

    .1

    t

    i i

    i

    L C Y

    2

    1

    ki

    Li i

    CS CME

    n

  • t = nmero de tratamientos

    Se acepta 0H , si

    L VCS

    Se rechaza 0H , si

    20 L VCS

    Ejemplo: Con los datos de tiempo de coagulacin, pruebe:

    0 : 0A B C DH contra la alternativa : 0a A B C DH

    0.05

    A B C D

    .iY 61 66 68 61

    in 4 6 6 8

    iC 1 1 -1 -1

    5.6CME , 0.95,4,20 3.10F

    4

    .

    1

    1 61 1 66 1 68 1 61 2i ii

    L C Y

    2 2 2 224

    1

    1 1 1 15.6 1.991649

    4 6 6 8

    i

    Li i

    CS CME

    n

    1 , 1,4 1 1.991649 3 3.1 6.072138t GLELVCS S F

    Como 2 6.072138L VCS , se acepta 0H

    Usando R

    > tiempo dieta yp ci lab lab

    [,1]

    [1,] 2

    > re mod cme sdl vcs5 vcs5

    [1] 6.072138

  • > vcs10 vcs10

    [1] 5.321939

    El Mtodo de Bonferroni

    Este mtodo se basa en la desigualdad de Bonferroni, el cual dice: dado una secuencia

    de eventos jA , j jjjP A P A . De esta manera la posibilidad de uno o ms error tipo I es una coleccin arbitraria de la prueba es a lo ms la suma de sus

    posibilidades separada de error tipo I. Para el caso que se desee realizar 2

    tnc

    de

    tratamientos se puede seguir el siguiente procedimiento:

    1) Plantear las hiptesis:

    0 : i iH

    :a i iH , para i i , y , 1, 2, .i i t

    2) Fijar el nivel de significacin de comparacin simultnea 3) Encontrar toda las diferencias absolutas de medias muestrales para las

    comparaciones:

    . .i iY Y , para i i , y , 1, 2, .i i t

    4) Encontrar el valor Crtico de Bonferroni

    . .1 ,

    2

    ,i iY YGLE

    nc

    VCB i i t S

    donde:

    . .

    1 1i iY Y

    i i

    S CMEn n

    Se rechaza 0H para i i , y , 1, 2, .i i t , si

    . . ,i iY Y VCB i i

    Para aplicar esta prueba se requiere que ij son variables aleatorias independientes

    distribuidas normalmente con media cero y variancia comn 2 . Adems, en este caso las comparaciones deben ser planeadas de antemano. Esta prueba es recomendable

    cuando se desea realizar pocas comparaciones entre medias de la variable respuesta de

    dos tratamientos.

    Ejemplo Si se planeo realizar todas las comparaciones en forma simultanea en el

    ejemplo de coagulacin a un nivel de significacin 0.05 , use la prueba de Bonferroni. Luego, se tiene:

  • 0 : i iH

    :a i iH Para i i , , , , ,i i A B C D

    i A D B C

    .iY 61 61 66 68

    in 4 8 6 6

    0.05 0.9958333,201 ,20

    12

    2.927116t t

    , esto se obtuvo usando R:

    > qt(0.9958333,20)

    [1] 2.927116

    Comparaciones i iY Y i iY YS 0.9995833,20, i iY YVCB i i t S

    C-A 7 1.5275 4.471243* 4.471243

    C-D 7 1.2780 3.74091* 3.740910

    C-B 2 1.3663 3.999201ns 3.999201

    B-A 5 1.5275 4.471243* 4.471243

    B-D 5 1.2780 3.74091* 3.740910

    D-A 0 1.4491 4.241793ns 4.241793

    *=significativo , ns= no significativo

    > pairwise.t.test(tiempo,dieta,p.adjust.method="bonferroni")

    Pairwise comparisons using t tests with pooled SD

    data: tiempo and dieta

    a b c

    b 0.02282 - -

    c 0.00108 0.95266 -

    d 1.00000 0.00518 0.00014

    P value adjustment method: bonferroni

    Nota el R da los pvalue ajustado de manera que se pueda tomar decisiones con la tasa

    de error del experimento.

    Prueba de Comparaciones Mltiple con el Mejor

    El objetivo de esta prueba es seleccionar el conjunto de tratamientos o un slo

    tratamiento (si es posible) que proporcione el resultado ms deseable. El procedimiento

    de comparaciones mltiple con el mejor (CMM) permite al investigador clasificar los

    tratamientos de manera que la mejor poblacin est incluida en subconjunto con un

    nivel de confianza dado. Existen dos casos:

    a) Eleccin de subconjunto con la media ms grande b) Eleccin de subconjunto con la media ms pequea

    a) Eleccin de subconjunto con la media ms grande

  • En este caso los parmetros de inters son:

    . , para 1, 2, ,i jj i

    mx i t

    donde: j

    j imx

    es la media mxima sin incluir

    i . Si . 0i jj i

    mx

    , entonces el

    tratamiento i es el mejor. Por otro lado, si . 0i jj i

    mx

    , entonces el tratamiento i

    no es el mejor.

    Los intervalos de confianza simultneos (ICS) de las CMM para .i jj i

    mx

    tiene la

    restriccin de incluir el cero con la perspectiva de que a la larga dos tratamientos nunca

    tienen promedio idnticos. El intervalo de confianza CMM restringido establece que el

    tratamiento i es uno de los mejores si el intervalo para .i jj i

    mx

    incluye el cero o el

    cero es su lmite inferior. Por el contrario, si el lmite superior del intervalo para

    .i jj i

    mx

    es cero, entonces el tratamiento i no es el mejor. El procedimiento para

    construir los intervalos de confianza simultneos se da a continuacin:

    1.- Se calcula la diferencia, , para 1, 2, ,i i jj i

    D y mx y i t

    . Esto es entre cada

    media de la variable respuesta de estos tratamientos, iy , y con la mayor media de la

    variable respuesta de los tratamientos restantes, jj i

    mx y

    2.- La cantidad , 1,2

    t gle

    CMEM d

    r , donde , 1,t gled es el estadstico tabulado para las

    comparaciones de un lado en la Tabla IV del apndice del texto Diseos de

    Experimentos de Robert Kuehl para una tasa experimental de , 1t comparaciones y gle grados de libertad del error experimental.

    3.- Encontrar los intervalos de confianza restringidos. El lmite inferior del intervalo de

    confianza restringido para .i jj i

    mx

    es:

    , Si 0

    0 de otra manera

    i iD M D ML

    y el lmite superior de confianza para .i jj i

    mx

    es:

    , Si 0

    0 de otra manera

    i iD M D MU

    4.- Para obtener el mejor tratamiento o el conjunto de los mejores de tratamientos con

    una tasa de error experimental de se selecciona a aquellos tratamientos cuyo lmite

    superior cumple con la regla: 0iD M

    b) Eleccin de subconjunto con la media ms pequea

    En este caso los parmetros de inters son:

  • . min , para 1, 2, ,i jj i

    i t

    donde: min jj i

    es la media mnima sin incluir i . Si . min 0i j

    j i

    , entonces el

    tratamiento i es el mejor. Por otro lado, si . min 0i jj i

    , entonces el tratamiento i

    no es el mejor.

    El procedimiento para construir los intervalos de confianza simultneos se da a

    continuacin:

    1.- Se calcula la diferencia, min , para 1, 2, ,i i jj i

    D y y i t

    . Esto es entre media

    de la variable respuesta de cada tratamiento, iy , y la menor media de la variable

    respuesta obtenido con los tratamientos restantes, min jj i

    y

    2.- La cantidad , 1,2

    t gle

    CMEM d

    r , donde , 1,t gled es el estadstico tabulado para las

    comparaciones de un lado en la Tabla IV del apndice del texto Diseos de

    Experimentos de Robert Kuehl para una tasa experimental de , 1t comparaciones y gle grados de libertad del error experimental.

    3.- Encontrar los intervalos de confianza restringidos. El lmite inferior del intervalo de

    confianza restringido para . mini jj i

    es:

    , Si 0

    0 de otra manera

    i iD M D ML

    y el lmite superior de confianza para . mini jj i

    es:

    , Si 0

    0 de otra manera

    i iD M D MU

    4.- Para obtener el mejor tratamiento o el conjunto de los mejores de tratamientos con

    una tasa de error experimental de se selecciona a aquellos tratamientos cuyo lmite

    inferior cumple con la regla: 0iD M

    Observacin: Hsu (1996) desarroll su metodologa para el caso balanceado donde las

    variancias de la diferencia de media de la variable respuesta de tratamientos son todos

    iguales. Por otro lado, para el caso del Diseo completamente aleatorizado

    desigualmente repetido, recomienda algunas aproximaciones basadas en desigualdades

    de probabilidad, que paquetes como el Minitab ha incorporado

    Ejemplo: Un ingeniero de desarrollo de producto le interesa determinar si el porcentaje

    de algodn en una fibra sinttica afecta la tensin, y ha llevado a cabo un experimento

    completamente aleatorizado con 5 niveles del peso porcentual de algodn y cinco

    rplicas. los resultados sobre resistencia en lb/pulg2 del experimento se muestra a

    continuacin:

  • > algodon

    Resistencia Porcentajes

    1 7 15

    2 7 15

    3 15 15

    4 11 15

    5 9 15

    6 12 20

    7 17 20

    8 12 20

    9 18 20

    10 18 20

    11 14 25

    12 18 25

    13 18 25

    14 19 25

    15 19 25

    16 19 30

    17 25 30

    18 22 30

    19 19 30

    20 23 30

    21 7 35

    22 10 35

    23 11 35

    24 15 35

    25 11 35

    One-way ANOVA: Resistencia versus Porcentajes Source DF SS MS F P

    Porcentajes 4 475,76 118,94 14,76 0,000

    Error 20 161,20 8,06

    Total 24 636,96

    S = 2,839 R-Sq = 74,69% R-Sq(adj) = 69,63%

    Individual 95% CIs For Mean Based on

    Pooled StDev

    Level N Mean StDev ------+---------+---------+---------+---

    15 5 9,800 3,347 (-----*----)

    20 5 15,400 3,130 (----*----)

    25 5 17,600 2,074 (----*----)

    30 5 21,600 2,608 (----*----)

    35 5 10,800 2,864 (-----*----)

    ------+---------+---------+---------+---

    10,0 15,0 20,0 25,0

    Pooled StDev = 2,839

    Hsu's MCB (Multiple Comparisons with the Best)

    Family error rate = 0,05

    Critical value = 2,30

    Intervals for level mean minus largest of other level means

    Level Lower Center Upper ---+---------+---------+---------+------

    15 -15,938 -11,800 0,000 (-----*----------------)

    20 -10,338 -6,200 0,000 (-----*--------)

    25 -8,138 -4,000 0,138 (-----*-----)

    30 -0,138 4,000 8,138 (-----*-----)

    35 -14,938 -10,800 0,000 (-----*--------------)

    ---+---------+---------+---------+------

    -14,0 -7,0 0,0 7,0

  • En este caso el conjunto de los tratamientos con mejores resistencia promedio est dado

    por los tratamientos con los porcentajes de algodn 25 y 30

    En el caso del tiempo de coagulacin, si estuviramos interesados en determinar con

    cuales de las dietas se obtienen las menores medias de los tiempos de coagulacin,

    aplicando la prueba de Hsu se tiene:

    ANOVA unidireccional: Tiempo vs. dieta Fuente GL SC MC F P

    dieta 3 228.00 76.00 13.57 0.000

    Error 20 112.00 5.60

    Total 23 340.00

    S = 2.366 R-cuad. = 67.06% R-cuad.(ajustado) = 62.12%

    ICs de 95% individuales para la media

    basados en Desv.Est. agrupada

    Nivel N Media Desv.Est. -----+---------+---------+---------+----

    A 4 61.000 1.826 (-------*--------)

    B 6 66.000 2.828 (------*------)

    C 6 68.000 1.673 (------*-----)

    D 8 61.000 2.619 (----*-----)

    -----+---------+---------+---------+----

    60.0 63.0 66.0 69.0

    Desv.Est. agrupada = 2.366

    MCB de Hsu (comparaciones mltiples con el mejor)

    Tasa de error por familia = 0.05

    Valor crtico = 2.22

    Intervalos para la media de los niveles menos la menor de las medias de otros

    niveles

    Nivel Inferior Centro Superior ---------+---------+---------+---------+

    A -3.214 0.000 3.214 (--------*--------)

    B 0.000 5.000 8.388 (-------------*---------)

    C 0.000 7.000 10.388 (-------------------*---------)

    D -3.214 0.000 3.214 (--------*--------)

    ---------+---------+---------+---------+

    0.0 3.5 7.0 10.5

    Varias Muestras Independientes (La prueba de Kruskal - Wallis)

    Cuando no se cumple el supuesto de Normalidad de los errores, una alternativa es usar

    Mtodos no paramtricos, como la pruebas de Kruskal-Wallis. Para realizar esta prueba

    se sigue el siguiente procedimiento.

    Datos: Los datos consisten de k muestras aleatorias, posiblemente de tamaos

    diferentes. La i-sima muestra aleatoria de tamao ni se denota por X X Xi i ini1 2, , , .

    Entonces, los datos pueden ser arreglados en columna:

    Muestra1 Muestra 2 ... Muestra k

    X11 X21 Xk1

    X12 X22 Xk2

  • .

    .

    .

    .

    .

    .

    .

    .

    .

    X n1 1 X n2 2

    X knk

    Sea N que denota el nmero total de observaciones

    N nii

    k

    1

    (1)

    Asignar el rango 1 al ms pequeo de la totalidad de N observaciones, rango 2 al

    segundo ms pequeo, y as sucesivamente hasta el ms grande de todas las

    observaciones, al cual se le asigna rango N. Sea R(Xij) que representa el rango asignado

    a Xij. Sea iR la suma de rango asignado a la i-sima muestra

    R R Xi ijj

    ni

    1

    i=1, 2, ..., k (2)

    Calcule Ri para cada muestra.

    En caso que existan empates, asignar el promedio de los rangos a cada una de las

    observaciones empatadas.

    Asunciones:

    1.- Todas las muestras son muestras aleatorias de sus respectivas poblaciones

    2.- Las muestras son mutuamente independientes.

    3.- La escala de medida es al menos ordinal.

    4.- Las k poblaciones tienen funciones de distribucin idnticas, o algunas de las

    poblaciones tiende a producir valores ms grandes que otras poblaciones.

    Hiptesis :

    H0 : Las k poblaciones tienen funciones de distribucin idnticas.

    H1 : Al menos una de las k poblaciones tiende a producir observaciones ms grandes

    que las restantes.

    Nota : La prueba de Kruskal - Wallis est diseado para ser ms sensitivo contra la

    diferencia entre medias en k poblaciones, por esta razn, algunas veces la hiptesis

    alternativa se expresa como sigue :

    H1 : Las k poblaciones no tiene medias idnticas.

  • Estadstico de Prueba : Se usa el siguiente estadstico

    T

    S

    R

    n

    N Ni

    ii

    k

    1 1

    42

    2

    1

    2

    (3)

    donde

    SN

    R XN N

    iji j

    22

    21

    1

    1

    4

    ,

    (4)

    si no hay empates S2 se simplifica a

    N N 1

    4

    2

    y el estadstico de prueba se reduce a

    T

    N N

    R

    nN

    i

    ii

    k

    12

    13 1

    2

    1

    (5)

    Si hay pocos empates (nmero de empates moderado) de manera que los valores

    obtenidos con la ecuacin (3) y (5) son muy prximos, entonces se prefiere usar

    ecuacin (5).

    Regla de decisin :

    Si k=3, todos los tamaos de muestras son 5 o menos y no hay empates, el cuantil

    exacto puede ser obtenido de la tabla A8. Tabla ms completa pueden ser obtenidos de

    Iman Quade y Alexander (1975). Cuando hay empates o cuando tablas exactas no son

    disponibles, entonces se puede usar la aproximacin

    T H es ciertak 12

    0|

    Comparaciones Mltiples :

    Si y solamente si la hiptesis nula es rechazada, se puede usar el siguiente

    procedimiento para determinar cuales de los pares de poblaciones tiende a ser

    diferentes. As, para ver si existe diferencia entre las poblaciones i y j a un nivel de

    significacin se compara:

    R

    n

    R

    n

    i

    i

    j

    j

    con

    t

    S N T

    N k n nN k i j1

    21 2

    2

    1 1 1

    ,

    /

    As si

    R

    n

    R

    nt

    S N T

    N k n n

    i

    i

    j

    jN k

    i j

    1

    21 2

    2

    1 1 1

    ,

    /

  • Existe diferencia entre las funciones de distribucin de las poblaciones i y j a un nivel

    de significacin .

    Ejemplo No 1 : Para comparar tres mtodos de enseanza de programacin en cierto

    lenguaje en computadora, en donde:

    El mtodo A: instruccin directa con la computadora

    El mtodo B: instruccin de teora y prctica en computadora

    El mtodo C: instruccin solo de clase tericas

    Se extraen de grandes grupos de alumnos instruidas por uno de los mtodos en forma

    aleatoria: 4 alumnos del mtodo A, 6 del mtodo B y 5 del mtodo C. Luego se les tom

    una prueba. Los puntajes obtenidos se dan a continuacin:

    Mtodos

    A B C

    73 91 72

    77 90 76

    67 81 79

    71 83 77

    84 78

    83

    H0 : Los tres mtodos son equivalentes.

    H1 : Algunos mtodos de enseanza tiene puntajes ms altos que otros.

    Mtodos

    A B C

    Observ. Rango Observ. Rango Observ. Rango

    73 4 91 15 72 3

    77 6.5 90 14 76 5

    67 1 81 10 79 9

    71 2 83 11.5 77 6.5

    84 13 78 8

    83 11.5

    Ri 13.5 75 31.5

    ni 4 6 5

    N=15

    2 22

    2

    ,

    1 15 15 11 11239 19.92857

    1 4 15 1 4ij

    i j

    N NS R X

    N

    2 22

    21

    1 15 15 11 1 1181.513 11.11535

    4 19.92857 4

    ki

    i i

    N NRT

    S n

  • 2

    0.95,25.991 , se rechaza H0.

    Como se rechaz H0 en la prueba anterior, entonces se prosigue con las comparaciones

    mltiples para determinar entre que mtodos existe diferencias en los rendimientos:

    0.975,11 2.201t

    Comparaciones R

    n

    R

    n

    i

    i

    j

    j

    2

    1/ 22

    1 ,

    1 1 1N k

    i j

    S N Tt

    N k n n

    A y B 9.125 3.078296*

    A y C 2.925 3.199059ns

    B y C 6.2 2.887698*

    > curso calificacin mtodo library(agricolae)

    > kruskal(calificacin,mtodo)

    Study:

    Kruskal-Wallis test's

    Ties or no Ties

    Value: 11.11532

    degrees of freedom: 2

    Pvalue chisq : 0.003857788

    mtodo, means of the ranks

    calificacin replication

    a 3.375 4

    b 12.500 6

    c 6.300 5

    t-Student: 2.178813

    Alpha : 0.05

    LSD : 3.057705

    Harmonic Mean of Cell Sizes 4.864865

    Means with the same letter are not significantly different

    Groups, Treatments and mean of the ranks

    a b 12.5

    b c 6.3

    b a 3.375

    > kruskal(calificacin,mtodo,group=FALSE)

    Study:

    Kruskal-Wallis test's

    Ties or no Ties

    Value: 11.11532

    degrees of freedom: 2

    Pvalue chisq : 0.003857788

    mtodo, means of the ranks

  • calificacin replication

    a 3.375 4

    b 12.500 6

    c 6.300 5

    Comparison between treatments mean of the ranks

    Difference pvalue sig LCL UCL

    a - b -9.125 0.000032 *** -12.203296 -6.0467039

    a - c -2.925 0.069606 . -6.124059 0.2740591

    b - c 6.200 0.000534 *** 3.312302 9.0876977

    >