ANOVA-TUCKEY-SCHEFFE-Seminario DR. GUSTAVO RUÏZ

Uso y aplicación de las pruebas

Anova, Tuckey y Scheffe

MAESTRANDO: Gustavo Armando Ruiz Mora

ANOVA

En la comparación de más de dos grupos no es muy práctico comparar las variablesde dos en dos con pruebas de contraste como la t de Student.

La herramienta estadística que sirve para resolver el problema de comparar mas dedos medias o promedios es el ANALISIS DE VARIANZA que se llama así precisamenteporque compara la variabilidad de las medias muestrales ( a través de la varianzamuestral) con la variabilidad de los elementos dentro de la muestra.

El ANALISIS DE LA VARIANZA permite también descomponer la variabilidad total encomponentes independientes que puedan asignarse a causaa distintas.

ANOVA

Definiendo ANOVA

ANOVA

ANOVA

-Comparar diversos métodos de análisis

-Diferentes características

-Varios laboratorios o investigadores

analizando la misma muestra con el mismo método

-Muestra expuesta a distintos tratamientos o

intervenciones

En todos estos

casos hay al menos

dos posibles

fuentes de

VARIACION:

1-ERROR

ALEATORIO

2-FACTOR

CONTROLADO

-Métodos

-Condiciones

-Laboratorios

-Investigadores

-Tiempos

Ricardo Boqué,Alicia Maroto. Grupo de Quimioterapia y Cualimetria.

Universitat Rovira i Virgili.Pl. Imperial Tárraco, 1.43005-Tarragona

ANOVA

Tipos de Anova

• Con un factor

• Con dos factores:

– tres grupos (A, B, C)

– género (M, F)

– Interacción

• Con más de dos factores (NSE, género, religión)

• De medidas repetidas (activ EMG)

ANOVA

ANOVA

Condiciones para el ANOVA

Independientes.

Homogéneas ( Test de Levene)

Paramétricos.

ANOVA

EJEMPLO UNO

Tomando un ejemplo práctico general de una publicación online española:



Intentaré explicar descriptivamente lo que ocurre matemáticamente con ANOVA.

Analizando los promedios , parece que existen diferencias en los diferentes laboratorios,

pero NO sabemos si esas diferencias son estadíticamente significativas.



ANOVA



ANOVA



ANOVA



ANOVA

0,00623



ANOVA

Las pruebas estadísticas Post Hoc o Comparaciones a Posteriori de Tukey

y Scheffé podrían permitirnos saber cuántos laboratorios y cuáles son.

ANOVA

En este artículo hemos visto que el ANOVA puede utilizarse para comparar entre si las

medias de los resultados obtenidos por diferentes laboratorios, analistas, métodos de

análisis, etc.

EJEMPLO DOS

Cómo pude aplicar ANOVA en mi trabajo de investigación?

TEMA: Altura y posición horizontal de molares superiores en Tomografía

Computarizada Cone Beam TCCB de acuerdo a la relación esquelética.

Variables Resultado: Altura del primero (A1M) y segundo (A2M) molares

maxilares y posición horizontal (PH1M) del primer molar maxilar

Variable Causa: Relación Esquelética (ANB Steiner) Clase I-Clase II-Clase III.

ANOVA

Hipótesis Estadística Verdadera: No hay distribución normal en los datos p<0,05Hipótesis Estadística Nula : Sí hay distribución normal en los datos p>0,05

Para evaluar normalidad en más de tres (3) datos, para la variable efecto alturadel primer molar maxilar (A1M), utilizamos la prueba de Shapiro- Wilk.

p>0,05 Distribución Normal


p<0,05 NO HAY Distribución Normal

En la evaluación de significancia estadística en las diferencias entre las variablescausa Clase I y Clases II para la variable dependiente A1M que presentandistribución normal o normalidad, se utilizará estadística para datosparamétricos con análisis bivariado para comparar dos o más grupos. La pruebamás indicada es ANOVA (Análisis de Varianza) de un factor para muestrasindependientes.La A1M en clase III no presenta normalidad . La significancia para A1M entreClase I con clase III y clase II con clase III serán evaluadas con la prueba de sumade rangos asignados U de Mann Withney par muestras independientes.

ANOVA




La A1M presenta normalidad en clase I y Clase II, pero en clase III no presentanormalidad . La significancia para A1M entre Clase I con clase III y clase II conclase III podrían ser evaluadas con la prueba H de Kruskal Wallis para muestrasindependientes en tres o más grupos, pero al comparar 1 con 2, 1 con 3 o 2 con 3solamente nos indicaría que por lo menos alguno de los resultados es diferentede los otros dos.Por ésta razón para comparar 1 con 2 (paramétricos) utlizaría ANOVA o t deStudent , y sabiendo que 3 NO es paramétrico, al comparar 1 con 3 y 2 con 3preferiría U de Mann Withney para muestras independientes.

1-

2-

3-

ANOVA

Hipótesis Estadística Verdadera: No hay distribución normal en los datos( p<0,05)Hipótesis Estadística Nula : Sí hay distribución normal en los datos (p>0,05)

Para evaluar normalidad en más de tres (3) datos, para la variable efecto alturadel segundo molar maxilar (A2M), utilizamos la prueba de Shapiro- Wilk.




En la evaluación de significancia estadística en las diferencias entre las variablescausa Clase I, II y III para la variable dependiente A2M que presentandistribución normal o normalidad, se utilizará estadística para datosparamétricos con análisis bivariado para comparar dos o más grupos. La pruebamás indicada es ANOVA (Análisis de Varianza) de un factor para muestrasindependientes. Son alternativas: la prueba t de Student sirve para comparardos grupos con normalidad, o una prueba para comparación múltiple devarianzas en datos con normalidad conocida como prueba pos hoc de Tuckey.

ANOVA

La prueba Post Hoc de Tukeypara la VD denominada A2Mno mostró diferenciasestadísticamente significantesentre las tres clasesesqueléticas

Hipótesis Estadística Verdadera: No hay distribución normal en los datos p<0,05Hipótesis Estadística Nula : Sí hay distribución normal en los datos p>0,05

Para evaluar normalidad en más de tres (3) datos, para la variable efectoposición horizontal del primer molar maxilar (PH1M), utilizamos la prueba deShapiro- Wilk.




En la evaluación de significancia estadística en las diferencias entre las variablescausa 1-clase I para la variable dependiente PH1M que NO presentadistribución normal o normalidad, y compararlo con 2-clase II y con 3-clase IIIque sí tienen distribución normal utilizamos la prueba de suma de rangosasignados U de Mann Withney para muestras independientes.

Para comparar 2 con 3 que son paramétricas, ANOVA y comparación Post Hocde Tukey que compara varianzas entre dos grupos con normalidad esapropiada.

1-

2-

3-

TUKEY

n Media DS Mínimo Máximo Rango Varianza p (1,2,3)

A1M 16 47,08 3,86 41,50 53,80 12,30 14,89 0,581*

A2M 16 44,46 3,40 39,10 50,30 11,20 11,57 0,519**

PH1M 16 20,81 2,84 18,00 29,00 11,00 8,05 0,005*

A1M 16 47,67 2,50 40,80 51,40 10,60 6,26

A2M 16 45,14 2,95 38,30 48,50 10,20 8,70

PH1M 16 23,04 4,08 15,00 30,00 15,00 16,67

A1M 16 45,26 6,38 26,30 52,30 26,00 40,72

A2M 16 43,69 4,21 36,70 50,10 13,40 17,70

PH1M 16 18,90 3,75 14,00 27,00 13,00 14,05

3.CLASE III

2.CLASE II

1.CLASE I

TABLA 3. Descripción de la posición vertical y horizontal del primero y segundo molar maxilar de acuerdo a la clase

esquelética

Relación Esquelética

*ANOVA **H de Kruskal Wallis

***A1M:Altura primer molar maxilar ****A2M:Altura segundo molar maxilar *****PH1M:Posición horizontal primer molar maxilar

Las diferentes pruebas estadísticas no aportaron diferencias estadísticamentesignificativas para las variables dependientes A1M (p=0,581) y A2M (p=0.519)entre las tres clases equeléticas.

Los resultados aportaron diferencias estadísticamente significativas en laposición horizontal del primer molar maxilar (PH1M) para las diferentesrelaciones esqueléticas estudiadas ( PH1M para Clase I-II-III p =0,005).

ANOVA

TABLA 4. Comparación de los valores de significancia (p) para la variable de estudio PH 1 M de acuerdo a la relación

esquelética

Relacion CLASE II CLASE III

Variable PH 1 M PH 1 M

CLASE I PH 1 M 0,021 0,047

CLASE II PH 1 M - 0,005

ANOVA

Para la variable resultado Posición Horizontal del Primer Molar -PH1M

se analizó específicamente la significancia en las diferencias entre

cada clase esquelética una vez se detectó que PH1M fue la única VD

( distinto de A1M y A2M ) que mostró diferencias significativas para

la posición del primer molar maxilar.

Puebas ANOVA y Pos Hoc de Tukey

Un problema común al que nos podemos enfrentar en cualquier

investigación es querer comparar más de 2 grupos de datos para detectar

posibles diferencias entre ellos.

La utilización de modelos de ANOVA puede permitirnos detectar

diferencias, a nivel global, entre las medias involucradas, pero en muchas

ocasiones deseamos trabajar a un mayor detalle y detectar las

diferencias entre grupos concretos lo que sólo es posible mediante el

uso de los Procedimientos de Comparaciones múltiples (PCM)

Procedimientos de Comparaciones múltiples (PCM)

Basadas en la distribución t

-Dunn-Bonferroni (Dunn, 1961)

-Dunn-Sidak (Dunn, 1958 y Sidák, 1967)

-Holm-Shaffer (Holm, 1979 y Shaffer, 1986)

Basadas en la distribución del Rango Studentizado

-Tukey (Tukey, 1953)

-Newman-Keuls (Newman, 1932 y Keuls 1952)

-Duncan (Duncan, 1955)

-Ryan (Ryan, 1960; Einot y Gabriel , 1975)

-Peritz (Peritz, 1970)

Basadas en la distribución F

-Scheffé (Scheffé, 1953, 1959)

-F de Newman-Keuls

-F de Ryan

Basadas en una prueba t protegida

-LSD de Fisher (Fisher, 1935)

-Shaffer-Ryan (Shaffer, 1979)

-Fisher-Hayter (Hayter, 1986)

Basadas en la comparación con un control

- Dunnet (Dunnett, 1955)

COMPARACIONES

MULTIPLES

clasificadas según la

distribución estadistica

que utilizan en su cálculo:

COMPARACIONES post hoc o a posteriori


Tukey

(1953). Diferencia honestamente significativa de Tukey. Equivale a utilizar el

método de Student-Newman-Keuls con r= J= nº de medias. Por tanto, todas

las comparaciones son referidas a una misma diferencia mínima. Es uno de

los métodos de mayor aceptación.


Una vez que se ha determinado que existen diferencias entre las medias, las pruebas de

rango post hoc permiten determinar qué medias difieren. La prueba de rango post hoc

identifica subconjuntos homogéneos de medias que no se diferencian entre sí.

Prueba deTukey, es una prueba estadística utilizada general y conjuntamente con ANOVA. La

prueba Tukey se usa en experimentos que implican un número elevado de comparaciones.

Es de fácil cálculo puesto que se define un solo comparador, resultante del producto del error

estándar de la media por el valor tabular en la tabla de Tukey usando como numerador el

número de tratamientos y como denominador los grados de libertad del error


Prueba deTukey

Scheffé

(1953, 1959). Este método, basado en la distribución F, permite controlar la

tasa de error para el conjunto total de comparaciones que es posible diseñar

con J medias (una con otra, una con todas las demás, dos con dos, etc.).

Utilizado para efectuar sólo compara-ciones por pares, es un procedimiento

muy conservador: tiende a considerar significativas menos diferencias de las

que debería.


El test de Scheffé pertenece a una de las tantas pruebas a posteriori con las que

nos encontramos al realizar un ANOVA de un factor, es decir, comparaciones entre

medias para determinar diferencias significativas entre pares de medias. En este

sentido, es similar al test de Tukey, pero a diferencia de este se emplea

comúnmente cuando las muestras tienen n distintos (el de Tukey es sólo para n

iguales).


Prueba de Scheffé es una prueba que se aplica para hacer comparaciones

múltiples de las medias de grupos. Su uso está relacionado con la prueba del

análisis de varianza, y se incuye dentro de las llamadas pruebas de

comparaciones múltiples.

La prueba del análisis de la varianza contrasta la hipótesis de igualdad de medias

de dos o más grupos. Si el resultado se considera estadísticamente significativo,

lo que se puede afirmar es que al menos la media de uno de los grupos es distinta

a las restantes, o bien que hay otras medias diferentes entre sí.

Prueba de Scheffé

El siguiente paso consiste en identificar qué grupos son los que tienen medias diferentesentre sí. Una solución es comparar las medias por pares, usando una prueba estadísticacomo la t de Student. Pero al hacerlo así se produce un aumento del error tipo I que sequiere admitir. Las pruebas de comparaciones múltiples corrigen el error para conseguirque no sobrepase el nivel establecido, por ejemplo del 5%.

La prueba de Scheffé se realiza comparando todos los posibles pares de medias, perousando como error típico el valor de la varianza residual o intragrupos obtenida en elanálisis de la varianza.


COMPARACIONES post hoc o a posteriori-EJEMPLO

http://bioestadistico.com/pruebas-post-hoc


Dr. José Antonio Supo CondoriSociedad Peruana de Bioestadística

http://www.josesupo.com/

http://spbis.org/

Proceso estadístico ANOVA Y Pos Hoc sobre programa SPSS



Proceso estadístico ANOVA Y Pos Hoc sobre programa SPSS – Prueba de Tukey


Valor medio del peso del

Recién Nacido por

procedencia (CIUDAD).

Nos preguntamos : si el

peso promedio DIFIERE

ENTRE LAS CIUDADES O

SI ES MUY SEMEJANTE?.

Si p<0,05 entonces ya sabemos que existen

diferencias entre los promedios de los cuatro grupos

poblacionales la siguiente pregunta es:

Habrá diferencias al comparar una ciudad con otra y

específicamente entre qué ciudades concretas se

presentan las diferencias ?.

Entonces vamos a pruebas Post Hoc:

Seleccionamos HSD de T uckey,

con esta pruebe podemos conocer

qué diferencias significativas existen

y entre qué ciudades concretamente.

Arequipa mostró evidentes diferencias

significativas para el peso de recién

nacidos en relación con las otras

ciudades.

Entre los grupos Cusco ,Puno yTacna no existen diferenciassignificativas y están en lamisma columna, en cambioArequipa está en distintacolumna y la diferencia essignificativa respecto de lasotras tres.

Los tres primeros grupos notienen diferencias entre ellos yson a su vez distintos del últimogrupo llamado Arequipa.



La prueba Pos Hoc de Scheffé confirma cómo las diferencias estadísticamente significantes se presentan entre Arequipa y los Otros departamentos , Puno y Cusco.

COMPARACIONES post hoc o a posteriori- Prueba de Scheffé

http://bioestadistico.com/pruebas-post-hocDr. José Antonio Supo CondoriSociedad Peruana de Bioestadística


http://spbis.org/

Solamente Arequipa tiene sus niños con pesos distintos a los de otras

localidades .

RESULTADOS: El peso de los niños que nacen en Arequipa difieren de peso

de los que nacen en otras localidades.

http://bioestadistico.com/pruebas-post-hocDr. José Antonio Supo CondoriSociedad Peruana de Bioestadística


http://spbis.org/

Conclusiones

ANOVA es una técnica estadística que sirve para decidir/determinar si las

diferencias que existen entre las medias de tres o más grupos (niveles declasificación) son estadísticamente significativas.

Las técnicas de ANOVA se basan en la partición de la varianza para

establecer si la varianza explicada por los grupos formados es suficientemente

mayor que la varianza residual o no explicada.

La utilización de modelos de ANOVA puede permitirnos detectar diferencias, a

nivel global, entre las medias involucradas, pero en muchas ocasiones

deseamos trabajar a un mayor detalle y detectar las diferencias entre

grupos concretos lo que sólo es posible mediante el uso de los

Procedimientos de Comparaciones múltiples como la prueba de Tukey y

la prueba de Scheffé

Uso y aplicación de las pruebas

Anova, Tuckey y Scheffe

MAESTRANDO: Gustavo Armando Ruiz Mora

Documents

ANOVA-TUCKEY-SCHEFFE-Seminario DR. GUSTAVO RUÏZ