Upload
luisarriolaguillen
View
1.253
Download
1
Embed Size (px)
Citation preview
Uso y aplicación de las pruebas
Anova, Tuckey y Scheffe
MAESTRANDO: Gustavo Armando Ruiz Mora
ANOVA
En la comparación de más de dos grupos no es muy práctico comparar las variablesde dos en dos con pruebas de contraste como la t de Student.
La herramienta estadística que sirve para resolver el problema de comparar mas dedos medias o promedios es el ANALISIS DE VARIANZA que se llama así precisamenteporque compara la variabilidad de las medias muestrales ( a través de la varianzamuestral) con la variabilidad de los elementos dentro de la muestra.
El ANALISIS DE LA VARIANZA permite también descomponer la variabilidad total encomponentes independientes que puedan asignarse a causaa distintas.
ANOVA
Definiendo ANOVA
ANOVA
ANOVA
-Comparar diversos métodos de análisis
-Diferentes características
-Varios laboratorios o investigadores
analizando la misma muestra con el mismo método
-Muestra expuesta a distintos tratamientos o
intervenciones
En todos estos
casos hay al menos
dos posibles
fuentes de
VARIACION:
1-ERROR
ALEATORIO
2-FACTOR
CONTROLADO
-Métodos
-Condiciones
-Laboratorios
-Investigadores
-Tiempos
Ricardo Boqué,Alicia Maroto. Grupo de Quimioterapia y Cualimetria.
Universitat Rovira i Virgili.Pl. Imperial Tárraco, 1.43005-Tarragona
ANOVA
Tipos de Anova
• Con un factor
• Con dos factores:
– tres grupos (A, B, C)
– género (M, F)
– Interacción
• Con más de dos factores (NSE, género, religión)
• De medidas repetidas (activ EMG)
ANOVA
ANOVA
Condiciones para el ANOVA
Independientes.
Homogéneas ( Test de Levene)
Paramétricos.
ANOVA
EJEMPLO UNO
Tomando un ejemplo práctico general de una publicación online española:
Ricardo Boqué,Alicia Maroto. Grupo de Quimioterapia y Cualimetria.
Universitat Rovira i Virgili.Pl. Imperial Tárraco, 1.43005-Tarragona
Intentaré explicar descriptivamente lo que ocurre matemáticamente con ANOVA.
Analizando los promedios , parece que existen diferencias en los diferentes laboratorios,
pero NO sabemos si esas diferencias son estadíticamente significativas.
Ricardo Boqué,Alicia Maroto. Grupo de Quimioterapia y Cualimetria.
Universitat Rovira i Virgili.Pl. Imperial Tárraco, 1.43005-Tarragona
ANOVA
Ricardo Boqué,Alicia Maroto. Grupo de Quimioterapia y Cualimetria.
Universitat Rovira i Virgili.Pl. Imperial Tárraco, 1.43005-Tarragona
ANOVA
Ricardo Boqué,Alicia Maroto. Grupo de Quimioterapia y Cualimetria.
Universitat Rovira i Virgili.Pl. Imperial Tárraco, 1.43005-Tarragona
ANOVA
Ricardo Boqué,Alicia Maroto. Grupo de Quimioterapia y Cualimetria.
Universitat Rovira i Virgili.Pl. Imperial Tárraco, 1.43005-Tarragona
ANOVA
0,00623
Ricardo Boqué,Alicia Maroto. Grupo de Quimioterapia y Cualimetria.
Universitat Rovira i Virgili.Pl. Imperial Tárraco, 1.43005-Tarragona
ANOVA
Las pruebas estadísticas Post Hoc o Comparaciones a Posteriori de Tukey
y Scheffé podrían permitirnos saber cuántos laboratorios y cuáles son.
ANOVA
En este artículo hemos visto que el ANOVA puede utilizarse para comparar entre si las
medias de los resultados obtenidos por diferentes laboratorios, analistas, métodos de
análisis, etc.
EJEMPLO DOS
Cómo pude aplicar ANOVA en mi trabajo de investigación?
TEMA: Altura y posición horizontal de molares superiores en Tomografía
Computarizada Cone Beam TCCB de acuerdo a la relación esquelética.
Variables Resultado: Altura del primero (A1M) y segundo (A2M) molares
maxilares y posición horizontal (PH1M) del primer molar maxilar
Variable Causa: Relación Esquelética (ANB Steiner) Clase I-Clase II-Clase III.
ANOVA
Hipótesis Estadística Verdadera: No hay distribución normal en los datos p<0,05Hipótesis Estadística Nula : Sí hay distribución normal en los datos p>0,05
Para evaluar normalidad en más de tres (3) datos, para la variable efecto alturadel primer molar maxilar (A1M), utilizamos la prueba de Shapiro- Wilk.
p>0,05 Distribución Normal
p>0,05 Distribución Normal
p<0,05 NO HAY Distribución Normal
En la evaluación de significancia estadística en las diferencias entre las variablescausa Clase I y Clases II para la variable dependiente A1M que presentandistribución normal o normalidad, se utilizará estadística para datosparamétricos con análisis bivariado para comparar dos o más grupos. La pruebamás indicada es ANOVA (Análisis de Varianza) de un factor para muestrasindependientes.La A1M en clase III no presenta normalidad . La significancia para A1M entreClase I con clase III y clase II con clase III serán evaluadas con la prueba de sumade rangos asignados U de Mann Withney par muestras independientes.
ANOVA
p>0,05 Distribución Normal
p>0,05 Distribución Normal
p<0,05 NO HAY Distribución Normal
La A1M presenta normalidad en clase I y Clase II, pero en clase III no presentanormalidad . La significancia para A1M entre Clase I con clase III y clase II conclase III podrían ser evaluadas con la prueba H de Kruskal Wallis para muestrasindependientes en tres o más grupos, pero al comparar 1 con 2, 1 con 3 o 2 con 3solamente nos indicaría que por lo menos alguno de los resultados es diferentede los otros dos.Por ésta razón para comparar 1 con 2 (paramétricos) utlizaría ANOVA o t deStudent , y sabiendo que 3 NO es paramétrico, al comparar 1 con 3 y 2 con 3preferiría U de Mann Withney para muestras independientes.
1-
2-
3-
ANOVA
Hipótesis Estadística Verdadera: No hay distribución normal en los datos( p<0,05)Hipótesis Estadística Nula : Sí hay distribución normal en los datos (p>0,05)
Para evaluar normalidad en más de tres (3) datos, para la variable efecto alturadel segundo molar maxilar (A2M), utilizamos la prueba de Shapiro- Wilk.
p>0,05 Distribución Normal
p>0,05 Distribución Normal
p>0,05 Distribución Normal
En la evaluación de significancia estadística en las diferencias entre las variablescausa Clase I, II y III para la variable dependiente A2M que presentandistribución normal o normalidad, se utilizará estadística para datosparamétricos con análisis bivariado para comparar dos o más grupos. La pruebamás indicada es ANOVA (Análisis de Varianza) de un factor para muestrasindependientes. Son alternativas: la prueba t de Student sirve para comparardos grupos con normalidad, o una prueba para comparación múltiple devarianzas en datos con normalidad conocida como prueba pos hoc de Tuckey.
ANOVA
La prueba Post Hoc de Tukeypara la VD denominada A2Mno mostró diferenciasestadísticamente significantesentre las tres clasesesqueléticas
Hipótesis Estadística Verdadera: No hay distribución normal en los datos p<0,05Hipótesis Estadística Nula : Sí hay distribución normal en los datos p>0,05
Para evaluar normalidad en más de tres (3) datos, para la variable efectoposición horizontal del primer molar maxilar (PH1M), utilizamos la prueba deShapiro- Wilk.
p<0,05 NO HAY Distribución Normal
p>0,05 Distribución Normal
p>0,05 Distribución Normal
En la evaluación de significancia estadística en las diferencias entre las variablescausa 1-clase I para la variable dependiente PH1M que NO presentadistribución normal o normalidad, y compararlo con 2-clase II y con 3-clase IIIque sí tienen distribución normal utilizamos la prueba de suma de rangosasignados U de Mann Withney para muestras independientes.
Para comparar 2 con 3 que son paramétricas, ANOVA y comparación Post Hocde Tukey que compara varianzas entre dos grupos con normalidad esapropiada.
1-
2-
3-
TUKEY
n Media DS Mínimo Máximo Rango Varianza p (1,2,3)
A1M 16 47,08 3,86 41,50 53,80 12,30 14,89 0,581*
A2M 16 44,46 3,40 39,10 50,30 11,20 11,57 0,519**
PH1M 16 20,81 2,84 18,00 29,00 11,00 8,05 0,005*
A1M 16 47,67 2,50 40,80 51,40 10,60 6,26
A2M 16 45,14 2,95 38,30 48,50 10,20 8,70
PH1M 16 23,04 4,08 15,00 30,00 15,00 16,67
A1M 16 45,26 6,38 26,30 52,30 26,00 40,72
A2M 16 43,69 4,21 36,70 50,10 13,40 17,70
PH1M 16 18,90 3,75 14,00 27,00 13,00 14,05
3.CLASE III
2.CLASE II
1.CLASE I
TABLA 3. Descripción de la posición vertical y horizontal del primero y segundo molar maxilar de acuerdo a la clase
esquelética
Relación Esquelética
*ANOVA **H de Kruskal Wallis
***A1M:Altura primer molar maxilar ****A2M:Altura segundo molar maxilar *****PH1M:Posición horizontal primer molar maxilar
Las diferentes pruebas estadísticas no aportaron diferencias estadísticamentesignificativas para las variables dependientes A1M (p=0,581) y A2M (p=0.519)entre las tres clases equeléticas.
Los resultados aportaron diferencias estadísticamente significativas en laposición horizontal del primer molar maxilar (PH1M) para las diferentesrelaciones esqueléticas estudiadas ( PH1M para Clase I-II-III p =0,005).
ANOVA
TABLA 4. Comparación de los valores de significancia (p) para la variable de estudio PH 1 M de acuerdo a la relación
esquelética
Relacion CLASE II CLASE III
Variable PH 1 M PH 1 M
CLASE I PH 1 M 0,021 0,047
CLASE II PH 1 M - 0,005
ANOVA
Para la variable resultado Posición Horizontal del Primer Molar -PH1M
se analizó específicamente la significancia en las diferencias entre
cada clase esquelética una vez se detectó que PH1M fue la única VD
( distinto de A1M y A2M ) que mostró diferencias significativas para
la posición del primer molar maxilar.
Puebas ANOVA y Pos Hoc de Tukey
Un problema común al que nos podemos enfrentar en cualquier
investigación es querer comparar más de 2 grupos de datos para detectar
posibles diferencias entre ellos.
La utilización de modelos de ANOVA puede permitirnos detectar
diferencias, a nivel global, entre las medias involucradas, pero en muchas
ocasiones deseamos trabajar a un mayor detalle y detectar las
diferencias entre grupos concretos lo que sólo es posible mediante el
uso de los Procedimientos de Comparaciones múltiples (PCM)
Procedimientos de Comparaciones múltiples (PCM)
Basadas en la distribución t
-Dunn-Bonferroni (Dunn, 1961)
-Dunn-Sidak (Dunn, 1958 y Sidák, 1967)
-Holm-Shaffer (Holm, 1979 y Shaffer, 1986)
Basadas en la distribución del Rango Studentizado
-Tukey (Tukey, 1953)
-Newman-Keuls (Newman, 1932 y Keuls 1952)
-Duncan (Duncan, 1955)
-Ryan (Ryan, 1960; Einot y Gabriel , 1975)
-Peritz (Peritz, 1970)
Basadas en la distribución F
-Scheffé (Scheffé, 1953, 1959)
-F de Newman-Keuls
-F de Ryan
Basadas en una prueba t protegida
-LSD de Fisher (Fisher, 1935)
-Shaffer-Ryan (Shaffer, 1979)
-Fisher-Hayter (Hayter, 1986)
Basadas en la comparación con un control
- Dunnet (Dunnett, 1955)
COMPARACIONES
MULTIPLES
clasificadas según la
distribución estadistica
que utilizan en su cálculo:
COMPARACIONES post hoc o a posteriori
COMPARACIONES post hoc o a posteriori
Tukey
(1953). Diferencia honestamente significativa de Tukey. Equivale a utilizar el
método de Student-Newman-Keuls con r= J= nº de medias. Por tanto, todas
las comparaciones son referidas a una misma diferencia mínima. Es uno de
los métodos de mayor aceptación.
COMPARACIONES post hoc o a posteriori
Una vez que se ha determinado que existen diferencias entre las medias, las pruebas de
rango post hoc permiten determinar qué medias difieren. La prueba de rango post hoc
identifica subconjuntos homogéneos de medias que no se diferencian entre sí.
Prueba deTukey, es una prueba estadística utilizada general y conjuntamente con ANOVA. La
prueba Tukey se usa en experimentos que implican un número elevado de comparaciones.
Es de fácil cálculo puesto que se define un solo comparador, resultante del producto del error
estándar de la media por el valor tabular en la tabla de Tukey usando como numerador el
número de tratamientos y como denominador los grados de libertad del error
COMPARACIONES post hoc o a posteriori
Prueba deTukey
Scheffé
(1953, 1959). Este método, basado en la distribución F, permite controlar la
tasa de error para el conjunto total de comparaciones que es posible diseñar
con J medias (una con otra, una con todas las demás, dos con dos, etc.).
Utilizado para efectuar sólo compara-ciones por pares, es un procedimiento
muy conservador: tiende a considerar significativas menos diferencias de las
que debería.
COMPARACIONES post hoc o a posteriori
El test de Scheffé pertenece a una de las tantas pruebas a posteriori con las que
nos encontramos al realizar un ANOVA de un factor, es decir, comparaciones entre
medias para determinar diferencias significativas entre pares de medias. En este
sentido, es similar al test de Tukey, pero a diferencia de este se emplea
comúnmente cuando las muestras tienen n distintos (el de Tukey es sólo para n
iguales).
COMPARACIONES post hoc o a posteriori
Prueba de Scheffé es una prueba que se aplica para hacer comparaciones
múltiples de las medias de grupos. Su uso está relacionado con la prueba del
análisis de varianza, y se incuye dentro de las llamadas pruebas de
comparaciones múltiples.
La prueba del análisis de la varianza contrasta la hipótesis de igualdad de medias
de dos o más grupos. Si el resultado se considera estadísticamente significativo,
lo que se puede afirmar es que al menos la media de uno de los grupos es distinta
a las restantes, o bien que hay otras medias diferentes entre sí.
Prueba de Scheffé
El siguiente paso consiste en identificar qué grupos son los que tienen medias diferentesentre sí. Una solución es comparar las medias por pares, usando una prueba estadísticacomo la t de Student. Pero al hacerlo así se produce un aumento del error tipo I que sequiere admitir. Las pruebas de comparaciones múltiples corrigen el error para conseguirque no sobrepase el nivel establecido, por ejemplo del 5%.
La prueba de Scheffé se realiza comparando todos los posibles pares de medias, perousando como error típico el valor de la varianza residual o intragrupos obtenida en elanálisis de la varianza.
COMPARACIONES post hoc o a posteriori
COMPARACIONES post hoc o a posteriori-EJEMPLO
http://bioestadistico.com/pruebas-post-hoc
http://bioestadistico.com/pruebas-post-hoc
Dr. José Antonio Supo CondoriSociedad Peruana de Bioestadística
Proceso estadístico ANOVA Y Pos Hoc sobre programa SPSS
http://bioestadistico.com/pruebas-post-hoc
COMPARACIONES post hoc o a posteriori
Proceso estadístico ANOVA Y Pos Hoc sobre programa SPSS – Prueba de Tukey
http://bioestadistico.com/pruebas-post-hoc
Valor medio del peso del
Recién Nacido por
procedencia (CIUDAD).
Nos preguntamos : si el
peso promedio DIFIERE
ENTRE LAS CIUDADES O
SI ES MUY SEMEJANTE?.
Si p<0,05 entonces ya sabemos que existen
diferencias entre los promedios de los cuatro grupos
poblacionales la siguiente pregunta es:
Habrá diferencias al comparar una ciudad con otra y
específicamente entre qué ciudades concretas se
presentan las diferencias ?.
Entonces vamos a pruebas Post Hoc:
Seleccionamos HSD de T uckey,
con esta pruebe podemos conocer
qué diferencias significativas existen
y entre qué ciudades concretamente.
Arequipa mostró evidentes diferencias
significativas para el peso de recién
nacidos en relación con las otras
ciudades.
Entre los grupos Cusco ,Puno yTacna no existen diferenciassignificativas y están en lamisma columna, en cambioArequipa está en distintacolumna y la diferencia essignificativa respecto de lasotras tres.
Los tres primeros grupos notienen diferencias entre ellos yson a su vez distintos del últimogrupo llamado Arequipa.
COMPARACIONES post hoc o a posteriori
http://bioestadistico.com/pruebas-post-hoc
La prueba Pos Hoc de Scheffé confirma cómo las diferencias estadísticamente significantes se presentan entre Arequipa y los Otros departamentos , Puno y Cusco.
COMPARACIONES post hoc o a posteriori- Prueba de Scheffé
http://bioestadistico.com/pruebas-post-hocDr. José Antonio Supo CondoriSociedad Peruana de Bioestadística
Solamente Arequipa tiene sus niños con pesos distintos a los de otras
localidades .
RESULTADOS: El peso de los niños que nacen en Arequipa difieren de peso
de los que nacen en otras localidades.
http://bioestadistico.com/pruebas-post-hocDr. José Antonio Supo CondoriSociedad Peruana de Bioestadística
Conclusiones
ANOVA es una técnica estadística que sirve para decidir/determinar si las
diferencias que existen entre las medias de tres o más grupos (niveles declasificación) son estadísticamente significativas.
Las técnicas de ANOVA se basan en la partición de la varianza para
establecer si la varianza explicada por los grupos formados es suficientemente
mayor que la varianza residual o no explicada.
La utilización de modelos de ANOVA puede permitirnos detectar diferencias, a
nivel global, entre las medias involucradas, pero en muchas ocasiones
deseamos trabajar a un mayor detalle y detectar las diferencias entre
grupos concretos lo que sólo es posible mediante el uso de los
Procedimientos de Comparaciones múltiples como la prueba de Tukey y
la prueba de Scheffé
Uso y aplicación de las pruebas
Anova, Tuckey y Scheffe
MAESTRANDO: Gustavo Armando Ruiz Mora