26

ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

Embed Size (px)

Citation preview

Page 1: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida
Page 2: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

ANOVA I ES EL ANÁLISIS DE LA VARIANZA DE UN FACTOR

Page 3: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

En el análisis de la varianza con un factor (ANOVA I) se supone que hay variación debida a los tratamientos.

p: número tratamientos.

xij: valor de la variable en el elemento i-ésimo aplicado al tratamiento j.

nj: número de elementos de la muestra al que se aplicó el tratamiento j.

n: número total de elementos.

Se aplica un tratamiento distinto a cada una de las muestras p de tamaños n1 , n2 , … , np, obteniendo así una variable de respuesta xij, que se ordenan en la tabla adjunta.

Para aplicar el método ANOVA I se tiene que verificar las hipótesis:

Que las poblaciones de donde proceden las muestras sean normales.

Que las poblaciones tengan la misma varianza (homocedasticidad).

Que las muestras hayan sido elegidas al azar.

Page 4: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

Las p poblaciones normales, se representan por N(µ1, σ) , N(µ2, σ) , … , N(µp, σ)

Se pretende contrastar la hipótesis nula H0 frente a la alternativa H1, donde:

Hipótesis nula H0: Las medias poblacionales de donde proceden las muestras son iguales, µ1 = µ2 = … = µp

Hipótesis alternativa H1: Las medias poblacionales de donde proceden las muestras no son iguales.

A priori se supone que en los datos de la tabla existe una variación que se denota por SS y ésta se debe a dos factores:

SST = Variación debida a los tratamientos. SSE = Variación debida al azar.

SS = SST + SSE jn p

2ij

i 1 j 1

SS x C tiene (n-1) grados de libertad= =

= −∑∑

j2n p

iji 1 j 1

1C xn = =

= ∑∑ jn

j iji 1

T x=

=∑p 2

j

jj 1

TSST C tiene (p-1) grados de libertad

n=

= −∑SSE con (n−p) g. l.

Page 5: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

Contraste de hipótesis

0 , (p 1) ,(n p)MTSe acepta H si F FME α − −= ≤

0 , (p 1) ,(n p)MTSe rechaza H si F FME α − −= >

En SPSS se acepta H0 si p−valor > α

SSTMTp 1

=−

El cuadrado medio es el cociente entre la variación y los grados de libertad.

Cuadrado medio tratamientos Cuadrado medio azar

SSEMEn p

=−

Un caso práctico rural ...

Page 6: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

Se han elegido cuatro fincas de la misma calidad de tierra y sembradas con el mismo tipo de trigo y se les ha suministrado a cada una un tipo de abono. Al final de la cosecha se han tomado muestras de trigo en cada una de ellas y se ha pesado la cantidad de trigo que dan. Se ha obtenido:

El abono se produce en cuatro fábricas distintas, y cada una de ellas asegura que su abono es superior a los otros tres. ¿Mienten todas las fábricas?.

• Analizar/Comparar medias/ANOVA de un factor... • Analizar/Modelo lineal general/Univariante...

¿Son los abonos diferentes?

Page 7: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

• Analizar/Comparar medias/ANOVA de un factor...

Page 8: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

VISOR DE SPSS Hipótesis nula H0: Los pesos medios obtenidos son iguales.

p-valor = 0,390

α = 0,05

Se acepta la hipótesis nula H0 al ser p-valor = 0,390 > 0,05 = α

Page 9: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

Se había solicitado la Prueba de Levene y comparaciones mútiples

El estadístico de Levene presenta un p-valor = 0,356 > 0,05 = α por lo que las poblaciones tienen la misma varianza.

Partiendo de varianzas iguales, la Prueba DMS presenta las comparaciones de las medias de los cuatro tipos de abonos. Se observa que los distintos intervalos cubren el 0, por lo que no hay diferencia significativa entre ellas.

Si lo hacemos en SPSS con Analizar/Modelo lineal general/Univariante...

Page 10: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

• Analizar/Modelo lineal general/Univariante...

se pueden introducir 3 factores

variable que puede controlar el experimento

Page 11: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

VISOR DE SPSS Hipótesis nula H0: Los pesos medios obtenidos son iguales.

Se acepta la hipótesis nula H0 al ser p-valor = 0,390 > 0,05 = α Cálculos ...

Page 12: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

jn 4

iji 1 j 1

x 251 291 322 363 1.227= =

= + + + =∑∑j

2n 4 2

iji 1 j 1

1 (1.227)C x 79.238,36819 19= =

= = = ∑∑

jn 42ij

i 1 j 1

x 86.765= =

=∑∑

4 2j

jj 1

T 63.001 84.681 103.684 131.769 80.568,95n 4 5 4 6

=

= + + + =∑VARIACIÓN TOTAL:

jn 42ij

i 1 j 1

SS x C 86.765 79.238 7.527 = =

= − = − =∑∑

Page 13: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

4 2j

jj 1

TSST C 80.568,95 79.238,368 1330,582

n=

= − = − =∑VARIACIÓN TRAMAMIENTOS:

SS SST SSE SSE SS SST= + = −VARIACIÓN AZAR: SSE 7.527 1.330,95 6.196,05= − =

El cuadrado medio es el cociente entre la variación y los grados de libertad.

SSEMEn p

=−SSTMT

p 1=

CUADRADO MEDIO TRATAMAMIENTOS: SST 1.330,582MT 443,527p 1 4 1

= = =− −

CUADRADO MEDIO AZAR: SSF 6.196,05ME 413,07n p 19 4

= = =− −

MT 443,527F 1,074ME 413,07

= = =

Page 14: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

Contraste de hipótesis:

Hipótesis nula H0: Los pesos medios obtenidos aplicando los distintos abonos son iguales. µ1 = µ2 = µ3 = µ4 p = 4

0 0,05 , 3 ,15MTSe acepta H si F 1,074 3,2874 FME

= = ≤ =

0 0,05 , 3 ,15MTSe rechaza H si F 1,074 3,2874 FME

= = > =

Por lo que se acepta H0, es decir, no existe diferencia significativa entre los abonos, luego los fabricantes mienten.

Si p-valor = 0,39 > 0,05 = α se acepta H0

Page 15: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

ANOVA II ES EL ANÁLISIS DE LA VARIANZA DE DOS FACTORES

Page 16: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

En el análisis de la varianza con dos factores (ANOVA II) se supone que hay variación debida a los tratamientos y variación debida a los bloques.

La variación de la tabla se descompone:

SS = SST + SSB + SSE

SS: variación total SST: variación debida a tratamientos SSB: variación debida a bloques SSE: variación debida al azar

b: número de bloques p: número tratamientos xij: valor de la variable en el bloque i-ésimo y tratamiento j-ésimo. n = b x p: número de observaciones

MT = cuadrado medio tratamientos

SSTMTp 1

=−

MB = cuadrado medio bloques

ME = cuadrado medio del azar

SSBMBb 1

=−

SSEMEn b p 1

=− − +

Page 17: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

No olvides que para aplicar el método ANOVA II se tiene que cumplir: • Que las poblaciones de donde proceden las muestras sean normales. • Que las varianzas tengan la misma varianza (homocedasticidad). • Que las muestras hayan sido elegidas al azar.

Hay cuatro razas de gatos. Se toman tres muestras al azar de forma que en cada una de ellas hay un gato de cada raza. Se dispone de tres tipos de vitaminas distintas y se administra una de ellas solamente a cada muestra. Eligiendo como variable de respuesta el peso ganado por cada uno de los gatos. Información recogida en la tabla:

Vitamina A Vitamina B Vitamina C1 80 70 822 60 32 353 90 82 854 95 89 78

Tratamientos

Razas

Vamos a iniciarnos con el cálculo manual y el SPSS.

Se introducen los datos y cuando salgan los resultados se interpretan y se van obteniendo.

Page 18: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

INTRODUCIR DATOS EN SPSS:

Page 19: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

INTRODUCIR DATOS EN SPSS:

VISOR DE SPSS:

Page 20: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

DOBLE CONTRASTE DE HIPÓTESIS

Ho: El peso medio ganado es independiente de las razas.

H’o: Las tres vitaminas proporcionan una ganancia en peso medio equivalente.

Bloques Tratamientos

H1: El peso medio ganado varía con las razas.

H’1: Las tres vitaminas no proporcionan una ganancia en peso medio equivalente.

Se acepta Ho sí 0H, (b 1) , (p 1)(b 1)F Fα − − −≤

Se acepta H’o sí 0H', (p 1) , (p 1)(b 1)F Fα − − −≤

En SPSS si p-valor > α

Page 21: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

SS: variación total SST: variación debida a tratamientos SSB: variación debida a bloques SSE: variación debida al azar

Vitamina A Vitamina B Vitamina C1 80 70 822 60 32 353 90 82 854 95 89 78

TratamientosBloques

b = 4 número de bloques p = 3 número tratamientos n = 4 x 3 = 12 número de observaciones

Page 22: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

En los bloques (razas) p-valor=0,001 < α = 0,05

Se rechaza H0

En los tratamientos (vitaminas) p-valor=0,097 > α = 0,05

Se acepta H’0

Al rechazar la hipótesis nula en las razas, se acepta la hipótesis alternativa H1 afirmando que el peso medio varía de unas razas a otras.

Aceptando la hipótesis nula en el tratamiento con vitaminas, se afirma que no hay diferencia significativa en la ganancia de pesos con las vitaminas.

Cálculos ...

Page 23: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

CÁLCULO VARIACIÓN TOTAL:

4 32ij

i 1 j 1

x 68.952= =

=∑∑ ( )2 24 3

iji 1 j 1

1 878C x 64.240,33312 12= =

= = =

∑∑

SS 68.952 64.240,333 4.711,667= − = con (12 - 1) grados de libertad

CÁLCULO VARIACIÓN DE BLOQUES:

4 32ij

i 1 j 1

SS x C= =

= −∑∑

4 2i

i 1

BSSB C3=

= −∑

Page 24: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

No se puede mostrar la imagen en este momento.

SSB 68.215,333 64.240,333 3.975= − =

CÁLCULO VARIACIÓN DE TRATAMIENTOS:

con (4 - 1) grados de libertad 23j

j 1

TSST C

4=

= −∑SST 64.638,5 64.240,333 398,167= − = con (3 - 1) grados de libertad

Queda por calcular los Cuadrados medios.

Page 25: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

El cuadrado medio es el cociente entre la variación y los grados de libertad.

MEDIA CUADRÁTICA BLOQUES: SSB 3975MB 1325b 1 3

= = =−

MEDIA CUADRÁTICA TRATAMIENTOS: SST 398,167MT 199,083p 1 2

= = =−

MEDIA CUADRÁTICA AZAR: SSE 338,5ME 56,417(p 1)(b 1) 6

= = =− −

BLOQUES:

TRATAMIENTOS:

Test de contrastes MTF

ME=

MBFME

=

CONTRASTE BLOQUES

0H MB 1325F 23,486ME 56,417

= = =

, (b 1) , (b 1)(p 1) 0,05 , 3 , 6F F 4,76α − − − = =b = 4 p = 3

0H0,05 , 3 , 6F 23,486 4,76 F= > =

Se rechaza la hipótesis nula H0 y se acepta que el peso medio varía de una raza a otra, con una fiabilidad del 95%.

Page 26: ANOVA I VARIANZA DE UN FACTOR - estadistica.netestadistica.net/analisis-varianza.pdf · En el análisis de la varianza con dos factores (ANOVA II) se supone que hay . variación debida

CONTRASTE TRATAMIENTOS

0H' MT 199,083F 3,529ME 56,417

= = = , (p 1) , (b 1)(p 1) 0,05 , 2 , 6F F 5,14α − − − = =

0H'0,05 , 2 , 6F 3,529 5,14 F= < =

Se acepta la hipótesis nula H’0 y se acepta que no hay diferencia de ganancia de pesos debida a las vitaminas.