Anova 2

Preview:

Citation preview

Es un método de prueba de

igualdad de tres o más medias

poblacionales, por medio del

análisis de varianzas

muestrales

Como se van a comparar

varianzas, entonces se utiliza la

distribución F

Diseño

Completamente

aleatorio

Llamado también ANOVA de una vía

o una entrada

Se emplea una sola propiedad o

característica para categorizar las

poblaciones

Unidades Experimentales : Objetos

que reciben el tratamiento

Tratamientos o factor: Es una

propiedad o característica que nos

permite distinguir entre si a las distintas

poblaciones

1. Todas las poblaciones involucradas son

normales

2. Todas las poblaciones tienen la misma varianza

3. Las muestras son aleatorias simples

4. Las muestras son independientes

5. Las muestras provienen de poblaciones que

están categorizadas de una solo forma

kH ...: 210

:1HAl menos una de las medias

poblacionales es diferente a

las otras

1. Utilice algún programa estadístico ( SPSS,

Miniab, etc) o Excel para obtener los

resultados.

2. Identifique el valor de P en los resultados

3. Plantee una conclusión con base en estos

criterios:

Si el valor de P≤ α, rechace la hipótesis

nula de medias iguales y concluya que al

menos una de las medias poblacionales

es diferente a las otras

Si el valor de P> α, no rechace la

hipótesis nula de medias iguales.

muestras las de dentro varianza

muestras las entre varianzaF

Gl = c-1;n - k

FC

RA

1 - RR

Si F > Fc Rechazar la hipótesis Nula

2

2

p

x

s

nsF

Grados de Libertad:

gl del numerador = k – 1

gl del denominador = k(n - 1)

2

)( xxtotalSCSuma de cuadrados total

2)( xxnotratamientSC ii

2)1()( ii snerrorSC

Suma de cuadrados entre tratamientos

Suma de cuadrados del error

1

)()(

k

otratamientSCotratamientCM

kn

errorSCerrorCM

)()(

Cuadrado Medio del Tratamiento

Cuadrado Medio del Error

Cuadrado Medio Total

1

)()(

n

totalSCtotalCM

)(

)(

errorCM

otratamientCMF

Grados de liberad:

gl del numerador = k - 1

gl del denominador = n - k

Fuente de

variación

Suma de

cuadrados

Grados de

libertad

Cuadrado medio Valor F

Tratamiento

Error

Total

SC(tratamiento)

SC(error)

SCT

k -1

n – k

n – 1

CM (tratamiento)

CM(error)

CM(error)

ento)CM(tratamiF

Paso 1: Realice una prueba t separada para cada par de muestras,

haciendo los ajustes de los siguientes pasos

Paso 2; Calcule para cada par de muestras el valor de t

Paso 3: Calcule el valor t crítico o el valor de P

Valor de P: elegir t con gl=n-k y ajuste el valor de P

multiplicándolo por el número de pares de muestras diferentes

posibles

Valor Crítico: ajuste el nivel de significancia α dividiéndolo

entre el número de pares de muestras posibles

ji

ji

nnerrorCM

xxt

11).(

Se quiere medir el efecto que tienen tres programas de capacitación (A, B, C) en la producción de los empleados, se ha tomado una muestra de 14 empleados siendo distribuidos en el cuadro adjunto. Pruebe la aseveración que no existe diferencia significativa entre los tres programas de capacitación.

PROGRAMAS

A B C

85

72

83

80

80

84

81

78

82

82

80

85

90

88

Los esfuerzos promocionales para atraer nuevos

depositantes a un banco incluyen algunos juegos y

premios en cuatro sucursales del banco.

Se decide utilizar el monto de los depósitos como

una media representativa del ingreso.

Se desea determinar si existe una diferencia en el

nivel promedio de depósito entre las cuatro

sucursales. Si se halla algunas diferencias, el banco

ofrecerá una diversidad de premios promocionales.

Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4

1 5.1 1.9 3.6 1.3

2 4.9 1.9 4.2 1.5

3 5.6 2.1 4.5 0.9

4 4.8 2.4 4.8 1.0

5 3.8 2.1 3.9 1.9

6 5.1 3.1 4.1 1.5

7 4.8 2.5 5.1 2.1

El ANOVA de dos vías se utiliza cuando

existe influencia de dos factores en las

unidades experimentales.

Requiere que se haga una prueba de iteración

entre los dos factores, para verificar si el

efecto de uno de los factores cambia en las

diferentes categorías del otro factor.

Los valores muestrales provienen de una población con

una distribución que es aproximadamente normal.

Las poblaciones tienen la misma varianza o desviación

estándar

Las muestras son aleatorias simples

Las muestras son independientes entre si

Los valores muestrales se categorizan en dos factores

Todas las celdas tienen mismo número de valores

muestrales

Paso 1: Efecto de interacciones: se

debe probar la hipótesis nula de que no

existe interacciones entre los dos

factores.

Paso 2: Efectos renglón/columna:

Si rechazamos la hipótesis nula no se

debe seguir con las pruebas

adicionales.

Si no rechazamos la hipótesis nula

entonces procedemos a probar las

siguientes dos hipótesis:

cH ...: 210

:1H No todas las medias de las columnas son iguales

Hipótesis con respecto a los tratamientos

rH ...: 210

:1H No todas las medias de la filas o renglón son iguales

Hipótesis con respecto a los bloques No existe efectos del factor de renglón = las

medias de la fila o renglón son iguales

No existe efectos del factor de columna= las

medias de la columnas son iguales

Suma de Cuadrados del Total

SCT = SCTR + SCE + SCBL

Donde :

SCT y SCTR se calculan de la misma manera que ANOVA de

una vía

Suma de Cuadrados del Error

SCE = SCT - SCTR - SCBL

y la SCBL (Suma de cuadrados de bloques)

está dado por:

2)( xxcSCBL ii

CUADRADO MEDIO DEL TOTAL

1

n

SCTCMT

CUADRADO MEDIO DEL TRATAMIENTO

1

c

SCTRCMTR

CUADRADO MEDIO DEL ERROR

)1)(1(

cr

SCECME

CUADRADO MEDIO DEL BLOQUE

1

r

SCBLCMBL

Donde : r es el número de bloques

CME

CMTRF

CME

CMBLF

Determinar si los bloques se realizaron de manera

efectiva o si loa bloques afectar a los tratamientos

Determinar la diferencia significativa entre las medias

de los tratamientos

Una empresa de contabilidad grande trata de

seleccionar un sistema de computación integrado

a la oficina, entre los tres modelos que están

actualmente en estudio. La selección final

dependerá de la productividad de los sistemas.

Se seleccionan aleatoriamente 5 operadores para

manejar cada sistema. Es importante tener en

cuenta que el nivel de experiencia que tienen los

empleados en el manejo de computadoras puede

afectar el resultado de la prueba.

Por tanto, existe la necesidad de justificar el

impacto de la experiencia al determinar los

meritos relativos de los sistemas de

computación. Los niveles resultantes de

producción medidos en unidades por hora se

muestran a continuación

Nivel de Experiencia

Sistemas

1 2 3

1

2

3

4

5

27

31

42

38

45

21

33

39

41

46

25

35

39

37

45

Niveles de producción para los sistemas de

computación

543210 : H

:1H Al menos una de las medias de producción

para cada nivel de experiencia (las filas) no

son iguales

Hipótesis con respecto a los bloques

El nivel promedio de producción para cada

nivel de experiencia es el mismo

3210 : H

:1H Al menos una de las medias de los sistemas

de computación (las columnas) no son

iguales

Hipótesis con respecto a los tratamientos

La producción promedio de los sistemas de

computación son iguales

Recommended