25
Diseño Factorial (dos factores) ANOVA dos vías Ayuda para la tarea de estadística TPICI – 2C2015 FI - UNLZ – IRMA NOEMÍ NO FI - UNLZ – IRMA NOEMÍ NO

Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Embed Size (px)

Citation preview

Page 1: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Diseño Factorial (dos factores)

ANOVA dos vías

Ayuda para la tarea de estadística

TPICI – 2C2015

FI - UNLZ – IRMA NOEMÍ NO

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 2: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Diseño Factorial

Cuando estamos interesados en estudiar el efecto de dos o

más variables independientes sobre una variable

respuesta, es más eficiente hacerlo en un solo

experimento, que realizar experimentos por separado para

cada variable independiente o “Factor”. Para resolver esta

situación se utiliza el ”Diseño Factorial”.

Se entiende por diseño factorial aquel diseño en el que se

investigan todas las posibles combinaciones de los niveles

de los factores en cada réplica del experimento.

En estos diseños, los factores que intervienen tienen la

misma importancia a priori y se supone por tanto, la posible

presencia de interacción.

FI - UNLZ – IRMA NOEMÍ NO

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 3: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Modelo Bifactorial de efectos fijos

FI - UNLZ – IRMA NOEMÍ NO

Se consideran dos factores “A” y “B”, con “a” niveles

para A y “b” niveles para B. En caso de trabajar sin

replicación el tamaño de la muestra será igual a “a.b”

yij: Representa la observación correspondiente al nivel (i) del

factor A y al nivel (j) del factor B.

µ: Efecto constante, común a todos los niveles de los factores,

denominado media global.

i : Efecto producido por el nivel i-ésimo del factor A.

j : Efecto producido por el nivel j-ésimo del factor B.

()ij : Efecto producido por la interacción AxB

uij : Son vv. aa. independientes con distribución N(0,).

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 4: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Caso Producto Panificado

FI - UNLZ – IRMA NOEMÍ NO

Estudiamos el efecto de los factores: “Temperatura” y

“Azúcar” sobre la variable respuesta “calidad del producto

panificado”.

Temperatura

Baja Media Alta

Azú

ca

r Escasa 6,8 8,2 5,9

Media 7,2 8,7 6,1

Abundante 7,1 8,5 6,5

En este caso ambos factores:

Temperatura y Azúcar tienen

3 niveles.

Calificación en calidad del producto

Nivel 1 de Temperatura, Nivel 3 de Azúcar

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 5: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Caso Producto Panificado

FI - UNLZ – IRMA NOEMÍ NO

Debido al escaso número de mediciones algún parámetro

no será estimable a menos que: se replique ó se considere

la interacción de factores nula (Temperatura x Azúcar = 0)

Trabajamos con una sola muestra, por lo cual

consideraremos interacción nula.

Hipótesis

𝐻0 ≡ 𝛽1 = 𝛽2 = 𝛽3 𝑣𝑠 𝐻1 ≡ 𝛽𝑖 ≠ 𝛽𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔ú𝑛 𝑖 ≠ 𝑗

𝐻0 ≡ 𝜏1 = 𝜏2 = 𝜏3 𝑣𝑠 𝐻1 ≡ 𝜏𝑖 ≠ 𝜏𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔ú𝑛 𝑖 ≠ 𝑗 FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 6: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático

Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Definición de variables

y Carga de datos

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 7: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático

Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Analizar / Modelo lineal General / Univariante

Variable dependiente: calificación_producto

Factores Fijos: Temperatura

Azúcar

Modelo -> Personalizado -> Efectos principales

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 8: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

El p-valor del factor temperatura es menor que 0,05,

rechazamos Ho y buscamos los niveles de temperatura

que provocan efectos diferentes.

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 9: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Analizar / Modelo lineal General / Univariante

Post hoc -> Tukey -> Temperatura

Utilizando Tukey

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 10: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Todas las diferencias son significativas (p<0,05)

Utilizando Tukey

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 11: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Existen tres subconjuntos homogéneos (tres columnas).

Los tres niveles provocan efectos o medias muy

distintas en la calificación del producto.

Utilizando Tukey

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 12: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Gráficamente: Factor Temperatura

Ninguna caja

se superpone

con otra.

Ninguna

mediana se

ubica a la

altura de otra

caja.

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 13: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Las cajas no

difieren signifi-

-cativamente,

se consideran

“superpuestas”.

Las medianas

se ubican a la

altura de las

otras cajas.

Gráficamente: Factor Azúcar

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 14: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Tuckey también muestra que el Factor Azúcar no

establece diferencia de medias en sus niveles.

p > 0,05

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 15: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando SPSS

FI - UNLZ – IRMA NOEMÍ NO

Hay un único subconjunto o columna de medias

homogéneas para el Factor Azúcar.

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 16: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando Excel

FI - UNLZ – IRMA NOEMÍ NO

Temperatura

Baja Media Alta

Azú

car

Escasa 6,8 8,2 5,9

Media 7,2 8,7 6,1

Abundante 7,1 8,5 6,5

Se cargan los datos en las celdas

creando una tabla de doble entrada

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 17: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando Excel

FI - UNLZ – IRMA NOEMÍ NO

Datos / Análisis de Datos / Análisis de varianza

de dos factores con una sola muestra por grupo

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 18: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Tratamiento informático Utilizando Excel (I)

FI - UNLZ – IRMA NOEMÍ NO

Azúcar

Temperatura Medias

muy distintas

Medias

similares

Page 19: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Tratamiento informático Utilizando Excel (II)

FI - UNLZ – IRMA NOEMÍ NO

Azúcar

p < 0,05 en

Temperatura

Temperatura

Page 20: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Tratamiento informático Utilizando Excel (III)

FI - UNLZ – IRMA NOEMÍ NO

Azúcar Temperatura

F calculado > F (Fisher) crítico

en el factor Temperatura

Page 21: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando Excel – Conclusión de I – II y III

FI - UNLZ – IRMA NOEMÍ NO

Existe diferencia significativa entre las medias

provocadas por los diferentes niveles del factor

Temperatura.

No se observa diferencia significativa en las

medias de los distintos niveles del factor Azúcar. FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 22: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Tratamiento informático Utilizando Excel

FI - UNLZ – IRMA NOEMÍ NO

A la misma conclusión se llega analizando por

separado los factores (aunque con otros valores):

Datos / Análisis de Datos / Análisis de varianza de

un factor

Elijo columnas

si quiero

analizar el

factor

Temperatura

(o filas para el

azúcar)

Señalo el

rango de

toda la

tabla de

datos

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Page 23: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Tratamiento informático Utilizando Excel

FI - UNLZ – IRMA NOEMÍ NO

Nuevamente los niveles del

factor TEMPERATURA

demuestran heterogeneidad de

medias en la variable

respuesta del experimento

Page 24: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O

Tratamiento informático Utilizando Excel

FI - UNLZ – IRMA NOEMÍ NO

Gráficamente: Factor Temperatura

Page 25: Ayuda para la tarea de estadística TPICI 2do. cuatrimestre 2015

Para finalizar

FI - UNLZ – IRMA NOEMÍ NO

Las herramientas informáticas nos proveen de

diversos procedimientos convergentes y

consistentes para realizar análisis estadísticos

en diseño de experimentos.

Excel posee limitaciones (Tukey debería

construirse con cálculos auxiliares por ejemplo),

pero siempre es un programa disponible por la

gran mayoría de los usuarios informáticos, y por

esta razón fue utilizado en este ejemplo.

FI -

UN

LZ

– IR

MA

NO

EM

Í N

O