DBCA

Embed Size (px)

Citation preview

DISEO DE BLOQUES COMPLETOS ALEATORIZADOS (DBCA) - MODELO DE UN FACTOR Un experimento puede involucrar uno o ms factores que aunque no son de inters para el experimentador podra tener un efecto sobre la respuesta. Entre dicho tipo de factores encontramos los factores de bloqueo. Un diseo de bloques es apropiado cuando el objetivo del experimento es comparar los efectos de diferentes tratamientos promediados sobre un rango de condiciones diferentes. Las unidades experimentales son agrupadas en conjuntos de tal forma que dos unidades experimentales en el mismo grupo son similares y pueden ser medidas bajo condiciones experimentales similares, pero dos unidades experimentales en diferentes grupos probablemente ocasionarn mediciones muy diferentes an cuando sean asignadas al mismo tratamiento. Los grupos de unidades experimentales similares son llamados bloques, y las condiciones que varan de bloque a bloque forman los niveles del factor de bloqueo. El anlisis de un diseo de bloques incluye la comparacin de tratamientos aplicados a las unidades experimentales dentro del mismo bloque. As, el propsito de bloquear es prevenir que diferencias grandes en las unidades experimentales enmascaren las diferencias entre los niveles del factor de tratamiento, mientras que al mismo tiempo permita que los tratamientos sean examinados bajo diferentes condiciones experimentales. Los niveles de un factor de bloqueo pueden ser los valores de una covariable que ha sido medida antes del experimento y cuyos valores son usados para agrupar a las unidades experimentales. Muy a menudo sin embargo, los niveles de un factor de bloqueo son agrupamientos de caractersticas que no pueden ser medidas convenientemente. Por ej., Agrupar los rangos de tiempo en el mismo da dentro del mismo bloque, puede asegurar que las condiciones ambientales dentro de un bloque sean bastante similares sin necesidad de medirlas. Dado que los niveles del factor de bloqueo no necesariamente necesitan ser medidas, el diseo de bloques es muy popular. Los experimentadores agrcolas pueden saber que parcelas cercanas en un campo son similares, en tanto que las parcelas lejanas no lo son. Los experimentadores industriales pueden saber que dos unidades producidas por una misma mquina tienen caractersticas similares, mientras que aquellas producidas por dos mquinas distintas son algo diferentes. Los experimentadores clnicos pueden saber que las mediciones tomadas sobre el mismo sujeto sern similares, mientras que aquellas tomadas sobre sujetos distintos no lo sern. Por tanto los bloques pueden ser formados sin conocer los niveles precisos del factor de bloqueo. ASPECTOS DEL DISEO DE BLOQUES Tamao de los bloques: Aunque es posible que el nmero de unidades experimentales en cada bloque sea distinto, se examinar slo diseos de bloques con igual tamao de bloque. Representaremos el nmero de bloques por b; y en este curso consideraremos el caso de tamao de bloque igual al nmero de niveles a del factor de estudio. Es comn que en experimentos industriales haya una divisin automtica en bloques de acuerdo al intervalo de tiempo en un da como proteccin contra condiciones experimentales cambiantes. Un experimento piloto puede ser realizado para determinar la necesidad de bloquear. NOTA 1: Debe tenerse en cuenta que cuando se bloquea innecesariamente, las pruebas de hiptesis sern menos potentes y los intervalos de confianza sern ms anchos que los que se obtendran con un diseo completamente aleatorizado. 1

DISEO DE BLOQUES COMPLETOS ALEATORIZADOS (DBCA) - MODELO DE UN FACTOR Una vez se haya determinado el nmero de bloques y se hayan agrupado a las unidades experimentales en tales grupos, a continuacin se asignan las unidades a los tratamientos. La peor asignacin posible de unidades a tratamientos es asignar todas las unidades de un bloque a un tratamiento, todas las unidades de otro bloque a otro tratamiento, y as sucesivamente. Esta asignacin no permite en el anlisis distinguir entre diferencias entre bloques y diferencias entre tratamientos. Los efectos de los tratamientos y los del factor de bloqueo quedan confundidos (confusin de efectos). La mejor asignacin posible es asignar a cada tratamiento el mismo nmero de unidades experimentales en cada bloque. Esto puede lograrse slo cuando el tamao del bloque k sea un mltiplo del nmero de niveles o tratamientos del factor, a. Este diseo es llamado diseo de bloques completos, y el caso especial en cual k=a, es el que se conoce usualmente como diseo de bloques completos aleatorizados, o simplemente diseo de bloques aleatorizados. Si el tamao de bloque no es mltiplo de a, entonces el diseo es conocido como un diseo de bloques incompletos. Este nombre es algunas veces reservado para el diseo en el cual k 1 H > 1

Cmo interpretar los valores de E.R? Si ER = 1( 100% ) La cantidad de bloques ni ha ayudado ni perjudicado ER < 1( 100% ) La cantidad de bloques no ha sido til ER > 1( 100% ) La cantidad de bloques ha sido til Se requieren n = b ER replicaciones por tratamiento para un DCA para que sea tan efectivo como un DBC con b replicaciones. Por ejemplo: Si ER = 96% (0.96) no es til el DBCA, ya que 96 rplicas de DCA dan tanta informacin como 100 bloques o rplicas de un DBCA. Si ER = 1.55 (155%) es til el DBCA ya que el DCA para obtener la misma eficiencia que el DBCA necesitara 155 rplicas y el DBCA solo 100. Si ER = n/b = 1.55/1 , se requieren 1.55 ms rplicas por tratamientos en un DCA para obtener la misma eficiencia que un DBCA con b bloques. NOTA: La ER slo habla de la precisin de los estimados y no de la potencia (sensibilidad del experimento). Por sta razn se recomienda considerar un DBCA mejor que un DCA cuando E.R=125% o ms.

7

EJEMPLO DE UN DBCA: COMPARACIN DE CUATRO MTODOS DE ENSAMBLE Un equipo de mejora investiga el efecto de cuatro mtodos de ensamble A, B, C, y D, sobre el tiempo de ensamble en minutos. En primera instancia la estrategia experimental fue aplicar cuatro veces los cuatro mtodos de ensamble en orden aleatorio en un diseo completamente aleatorizado. Sin embargo, los experimentadores se dan cuenta que hay cuatro operadores con distintas destrezas y consideran que esto puede afectar de manera significativa los tiempos de ensamble, y por ende la comparacin de los mtodos, entonces debe utilizarse un diseo de bloques completos aleatorizados para controlar activamente en el experimento a los operadores que realizarn el ensamble. Los datos recolectados en este diseo fueron los siguientes: Mtodo A B C D 1 6 7 10 10 2 9 10 16 13 Operador 3 7 11 11 11 4 8 8 14 9

Se desea determinar si existen diferencias entre los cuatro mtodos y cmo se diferencian, adems elegir el mejor mtodo, si lo hay.Solucin En primera instancia se construyen los grficos boxplots de los tiempos vs. mtodos y tiempos vs. operadores, usando programa SAS que aparece en ANEXO 1.

Se observan diferencias en los tiempos promedios de ensamble entre los cuatro mtodos. A primera vista parece que los dos mejores mtodos son el A y B. Parece que con el mtodo C los tiempos alcanzados tienen mayor dispersin que en los otros dos casos. Por su parte, el operador 1 parece tener en promedio el menor tiempo de ensamble, en tanto que los operadores 3 y 4 en promedio y tienen aproximadamente los mismos tiempos. El operador 2 es ms lento y opera con una mayor variabilidad lo que nos dice que es menos consistente en sus acciones. El modelo estadstico es Yij = + i + j + ij i=1, 2, 3, 4 para denotar los mtodos A, B, C y D respectivamente, y j=1, 2, 3, 4 operadores. i representa el efecto sobre el tiempo promedio de ensamble 8

EJEMPLO DE UN DBCA: COMPARACIN DE CUATRO MTODOS DE ENSAMBLE debido al mtodo i-esimo y j es el efecto del j-esimo operador sobre el tiempo promedio de ensamble. Restricciones y supuestos son

= i =1 i j =1

4

4

j

= 0 , con los errores ij ~ N 0, 2

iid

(

)

Se construye la tabla ANOVA con ayuda del SAS, los resultados son los siguientes:Dependent Variable: TIEMPO Source Model Error Corrected Total R-Square Coeff Var 0.833333 14.14214 Source OPERADOR METODO

ANOVASum of DF Squares Mean Square 6 90.0000000 15.0000000 9 18.0000000 2.0000000 15 108.0000000 Root MSE TIEMPO Mean 1.414214 10.00000 DF Type I SS Mean Square 3 28.50000000 9.50000000 3 61.50000000 20.50000000 F Value 7.50 Pr > F 0.0042

F Value 4.75 10.25

Pr > F 0.0298 0.0029

El test de hiptesis H 0 : 1 = 2 = 3 = 4 = 0 es rechazado con un valor p de 0.0029 a un nivel de significancia de 0.05, es decir, los tiempos medios de ensamble no son iguales para todos los mtodos. Para evaluar la eficiencia del diseo tenemos que : ( 9 + 1)(12 + 3) 3 9.5 + 4 3 2 100% = 168% , ER = (12 + 1)( 9 + 3) ( 4 4 1) 2 es decir, 168 rplicas de un DCA seran necesarias para obtener tanta informacin como 100 bloques de un DBCA. Por tanto fue altamente eficiente el diseo aplicado. Comparemos ahora los tiempos medios de ensamble para los cuatro mtodos mediante el procedimiento de Tukey. SAS da la siguiente salida:Tukey's Studentized Range (HSD) Test for TIEMPONOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 9 Error Mean Square 2 Critical Value of Studentized Range 4.41490 Minimum Significant Difference 3.1218 Means with the same letter are not significantly different.

9

EJEMPLO DE UN DBCA: COMPARACIN DE CUATRO MTODOS DE ENSAMBLEGroupingB B A A C C 12.750 10.750 9.000 7.500

Mean

N

4 4 4 4

METODOC D B A

Como vemos Tukey define tres grupos de medias que se traslapan: grupo A: mtodos C y D, grupo B: mtodos D y B y grupo C: mtodos A y B. Hay un problema de potencia del procedimiento debido a la gran dispersin en los datos en algunos operarios y mtodos como veremos. Validemos los supuestos de normalidad y de varianza constante mediante grficos de residuales:

La normalidad parece un supuesto razonable para los errores en este experimento. Sin embargo, hay problemas con el supuesto de varianza constante. Con los mtodos B y C la dispersin de los residuales es mayor comparativamente a la dispersin en los mtodos A y D. Con el mtodo A hay menos dispersin. A nivel del operador 3 las dispersin de los residuales es mayor aparentemente debido a una observacin que es subestimada. A pesar de estos inconvenientes es posible llegar a una conclusin: Elegir como mejor mtodo el A, dado que tiene menor tiempo promedio observado y menor dispersin (esto ltimo indica que los operadores con este mtodo son ms consistentes) g. Adicionalmente, se estimaron los efectos de cada mtodo de ensamble, y sus intervalos de confianza (cuyos niveles de confianza pueden ser un poco diferentes a los esperados dados los problemas de varianza). Se deja al lector la interpretacin de estos resultados.

10

EJEMPLO DE UN DBCA: COMPARACIN DE CUATRO MTODOS DE ENSAMBLEParameter EFECTO METODO EFECTO METODO EFECTO METODO EFECTO METODO Parameter EFECTO METODO EFECTO METODO EFECTO METODO EFECTO METODO Estimate -2.50000000 -1.00000000 2.75000000 0.75000000 Standard Error 0.61237244 0.61237244 0.61237244 0.61237244 t Value -4.08 -1.63 4.49 1.22 Pr > |t| 0.0027 0.1369 0.0015 0.2518

A B C D

A B C D

95% Confidence Limits -3.88528269 -1.11471731 -2.38528269 0.38528269 1.36471731 4.13528269 -0.63528269 2.13528269

ANEXO : PROGRAMA SAS PARA COMPARACIN DE LOS MTODOS DE ENSAMBLEoptions nodate nocenter nonumber; goptions colors=(black,black,black) cback=white ftext=simplex ftitle=simplex htitle=1.0 htext=0.9; DATA ENSAMBLE; DO OPERADOR=1 TO 4; DO METODO="A", "B", "C", "D"; INPUT TIEMPO @; OUTPUT; END; END; CARDS; 6 7 10 10 9 10 16 13 7 11 11 11 8 8 14 9 ; RUN; PROC SORT DATA=ENSAMBLE; BY METODO; RUN; TITLE1'BOXPLOTS TIEMPO ENSAMBLE'; TITLE2'COMPARACION POR METODOS'; PROC BOXPLOT DATA=ENSAMBLE; PLOT TIEMPO*METODO/BOXCONNECT=MEAN CCONNECT=RED CBOXES=BLACK CBOXFILL=YELLOW CFRAME=CXF7E1C2; RUN; QUIT; PROC SORT DATA=ENSAMBLE; BY OPERADOR; RUN; TITLE1'BOXPLOTS TIEMPO ENSAMBLE'; TITLE2'COMPARACION POR OPERADOR';

11

EJEMPLO DE UN DBCA: COMPARACIN DE CUATRO MTODOS DE ENSAMBLEPROC BOXPLOT DATA=ENSAMBLE; PLOT TIEMPO*OPERADOR/BOXCONNECT=MEAN CCONNECT=RED CBOXES=BLACK CBOXFILL=YELLOW CFRAME=CXF7E1C2; RUN; QUIT; PROC GLM DATA=ENSAMBLE; CLASS OPERADOR METODO; MODEL TIEMPO=OPERADOR METODO/SS1 CLPARM; MEANS METODO/TUKEY; ESTIMATE 'EFECTO METODO A' METODO 3 -1 -1 -1/DIVISOR=4; ESTIMATE 'EFECTO METODO B' METODO -1 3 -1 -1/DIVISOR=4; ESTIMATE 'EFECTO METODO C' METODO -1 -1 3 -1/DIVISOR=4; ESTIMATE 'EFECTO METODO D' METODO -1 -1 -1 3/DIVISOR=4; OUTPUT OUT=SAL R=RES P=PRED; RUN; QUIT; /*ESTANDARIZACIN DE RESIDUALES*/ PROC STANDARD DATA=SAL OUT=SAL2 STD=1 MEAN=0; VAR RES; RUN; TITLE1'GRAFICO PARA NORMALIDAD DE LOS ERRORES (RESIDUOS ESTANDARIZADOS)'; TITLE2'TIEMPOS DE ENSAMBLE'; PROC UNIVARIATE DATA=SAL2 NORMALTEST NOPRINT; VAR RES; PROBPLOT RES/NORMAL; INSET NORMALTEST PROBN; RUN; TITLE1'GRAFICOS DE RESIDUALES ESTANDARIZADOS- EXPERIMENTO DE LOS ENSAMBLES'; TITLE2'TIEMPOS DE ENSAMBLE - METODO'; PROC GPLOT DATA=SAL2; PLOT RES*METODO/VREF=0 LVREF=2; SYMBOL1 I=NONE V=DOT H=0.8 C=BLACK; RUN; QUIT; TITLE1'GRAFICOS DE RESIDUALES ESTANDARIZADOS- EXPERIMENTO DE LOS ENSAMBLES'; TITLE2'TIEMPOS DE ENSAMBLE - OPERADOR'; PROC GPLOT DATA=SAL2; PLOT RES*OPERADOR/VREF=0 LVREF=2; SYMBOL1 I=NONE V=DOT H=0.8 C=BLACK; RUN; QUIT;

12

EJEMPLO DE UN DBCA: COMPARACIN DE CUATRO MTODOS DE ENSAMBLE ANEXO: PROGRAMA R PARA COMPARACIN DE LOS MTODOS DE ENSAMBLECREANDO LA VARIABLE RESPUESTA tiempo