Upload
daniel
View
216
Download
0
Embed Size (px)
Citation preview
7/31/2019 Lean Sigma Bb Analisis b
1/264
1
Programa de certificacin
de Black BeltsVI. Lean Seis Sigma Anlisis B
Segunda Parte
P. Reyes / Abril de 2010
7/31/2019 Lean Sigma Bb Analisis b
2/264
2
VI.F Mtodos de anlisisadicionales
7/31/2019 Lean Sigma Bb Analisis b
3/264
3
Mtodos adicionales de anlisis1. Anlisis de brecha
2. Anlisis de causa raz
3. Anlisis del Muda
7/31/2019 Lean Sigma Bb Analisis b
4/264
4
VI.F.1 Anlisis de brecha
7/31/2019 Lean Sigma Bb Analisis b
5/264
5
El anlisis de brecha (Gap Analysis) es unaherramienta de evaluacin para comparar eldesempeo actual de la organizacin, a undesempeo potencial deseado.
Identifica la diferencia de lo que es y lo que deberaser
7/31/2019 Lean Sigma Bb Analisis b
6/264
6
Anlisis de brecha Se pueden redirigir los esfuerzos a objetivos como:
Permanecer en el negocio
Mantener o incrementar la participacin del mercado Mejorar el clima laboral
Igualar o exceder a Benchmarks
Igualar o exceder a la competencia
Reducir tiempos de ciclo Lograr certificaciones
Mejorar la productividad
Mejorar los niveles de calidad
7/31/2019 Lean Sigma Bb Analisis b
7/2647
Anlisis de brecha Se requieren tres categoras de informacin
Dnde estamos?
Dnde queremos ir? Cmo vamos a medir los resultados?
7/31/2019 Lean Sigma Bb Analisis b
8/2648
Planeacin de escenarios Al elaborar planes estratgicos, los directivos pueden
confiarse o ser orgullosos de aceptar cambios. Por loque se sugiere considerar escenarios del mejor y delpeor caso, para evitar errores en la toma dedecisiones
Los escenarios permiten imaginar el desempeofuturo de la organizacin ante riesgos, para tomar lasmejores decisiones y atender estos eventos. Aunquealgunos elementos sean desconocidos
7/31/2019 Lean Sigma Bb Analisis b
9/2649
Planeacin de escenarios El proceso de planeacin es como sigue:
Seleccionar al personal que pueda dar muchasperspectivas
Desarrollar una lista de cambios percibidos, sociales,tcnicos y econmicos
Agrupar estas percepciones en patrones relacionados
Desarrollar una lista de las mejores percepciones
(prioridades)
7/31/2019 Lean Sigma Bb Analisis b
10/26410
Planeacin de escenarios El proceso de planeacin es como sigue:
Desarrollar un escenario grueso del futuro basado enestas prioridades
Determinar como afectan los escenarios a laorganizacin
Determinar los cursos de accin potenciales a tomar
Monitorear, evaluar, y revisar los escenarios
7/31/2019 Lean Sigma Bb Analisis b
11/26411
Planeacin de escenarios Por lo comn se perciben de 6 10 amenazas u
oportunidades en 2 o 3 escenarios desarrollados.Evitar las siguientes trampas:
No utilizar un facilitador experimentado
Considerar escenarios como pronsticos
Hacer escenarios simplistas
Limitar el impacto global de los escenarios
7/31/2019 Lean Sigma Bb Analisis b
12/264
12
Planeacin de escenarios Evitar las siguientes trampas..:
No incluir a un equipo directivo en el proceso
Tratar los escenarios solo como actividad informativa
Limitar el estmulo imaginativo en el diseo delescenario
No desarrollar escenarios para rea de impacto clavedel negocio
7/31/2019 Lean Sigma Bb Analisis b
13/264
13
Planeacin Hoshin Es una herramienta de ejecucin, usada para
organizar y desplegar planes estratgicos
Hoshin traduce la visin de la empresa en resultadosmedibles dramticos y rupturas estratgicas
Hoshin se enfoca a identificar los pocos logros vitalesde ruptura
7/31/2019 Lean Sigma Bb Analisis b
14/264
14
Planeacin Hoshin Tiene seis objetivos:
Alinear las metas organizacionales
Enfocarse en las pocas brechas vitales estratgicas
Trabajar con otros para cerrar las brechas
Especificar los mtodos para lograr los objetivos
Hacer visible el enlace entre planes locales
Mejora continua del proceso de planeacin
7/31/2019 Lean Sigma Bb Analisis b
15/264
15
Otras tcnicas de anlisis clave Benchmarking
Anlisis FODA
Anlisis PEST
Las cinco fuerzas competitivas de Porter
7/31/2019 Lean Sigma Bb Analisis b
16/264
16
Evaluacin organizacional Anlisis funcional con datos de coleccin:
Entrevistas cara a cara
Seleccin de muestra apropiada
Entradas de grupo de enfoque Observaciones de visitas a la planta
Datos colectados de fuentes de la industria
Se divide a la organizacin en reas funcionales clave Liderazgo, prcticas de negocio, anlisis financiero,
mercadotecnia, gestin de la calidad, diseo ydesarrollo, manufactura, salud y seguridad, etc
7/31/2019 Lean Sigma Bb Analisis b
17/264
7/31/2019 Lean Sigma Bb Analisis b
18/264
18
Mtricas organizacionales Se establecen metas de desempeo organizacional y
sus mtricas en las reas de:
Utilidades
Tiempos de ciclo
Recursos
Respuestas del mercado
Por cada meta organizacional mayor debendesarrollarse mtricas, con unidades y mtodos demedicin.
7/31/2019 Lean Sigma Bb Analisis b
19/264
19
Mtricas organizacionalesPara los anteriores, las mtricas pueden ser:
Utilidades a corto y largo plazo
Valor de acciones, inversin de capital, costospersonales, comparaciones competitivas, ROI, ventas$
Tiempos de ciclo
Tiempos de ciclo actuales
Benchmarks internos
Benchmarks externos
Reduccin en tiempos de ciclo
7/31/2019 Lean Sigma Bb Analisis b
20/264
20
Mtricas organizacionales Recursos
No. De proyectos de mejora, ROI de proyectos, estudios decapacidad de procesos, reducciones de variabilidad, costos
de calidad con relacin a una base, porcentaje de defectoscon relacin a alguna base
Respuestas del mercado
Encuestas con clientes
Anlisis de devoluciones
Desarrollo de nuevos productos
Retencin de clientes
Prdidas con clientes
Tasas de cortesas e instalaciones
7/31/2019 Lean Sigma Bb Analisis b
21/264
21
Mtricas organizacionalesLas mtricas permiten medir los avances en relacin a
las metas organizacionales
De acuerdo a Juran se debe tomar en cuenta losiguiente: Las mtricas deben tener un significado estndar
Deben apoyar el proceso de toma de decisiones
Deben proporcionar informacin valiosa Debe ser fcil de instalar
Si son valiosas, deben usarse en todo
Las mtricas se basan en la retroalimentacin conbase en clientes, proveedores, o internas
7/31/2019 Lean Sigma Bb Analisis b
22/264
22
VI.F.2 Anlisis de causa raz
7/31/2019 Lean Sigma Bb Analisis b
23/264
23
Anlisis de causa raz
Un equipo tiene la responsabilidad de determinar lacausa raz de una deficiencia y corregirla. Puedentomar varios pasos:
Situacin (presa con fuga)
Accin inmediata (desahogarla)
Accin intermedia (reparar la presa)
Accin en la causa raz (identificar que caus la fugapara evitar su recurrencia y reconstruir la presa)
7/31/2019 Lean Sigma Bb Analisis b
24/264
7/31/2019 Lean Sigma Bb Analisis b
25/264
25
Anlisis de causa raz
Se pueden utilizar las siguientes herramientas:
Herramientas analticas: Coleccin y anlisis de datos
Anlisis de Pareto, anlisis de regresin, hoja deverificacin
Anlisis de matriz de datos Anlisis de capacidad de procesos, divisin de variacin
Subgrupos de datos, experimentos simples, DOE
Pruebas analticas, cartas de control
7/31/2019 Lean Sigma Bb Analisis b
26/264
7/31/2019 Lean Sigma Bb Analisis b
27/264
27
Los 5 Por qus Se hace la pregunta Por qu? Cinco veces
Por qu? Nos faltaron partes por mquina daada
Por qu? La mquina no ha tenido mantenimiento enlos ltimos 3 meses
Por qu? El departamento de mantenimiento se hareducido a 6 personas de 8
Por qu? Se pas del presupuesto, les quitaron el
tiempo extra y dos personas Por qu? La empresa no ha tenido los resultados
esperados y el director ha hecho recortes para salvar lasituacin, teme por su puesto
7/31/2019 Lean Sigma Bb Analisis b
28/264
28
5Ws y 1H El mtodo de las 5Ws y 1H se resume al preguntar
quin?, qu?, cundo?, dnde?, por qu? Ycmo?.
Pueden usarse las ramas del diagrama de causaefecto
7/31/2019 Lean Sigma Bb Analisis b
29/264
29
Diagrama de causa efecto Rompe el problema en partes ms pequeas
Muestra muchas causas potenciales grficamente
Muestra como interactan las causas Sigue las reglas de la tormenta de ideas
Las sesiones tienen tres partes:
Tormenta de ideas
Dar prioridades (identificar las tres causas principales) Desarrollo de un plan de accin
7/31/2019 Lean Sigma Bb Analisis b
30/264
30
Diagrama de Pareto Sirve para identificar problemas u oportunidades
prioritarias o mayores
De acuerdo a Juran permite identificar los pocosvitales de los muchos triviales
El principio de Pareto sugiere que unas cuantascategoras de problemas (20% aprox.) presentan lamayor oportunidad para la mejora (80% aprox.)
7/31/2019 Lean Sigma Bb Analisis b
31/264
31
Mtodo de las 8 disciplinas - Ford El mtodo de Ford para el anlisis de causa raz es:
D1. Establecer el equipo
D2. Describir el problema
D3. Desarrollar una accin de contencin
D4. Identificar la causa raz
D5. Desarrollar alternativas de solucin
D6. Implementar una accin correctiva permanente
D7. Prevenir la recurrencia
D8. Reconocer al equipo y las contribuciones individuales
7/31/2019 Lean Sigma Bb Analisis b
32/264
7/31/2019 Lean Sigma Bb Analisis b
33/264
33
Anlisis de rbol de falla - FTA Otras reas de su aplicacin son:
Anlisis funcional de sistemas complejos
Evaluacin de requerimientos de seguridad,
confiabilidad,
defectos de diseo,
riesgos de peligro,
acciones correctivas,
simplificacin de mantenimiento y deteccin de falla,
eliminacin lgica de causas de falla
7/31/2019 Lean Sigma Bb Analisis b
34/264
34
Anlisis de rbol de falla - FTA Se prefiere el FTA en vez del FMEA cuando:
La seguridad el personal es importante
Se pueden identificar un nmero pequeo de eventossuperiores
Hay alto potencial de falla
El problema es cuantificar la evaluacin del riesgo
La funcionalidad del producto es altamente compleja
El producto no es reaprables
7/31/2019 Lean Sigma Bb Analisis b
35/264
35
Anlisis de rbol de falla - FTA Se prefiere el FMEA en vez del FTA cuando:
Los eventos superiores no se pueden definirexplcitamente
Son factibles mltiples perfiles potencialmente exitosos
La identificacin de todos los modos de falla esimportante
La funcionalidad del producto tiene poca intervencin
externa
7/31/2019 Lean Sigma Bb Analisis b
36/264
36
Anlisis de rbol de falla - FTA Smbolos de compuertas lgicas para determinar la
confiabilidad del sistema. Hay smbolos de eventos ysmbolos de compuertas
Smbolos de eventos
Evento superior, falla a nivel sistema o eventoindeseable
Evento bsico, evento falla de ms bajo nivela estudiar
Evento de falla, evento de falla de bajo nivel. Puede recibirentradas o proporcionar salidas a una compuerta lgica
7/31/2019 Lean Sigma Bb Analisis b
37/264
37
Anlisis de rbol de falla - FTA Smbolos de compuertas lgicas
AND. El evento de salida ocurre soloSi ocurren todos los eventos de entrada
Simultaneamente
OR. El evento de salida ocurre siOcurre alguno de los eventos de
La entrada
7/31/2019 Lean Sigma Bb Analisis b
38/264
38
Anlisis de rbol de falla - FTA Ejemplo: se asume que falla el sistema superior
7/31/2019 Lean Sigma Bb Analisis b
39/264
39
Anlisis de rbol de falla - FTA La probabilidad de falla del sistema es 5.02%. Se
indica que el teclado es prioritario (0.20), despus laCPU (0.015) y el monitor (0.015)
7/31/2019 Lean Sigma Bb Analisis b
40/264
40
VI.F.3 Anlisis del Muda
7/31/2019 Lean Sigma Bb Analisis b
41/264
41
Anlisis de Muda Las actividades que no agregan valor se clasifican
como Muda, de acuerdo a Imai son:
Sobreproduccin
Inventarios
Reparaciones / rechazos
Movimientos
Transportes
Re Procesos
Esperas
7/31/2019 Lean Sigma Bb Analisis b
42/264
42
Sobreproduccin Se produce ms en cierto momento, por:
Producir ms de lo necesario por el siguiente proceso
Producir antes de lo requerido por el siguiente proceso
Producir ms rpido de lo requerido por el siguienteproceso
Sus consecuencias son:
Espacio extra en las instalaciones del cliente
Materias primas adicionales en uso
Utilizacin de energticos y transportes adicionales
Costos de programacin adicionales
7/31/2019 Lean Sigma Bb Analisis b
43/264
43
Inventario en exceso Las partes, materias primas, inventario en proceso,
refacciones y productos terminados forman elinventario, el inventario es Muda ya que requiere:
Espacio en piso, Transporte, Montacargas
Sistemas de transportadores
Inters sobre el costo de los materiales
Puede verse afectado por:
El polvo, deterioro, obsolescencia
Humedad (oxidacin), dao durante el manejo
7/31/2019 Lean Sigma Bb Analisis b
44/264
44
Inventario en exceso Las partes, materias primas, inventario en proceso,
refacciones y productos terminados forman elinventario, el inventario es Muda ya que requiere:
Espacio en piso, Transporte, Montacargas
Sistemas de transportadores
Inters sobre el costo de los materiales
Puede verse afectado por:
El polvo, deterioro, obsolescencia
Humedad (oxidacin), dao durante el manejo
7/31/2019 Lean Sigma Bb Analisis b
45/264
45
Reparaciones / defectos Las reparaciones o el retrabajo de partes defectivas
significa un segundo intento de producirlas bien. Serompe el Takt Time
Puede haber desperdicio de materiales o productosno recuperable
Si hay defectos, no puede implementarse el flujo deuna pieza
Los cambios de diseo tambin son Muda
7/31/2019 Lean Sigma Bb Analisis b
46/264
7/31/2019 Lean Sigma Bb Analisis b
47/264
47
Movimientos Algunas reglas de la ergonoma incluyen:
Enfatizar la seguridad todas las veces
Adecuar el empelado a la tarea
Cambiar el lugar de trabajo para que se adecue alempleado
Mantener posiciones neutrales del cuerpo
Redisear las herramientas para reducir esfuerzo y
daos Variar las tareas con rotacin de puestos
Hacer que la mquina sirva al ser humano
7/31/2019 Lean Sigma Bb Analisis b
48/264
48
Reprocesos Consiste de pasos adicionales en el proceso de
manufactura, por ejemplo:
Remocin de rebabas
Maquinado de partes mal moldeadas
Agregar procesos de manejo adicionales
Realizar procesos de inspeccin
Repetir cambios al producto innecesarios
Mantener copias adicionales de informacin
7/31/2019 Lean Sigma Bb Analisis b
49/264
49
Transportes Todo transporte es Muda excepto la entrega al
cliente. Incluye:
Uso de montacargas
Uso de transportadores
Uso de movedores de pallets y camiones
Puede ser causado por:
Deficiente distribucin de planta o de celdas
Tiempos de espera largos, reas grandes dealmacenaje, o problemas de programacin
7/31/2019 Lean Sigma Bb Analisis b
50/264
50
Esperas Ocurre cuando un operador est listo para realizar su
operacin, pero permanece ocioso, por falla demquina, falta de partes, paros de lnea, etc. El Muda
de espera puede ser por: Operadores ociosos
Fallas de maquinaria
Tiempos de ajuste y preparacin largos
Tareas no programadas a tiempo Flujo de materiales en lotes
Juntas largas e innecesarias
7/31/2019 Lean Sigma Bb Analisis b
51/264
51
Mudas adicionales Otros mudas adicionales a los 7 desperdicios son:
Recursos mal utilizados
Recursos poco utilizados
Actividades de conteo
Bsqueda de herramientas o partes
Sistemas mltiples
Manos mltiples
Aprobaciones innecesarias
Fallas de mquinas
Envo de producto defectivo al cliente o mal servicio
7/31/2019 Lean Sigma Bb Analisis b
52/264
52
VI.B.3 Regresin lineal mltiple
7/31/2019 Lean Sigma Bb Analisis b
53/264
7/31/2019 Lean Sigma Bb Analisis b
54/264
54
Regresin mltipleEstimacin de los parmetros del modelo Se trata de minimizar los errores cuadrticos en:
El modelo de regresin mltiple en forma matricial es:
Y = X + = [1 : D] +
Y es un vector N x 1.X es una matriz de orden N x (k + 1), donde la 1. columna es 1s.
es un vector de orden (k + 1) x 1.
es un vector de orden N x 1.
D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k
N
u
ukuuuk XXYR1
2
2211010 ).....(),...,,(
7/31/2019 Lean Sigma Bb Analisis b
55/264
55
Regresin mltipleEstimacin de los parmetros del modelo:
b = (XX)-1 XY
El vector de valores ajustados se puede expresar como:
La varianza del modelo se estima como:
HyYXXXXXbY ')'( 1XbY
eeeYYSSEn
i
ii ')(1
22
XbXbYXbYYXbXbXbYYXbYYXbYXbYSSE ''''2''''''')()'(
YXbYYSSE ''' pNSSE
MSEs
2
7/31/2019 Lean Sigma Bb Analisis b
56/264
56
Tamao de muestra Tomar 5 observaciones para cada una de las
variables independientes, si esta razn es menor de5a 1, se tiene el riesgo de sobreajustar el modelo
Un mejor nivel deseable es tomar 15 a 20observaciones por cada variable independiente
7/31/2019 Lean Sigma Bb Analisis b
57/264
57
Ejemplo de regresin mltiple
Un embotellador est analizando las rutas de servicio demquinas dispensadoras, est interesado en predecir lacantidad de tiempo requerida por el chofer para surtir lasmquinas en el local (Y).
La actividad de servicio incluye llenar la mquina con refrescos yun mantenimiento menor.
Se tienen como variables el nmero de envases con que llena lamquina (X1) y la distancia que tiene que caminar (X2).
X2-Dist X1-CAS Y-TENT Fit SE Fit Residual St Resid
Obs
7/31/2019 Lean Sigma Bb Analisis b
58/264
58
Ejemplo de regresin mltiple
16.68 7.0 16.680 21.708 1.040 -5.028 -1.63
1
11.50 3.0 11.500 10.354 0.867 1.146 0.36
2
12.03 3.0 12.030 12.080 1.024 -0.050 -0.02
3
14.88 4.0 14.880 9.956 0.952 4.924 1.58
4
13.75 6.0 13.750 14.194 0.893 -0.444 -0.14
5
18.11 7.0 18.110 18.400 0.675 -0.290 -0.096
08.00 2.0 8.000 7.155 0.932 0.845 0.27
7
17.83 7.0 17.830 16.673 0.823 1.157 0.37
8
79.24 30.0 79.240 71.820 2.301 7.420 3.21RX
9
21.50 5.0 21.500 19.124 1.444 2.376 0.81
10
40.33 16.0 40.330 38.093 0.957 2.237 0.72
11
21.00 10.0 21.000 21.593 1.099 -0.593 -0.19
12
13.50 4.0 13.500 12.473 0.806 1.027 0.33
13
19.75 6.0 19.750 18.682 0.912 1.068 0.34
14
24.00 9.0 24.000 23.329 0.661 0.671 0.21
15
29.00 10.0 29.000 29.663 1.328 -0.663 -0.22
16
15.35 6.0 15.350 14.914 0.795 0.436 0.14
17
19.00 7.0 19.000 15.551 1.011 3.449 1.11
18
09.50 3.0 9.500 7.707 1.012 1.793 0.58
1935.10 17.0 35.100 40.888 1.039 -5.788 -1.87
20
17.90 10.0 17.900 20.514 1.325 -2.614 -0.88
21
52.32 26.0 52.320 56.007 2.040 -3.687 -1.45 22
18.75 9.0 18.750 23.358 0.662 -4.608 -1.44 23
19.83 8.0 19.830 24.403 1.132 -4.573 -1.50 24
10.75 4.0 10.750 10.963 0.841 -0.213 -0.07 25
R denotes an observation with a large standardized residual
X denotes an observation whose X value gives it large influence.
Durbin-Watson statistic = 1.17
7/31/2019 Lean Sigma Bb Analisis b
59/264
59
Ejemplo de regresin mltipleSolucin matricial
Matrix M5 = X'
[ 1 1 1 1 1 1 1 1 1 1 1 1
1
7 3 3 4 6 7 2 7 30 5 16 10
4
560 220 340 80 150 330 110 210 1460 605 688 215
255
1 1 1 1 1 1 1 1 1 1 1 1
6 9 10 6 7 3 17 10 26 9 8 4
462 448 776 200 132 36 770 140 810 450 635 150 ]
Matrix M6 = X'Y
[ 25 219 10232
219 3055 133899
10232 133899 6725688 ]
Matrix M7 = X'Y
[ 560
7375
337072 ]
7/31/2019 Lean Sigma Bb Analisis b
60/264
60
Ejemplo de regresin mltipleSolucin matricial
Matrix M8 = INV(X'X)
0.113215 -0.004449 -0.000084
-0.004449 0.002744 -0.000048
-0.000084 -0.000048 0.000001
Matrix M9 = INV(X'X) X'Y
2.34123
1.61591
0.01438
The regression equation is
Y-TENT = 2.34 + 1.62 X1-CAS + 0.0144 X2-DISTPredictor Coef SE Coef T P
Constant 2.341 1.097 2.13 0.044
X1-CAS 1.6159 0.1707 9.46 0.000
X2-DIST 0.014385 0.003613 3.98 0.001
S = 3.259 R-Sq = 96.0% R-Sq(adj) = 95.6%
7/31/2019 Lean Sigma Bb Analisis b
61/264
61
Ejemplo de regresin mltipleSolucin matricial
Clculo de la estimacin de la varianza:
Data Display
Matrix M10 = Y'
[ 16.68 11.50 12.03 14.88 13.75 18.11 8.00 17.83 79.24 21.50
40.3321.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50 35.10 17.90 52.32
18.75 19.83 10.75 ]
Matrix M11 = Y'Y = 18310.6
Matrix M12 = b' = [ 2.34123 1.61591 0.01438 ]
Matrix M13 = b'X'Y = 18076.9
Matrix M14 = SSe = Y'Y - b'X'Y = 233.732
624.10325
732.2332
pN
SSS E
7/31/2019 Lean Sigma Bb Analisis b
62/264
62
Ejemplo de regresin mltipleSolucin matricial
Intervalo de confianza para Beta 1
Por tanto el intervalo de confianza para el 95% es:
1.26181 1 1.97001
)()( 122,025.11122,025.1 bsetbbsetb
)17073.0)(074.2(6191.1)00274378.0)(6239.10()074.2(61591.1 1
7/31/2019 Lean Sigma Bb Analisis b
63/264
63
Ejemplo de regresin mltipleSolucin matricial
El embotellador desea construir un intervalo de confianza sobreel tiempo medio de entrega para un local requiriendo:
X1 = 8 envases y cuya distancia es X2 = 275 pies.
La varianza de la Y0 estimada es (tomando M8=inv(XX):
275
8
1
0X minutosbXY 22.19
01438.0
61591.1
34123.2
275,8,1'00
56794.0)05346.0(6239.10
275
8
1
8275,8,16239.10)'(')(0
1
0
2
0
MXXXXSYVar
7/31/2019 Lean Sigma Bb Analisis b
64/264
64
Ejemplo de regresin mltipleSolucin matricial
El intervalo de confianza sobre el tiempo medio de entrega paraun local requiriendo es para 95% de nivel de confianza:
Que se reduce a: 17.66 Y0 20.78
56794.0074.222.1956794.0074.222.19 0
Y
7/31/2019 Lean Sigma Bb Analisis b
65/264
65
Ejemplo de regresin mltipleSolucin matricial
El anlisis de varianza es:
Analysis of Variance
SST = 18,310.629 -
25
)6.559(2
= 5784.5426
SSR = 18,076.930 -25
)6.559(2
= 5,550.8166
SSE = SST SSR = 233.7260
24.2616239.10
4083.27750
MSE
MSRF
44.322,2,05.0 F
Como la F calculada es mayor que la F de tablas, se
concluye que existe el modelo con alguno de sus
coeficientes diferente de cero
Con el paquete Minitab se obtuvo lo siguiente:
Source DF SS MS F PRegression 2 5550.8 2775.4 261.24 0.000
Residual Error 22 233.7 10.6
Total 24 5784.5
7/31/2019 Lean Sigma Bb Analisis b
66/264
66
Ejemplo de regresin mltipleSolucin matricial
El comportamiento de los residuos es como sigue:
7/31/2019 Lean Sigma Bb Analisis b
67/264
67
Multicolinealidad
La multicolinealidad implica una dependencia cercana entreregresores (columnas de la matriz X ), de tal forma que si hayuna dependencia lineal exacta har que la matriz XX seasingular.
La presencia de dependencias cercanamente lineales impactandramticamente en la habilidad para estimar los coeficientes deregresin.
La varianza de los coeficientes de la regresin son infladosdebido a la multicolinealidad. Es evidente por los valoresdiferentes de cero que no estn en la diagonal principal de XX.Que son correlaciones simples entre los regresores.
7/31/2019 Lean Sigma Bb Analisis b
68/264
68
Multicolinealidad
Una prueba fcil de probar si hay multicolinealidad entre dosvariables es que su coeficiente de correlacin sea mayor a 0.7
Los elementos de la diagonal principal de la matriz XX sedenominan Factores de inflacin de varianza (VIFs)y se usancomo un diagnstico importante de multicolinealidad. Para elcomponente j simo se tiene:
Si es mayor a 10 implica que se tienen serios problemas demulticolinealidad.
21
1
jj RVIF
7/31/2019 Lean Sigma Bb Analisis b
69/264
69
Anlisis de los residuos
Los residuos graficados vs la Y estimada, pueden mostrardiferentes patrones indicando adecuacin o no adecuacin delmodelo:
Grfica de residuos aleatorios cuya suma es cero (null plot)indica modelo adecuado
Grfica de residuos mostrando una no linealidad curvilnea
indica necesidad de transformar las variables
Si los residuos se van abriendo indica que la varianza muestraheteroestacidad y se requiere transformar las variables. Sepuede probar con la prueba de Levene de homogeneidad de
varianzas
7/31/2019 Lean Sigma Bb Analisis b
70/264
70
Escalamiento de residuos
En algunos casos es difcil hacer comparaciones directas entrelos coeficientes de la regresin debido a que la magnitud de bjrefleja las unidades de medicin del regresor Xj. Por ejemplo:
Para facilitarla visualizacin de residuos ante grandes
diferencias en los coeficientes, se sugiere estandarizar oestudentizar los residuos
2110005 XXY
7/31/2019 Lean Sigma Bb Analisis b
71/264
7/31/2019 Lean Sigma Bb Analisis b
72/264
72
Escalamiento de residuos
Residuos estudentizados Son similares a los residuos donde se elimina una
observacin y se predice su valor, pero adems se elimina la
i-sima observacin en el clculo de la desviacin estndarusada para estandarizar la -sima observacin
Puede identificar observaciones que tienen una graninfluencia pero que no son detectadas por los residuos
estandarizados
H = X (XX)-1X es la matriz sombrero o hat matriz.
,
)1( ii
i
i
hMSE
er
7/31/2019 Lean Sigma Bb Analisis b
73/264
73
Escalamiento de residuos
El estadstico PRESS (Prediction Error Sum of Squares) es unamedida similar a la R2 en la regresin. Difiere en que se estimann-1 modelos de regresin.
En cada modelo se omite una observacin en la estimacin delmodelo de regresin y entonces se predice el valor de laobservacin omitida con el modelo estimado. El residuo isimoser:
El residuo PRESS es la suma al cuadrado de los residuosindividuales e indica una medida de la capacidad de prediccin
)()(iii YYe
2
)(
1
2
)(ii
N
i
i YYePRESS
YY
ediccin
S
PRESSR 12
Pr
7/31/2019 Lean Sigma Bb Analisis b
74/264
74
Grficas parciales de regresin
Para mostrar el impacto de casos individuales es ms efectiva lagrfica de regresin parcial. Un caso outlier impacta en lapendiente de la ecuacin de regresin (y su coeficiente).
Una comparacin visual de la grfica de regresin parcial con ysin la observacin muestra la influencia de la observacin
El coeficiente de correlacin parcial es la correlacin de la
variable independiente Xi la variable dependiente Y cuando sehan eliminado de ambos Xi y Y
La correlacin semiparcial refleja la correlacin entre lasvariables independiente y dependiente removiendo el efecto Xi
7/31/2019 Lean Sigma Bb Analisis b
75/264
75
Matriz sombrero
Los puntos de influencia son observaciones substancialmentediferentes de las observaciones remanentes en una o msvariables independientes
Contiene valores (sombrero en su diagonal) para cadaobservacin que representa influencia. Representa los efectoscombinados de todos las variables independientes para cadacaso
7/31/2019 Lean Sigma Bb Analisis b
76/264
76
Matriz sombrero
Los valores en la diagonal de la matriz sombrero miden dosaspectos:
Para cada observacin miden la distancia de la observacinal centro de la media de todas las observaciones de lasvariables independientes
Valores altos en la diagonal indica que la observacin tienemucho peso para la prediccin del valor de la variable
dependiente, minimizando su residuo El rango de valores es de 0 a 1, con media p/n, p es el
nmero de predictores y n es el tamao de muestra. Valoreslmite se encuentran en 2p/n y 3p/n
7/31/2019 Lean Sigma Bb Analisis b
77/264
77
Distancia de Mahalanobis
D2 es una medida comparable a los valores sombrero (hatvalues) que considera slo la distancia de una observacin delvalor medio de las variables independientes.
Es otra forma de identificar outliers
La significancia estadstica de la distancia de Malahanobis sepuede hacer a partir de tablas del texto:
Barnett, V., Outliers in Statistical Data, 2nd. Edition, NuevaYork, Wiley, 2984
7/31/2019 Lean Sigma Bb Analisis b
78/264
78
Influencia en coeficientesindividuales
El impacto de eliminar una observacin simple en cadauno de los coeficientes de la regresin mltiple se muestracon la DFBETA y su versin estandarizada SDFBETA.
Se sugiere aplicar como lmites 1.0 o 2 para tamaosde muestra pequeos y n para muestras medias ygrandes
La distancia de Cook (Di) captura el impacto de unaobservacin:
La dimensin del cambio en los valores pronosticadoscuando se omite la observacin y la distancia de lasotras observaciones, el lmite es 1 o 4/(n-k-1)
7/31/2019 Lean Sigma Bb Analisis b
79/264
Influencia en coeficientesindividuales
La medida COVRATIO estima el efecto de la observacinen la eficiencia del proceso, en sus errores estndar de loscoeficientes de la regresin. Considera a todos los
coeficientes colectivamente.
El lmite puede ser establecido en 1 3p/n, los valoresmayores al lmite hacen el proceso ms eficiente y losmenores ms ineficiente
La medida SDFFIT es el grado en que cambian losvalores ajustados o pronosticados cuando el caso seelimina. El valor lmite es 2*raz((k+1)/(n-k-1))
7/31/2019 Lean Sigma Bb Analisis b
80/264
80
Ejemplo de regresin mltipleSolucin con Excel y Minitab
Ejemplo de Regresin Mltiple
7/31/2019 Lean Sigma Bb Analisis b
81/264
81
Ejemplo de Regresin Mltiple
Cat. (US News) GMAT Salario Inicial ($) % AceptacinStanford 1 711 82000 7.4Harvard 2 670 80000 12.8
Penn (Wharton) 3 662 79000 14.7MIT (Sloan) 4 650 78000 15.1Chicago 5 680 65000 25.0Northwestern 6 660 70000 16.0Columbia 7 660 83000 14.8Dartmouth 8 670 70000 12.6Duke 9 646 67500 20.5
Berkeley 10 653 70000 13.3Virginia 11 660 66000 18.9Michigan 12 645 65000 28.0NYU 13 646 70583 20.9Carnegie Mellon 14 640 67200 30.8Yale 15 675 65000 23.5U.N.C. 16 630 60000 19.8UCLA 17 651 65000 17.5
Texas-Austin 18 630 60000 27.3Indiana 19 630 61500 44.7Cornell 20 637 64000 25.4Rochester 21 630 58500 36.0Ohio State 22 611 61000 23.2Emory 23 626 60000 33.0Purdue 24 603 63700 20.7
Maryland 25 640 53000 18.9
Interpretacin de Resultados de Excel- Regresin Multiple
7/31/2019 Lean Sigma Bb Analisis b
82/264
SUMMARY OUTPUTRegression StatisticsMultiple R 0.8749313 R Square 0.76550478Adjusted R Square 0.732005463 Standard Error 4050.855918 Observations 25
ANOVAdf SS MS F Significance F
Regression 3 1.12E+09 374977790.1 22.851355 8.17E-07Residual 21 3.45E+08 16409433.67Total 24 1.47E+09
Coefficients Standard t Stat P-value Lower 95% U pper 95%Error
Intercept 122481.40 41473.13 2.953271081 0.007589 36233.29 208729.5
X Variable1 -926.873 198.8104 -4.662094325 0.0001336 -1340.32 -513.424
X Variable2 -59.9488 60.44875 -0.991730876 0.3326192 -185.659 65.76118
X Variable3 -191.7291 125.6138 -1.526337637 0.1418472 -452.957 69.49917
Resultados de Excel- Regresin slo con slo X1
S O
7/31/2019 Lean Sigma Bb Analisis b
83/264
SUMMARY OUTPUT
Regression StatisticsMultiple R 0.855974
R Square 0.732691Adjusted R Square 0.721069Standard Error 4132.688Observations 25
ANOVAdf SS MS F Significance F
Regression 1 1.08E+09 1.08E+09 63.04264 4.88E-08Residual 23 3.93E+08 17079107Total 24 1.47E+09
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 79230.32 1703.951 46.49801 2.98E-24 75705.43405 82755.20595X Variable1 -910.077 114.6201 -7.93994 4.88E-08 -1147.186411 -672.9674353
Con slo X1, el Modelo se simplifica enormementepoca importancia prctica se pierde en R2 (ajustada)
Reduccin del ModeloVuelva a correr la regresin usando la categoraUS News, como el nico agente de prediccin (predictor)
7/31/2019 Lean Sigma Bb Analisis b
84/264
La ecuacin de regresin es:y = 79230 - 910 x
Predictor Coef Desv. Estndar T pConstante 79230 1704 46.50 0.000x -910.1 114.6 -7.94 0.000
S = 4133 R2
= 73.3% R2
(ajustada) = 72.1%Anlisis de Variancia
Fuente DF SS MS F pRegresin 1 1076712008 1076712008 63.04 0.000
Error 23 392819470 17079107Total 24 1469531477
US News, como el nico agente de prediccin ( predictor )
El Modelo se simplifica enormemente..pocaimportancia prctica se pierde en R2 (ajustada)
7/31/2019 Lean Sigma Bb Analisis b
85/264
85
Corrida en Minitab Se introducen los datos en varias columnas C1 a C5
incluyendo la respuesta Y(heatflux) y las variablespredictoras Xs (North, South, East)
HeatFlux Insolation East South North271.8 783.35 33.53 40.55 16.66
264.0 748.45 36.50 36.19 16.46
238.8 684.45 34.66 37.31 17.66
230.7 827.80 33.13 32.52 17.50251.6 860.45 35.75 33.71 16.40
257.9 875.15 34.46 34.14 16.28
7/31/2019 Lean Sigma Bb Analisis b
86/264
86
Corrida en Minitab
Utilzar el archivo de ejemplo Exh_regr.mtw
Opcin: Stat > Regression > Regression
Para regresin lineal indicar la columna de respuesta
Y (Score2) y X (Score1)
En Regresin lienal en opciones se puede poner unvalor Xo para predecir la respuesta e intervalos. Las
grficas se obtienen Stat > Regression > Regression> Fitted line Plots
Para regresin mltiple Y(heatflux)y las columnasde los predictores(north, south, east)
7/31/2019 Lean Sigma Bb Analisis b
87/264
87
Resultados de la regresin linealThe regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor Coef SE Coef T P
Constant 1.1177 0.1093 10.23 0.000
Score1 0.21767 0.01740 12.51 0.000
S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.5419 2.5419 156.56 0.000
Residual Error 7 0.1136 0.0162
Total 8 2.6556
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)
New Obs Score1
1 7.00
7/31/2019 Lean Sigma Bb Analisis b
88/264
88
Resultados de la regresin lineal
98765432
3.5
2.5
1.5
Score1
Score2
S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %
Score2 = 1.11771 + 0.217670 Score1
95% PI
95% CI
Regression
Regression Plot
Resultados de la regresin Mltiple
7/31/2019 Lean Sigma Bb Analisis b
89/264
89
Resultados de la regresin Mltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
East 1 226.3
7/31/2019 Lean Sigma Bb Analisis b
90/264
90
La regresin slo puede utilizarse con informacin de variablescontinuas.
Los residuos deben distribuirse normalmente con media cero.
Importancia prctica: (R2). Importancia estadstica: (valores p)
La regresin puede usarse con un predictor X o ms,para una respuesta dada
Reduzca el modelo de regresin cuando sea posible,sin perder mucha importancia prctica
Resumen de la Regresin
7/31/2019 Lean Sigma Bb Analisis b
91/264
91
VI.B.4 Herramientasmultivariadas
7/31/2019 Lean Sigma Bb Analisis b
92/264
92
Herramientas multivariadas
1. Introduccin
2. Anlisis de componentes principales
3. Anlisis factorial
4. Anlisis discriminante
5. MANOVA
7/31/2019 Lean Sigma Bb Analisis b
93/264
93
Introduccin
En el anlisis multivariado se incluyen dos o msvariables dependientes Y1, Y2, etc. Consideradassimultneamente para las variables independientesX1, X2, ., Xn
Normalmente se resuelven con herramientascomputacionales tales como Minitab y SPSS.
Entre las herramientas principales se encuentran: Componentes principales, anlisis factorial, anlisis
discriminante, anlisis de conglomerados, anlisiscannico, MANOVA
7/31/2019 Lean Sigma Bb Analisis b
94/264
94
Anlisis de componentes principales
El anlisis (PCA) y el anlisis factorial (FA) se usanpara encontrar patrones de correlacin entre muchasvariables posibles y subconjuntos de datos
Busca reducirlas a un menor nmero decomponentes o factores que representen la mayorparte de la varianza.
Normalmente se requieren al menos 100observaciones y cinco observaciones por variable
7/31/2019 Lean Sigma Bb Analisis b
95/264
95
Anlisis de componentes principales
Pasos de anlisis en Minitab
Se usa una matriz de correlacin para determinar larelacin entre componentes
Las matrices definen cantidades como eigenvalores yeigenvectores
Se suman los eigenvalores y se calculan lasproporciones de cada componente
Se identifican los PC1, PC2, que explican la mayorparte de la varianza
Se puede hacer un diagrama de Pareto como apoyo
Ejemplo: Alimentos en Europa
7/31/2019 Lean Sigma Bb Analisis b
96/264
96
j p p
Pas RMEAT WMEAT EGGS MILK FISH CERL STARCH NUTS FR-VEG
1 10.1 1.4 0.5 8.9 0.2 42.3 0.6 5.5 1.7
2 8.9 14 4.3 19.9 2.1 28 3.6 1.3 4.3
3 13.5 9.3 4.1 17.5 4.5 26.6 5.7 2.1 4
4 7.8 6 1.6 8.3 1.2 56.7 1.1 3.7 4.2
5 9.7 11.4 2.8 12.5 2 34.3 5 1.1 4
6 10.6 10.8 3.7 25 9.9 21.9 4.8 0.7 2.4
7 8.4 11.6 3.7 11.1 5.4 24.6 6.5 0.8 3.6
8 9.5 4.9 2.7 33.7 5.8 26.3 5.1 1 1.49 18 9.9 3.3 19.5 5.7 28.1 4.8 2.4 6.5
10 10.2 3 2.8 17.6 5.9 41.7 2.2 7.8 6.5
11 5.3 12.4 2.9 9.7 0.3 40.1 4 5.4 4.2
12 13.9 10 4.7 25.8 2.2 24 6.2 1.6 2.9
13 9 5.1 2.9 13.7 3.4 36.8 2.1 4.3 6.7
14 9.5 13.6 3.6 23.4 2.5 22.4 4.2 1.8 3.7
15 9.4 4.7 2.7 23.3 9.7 23 4.6 1.6 2.7
16 6.9 10.2 2.7 19.3 3 36.1 5.9 2 6.6
17 6.2 3.7 1.1 4.9 14.2 27 5.9 4.7 7.9
18 6.2 6.3 1.5 11.1 1 49.6 3.1 5.3 2.819 7.1 3.4 3.1 8.6 7 29.2 5.7 5.9 7.2
20 9.9 7.8 3.5 24.7 7.5 19.5 3.7 1.4 2
21 13.1 10.1 3.1 23.8 2.3 25.6 2.8 2.4 4.9
22 17.4 5.7 4.7 20.6 4.3 24.3 4.7 3.4 3.3
23 9.3 4.6 2.1 16.6 3 43.6 6.4 3.4 2.9
24 11.4 12.5 4.1 18.8 3.4 18.6 5.2 1.5 3.8
25 4.4 5 1.2 9.5 0.6 55.9 3 5.7 3.2
X1 X2 X3 X4 X5 X6 X7 X8 X9
7/31/2019 Lean Sigma Bb Analisis b
97/264
97
Corrida en Minitab
2 Stat > Multivariate > Principal components
3 EnVariables, X1, X2, X3, X4, X6, X7, X8, X9
4 En Number of factors to extract, 3. SeleccionarCorrelation Matrix
5 ClickGraphs y seleccionar Scree Plot, Score plot for first2 components Loading plot for first 2 components
8 ClickStoragee indicar las columnas donde se guarden loscoeficientes y los valores Z (scores) Coef1 Coef 2 y Z1 Z2
9. ClickOKen cada uno de los cuadros de dilogo
7/31/2019 Lean Sigma Bb Analisis b
98/264
98
Ejemplo: Alimentos en Europa
Component Number
Eigenva
lue
987654321
4
3
2
1
0
Scree Plot of RMEAT, ..., FR-VEG
First Component
SecondComponent
0.40.30.20.10.0-0.1-0.2-0.3-0.4-0.5
0.2
0.1
0.0
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6
-0.7
FR-VEG
NUTS
STARCH
CERL
FISH
MILK
EGGS
WMEAT
RMEAT
Loading Plot of RMEAT, ... , FR-VEG
Dos componentes excedenEl eigenvalor de ref. de 1
7/31/2019 Lean Sigma Bb Analisis b
99/264
99
Ejemplo: Alimentos en Europa
Se tiene la grfica siguiente de pases:
Europa occidental Europa oriental Balcanes
Z1
Z2
43210-1-2-3
2
1
0
-1
-2
-3
-4
-5
25
242322
21
20
19
18
17
16
15
14
13
12 11
109
8
76
5
4
3
2
1
Scatterplot of Z2 vs Z1
Pennsula ibrica
l f l
7/31/2019 Lean Sigma Bb Analisis b
100/264
Ejemplo: factores principales paracrecimiento tecnolgico en la comunidad
Factores independientes
Miles de trabajadores en alta tecnologa
Cultura emprendedora (inicios por ao)
Interacciones con la universidad (proyectos por ao) Clases de creatividad (porcentaje de profesionales)
Cantidad de capital de aventura (millones de dlares)
100
7/31/2019 Lean Sigma Bb Analisis b
101/264
Matriz de correlacin del ejemplo
101
7/31/2019 Lean Sigma Bb Analisis b
102/264
Resultados
La suma de los eigenvalores es aprox. cinco
La proporcin de la varianza explicada por el
componente 1 es de 71.7%
PC1 y PC2 explican el 89.2% de la varianza, portanto son los componentes principales
102
7/31/2019 Lean Sigma Bb Analisis b
103/264
103
Anlisis factorial
Es una tcnica de reduccin de variables paraidentificar factores que expliquen la variacin,aunque se reiere un juicio subjetivo.
Las variables de salida estn relacionadaslinealmente con las variables de entrada.
Las variables deben ser medibles y simtricas. Debehaber cuatro o ms factores de entrada para cadavariable independiente
7/31/2019 Lean Sigma Bb Analisis b
104/264
104
Anlisis factorial
Se especifican un cierto nmero de factores comunes
El anlisis factorial se hace en dos etapas:
Extraccin de factores, para identificar los factoresprincipales para un estudio posterior
Rotacin de factores, para hacerlos ms significativos
7/31/2019 Lean Sigma Bb Analisis b
105/264
105
Corrida con Minitab
2 Stat > Multivariate > Factor Analysis.
3 EnVariables, X1, X2, X3, X4, X6, X7, X8, X9
4 En Number of factors to extract, 4.
En Method of Extraction, seleccionar Principal components6 En Type of Rotation, seleccionarVarimax.
7 ClickGraphs y seleccionar Loading plot for first 2 factorsy Scree Plot.
ClickResults y seleccionar Sort loadings.
Seleccionar Storage e indicar columnas para ponderaciones,coeficientes, Zs, eigenvalores, etc.
ClickOKen cada uno de los cuadros de d
0 50
CERL
Loading Plot of RMEAT, ..., FR-VEG
7/31/2019 Lean Sigma Bb Analisis b
106/264
106
Ejemplo
First Factor
SecondF
actor
1.000.750.500.250.00-0.25-0.50
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
FR-VEG
NUTS
STARCH
FISH
MILKEGGS
WMEAT
RMEAT
Rotated Factor Loadings and Communalities
Varimax Rotation
Variable Factor1 Factor2 Factor3 Factor4 Communality
X1 RMEAT 0.051 -0.931 0.014 0.037 0.871
X2 WMEAT 0.943 -0.127 -0.100 0.050 0.918
X3 EGGS 0.628 -0.664 0.163 0.020 0.862
X4 MILK 0.197 -0.610 0.219 0.579 0.795X5 FISH -0.226 -0.088 0.921 -0.104 0.919
X6 CERL -0.395 0.549 -0.624 -0.145 0.867
X7 STARCH 0.515 -0.004 0.683 -0.026 0.732
X8 NUTS -0.638 0.263 -0.326 -0.515 0.849
X9 FR-VEG -0.010 0.003 0.178 -0.937 0.910
Variance 2.2054 2.0749 1.9273 1.5165 7.7240
% Var 0.245 0.231 0.214 0.168 0.858
7/31/2019 Lean Sigma Bb Analisis b
107/264
107
Ejemplo:
Z1
Z2
210-1-2
2
1
0
-1
-2
Yugo slavia
Alemania Occ
Rusia
Reino Unido
Suiza
Suecia
Espaa
RumaniaPortugal
Polonia
NoruegaHolanda
Italia
Irlanda
Hungra
Grecia
Francia
Finlandia
Alemania orien
Dinamarca
ChecaBulgaria
Blgica
Au tria
Albania
Scatterplot of Z2 vs Z1
7/31/2019 Lean Sigma Bb Analisis b
108/264
108
Anlisis discriminante
Si se tiene una muestra con grupos conocidos, elanlisis discriminante clasifica las observaciones oatributos en dos o ms grupos
Puede utilizarse como herramienta predictiva odescriptiva
Las variables deben ser multivariadamente normales,con la misma varianza y covarianza poblacional entrevariables dependientes, y las muestras exhibenindependencia
Ejemplo de actividades en pasesNo Grupo Ciudad Agr Min Man Ps Con Ser Fin Sps Tc
7/31/2019 Lean Sigma Bb Analisis b
109/264
109
No p Ciudad Agr Min Man Ps Con Ser Fin Sps Tc
1 1 Blgica 3.3 0.9 27.6 0.9 8.2 19.1 6.2 26.6 7.2
2 1 Dinamarca 9.2 0.1 21.8 0.6 8.3 14.6 6.5 32.2 7.1
3 1 Francia 10.8 0.8 27.5 0.9 8.9 16.8 6.0 22.6 5.7
4 1 Alemania Occ. 6.7 1.3 35.8 0.9 7.3 14.4 5.0 22.3 6.1
5 1 Irlanda 23.2 1.0 20.7 1.3 7.5 16.8 2.8 20.8 6.16 1 Italia 15.9 0.6 27.6 0.5 10.0 18.1 1.6 20.1 5.7
7 1 Luxenburgo 7.7 3.1 30.8 0.8 9.2 18.5 4.6 19.2 6.2
8 1 Holanda 6.3 0.1 22.5 1.0 9.9 18.0 6.8 28.5 6.8
9 1 Inglaterra 2.7 1.4 30.2 1.4 6.9 16.9 5.7 28.3 6.4
10 1 Austria 12.7 1.1 30.2 1.4 9.0 16.8 4.9 16.8 7.0
11 1 Finlandia 13.0 0.4 25.9 1.3 7.4 14.7 5.5 24.3 7.6
12 2 Grecia 41.4 0.6 17.6 0.6 8.1 11.5 2.4 11.0 6.7
13 1 Noruega 9.0 0.5 22.4 0.8 8.6 16.9 4.7 27.6 9.414 2 Portugal 27.8 0.3 24.5 0.6 8.4 13.3 2.7 16.7 5.7
15 2 Espaa 22.9 0.8 28.5 0.7 11.5 9.7 8.5 11.8 5.5
16 1 Suecia 6.1 0.4 25.9 0.8 7.2 14.4 6.0 32.4 6.8
17 1 Suiza 7.7 0.2 37.8 0.8 9.5 17.5 5.3 15.4 5.7
18 2 Turqua 66.8 0.7 7.9 0.1 2.8 5.2 1.1 11.9 3.2
19 3 Bulgaria 23.6 1.9 32.3 0.6 7.9 8.0 0.7 18.2 6.7
20 3 Checa 16.5 2.9 35.5 1.2 8.7 9.2 0.9 17.9 7.0
21 3 Alemania Ori. 4.2 2.9 41.2 1.3 7.6 11.2 1.2 22.1 8.4
22 3 Hungra 21.7 3.1 29.6 1.9 8.2 9.4 0.9 17.2 8.0
23 3 Polonia 31.1 2.5 25.7 0.9 8.4 7.5 0.9 16.1 6.9
24 3 Rumania 34.7 2.1 30.1 0.6 8.7 5.9 1.3 11.7 5.0
25 3 Rusia 23.7 1.4 25.8 0.6 9.2 6.1 0.5 23.6 9.3
26 3 Yugoslavia 48.7 1.5 16.8 1.1 4.9 6.4 11.3 5.3 4.0
7/31/2019 Lean Sigma Bb Analisis b
110/264
110
Corrida con Minitab
2 Stat > Multivariate > Discriminant Analysis.
3 En Groups, poner SalmonOrigin.
4 En Predictors, poner Freshwater Marine. ClickOK.
7/31/2019 Lean Sigma Bb Analisis b
111/264
111
Corrida con Minitab
Canonical Discriminant Functions
Function 1
6420-2-4-6
3
2
1
0
-1
-2
-3
-4
GRUPO
Group Centroids
3
2
1
3
2
1
7/31/2019 Lean Sigma Bb Analisis b
112/264
112
Anlisis de conglomerados
7/31/2019 Lean Sigma Bb Analisis b
113/264
113
Anlisis de conglomerados
Se usa para determinar agrupaciones oclasificaciones de un conjunto de datos
Las personas se pueden agrupar por IQ, padres,hbitos de estudio, etc.
Se trata de dar sentido a grandes cantidades de
datos de cuestionarios, ecnuestas, etc.
7/31/2019 Lean Sigma Bb Analisis b
114/264
114
Ejemplo
Suponer que un estudio demercado trata de determinarsegmentos de mercado enbase a los patrones de
lealtad de marcas (V1) ytiendas (V2), medidas del 0al 10 en 7 personas (A-G).
Variables V1 V2
A 3 2
B 4 5
C 4 7
D 2 7
E 6 6
F 7 7
G 6 4
7/31/2019 Lean Sigma Bb Analisis b
115/264
115
Corrida en Minitab
Stat > Multivariate Anlisis > Cluster Observations
Distance Measured Euclidean Seleccionar ShowDendogram OK
Observations
Distance
7654321
3.16
2.11
1.05
0.00
Dendrogram with Single Linkage and Euclidean Distance
7/31/2019 Lean Sigma Bb Analisis b
116/264
116
Anlisis de correlacin cannico
Prueba la hiptesis de que los efectos pueden tenercausas mltiples y de que las causas pueden tenerefectos mltiples (Hotelling 1935)
Es como una regresin mltiple para determinar lacorrelacin entre dos conjuntos de combinacioneslineales, cada conjunto puede tener varias variablesrelacionadas.
La relacin de un conjunto de variables dependientesa un conjunto de variables independientes formacombinaciones lineales
7/31/2019 Lean Sigma Bb Analisis b
117/264
117
Anlisis de correlacin cannico
Se usan los ms altos valores de correlacin para losconjuntos. Los pares de combinaciones lineales sedenominan variates cannicas con correlaciones
cannicas (Rc con valor mayor a 0.3)
Por ejemplo se quiere determinar si hay unacorrelacin entre las caractersticas de un ingeniero
industrial y las habilidades requeridas en ladescripcin de puesto del mismo ingeniero.
Ejemplo: Statgraphics - coches
7/31/2019 Lean Sigma Bb Analisis b
118/264
118
Ejemplo: Statgraphics - coches
7/31/2019 Lean Sigma Bb Analisis b
119/264
119
Ejemplo: Statgraphics - coches
7/31/2019 Lean Sigma Bb Analisis b
120/264
120
Ejemplo: Statgraphics - coches
7/31/2019 Lean Sigma Bb Analisis b
121/264
121
Ejemplo: Statgraphics - coches
7/31/2019 Lean Sigma Bb Analisis b
122/264
Ejemplo: Statgraphics coches
122
La primera correlacin de 0.94 tiene correlacionescannicas asociadas:
U1 = 0.262 Engine Size + 0.127 Horsepower + 0.024
Length + 0.041 Wheelbase- 0.068 Width + 0.004 RearSeat +0.658 Weight
V1 = 0.257 Mid Price0.097 * GPM Highway + 0.652
GPM City + 0.322 U Turn Space
Las variables estn estandarizadas. Parece haber unarelacin primaria entre peso del vehculo y las millas porgaln de rendimiento.
MANOVA
7/31/2019 Lean Sigma Bb Analisis b
123/264
123
MANOVA(Anlisis de varianza mltiple)
Es un modelo para analizar la relacin entre una oms variables independientesy dos o ms variablesdependientes
Prueba si hay diferencias significativas en las mediasde grupos de una combinancin de respuestas Y.
Los datos deben ser normales, con covarianzahomogenea y observaciones independientes
MANOVA
7/31/2019 Lean Sigma Bb Analisis b
124/264
124
MANOVA(Anlisis de varianza mltiple)
Diferencias de ANOVA y MANOVA
7/31/2019 Lean Sigma Bb Analisis b
125/264
125
Ejemplo:
7/31/2019 Lean Sigma Bb Analisis b
126/264
126
Ejemplo:Extrusin de pelcula plstica
Se realiza un estudio para determinar las condicionesptimas para extruir pelcula plstica.
Se miden tres respuestas Tear, gloss y opacitycinco veces en cada combinacin de dos factorestasa de extrusin y cantidad de aditivo cada grupose pone en niveles bajos y altos.
Se utiliza el MANOVA balanceado para probar laigualdad de las medias.
Ejemplo:
7/31/2019 Lean Sigma Bb Analisis b
127/264
127
j pExtrusin de pelcula plstica
Tear Gloss Opacity Extrusin Additive
6.5 9.5 4.4 1 1
6.2 9.9 6.4 1 1
5.8 9.6 3 1 1
6.5 9.6 4.1 1 1
6.5 9.2 0.8 1 1
6.9 9.1 5.7 1 2
7.2 10 2 1 2
6.9 9.9 3.9 1 2
6.1 9.5 1.9 1 2
6.3 9.4 5.7 1 2
6.7 9.1 2.8 2 1
6.6 9.3 4.1 2 1
7.2 8.3 3.8 2 1
7.1 8.4 1.6 2 16.8 8.5 3.4 2 1
7.1 9.2 8.4 2 2
7 8.8 5.2 2 2
7.2 9.7 6.9 2 2
7.5 10.1 2.7 2 2
7.6 9.2 1.9 2 2
Ejemplo:
7/31/2019 Lean Sigma Bb Analisis b
128/264
128
j pExtrusin de pelcula plstica
1 Abrir el archivo EXH_MVAR.MTW.
2 Seleccionar Stat > ANOVA > BalancedMANOVA.
3 En Responses, poner Tear Gloss Opacity.4 En Model, poner Extrusion | Additive.
5 ClickResults. En Display of Results, seleccionarMatrices (hypothesis, error, partial
correlations) y Eigen analysis.6 ClickOKen cada cuadro de dilogo.
EjemploCriterion Statistic F Num Denom P
Wilk ' 0 38186 7 554 3 14 0 003
7/31/2019 Lean Sigma Bb Analisis b
129/264
129
Wilks' 0.38186 7.554 3 14 0.003
SSCP Matrix for Extrusion
Tear Gloss Opacity
Tear 1.740 -1.505 0.8555
Gloss -1.505 1.301 -0.7395
Opacity 0.855 -0.739 0.4205
SSCP Matrix for Error
Tear Gloss Opacity
Tear 1.764 0.0200 -3.070
Gloss 0.020 2.6280 -0.552
Opacity -3.070 -0.5520 64.924
Partial Correlations for the Error SSCP Matrix
Eigenvector 1 2 3
Tear 0.6541 0.4315 0.0604
Gloss -0.3385 0.5163 0.0012
Opacity 0.0359 0.0302 -0.1209
Ejemplo:
7/31/2019 Lean Sigma Bb Analisis b
130/264
130
j pExtrusin de pelcula plstica
Las matrices SSCP evalan la contribucin a lavariabilidad de manera similar a la suma decuadrados en la ANOVA univariada.
Las correlaciones parciales entre Tear y Gloss sonpequeas. Como la estructura de las correlaciones esdbil, se pueden realizar anlisis univariados de
ANOVA para cada una de las respuestas.
7/31/2019 Lean Sigma Bb Analisis b
131/264
131
VI.B.5 Anlisis de datospor atributos
7/31/2019 Lean Sigma Bb Analisis b
132/264
132
Anlisis de datos por atributos
Si los CTQs son variables continuas, se usa laregresin, dependiendo de la naturaleza de lacaracterstica crtica para el cliente (CTSs) como ste
la expresa:
CTS HERRAMIENTA
Nominal (Verde, Rojo, azul) Regresin Logstica Nominal
Atributo (Pasa/No pasa) Regresin Logstica BinariaOrdinal (1, 2, 3, 4, 5) Regresin Logstica Ordinal
7/31/2019 Lean Sigma Bb Analisis b
133/264
133
Anlisis de datos por atributos
El anlisis de datos por atributos se organiza envalores, categoras o grupos dicotmicos
Las decisiones incluyen: si / no, pasa / no pasa,bueno / malo, pobre/justo/bueno/superior/excelente,etc.
Entre los modelos no lineales de regresin usados setienen: regresin logstica, regresin logit y regresinprobit
7/31/2019 Lean Sigma Bb Analisis b
134/264
134
Anlisis de datos por atributos
Regresin logstica
Relaciona variables independientes categricas a unavariable dependiente (Y). Minitab incluye los modelos
binario, ordinal y nominal
Regresin logit
Es subconjunto del modelo log-lineal. Tiene solo una
variable dependiente, usa determinaciones deprobabilidad o tasa de probabilidad
7/31/2019 Lean Sigma Bb Analisis b
135/264
135
Anlisis de datos por atributos
Regresin probit
Es similar a la prueba de vida acelerada, la unidad sesomete a esfuerzo con la respuesta pasa/falla, bueno o
malo. Es una respuesta binaria en un tiempo de fallafuturo
7/31/2019 Lean Sigma Bb Analisis b
136/264
136
Regresin logstica o binaria
En caso de informacin cualitativa es necesariotraducir las preferencias del cliente expresadas comoatributos a un intervalo de valores aceptables de
variables (Especificaciones).
7/31/2019 Lean Sigma Bb Analisis b
137/264
137
Regresin logstica o binaria
Es similar a la regresin mltiple excepto que larespuesta es binaria (si/no, bueno/malo, etc.) Suscoeficientes se determinan por el mtodo de mxima
verosimilitud
Su funcin tiene forma de S, con valores mximosde Cero y Uno.
Yi = 0, 1
7/31/2019 Lean Sigma Bb Analisis b
138/264
138
Regresin logstica o binaria
La probabilidad de que el resultado est en ciertacategora es:
El mtodo de clculo del coeficiente b es diferenteque en la regresin lineal
Los coeficientes se determinan con la relacin sig.:
nn
BXBXBXBe
eventonoP
eventoP ....
)(
)(2211
0
7/31/2019 Lean Sigma Bb Analisis b
139/264
139
Regresin logstica
Condiciones: Hay solo dos resultados posibles
Hay solo un resultado por evento
Los resultados son independientes estadsticamente Todos los predictores relevantes estn en el modelo
Es mutuamente exclusivo y colectivamente exhaustivo
Los tamaos de muestra son mayores que para laregresin mltiple
Los efectos positivos se obtienen con b1>1 y losnegativos con b1 e 0 a 1
7/31/2019 Lean Sigma Bb Analisis b
140/264
140
Regresin logstica
Relacin con ajuste pobre
Relacin con buen ajuste
7/31/2019 Lean Sigma Bb Analisis b
141/264
141
Regresin logstica - Procedimiento
Definir el atributo a traducir (y)
Definir la variable apropiada para el atributo (x)
Definir el modelo matemtico a probar
Determinar los defectos que est dispuesto aaceptar
Recolecte informacin de x vs y. Asigne 1 si fallay 0 si es aceptable.
Analice la informacin mediante Regresin LogsticaBinaria
Regresin logstica- Procedimiento
7/31/2019 Lean Sigma Bb Analisis b
142/264
142
7/31/2019 Lean Sigma Bb Analisis b
143/264
143
Regresin logstica - Procedimiento
Observe el P-Value de Deviance en la Sesin, debede ser grande (P >0.10)
Obtenga los coeficientes del modelo (De la Sesin)
Coeficientes del modelo
P-Value de Deviance
7/31/2019 Lean Sigma Bb Analisis b
144/264
144
Regresin logstica - Procedimiento
Construya el modelo de regresin para laprobabilidad de falla estar dado por :
Identifique el(los) valor(es) dexque le generarn
como mximo la cantidad de defectos que ustedest dispuesto a aceptar [4]
Donde :b0, b1, ... = Coeficientes del modelo
P(Falla) =b0+b1x1+....
e1+ eb0+b1x1+....
7/31/2019 Lean Sigma Bb Analisis b
145/264
R i l i di l
7/31/2019 Lean Sigma Bb Analisis b
146/264
146
Regresin logstica ordinal
Cuando la respuesta CTS es de tipo ordinal (Variascategoras de respuesta como totalmente deacuerdo, de acuerdo, en desacuerdo y
totalmente en desacuerdo) y el Factor CTQ es denaturaleza continua, entonces, para definirEspecificaciones, la herramienta a utilizar es laRegresin Logstica Ordinal.
Regresin logstica ordinal -
7/31/2019 Lean Sigma Bb Analisis b
147/264
147
Procedimiento
Defina la variable de respuesta a traducir (y CTS)
Defina el CTQ (x) variable a relacionar con el
CTS Defina el modelo matemtico a probar
Determine los defectos que est dispuesto a aceptaren la categora de inters
Recolecte informacin de x vs y Analice la informacin mediante Regresin Logstica
Ordinal
Regresin logstica ordinal -
7/31/2019 Lean Sigma Bb Analisis b
148/264
148
Procedimiento
Stat > Regression > Ordinal Logistic Regression
Seleccione la respuesta (y)
Seleccione los trminos que estima tiene el modelo
[3]
Constantes yCoeficientesdel modelo
Regresin logstica ordinal -
7/31/2019 Lean Sigma Bb Analisis b
149/264
149
Procedimiento
Observe el P-Value de Deviance en la Sesin, debede ser grande (P >0.10)
Obtenga las constantes y coeficientes del modelo(De la Sesin)
Construya los modelos de regresin para la
probabilidad acumulada por categora
Regresin logstica ordinal -d
7/31/2019 Lean Sigma Bb Analisis b
150/264
150
Procedimiento
e1+ e
Donde :Ki = Constante de la categora ib1, b2, ... = Coeficientes del modelo
acumuladahasta categorai
Ki+b1x1+ b2x2....
Ki+b1x1+ b2x2....=P
Constantes yCoeficientesdel modelo
Identifique el(los) valor(es) de x que le generarn como mximo lacantidad de defectos que usted est dispuesto a aceptar en lacategora de inters [4]
Regresin logstica ordinal -di i
7/31/2019 Lean Sigma Bb Analisis b
151/264
151
Procedimiento
Una vez que se tienen establecidos los CTQs con losque se medir el desempeo del producto, esnecesario indicar las Especificaciones de los mismos
Producto(General)
UsuariosFinales
ClientesExpectativas
(CTSs)
Tipo
Importan.
Producto(Especfico)
Parmetros
deDiseo
(DPs)
Matrizde
Diseo
CTQs
Especificaciones
LIE LSE Otra
7/31/2019 Lean Sigma Bb Analisis b
152/264
A li i L it j l
7/31/2019 Lean Sigma Bb Analisis b
153/264
153
Anlisis Logit - ejemplo
50 estudiantes tomaron un examen, donde solo 27 pasaron.Cules son las posibilidades de pasar?
Posibilidades = P/(1-P) = 0.54/0.46 = 1.17 o 1.71:1
Un estudiante que estudia 80 horas tiene un 54.5% de pasar,cules son las posibilidades?
Posibilidades = 0.545/(1-0.545) = 1.198 o 1.198:1
Logit = ln(p/(1-p)) = ln(1.189) = 0.1809 y despejando alExp(b1) = exp(0.1082) = 1.11 que es la tasa de pasar a otro nivel
A li i P bit
7/31/2019 Lean Sigma Bb Analisis b
154/264
154
Anlisis Probit
Es similar a las pruebas de vida acelerada y anlisisde sobrevivencia. Un artculo sujeto a esfuerzo puedefallar o sobrevivir. El modelo probit tiene un valor
esperado de 0 y una varianza de 1.
Requiere tamaos de muestra muy grandes paradiferenciarse del modelo logit
Los coeficientes b del modelo logit difieren del probiten 1.814 con: bl = -1.1814 bp
7/31/2019 Lean Sigma Bb Analisis b
155/264
155
VI.C.7 Pruebas de bondad deajuste
Bondad de aj ste
7/31/2019 Lean Sigma Bb Analisis b
156/264
156
Bondad de ajustePRUEBAS DE BONDAD DE AJUSTE
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribucin particular planteada como hiptesis
Si el ajuste es razonablemente cercano, puede concluirse que s exite la forma de distribucin
planteada como hiptesis
Por ejemplo:
Ho: La distribucin poblacional es uniforme
Ha: La distribucin poblacional no es uniforme
Se usa el estadstico Chi-Cuadrado
Oi = Frecuencia de los eventos observados en los datos muestrales
Ei = Frecuencia de los eventos esperados si la hiptesis nula es correcta
Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para
cumplir con este requisito.
K = Nmero de categoras o clases
K
i Ei
EiOi
1
2
2 )(
Bondad de ajuste
7/31/2019 Lean Sigma Bb Analisis b
157/264
157
Bondad de ajusteEjemplo:
Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperara que se vendieran
12 botes / mes. La cantidad real que se vendi fue:
Ventas (Oi) Ventas (Ei)
Tipo de bote observadas esperadas
A 15 12
B 11 12C 10 12
D 12 12
DISTR.CHI
Entonces el estadstico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76020818
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3
Chi cuadrado de excel = 7.815
El estadstico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hiptesis nula
PRUEBA.CHI.INV
Prueba de Bondad de ajustel di t ib i d P i
7/31/2019 Lean Sigma Bb Analisis b
158/264
158
para la distribucin de Poisson
1. Plantear la hiptesis nula y alterna
Ho: La poblacin tiene una distribucin de prob. De Poisson
Ha: Caso contrario
2. Tomar una muestra aleatoria, anotar la frecuencia observada fi ycalcular la media de ocurrencias
3. Calcular la frecuencia esperada de ocurrencias ei. Multiplicar eltamao de muestra con la prob. de Poisson para cada valor dela variable aleatoria. Si hay menos de 5 combinar las categoras
4. Calcular el estadstico de prueba
5. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivel designificancia
n
i i
ii
e
ef
1
2
2 )(
22
Ejemplo:Distribucin de Poisson =5
Ho: No de clientes que llega en intervalos de 5 min tiene una distribucin
7/31/2019 Lean Sigma Bb Analisis b
159/264
159
Ho: No. de clientes que llega en intervalos de 5 min. tiene una distribucinde Poisson Ha: No se sigue una distribucin de Poisson
Clientes Frec. observada f(x) de Poisson 128*f(x) cantidadesperada
0 2 0.0067 0.8576
1 8 0.0337 4.3136
2 10 0.0842 10.77763 12 0.1404 17.9712
4 18 0.1755 22.4640
5 22 0.1755 22.4640
6 22 0.1462 18.7136
7 16 0.1044 13.3662
8 12 0.0653 8.3584
9 6 0.0363 4.6464
10 o ms 0.0318 4.0704
Ejemplo:Distribucin de Poisson =5
Combinando X=0 1 y X=9 10 o ms para que la frecuencia observada sea
7/31/2019 Lean Sigma Bb Analisis b
160/264
160
Combinando X=0,1 y X=9, 10 o ms para que la frecuencia observada seamayor a 5 y se pueda aplicar la distribucin Chi Cuadrada se tiene
Clientes Frec. Observada
(fi)
f(x) de Poisson 128*f(x)frecuencia
esperada (ei)
0 o 1 10 0.0067+0.0337 5.1712
2 10 0.0842 10.77763 12 0.1404 17.9712
4 18 0.1755 22.4640
5 22 0.1755 22.4640
6 22 0.1462 18.71367 16 0.1044 13.3662
8 12 0.0653 8.3584
9 o ms 6 0.0363+0.0318 8.7168
Estadstico y conclusin
7/31/2019 Lean Sigma Bb Analisis b
161/264
161
Estadstico y conclusin
Con los datos anteriores se calcula el estadstico Chi cuadrada quese compara con Chi Cuadrada de alfa para k-p-1 grados delibertad (K categoras: 9, p parmetros a estimar: 1 media).
Ho se rechaza si o si p es mayor que alfa.
El valor de Chi Cuadrada calculado es de 10.9766 y el valor ChiCuadrada de alfa 0.05 con 2 gl. Es de 14.07 no se rechaza Ho
En este caso p = 0.14 > 0.05 por tanto no se rechaza Ho y seconcluye que los datos siguen una distribucin de Poisson
n
i i
ii
eef
1
2
2 )(
22
Prueba de Bondad de ajustepara la distribucin Normal
7/31/2019 Lean Sigma Bb Analisis b
162/264
162
para la distribucin Normal
1. Plantear la hiptesis nula y alterna
Ho: La poblacin tiene una distribucin de prob. Normal
Ha: Caso contrario
2. Tomar una muestra aleatoria, calcular la media y la desviacinestndar
3. Definir K intervalos de valores de forma que la frecuencia
esperada sea 5 cuando menos para cada uno (intervalos deigual probabilidad). Anotar la frecuencia observada de losvalores de datos fi, en cada intervalo
Prueba de Bondad de ajustepara la distribucin Normal
7/31/2019 Lean Sigma Bb Analisis b
163/264
163
para la distribucin Normal
4. Calcular el nmero de ocurrencias esperado ei, para cadaintervalo de valores. Multiplicar el tamao de muestra por laprobabilidad de que una variable aleatoria est en el intervalo.
5. Calcular el estadstico de prueba
6. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivelde significancia
n
i i
ii
e
ef
1
2
2
)(
22
Prueba de Bondad de ajustepara la distribucin Normal
7/31/2019 Lean Sigma Bb Analisis b
164/264
164
para la distribucin Normal
Ejemplo: datos de calificaciones: Media = 68.42; S = 10.41
Calificaciones
71 66 61 65 54 93
60 86 70 70 73 73
55 63 56 62 76 54
82 79 76 68 53 58
85 80 56 61 61 64
65 62 90 69 76 79
77 54 64 74 65 65
61 56 63 80 56 71
79 84
Prueba de Bondad de ajustepara la distribucin Normal
7/31/2019 Lean Sigma Bb Analisis b
165/264
165
para la distribucin Normal
Ho: la poblacin tiene una distribucin normal con media 68.42 yS=10.41 Ha: Caso contrario
Para una muestra de 50 con una frecuencia mnima esperada de 5
se tiene el 10% al menos por cada celda
La primera celda correspondiente al 10% est en Z = -1.28 con
X = (Media - Z*S) = 55.10
Para el rea del 20%, Z = -0.84 y X = 59.68
y as sucesivamente
7/31/2019 Lean Sigma Bb Analisis b
166/264
Prueba de Bondad de ajustepara la distribucin Normal
7/31/2019 Lean Sigma Bb Analisis b
167/264
167
para la distribucin Normal
Se determina el estadstico Chi Cuadrado = 7.2
El Valor de Chi Cuadrado de alfa = 0.10 para k p 1 gradosde libertad. K = 10 categoras, p = 2 parmetros. Gl = 7. ChiCuadrado es 12.017
Como no se puede rechazar la hiptesis nula denormalidad de las calificaciones
n
ii
ii
e
ef
1
2
2 )(
22
Prueba de Bondad de ajustepara la distribucin Multinomial
7/31/2019 Lean Sigma Bb Analisis b
168/264
168
para la distribucin Multinomial
1. Enunciar la hiptesis nula y alternativa
Ho: La poblacin sigue una distribucin de probabilidadmultinomial con probabilidades especificadas para cada una delas K categoras Ha: Caso contrario
2. Tomar una muestra aleatoria y anotar las frecuenciasobservadas fi para cada categora
3. Suponiendo que Ho es cierta, determinar la frecuencia esperadaei, en cada categora multiplicando la probabilidad de lacategora por el tamao de muestra
Prueba de Bondad de ajustepara la distribucin Multinomial
7/31/2019 Lean Sigma Bb Analisis b
169/264
169
para la distribucin Multinomial
4. Se determina el estadstico Chi Cuadrado de prueba
5. Regla de rechazo:
Si no se puede rechazar la hiptesis nula
Rechazar si el valor p es menor a alfa
Con alfa nivel de significancia y los grados de libertad son k-1
n
ii
ii
e
ef
1
2
2 )(
22
Prueba de Bondad de ajustepara la distribucin Multinomial
7/31/2019 Lean Sigma Bb Analisis b
170/264
170
para la distribucin Multinomial
Ejemplo: El ao pasado la participacin de mercado para laempresa A fue del 30%, 50% para la empresa B y 20% para laempresa C. La empresa C hace una prueba con un nuevoproducto para estimar su impacto en las preferencias del
mercado.
Se tom una muestra de 200 clientes resultando preferencias decompra de: 48 para A, 98 para B y 54 para C.
De acuerdo a las probabilidades esperadas, en los 200 clientes laspreferencias esperadas son: A=200*0.3=60, B=200*0.5=100,C=200*0.2=40
Prueba de Bondad de ajustepara la distribucin Multinomial
7/31/2019 Lean Sigma Bb Analisis b
171/264
171
para la distribucin Multinomial
Datos para calcular el estadstico de prueba Chi Cuadrado
Categora Proporcinhipottica
Frecuenciaobservada
Frecuenciaesperada
Empresa A 0.3 48 60
Empresa B 0.5 98 100
Empresa C 0.2 54 40
Prueba de Bondad de ajustepara la distribucin Multinomial
7/31/2019 Lean Sigma Bb Analisis b
172/264
172
para la distribucin Multinomial
Chi Cuadrado calculado = 7.34
Chi cuadrado de alfa = 0.05 con k 1 = 2 grados de libertad = 2es de 5.99. El valor p correspondiente es de 0.025.
Como 7.34 es mayor a 5.99 o el valor p de 0.025 es menor a alfade 0.05 se rechaza la hiptesis nula Ho y se concluye que elnuevo producto modificar las preferencias del mercadoactuales
La participacin de la empresa C aumenta con el nuevo producto
Prueba de Bondadde ajuste en Minitab
7/31/2019 Lean Sigma Bb Analisis b
173/264
173
de ajuste en Minitab
La columna C1 Observadas contiene las frecuencias observadasy la C2esperadas las frecuencias esperadas
Calc > Calculator > Store result in variable ChiCuadrada
Teclear en el cuadro de expresin sum((Observadas-Esperadas)**2/Esperadas)
Calc > Probability distributions > Chi Square
Seleccionar Cummulative probability
Degrees of freedom 2Input column ChiCuadrada; Optional Storage CumProb OK
Calc > Calculator > Store results in variable p
En el cuadro Expression teclear 1-CumProb
OK
Prueba de Bondadde ajuste en Minitab
7/31/2019 Lean Sigma Bb Analisis b
174/264
174
de ajuste en Minitab
Ejemplo: investigacin de mercado
Observadas Esperadas ChiCuadrada CumProb p
48 60 7.34 0.974524 0.0254765
98 100
54 40
Prueba de Bondadde ajuste en Excel
7/31/2019 Lean Sigma Bb Analisis b
175/264
175
de ajuste en Excel
Ejemplo: investigacin de mercado
1. Calcular el estadstico Chi Cuadrada con =(A2-B2)^2/B2 y Suma
Chi cuadrada = 7.34
2. El valor P es =distr.chi(7.34, 2)
3. El estadstico Chi Cuadrada de alfa es:
=prueba.chi.inv(0.05,2) = 5.99
4. Como p es menor a alfa de 0.05 se rechaza la Ho
7/31/2019 Lean Sigma Bb Analisis b
176/264
176
VI.C.8 Tablas de contingenciaPrueba Chi2 (2)
Para qu se utiliza?
1. Para probar si una serie de datos
7/31/2019 Lean Sigma Bb Analisis b
177/264
177
pobservada, concuerda con el modelo (serieesperada) de la informacin.
2. Para probar las diferencias entre lasproporciones de varios grupos (tabla de
contingencia).
2
Ho: No hay diferencia
Ha: Hay diferencia
Para todos los casos,
7/31/2019 Lean Sigma Bb Analisis b
178/264
(f - f )2
Ejemplo 1: Chi Cuadrada(2 )
7/31/2019 Lean Sigma Bb Analisis b
179/264
179
2 c= j = 1
gEstadstico Chi Cuadrada
Observada Esperada
Aguilas 63 50 3.38
Soles 37 50 3.38
2 = 3.38 + 3.38
2 = 6.76
(fo - fe)
fe( fo ) ( fe )
fe
(fo - fe)2
Funcin de Distribucin Acumulada Chi2 con 1 grado de
Ejemplo 1: Chi cuadrada
7/31/2019 Lean Sigma Bb Analisis b
180/264
180
libertad (d.f)
Ho: La moneda es buena.
Ha: La moneda est cargada.
Para un 95% de confianza antes de concluir que la moneda estcargada, se requiere que X2
c
> X2Crtica
o que el valor de p sea 0.05.
Como p 0.05, se puede concluir -con un 95% de confianza -que la moneda est cargada.
2c P( 2c > x)6.7600 p = 1 - 0.9907 = 0.0093
De tablas X2Crtica,(0.05, 1) = 3.8414
Clculo en Excel del estadstico Chi cuadrada
7/31/2019 Lean Sigma Bb Analisis b
181/264
181
1. Posicionarse en una celda vaca
2. Accesar el men de funciones con Fx
3. Seleccionar STATISTICAL o ESTADSTICAS, CHIINV.
4. Dar valores de probabilidad (0.05) y grados de libertad,normalmente (n - 1) para un parmetro o (# de renglones -1)
* (# de columnas - 1) para el caso de tablas de proporciones.
Tabla de Valores Crticos Seleccionados de Chi2
df . 250 . 100 . 050 . 025 . 010 . 005 . 001
1 1. 323 2. 706 3. 841 5. 024 6. 635 7. 879 10. 828
2 2. 773 4. 605 5. 991 7. 378 9. 210 10. 597 13. 816
3 4. 108 6. 251 7. 815 9. 348 11. 345 12. 838 16. 266
4 5. 385 7. 779 9. 488 11. 143 13. 277 14. 860 18. 467
5 6. 626 9. 236 11. 070 12. 832 15. 086 16. 750 20. 515
7/31/2019 Lean Sigma Bb Analisis b
182/264
182
6 7. 841 10. 645 12. 592 14. 449 16. 812 18. 548 22. 458
7 9. 037 12. 017 14. 067 16. 013 18. 475 20. 278 24. 322
8 10. 219 13. 362 15. 507 17. 535 20. 090 21. 955 26. 1259 11. 389 14. 684 16. 919 19. 023 21. 666 23. 589 27. 877
10 12. 549 15. 987 18. 307 20. 483 23. 209 25. 188 29. 588
11 13. 701 17. 275 19. 675 21. 920 24. 725 26. 757 31. 264
12 14. 845 18. 549 21. 026 23. 337 26. 217 28. 300 32. 909
13 15. 984 19. 812 22. 362 24. 736 27. 688 29. 819 34. 528
14 17. 117 21. 064 23. 685 26. 119 29. 141 31. 319 36. 123
15 18. 245 22. 307 24. 996 27. 488 30. 578 32. 801 37. 697
16 19. 369 23. 542 26. 296 28. 845 32. 000 34. 267 39. 252
17 20. 489 24. 769 27. 587 30. 191 33. 409 35. 718 40. 790
18 21. 605 25. 989 28. 869 31. 526 34. 805 37. 156 43. 312
19 22. 718 27. 204 30. 144 32. 852 36. 191 38. 582 43. 820
20 23. 828 28. 412 31. 410 34. 170 37. 566 39. 997 45. 315
21 24. 935 29. 615 32. 671 35. 479 38. 932 41. 401 46. 797
22 26. 039 30. 813 33. 924 36. 781 40. 289 42. 796 48. 268
23 27. 141 32. 007 35. 172 38. 076 41. 638 44. 181 49. 728
24 28. 241 33. 196 36. 415 39. 364 42. 980 45. 558 51. 179
25 29. 339 34. 382 37. 652 40. 646 44. 314 46. 928 52. 620
26 30. 434 35. 563 38. 885 41. 923 45. 642 48. 290 54. 052
27 31. 528 36. 741 40. 113 43. 194 46. 963 49. 645 55. 476
28 32. 620 37. 916 41. 337 44. 461 48. 278 50. 993 56. 892
29 33. 711 39. 087 42. 557 45. 722 49. 588 52. 336 58. 30230 34. 800 40. 256 43. 773 46. 979 50. 892 53. 672 59. 703
40 45. 616 51. 805 55. 758 59. 342 63. 691 66. 766 73. 402
50 56. 334 63. 167 67. 505 71. 420 76. 154 79. 490 86. 661
60 66. 981 74. 397 79. 082 83. 298 88. 379 91. 952 99. 607
70 77. 577 85. 527 90. 531 95. 023 100 .42 5 104 .21 5 112 .31 7
80 88. 130 96. 578 101 .87 9 106 .62 9 112 .32 9 116 .32 1 124 .83 9
90 98. 650 107 .56 5 113 .14 5 118 .13 6 124 .11 6 128 .29 9 137 .20 8
100 109 .14 1 118 .49 8 124 .34 2 129 .56 1 135 .80 7 140 .16 9 149 .44 9
Tabla de contingencia
7/31/2019 Lean Sigma Bb Analisis b
183/264
183
Tabla de contingencia
Una tabla de clasificacin de dos vas (filas y columnas) quecontiene frecuencias originales, se puede analizar paradeterminar si las dos variables (clasificaciones) sonindependientes o tienen una asociacin significativa.
La prueba Chi Cuadrada probar si hay dependencia entre lasdos clasificaciones.
Adems se puede calcular el coeficiente de contingencia
(correlacin) que en todo caso muestra la fuerza de ladependencia
Tabla de contingencia
7/31/2019 Lean Sigma Bb Analisis b
184/264
184
Tabla de contingencia
Para esta prueba se usa la prueba Chi Cuadrada donde:
Entre mayor sea su valor, mayor ser la diferencia de ladiscrepancia entre frecuencias observadas y tericas. Estaprueba es similar a la de bondad de ajuste.
Tabla de contingencia
7/31/2019 Lean Sigma Bb Analisis b
185/264
185
Tabla de contingencia
Ejemplo: Cada una de las 15 celdas hace una contribucin alestadstico Chi Cuadrado (una celda)
Asumiendo Alfa = 0.1 y Gl= (reng 1)*(Col 1) = 4*2 = 8 Chi-Cuadrado de alfa = 20.09
Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho deigualdad de resultados entre negocios
Ho: No existen diferencias en los ndices de defectos de las dos mquinas
Ejemplo 2: Chi2 Para comparacin de dosgrupos; son las mismas proporciones?)
7/31/2019 Lean Sigma Bb Analisis b
186/264
186
Los valores observados (fo) son los siguientes:
Ho: No existen diferencias en los ndices de defectos de las dos mquinas.
Ha: Existen diferencias en los ndices de defectos de las dos mquinas.
Total 751 28
El ndice de defectos totales es 28 / 779 = 3.6%
mquina 1 fo = 517 fo = 17 Total = 534
Partes buenas
mquina 2 fo = 234 fo = 11 Total = 245
779
Partes defectuosas
Ejemplo 2: Chi2 Para comparacin de dosgrupos; son las mismas proporciones?)
7/31/2019 Lean Sigma Bb Analisis b
187/264
187
Clculo de los valores esperados
Basados en este ndice, los valores esperados (fe) seran:
mquina 1 fo = 751*534/779 fo = 28*534/779 Total = 534
Partes buenas
mquina 2 fo = 751*245/779 fo = 28*245/779 Total = 245
779
Partes defectuosas
mquina 1 530.53 3.47
Partes
buenas
mquina 2 233.47 1.53
Partes defectuosas
Prueba de chi cuadrada:Los conteos esperados estn debajo de los conteos observados
Partes buenas Partes Defectuosas Total1 532 2 534
7/31/2019 Lean Sigma Bb Analisis b
188/264
188
Nota: Chi cuadrada no podr aplicarse en los casos donde los conteos seas menores a 5 en 20%de celdas.Si cualquiera de los conteos esperados en las celdas es menor a uno, no deber usarse Chi2.
Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendorenglones y/o columnas, las categoras pueden ser de utilidad.
1 532 2 534
530.53 3.472 232 3 235
233.47 1.53Total 764 5 769
Chi2 = 0.004 + 0.624 + 0.009 + 1.418 = 2.056DF= 1; valor de p = 0.152
2 celdas con conteos esperados menores a 5.0
Tabla de Chi2Tabla de valores crticos seleccionados para Chi2
7/31/2019 Lean Sigma Bb Analisis b
189/264
189
DF .250 .100 .050 .025 .010 .005 .001
1 1.323 2.706 3.841 5.024 6.635 7.879 10.828
2 2.773 4.605 5.991 7.378 9.210 10.597 13.816
3 4.108 6.251 7.815 9.348 11.345 12.838 16.266
4 5.385 7.779 9.488 11.143 13.277 14.860 18.467
5 6.626 9.236 11.070 12.832 15.086 16.750 20.515
6 7.841 10.645 12.592 14.449 16.812 18.548 22.458
7 9.037 12.017 14.067 16.013 18.475 20.278 24.322
8 10.219 13.362 15.507 17.535 20.090 21.955 26.1259 11.389 14.684 16.919 19.023 21.666 23.589 27.877
10 12.549 15.987 18.307 20.483 23.209 25.188 29.588
11 13.701 17.275 19.675 21.920 24.725 26.757 31.264
12 14.845 18.549 21.026 23.337 26.217 28.300 32.909
13 15.984 19.812 22.362 24.736 27.688 29.819 34.528
14 17.117 21.064 23.685 26.119 29.141 31.319 36.123
15 18.245 22.307 24.996 27.488 30.578 32.801 37.697
16 19.369 23.542 26.296 28.845 32.000 34.267 39.25217 20.489 24.769 27.587 30.191 33.409 35.718 40.790
18 21.605 25.989 28.869 31.526 34.805 37.156 43.312
19 22.718 27.204 30.144 32.852 36.191 38.582 43.820
20 23.828 28.412 31.410 34.170 37.566 39.997 45.315
.
Problema: FugasBeneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reduccin de tiempo de ciclo.
7/31/2019 Lean Sigma Bb Analisis b
190/264
190
Variacin en familias a probarOperador a operadorHo: No existe diferencia en los ndices de defecto de los diferentes
operadoresHa: Existe diferencia en los ndices de defecto de los diferentes
operadores
Mquina a mquinaHo: No existe diferencia en los ndices de defecto de las diferentes
mquinas
Ha: Existe diferencia en los ndices de defecto de las diferentesmquinas
Tamao de la muestra:5000 + total de oportunidades (172 piezas)
Los conteos esperados estn colocados debajo de los conteos observadosCon fugas Sin fugas Total
1 30 610 640
Prueba de chi2 (mquina a mquina)
7/31/2019 Lean Sigma Bb Analisis b
191/264
191
32.11 607.89
2 235 4217 4452223.38 4228.62
3 3 253 256
12.84 243.16
4 18 334 35217.66 334.34
Total 286 5414 5700
Chi2 = 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 +0.000 = 8.734DF= (4-1)(2-1) = 3; valor P = 0.033
Los conteos esperados estn colocados debajo de los conteos observados.Con gotera Sin gotera Total
1 6 122 1286 61 121 39
Prueba de chi2 (operador a operador)
7/31/2019 Lean Sigma Bb Analisis b
192/264
192
6.61 121.39
2 1 127 1286.61 121.39
3 200 3836 4036208.55 3827.45
4 54 202 25613.23 242.77
5 5 699 70436.38 667.62
6 12 116 1286.61 121.39
Total 278 5102 5380
Chi2 =0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475+ 4.386 + 0.239 = 171.132DF= 5; valor P = 0.000
Qu sucede si los grupos mltiples de variacin son estadsticamente significativos?(en este caso, operador a operador y mquina a mquina)
Se utiliza un procedimiento denominado Coeficiente de Contingencia como clavepara determinar qu grupo de variacin debe investigarse primero.
7/31/2019 Lean Sigma Bb Analisis b
193/264
193
Coeficiente deContingencia
x 100ChiCuadrada
N
Chi2 N CC
Mquina 8.734 5700 0.15
Operador 171.132 5380 3.18Controlador Mayor
SI el tamao de la muestra (N), es similar p