Upload
leanh
View
217
Download
0
Embed Size (px)
Citation preview
INSTITUTO POLITECNICO NACIONAL
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE INGENIERÍA Y
CIENCIAS SOCIALES Y ADMINISTRATIVAS
SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN
ALGORITMO PARA LA CLUSTERIZACIÓN DE ÓRDENES DE
PRODUCCIÓN
T E S I S
QUE PARA OBTENER EL GRADO DE MAESTRO EN INGENIERIA
INDUSTRIAL
P R E S E N T A
LUCÍA ENRÍQUEZ LUGO
DIRECTOR DE TESIS: M en C. Mario Aguilar Fernández
M en I Juan José Hurtado Moreno
MÉXICO. DF MARZO, 2015
i
ii
Dedicatorias
Dedico este trabajo a todos mis maestros quienes me han compartido su sabiduría y su
experiencia, a todos ellos que a lo largo de mi vida han cultivado el ímpetu de seguir
aprendiendo y preparándome para la vida, en especial a los más cercanos, mis padres,
quienes han inculcado en mi el amor al estudio.
”Además de uno de los más estimulantes y enriquecedores quehaceres del espíritu, una
actividad irremplazable para la formación del ciudadano en una sociedad moderna y
democrática, de individuos libres”, “para formar ciudadanos críticos e independientes,
difíciles de manipular, en permanente movilización espiritual y con una imaginación
siempre en ascuas” (Vargas, 2000).
Sinceramente
Lucia
iii
RESUMEN
GA es una empresa internacional dedicada a la seguridad digital la cual tiene una planta
México que se dedica a la producción de tarjetas. GA tiene una capacidad máxima anual
de producción superior a la cantidad de tarjetas producidas anualmente. Una de las
razones de la baja productividad es debido a que la mayor cantidad de órdenes
producidas en el centro de manufactura son de 1 unidad. Realizando un análisis sobre los
productos, pudimos darnos cuenta que contaban con ciertas similitudes por lo que era
posible la agrupación de productos por familias. Con esta implementación se pudo
obtener un ahorro en tiempos de setup e incrementar la producción. El objetivo de esta
tesis es Diseñar un algoritmo para agrupar productos bancarios por familias en la
empresa GA caso estudio, con base en el proceso del algoritmo de la k-mean, con el fin de
reducir costos en la línea de personalización de tarjetas. Utilizando este método, fue
posible realizar las agrupaciones de los productos con algunos de los clientes tomando
parámetros básicos necesarios. Al ser implementado este algoritmo se agruparon las
órdenes de trabajo que llegaban diariamente. Con esta propuesta se redujo la cantidad de
órdenes de trabajo mediante la agrupación, así como el tiempo de setup y los costos de
equipo.
iv
ABSTRACT
GA is an international company dedicated to digital security. It has a branch in Mexico
particularly for cards production, that has a maximum annual capacity of production
bigger higher the number of cards that are actually produced. One of the reason for the
low productivity is because the work orders produced in the manufacturing center are 1
unit. In the analysis of the products that we realized, we observed that were some
similarities allowing the clusterization of products by families, that would increase the
company productivity. The objective of this thesis is Design an algorithm to group banking
products into families in GA company using the algorithm of k-mean with the objective to
reduce the cost in the card personalization line. Using these method, it was possible
clustered the products with some of the customers taking basic parameters needed to be
implemented, whit this implementation all the work orders that arriving daily achieving a
reduction in the number of work orders by clusterization, setup time and equipment
costs.
v
INDICE
Dedicatorias iii
Resumen iv
Abstract v
Índice de figuras viii
Índice de tablas x
Prefacio xi
I. Introducción 1
I.I Contexto 1
I.I.I Mercado de fabricación de tarjetas bancarias 1
Mercado mundial 2
Latinoamérica 3
México 5
I.I.II GA a nivel mundial 5
I.I.III GA México 8
Estructura organizacional 11
Áreas de oportunidad 13
I.I.IV Situación Problemática 16
I.II Marco Teórico 20
I.II.I Historia 20
I.II.II Conceptos 23
I.III Objetivo 25
vi
II. Métodos 26
II.I Métodos para la Clusterización 26
II.I.I Método del particionamiento 26
II.I.II Método jerárquico 28
II.I.III Método Densidad-base 29
II.I.IV Método de la Base-Red 30
II.I.V Método del Modelo-base 30
II.II Análisis – Evaluación 32
II.III Algoritmo K-Media 34
II.III.I Despliegue del algoritmo 38
III. Resultados 40
III.I Modelo agregado 40
III.II Modelo desagregado 41
III.II.I. Fase 1 41
III.II.II Fase 2 43
III.II.III Fase 3 44
III.III Implicaciones 47
IV. Discusión 48
IV.I Análisis Interno 48
IV.II Análisis Externo 53
IV.III Aportaciones 54
IV. IV Futuras Investigaciones 55
IV.IV.I Futuros trabajos en la empresa 55
IV.IV.II Futuras investigaciones teóricas 56
Referencias 57
vii
Índice de Figuras
Figura I.I.I.1. Participación en mercado de tarjetas con microprocesador 12
Figura I.I.I.2 Estatus de la implementación de chip por región 13
Figura I.I.I.3 Estatus de la implementación de chip en América Latina 14
Figura I.I.II.1 Presencia de GA en el mundo 15
Figura I.I.III.1 Rollo de holograma 19
Figura I.I.III.2. Tarjeta con banda magnética 20
Figura I.I.III.3. Tarjeta con chip 20
Figura I.I.III.4 Tarjeta sin contacto 21
Figura I.I.III.5 Organigrama general de GA 22
Figura I.I.III.6 Organigrama general de Ingeniería 22
Figura I.I.III.7 Organigrama del área de Producción PSC 23
Figura I.I.III.8 Sistema de gestión de calidad de GA 24
Figura I.I.III.9 Áreas de producción de GA 25
Figura I.I.III.10 Centro de Personalización PSC 25
Figura I.I.III.11 Esquemas de Personalización 26
Figura I.I.IV.1. Pareto de la producción 2011 27
Figura I.I.IV.2 Cantidad de Ordenes por cantidad de tarjetas 28
Figura I.I.IV.3 Cantidad de ordenes respecto a cantidad de tarjetas en cada orden de trabajo
cliente A 29
Figura I.I.IV.4 Cantidad de ordenes respecto a cantidad de tarjetas en cada orden de trabajo
cliente B 30
Figura I.II.II.1. La producción como proceso de transformación 36
Figura II.III.1 Partición inicial de la k-mean 50
Figura II.III.2 Reposicionamiento del cetro del clúster después de la iteración 51
viii
Figura II.III.3 Centro del clúster final después de terminar las iteraciones 52
Figura II.III.4 Clusterización de un conjunto de objetos basado en el método de la k-mean (la media
de cada clúster está marcado por un “+”) 53
Figura III.I.1 Proceso PSC 56
Figura III.II.2 Tarjeta Indentado y banda 58
Figura III.II.3 Tarjeta Embosado y Chip 58
Figura III.II.4 Tarjeta Termografia y Foto 59
Figura III.II.5 Empaque del proceso 59
Figura III.II.6 Clusterización de órdenes de trabajo generadas en un día 63
Figura IV.I.1 Ordenes de trabajo vs clusters Cliente 1 66
Figura IV.I.2 Ordenes de trabajo vs clusters Cliente 2 67
Figura IV.I.3 Ordenes de trabajo vs clusters Cliente 3 68
Figura IV.I.4 Ordenes de trabajo vs clusters Cliente 4 69
Figura IV.I.5 Ordenes de trabajo vs clusters Cliente 5 70
Figura IV.I.6 Ordenes de trabajo vs clusters Cliente 6 70
Figura IV.I.7 Ordenes de trabajo vs clusters Cliente 7 71
Figura IV.I.8 Ordenes de trabajo vs clusters Cliente 8 71
ix
Índice de Tablas
Tabla I.I.IV.1 Simulación de ahorro de tiempo agrupando 31
Tabla III.II.1 Órdenes de trabajo generadas en un día 61
Tabla III.II.2 Coordenadas de los centroides 63
Tabla IV.II.1 Comparación de plantas 64
Tabla IV.II.2 Resultados obtenidos 65
x
PREFACIO
La elección del Tema de investigación del presente trabajo, ocurrió bajo la necesidad de
innovación de la empresa caso estudio y bajo la influencia de los conocimientos
adquiridos en el proceso de estudio de la maestría en ingeniería industrial, en la Sección
de Estudios de Posgrado e Investigación de la UPIICSA IPN. Particularmente motivante
fueron los cursos de:
- Fundamentos teóricos y metodológicos para la productividad.
- Gestión de tecnologías
- Estrategias y modelación para la ingeniería
Desde el ingreso a laborar a la empresa caso estudio, la autora se pudo percatar de la
problemática existente: complejidad en las órdenes de producción, desorden en los
procesos productivos, empalme o traslape en algunas operaciones, dificultades
esporádicas en el suministro de materiales y en la distribución del producto, etc.
Circunstancias que se reflejaban en la baja productividad de la empresa. Esta situación
motivó el planteamiento de búsqueda de la solución más adecuada.
La combinación de los dos aspectos anteriores, indujo a la autora, a plantear el proyecto:
“Algoritmo para la clusterización de órdenes de producción”.
El objetivo de esta tesis es Diseñar un algoritmo para agrupar productos bancarios por
familias en la empresa GA caso estudio, con base en el proceso de la k-mean, con el fin de
reducir costos en la línea de personalización de tarjetas.
La estructura utilizada en este trabajo es la conocida por las siglas IMRyD: Introducción, Metodología, Resultados y Discusión (Day & Gastel, 2006; Evans & Gruba, 2002; Matthews, Bowen, & Matthews, 2000; Weissberg & Buker, 1990; Wilkinson, 1991; Docherty & Smith, 1999).
Además de desarrollar la habilidad de buscar información vigente, relevante, pertinente,
suficiente, visible y de alto impacto (Shoaff, 2001). La metodología utilizada para la
realización de este proyecto, consistió de las siguientes etapas, mismas que se describen a
profundidad en los capítulos que forman la tesis:
- Contexto de la empresa.
- Descripción de la problemática.
- Investigación bibliográfica relacionada con la temática.
- Planteamiento de la solución y elaboración del algoritmo.
- Instrumentación e implementación de la solución.
xi
- Análisis de los resultados.
Cabe señalar, que la aplicación de los resultados de este trabajo, se reflejan en el
incremento de la productividad de la empresa caso estudio.
En el presente trabajo se presentan los resultados del estudio teórico, la investigación de
campo y las experiencias en otras empresas similares a la del objeto de estudio, así como
la problemática actual de la empresa caso estudio. En el primer capítulo, se habla del
contexto en que se ubica el problema de investigación para que sea posible valorar su
repercusión. La información sobre el origen y desarrollo del problema ayudaran a
comprender como se ha formado con que se relaciona y cuáles son sus tendencias
(Strunk, 2006). En el segundo capítulo se describen los métodos para la clusterización
existentes, se realiza un análisis te todos los métodos para elegir el que más convenga
según las necesidades de la empresa y la mejor opción para la solución de la problemática.
En el tercer capítulo se hace una presentación de la solución propuesta, reduciendo los
tiempos en ajustes de inicialización y actualización de los equipos (setup), teniendo como
resultado, un incremento considerable en la productividad del sistema. En el cuarto y
último capítulo de se discute sobre el presente trabajo, se realiza un análisis interno y
externo, se hace mención de futuras investigaciones y posibles trabajos a desarrollar en la
empresa caso estudio y futuras aportaciones técnicas.
Por último, es necesario señalar, que este trabajo se ha realizado, gracias a las facilidades
que la empresa caso estudio permitió y a la colaboración invaluable de mis compañeros
de trabajo, así como la orientación y asesoría del director de la tesis y de los profesores
miembros del comité revisor.
xii
CAPÍTULO I
INTRODUCCIÓN
A continuación se describirá la empresa en estudio hasta llegar a la descripción detallada
del área donde se encuentra la problemática y en el que se desarrollara el proyecto.
Presentaremos, en este primer capítulo, el estado actual de la empresa así como
información recolectada años atrás.
I.I CONTEXTO
El objetivo de este primer capítulo, es presentar el estado actual en que se encuentra el
mercado de tarjetas inteligentes en el mundo entero, pasando por Latinoamérica y
México, concluyendo en nuestro caso de estudio. Visualizar la posición en la que se
encuentra la empresa y la importancia de la mejora continua, reducción de costos y la
productividad. Al enfocarnos en la empresa de estudio nos daremos cuenta que esta es
especialista solo de una parte de todo el universo de GA, que es, fabricación de tarjetas
inteligentes, donde el área de estudio es la personalización de estas. Finalmente se realiza
una evaluación de la necesidad que se tiene por agrupar productos por familias para la
reducción de tiempos de operación.
I.I.I MERCADO MUNDIAL DE FABRICACION DE TARJETAS
Durante muchos años uno de los inconvenientes de guardar el dinero en un banco era la
limitada disponibilidad e información puntual que tenía el cliente, ya que dependía de las
horas en que estaban abiertas las oficinas; lo cual provocaba además enormes esperas
con el consiguiente estrangulamiento de las transacciones, del comercio y de la economía
en general. Otro obstáculo importante ha sido la concesión de préstamos toda vez que era
necesario el conocimiento de las posibilidades financieras de las dos partes implicadas en
el negocio, desarrollándose éstos en la mayor parte de los casos de forma lenta y
burocrática. Lo mismo cabría argumentar de las compañías de seguros que en muchas
ocasiones, desconocían el tipo de cliente con el que trataban y faltaban estadísticas o
acopio de información, relevante para proporcionar un trato diferenciado en base a una
estratificación por riesgos de sexo, edad, experiencia, accidentes, zonas geográficas en las
1
que viven etc. Estas situaciones y otras se han visto superadas o cuanto menos aliviadas
por la introducción de las nuevas tecnologías de la información en el sector financiero
(Casares, 2012).
a. Mercado mundial
Las necesidades de nuestra actual cultura para mejorar el nivel de vida de la sociedad,
como pueden ser, agilizando trámites, generando formas de identificación colectiva y
personal, sin olvidar la seguridad de nuestra información y que esta sea viable en todo el
mundo, ha dado lugar al surgimiento de las tarjetas inteligentes.
La venta de tarjetas inteligentes ascendió a 6,610 millones en el 2010, un 18.9% respecto
al año anterior. GA siguió siendo el principal fabricante de tarjetas con chip en el mundo
con un mercado del 30.1% (The Nilson Report, 2011). Ver Imagen I.I.I.1
Figura I.I.I.1. Participación en mercado de tarjetas con microprocesador (The Nilson Report, 2011).
2
A nivel mundial nos encontramos con un sector en el mercado ocupando:
41.1% de tarjetas y 76.7% de terminales en Canadá, Latinoamérica y el Caribe
El 28.2% de tarjetas y 51.4% de terminales en Asia
El 20.6 de tarjetas y el 75.9 de terminales en África y el medio oriente
El 84.4% de tarjetas y el 94.4% de terminales en Europa Zona 1
14.5% de tarjetas y 68.1% de terminales en Europa Zona 2
EUA es un mercado nuevo para nosotros
En la imagen I.I.I.2 podemos ver esta distribución.
Figura I.I.I.2 Estatus de la implementación de chip por región (GA, 2011).
b. Latinoamérica
La seguridad de las transacciones electrónicas siempre ha sido una prioridad para los
consumidores, reguladores, emisores y adquirientes en América Latina, por lo que estos
jugadores de la industria se han visto en la necesidad de poner especial atención a
tecnologías que combatan el fraude y protejan al consumidor. Las Tarjetas Inteligentes
contienen un microprocesador o chip integrado de múltiples aplicaciones, el chip permite
no sólo almacenar una mayor cantidad de información, sino generar y validar datos
dinámicos y así incrementar la seguridad de las transacciones de pago (Portafolio.co,
2010).
3
En América Latina, el Caribe y Canadá se han emitido 182.4 millones de tarjetas
inteligentes, lo que representa el 26.4% del total de tarjetas que circulan en dichas
regiones. Según la SCALA (Smart Card Alliance for Latin América – Alianza de Tarjetas
Inteligentes de América Latina) los dos mercados más grandes de América Latina son:
Brasil y México. Según las estimaciones de SCALA se estima que para el 2013 todas las
tarjetas de crédito en el mercado brasileño tendrán chip, para el caso de México se estima
que para el 2015 el número de tarjetas de crédito con chip alcanzará 27 millones
(Fernando Méndez, 2010). Según proyecciones de crecimiento indican que emisores
esperan migrar 100% de sus portafolios de crédito y débito a chip en los próximos 5 años
(Portafolio.co, 2010).
Hablando solamente de Latinoamérica:
- En Venezuela se tiene un mercado del más del 75%.
- En México y en Brasil tenemos entre el 50% y el 75%.
- Mientras que en los demás países nuestra demás participación es del 0% al 10%.
(Esta información la podemos ver representada en la siguiente imagen I.I.I.3.
Figura I.I.I.3 Estatus de la implementación de chip en América Latina (GA, 2011).
4
c. México
La actividad principal de GA en sus inicios en México fue la producción y venta de tarjetas
telefónicas de prepago y tarjetas bancaria con banda magnética. GA se establece por
primera vez en la ciudad de México hace 50 años, brindando servicios para los sectores de
Telecomunicaciones, Banca, Gobierno y otras áreas relacionadas con Seguridad. Esta
empresa decide incrementar sus inversiones en este país abriendo una nueva planta de
producción, con esto amplia la oferta de servicio y capacidad de producción para
satisfacer estos mercados (GA, 2011).
I.I.II GA A NIVEL MUNDIAL
GA, es una empresa de servicio líder en seguridad digital. Como ellos lo indican, “GA
provee soluciones de seguridad digital integrales diseñadas para que las interacciones
digitales personales sean más prácticas, seguras y placenteras”. Sus productos van desde
el desarrollo de aplicaciones de software, diseño y fabricación de dispositivos personales
seguros como lo son tarjetas inteligentes, SIMs, pasaportes, fichas electrónicos y va más
allá, hasta la administración de servicios personalizados de implantación para sus clientes.
Todos estos productos los podemos ver reflejados en los sectores de telecomunicaciones,
empresas bancarias, seguridad de redes, estacionamientos, transporte y de salud, estas
soluciones que brinda GA ponen en valor la seguridad y la comodidad de todos estos (GA,
2011).
GA además crea dispositivos portables seguros que almacenan aplicaciones específicas del
usuario final, estos productos pueden ser:
- Tarjetas con microprocesador, conocidas como “Smart Cards” como lo son las
tarjetas SIM inalámbricas y tarjetas bancarias EMV.
- Pasaportes, atención de salud, tarjetas de identificación, licencias de conducir en
versión electrónica.
- Fichas, llaves USB y dispositivos OTP.
Esta empresa también brinda otro tipo de productos como:
- software asociado, middleware, y soluciones con base en servers.
- servicios de personalización como administración de datos, manejo de archivos,
servicios de post-emisión y empaque.
- servicios de operación.
5
- consulta, integración, gestión y mantenimiento de proyectos, capacitación y
soporte.
- puntos de venta: una gama completa de terminales, herramientas de software
dedicadas, sistemas y servicios de administración.
- lectoras y chipsets.
- tarjetas de memoria.
- tarjetas pre-pagas para telefonía pública.
El mercado de esta compañía está distribuido alrededor del mundo en más de mil
millones de personas que utilizan sus productos y servicios para telecomunicaciones,
servicios financieros, gobierno electrónico, administración de identidad, contenidos
multimedia, administración de derechos digitales, seguridad informática, tránsito masivo y
muchas otras aplicaciones.
A marzo del 2010 se facturaron 1.906 mil millones de euros, que fueron gracias a más de
10,000 empleados de 90 diferentes nacionalidades localizados en 45 diferentes países. GA
cuenta con 87 oficinas de ventas y marketing; 18 emplazamientos de fabricación, 30
centros de personalización, 13 centros de investigación y desarrollo, como lo podemos ver
en la Imagen I.I.II.1.
Figura I.I.II.1 Presencia de GA en el mundo (GA, 2012).
6
Valores
GA es una sociedad global líder en seguridad digital. La empresa se basa en tres valores
fundamentales para satisfacer las necesidades de sus clientes (GA, 2012):
Nuestros Clientes:
o Poniendo sus necesidades como parte central de lo que hacemos.
o Desarrollando sociedades responsables y confiables para nuestro mutuo
beneficio.
o Asegurando su beneficio de nuestros desarrollos, producción y entregas a
tiempo, eficientes y confiables.
o Excediendo sus mejores expectativas, a través de nuestra atención y
servicio de calidad.
Nuestra Gente:
o Valorando su diversidad, respetando sus cualidades individuales, nutriendo
sus talentos y permitiendo llenar sus expectativas profesionales.
o Alentando el trabajo en equipo, apoyándonos cada uno de nosotros, a
través de la organización y haciendo la mejor combinación potencial.
o Conduciéndonos con la mayor de las integridades y ética, siendo un
ejemplo apropiado de una excepcional empresa internacional.
o Contribuyendo con motivación, compromiso, nuestro deseo y dedicación a
la excelencia.
Nuestra Innovación:
o Continuamente explorando y desarrollando nuevas ideas.
o Siendo pioneros creativos, acensando a retos de negocios y tecnología,
siendo abiertos y adaptables a las oportunidades y a la mejora continua.
o Colaborando con nuestros clientes y socios para formar un nuevo mundo
en seguridad digital.
o Liderando nuestra industria y formando su futuro a través de nuestra
visión, investigación y experiencia.
7
I.I.III GA MÉXICO
Inició operaciones como Tarjetas Inteligentes y Departamento de la Terminal de
Schlumberger, posteriormente fue comprado Sema Group que creó la fusión de
SchlumbergerSema. Cuando Schlumberger vendió el negocio de servicios de
SchlumbergerSema a Atos Origin, el departamento de Terminal y Tarjeta Inteligente se
separó nuevamente para convertirse en Axalto, que salió a la bolsa en el 2004. El 7 de
diciembre del 2005, Axalto anunció su plan de fusión con su principal competidor
Gemplus. El 19 de mayo del 2006, la comisión Europea aprobó la fusión entre Axalto y
Gemplus, dando lugar a la creación de la nueva empresa el 2 de junio del 2006 (GA, 2011).
La especialización en la fábrica GA de México, es la de Secure Transaction Business Unit,
que se refiere al negocio de transacciones seguras.
GA Secure Transactions Business Unit
El sitio es uno de los centros de producción de tarjetas inteligentes la cual se compone de
dos áreas: Card Bodies y Personalización.
Misión Corporativa
GA proporciona dispositivos de seguridad personal, plataformas y servicios, a través de la
innovación y colaboración, permitiendo a sus clientes ofrecer confiables y convenientes
servicios digitales a billones de personas.
Misión Iztapalapa
Asegurar la satisfacción de nuestros clientes de todos los sectores de negocio, a través de
Productos y Servicios personalizados:
Generados con calidad.
Entregados en Oportunidad.
Fabricados con Procesos tecnológicos de alto valor agregado.
Garantizando la Seguridad en toda la cadena productiva.
A través de la participación y compromiso de nuestro personal en equipos de alto
desempeño, para el cumplimiento de las metas de GA.
8
Visión Corporativa
En una sociedad cada vez más conectada, GA será líder en hacer las interacciones
personales digitales seguras y fáciles.
Visión Iztapalapa
Ser la referencia en GA y en el mercado de: Productos & Servicios tecnológicos
personalizados y en Satisfacción del cliente.
Los Productos
Los productos entregados por el sitio de México se manejan a través de las grandes
familias, dentro del perímetro de la certificación ISO de las actividades del sitio. Estas son:
Cuerpo impreso y acabado:
El cuerpo de tarjeta es una tarjeta troquelada de diferentes tamaños y espesores que
incluye una impresión genérica y elementos de acabado como panel de firma, holograma
(Imagen I.I.III.1) y banda magnética. Este producto se entrega a las actividades internas
y/o a clientes finales.
Figura I.I.III.1 Rollo de holograma (GA, 2012).
9
Productos Bancarios / Comerciales & Lealtad
Son cuerpos de tarjetas con banda magnética (Imagen I.I.III.2) y/o “Chip” componente
electrónico, tipo microprocesador. La tecnología utilizada durante el proceso de
operación es la laminación en hojas y personalización de la banda magnética asociada al
cuerpo de tarjeta.
Figura I.I.III.2. Tarjeta con banda magnética (GA, 2012).
En caso de que utilice un “chip” (Imagen I.I.III.3), la tecnología utilizada durante el proceso
de operación es la inserción y personalización del “chip” asociado a un cuerpo de tarjeta
previamente laminado y troquelado. Esos productos están principalmente destinados a
los mercados bancarios y seguridad de redes de datos.
Figura I.I.III.3. Tarjeta con chip (GA, 2012).
Productos Contactless / ID
Son cuerpos de tarjetas con Inlays (Antena) y/o Banda Magnética (imagen I.I.III.4). La
tecnología utilizada durante el proceso de operación es la laminación en hojas y
personalización del chip del inlay ó de la banda magnética asociada al cuerpo de tarjeta.
Figura I.I.III.4 Tarjeta sin contacto (GA, 2012).
10
En caso de que utilice un “chip”, la tecnología utilizada durante el proceso de operación es
la inserción y personalización del “chip” asociado a un cuerpo de tarjeta previamente
laminado y troquelado. Esos productos están principalmente destinados a los mercados
Gubernamentales, transporte y salud.
A. Estructura Organizacional
Organigrama general de la planta (Imagen I.I.III.4)
Figura I.I.III.5. Organigrama general de GA (GA, 2012).
11
El área en que llevara este proyecto de mejora es el de Ingeniería y está compuesto de la
siguiente manera, Imagen I.I.III.5, en el cual también viene marcado el nombre de la
persona que llevara a cabo el proyecto.
Figura I.I.III.6. Organigrama general de Ingeniería (GA, 2012).
Organigrama del área de trabajo en el que se desarrollara el proyecto, situando este en el
área productiva con 105 personas operativas y 3 supervisores (Imagen I.I.III.6).
Figura I.I.III.7. Organigrama del área de Producción PSC (GA, 2012).
12
Áreas de Oportunidad
La imagen I.I.III.7 está hecha en base al Sistema de Gestión de calidad, que es un conjunto
de elementos mutuamente relacionados o que interactúan, para establecer y cumplir con
la Política y los Objetivos, con el fin de dirigir y controlar una organización con respecto a
la calidad (ISO 9000:2005, 2009).
El departamento de ingeniería se encuentra fuera del proceso de producción pero es un
área de soporte para el toda el área productiva.
Figura I.I.III.8. Sistema de gestión de calidad de GA (GA, 2012).
13
El área de producción está dividida en tres áreas como se indica en la Imagen I.I.III.8
Card Body (Cuerpo de Tarjeta): Impresión del grafico sobre el cuerpo según requiera el
cliente, en esta área también se hace el ensamble de overlay (una capa de plástico) y
banda magnética, posteriormente se lamina el ensamble para ser troquelarse al tamaño
de una tarjeta.
Célula Bancaria: En esta área la entrada son los plásticos (tarjetas), según los
requerimientos del cliente en esta área de coloca por medio de estampado el panel de
firmas, el holograma y si el producto lleva chip se realiza la cavidad de este,
posteriormente de inserta el modulo en la cavidad para finalizar con la pre-
personalización del chip.
PSC (Centro de Personalización): Donde como su nombre lo indica, en esta sección se
personalizan los cuerpos, y es aquí donde se realizara el análisis de estudio.
Figura I.I.III.9. Áreas de producción de GA (GA, 2012).
El centro de personalización a su vez está compuesto por las diferentes sub-áreas (Imagen
I.I.III.9):
Mesa de Control: El área segura donde se reciben los archivos de los clientes y donde es
procesada la información.
OTP’s: Ensamble de token’s.
Grabación: Área donde se personalizan las tarjetas.
Acabado: Área donde se agrupa el material por envíos.
Figura I.I.III.10. Centro de Personalización PSC (GA, 2012).
14
A grandes rasgos el proceso de personalización inicia con la recepción de los archivos de
los clientes. Después de haberlos recibidos estos archivos son procesados por unos
servidores, cuando se tiene la información disponible inicia el proceso de personalización
de tarjetas (Imagen I.I.III.10).
Figura I.I.III.11. Esquemas de Personalización (GA, 2012).
Trabajo de Personalización
Proceso y Tecnología:
• Chip: software de personalización específico para cada producto de tarjeta,
aplicación de tarjeta y perfil seleccionado.
• Otros.
– Banda Magnética: común para toda tarjeta.
– Grabado en relieve:
Indentado: Impresión grafica cóncava.
Embozado: Impresión grafica en relieve.
Termoimpresión: Impresión grafica por medio de calor.
Embalaje: específico para cada Cliente (eventualmente para cada producto).
Control de Calidad: basado en los requerimientos del cliente (el Chip debe ser checado).
Entrega: se pueden proveer varios tipos de servicios.
15
I.I.IV SITUACIÓN PROBLEMÁTICA
GA fue fundada en Junio del 2006, mediante la fusión de Axalto y Gemplus International
SA. GA se expandió más allá de sus tradicionales raíces en el mercado de tarjetas
inteligentes. Ahora está centrada en crear soluciones de principio a fin para la seguridad
digital incluyendo el desarrollo de software, middleware, diseño producción de
dispositivos personales seguros y varios servicios de implementación (GA, 2011).
Actualmente más de mil millones de usuarios finales ya usan un producto GA de algún
tipo. Los mercados claves de GA son los proveedores de servicios de telecomunicaciones,
instituciones financieras, de seguridad corporativa, de contenidos de Internet, del sector
público y de transporte.
GA México tiene una capacidad máxima anual de producción de 30, 000,000 tarjetas
personalizadas, en el 2010 se registraron 23, 227,399, en el 2011 29, 671,309 unidades.
En la imagen I.I.IV.1 podemos observar la producción que se tiene por cliente durante el
año 2011, donde el 80% de nuestra producción está concentrada en 4 clientes.
Figura I.I.IV.1. Pareto de la producción 2011 (GA, 2011).
16
Se realizó un análisis de las órdenes producidas en el mes de noviembre del 2011 respecto
a la cantidad de unidades por orden y pudimos apreciar como lo muestra la imagen
I.I.IV.2, que la mayor cantidad de órdenes producidas en nuestro centro de manufactura
son de 1 unidad y en promedio las órdenes de trabajo no superan las 100 unidades.
Figura I.I.IV.2 Cantidad de Ordenes por cantidad de tarjetas (GA, 2012).
Se analizó el tiempo de setup de equipo del cual no se puede reducir de 3.30 minutos,
considerando solamente las 1000 órdenes producidas con una tarjeta, se estaría hablando
de 58 horas dedicadas exclusivamente a realizar el setup para la producción de una
tarjeta, el 12% del tiempo mensual.
17
Enfocándonos en los clientes A y B haciendo una relación entre la cantidad de órdenes
mensuales y la cantidad de producto por orden (1er de 1-100, 2da de 101 a 500, 3era de
501 a 1000 y 4ta > 1000), encontramos lo siguiente:
Para tarjetas de 1-100 unidades encontramos la mayor cantidad de órdenes en todos los
meses, esto significa mayor número de setup, imágenes I.I.IV.3 y I.I.IV.4
Cliente 3
Grafica I.I.IV.3 Cantidad de ordenes respecto a cantidad de tarjetas en cada orden de trabajo cliente 3 (GA, 2012).
Cliente 1
Grafica I.I.IV.4 Cantidad de ordenes respecto a cantidad de tarjetas en cada orden de trabajo cliente 1 (GA, 2012).
18
Para este estudio nos enfocaremos al cliente 2 ya que en la empresa se tiene más facilidad
ya que no es el cliente principal y es el segundo cliente según las compras.
En estas imágenes podemos observar que no existe una relación entre la cantidad de
órdenes por la cantidad de productos producidos, es decir, para el cliente 2 en el mes de
agosto se produjeron 1,350 órdenes de trabajo donde la cantidad de productos fueron de
1 a 100 unidades.
Para el cliente 2 contamos con 423 productos diferentes donde se pueden agrupar en 32
familias.
Si aplicamos la clusterización los ahorros semanales de Agosto a Diciembre del año 2011
hubieran sido de 308 horas mensuales y se hubieran reducido 5,280 órdenes de trabajo.
Mes Ordenes actuales
Ordenes agrupando
Ordenes ahorradas
Tiempo ahorrado (hrs) (Setup de 3'30'’)
Agosto 1662 690 972 56.7
Septiembre 1709 618 1091 63.6
Octubre 1723 615 1108 64.6
Noviembre 1697 590 1107 64.6
Diciembre 1559 557 1002 58.5
Tabla I.I.IV.1 Simulación de ahorro de tiempo agrupando (GA, 2011).
En promedio cada semana se podrían ahorrar 14 horas, ya que en los análisis realizado de
Agosto a Diciembre del 2011 (tabla I.I.IV.1) se produjeron en total 8,350 órdenes, de las
cuales se pudieron reducir a 3,070 órdenes utilizando grupabilidad, quedando 5,280
órdenes, ahorrando 308 horas durante estos 5 meses, que equivaldría a producir 115,500
unidades (tarjetas).
19
I.II MARCO TEORICO
La producción inicia de manera casual por el hombre para satisfacer a sus necesidades
primarias, y se ha llevado a cabo hasta nuestros días ya que esta es el motor de la
economía de las naciones. Debido a la globalización, toda empresa se ha visto obligada a
mejorar continuamente, la flexibilidad de la producción y la calidad del producto, así como
las entregas y los costos (Blackstone 2005, Muñoz 2009, Render, Barry & Heizer 1996).
Los avances tecnológicos que conocemos hoy en día, son el resultado de la reducción del
tiempo para la optimización de sus procesos productivos, todo esto con el objetivo de
perfeccionar los medios para alcanzar sus objetivos buscando siempre la productividad y
la eficiencia.
Dentro este capítulo también se aborda de manera general la historia y los conceptos
claves de la producción, ya que como sabemos la producción y la productividad son efecto
de la administración y las funciones operativas. Se revisará la evolución histórica,
analizando conceptos fundamentales hasta llegar a nuestro tema de interés, la
optimización, clusters.
I.II.I HISTORIA
El hombre ha producido bienes para su consumo desde la era prehistorica. La producción
y distribución de bienes la dominaban las uniones de artesanos y los mercados domésticos
(Hopp & Spearman, 2001). Las diferentes etapas de un proceso de manufactura no se
encontraban integrados en una fábrica, distintos artesanos realizaban cada paso del
proceso de manufactura después de haber comprado y vendido sus productos en los
mercados domésticos, pero es hasta la Revolución Industrial que se considera a la
producción industrial como la base de los sistemas actuales de la producción, que
evoluciona hasta llegar a lo que diversos autores denominan la economía basada en el
conocimiento. Durante este periodo se identifican varias etapas, cada una de ellas se
caracteriza por el desarrollo de técnicas y filosofías predominantes. Las etapas más
importantes en el desarrollo de los métodos de producción son las siguientes (Blackstone
2005, Muñoz 2009, Render, Barry & Heizer 1996):
20
Periodo antiguo, según restos arqueológicos encontrados, el hombre prehistórico
se preocupaba por satisfacer sus necesidades básicas, es decir, sus alimentos y su
vestimenta, basándose de procedimientos para la agricultura y la caza, donde
primero se baso de sus manos para estas labores y conforme el paso del tiempo
incorpora herramientas para facilitarle el trabajo.
La Revolución Industrial, inicia con la invención de la máquina de vapor por el
ingles James Watt en 1769, la máquina de vapor permite reemplazar el trabajo
artesanal por la maquina. A partir de su primera aplicación, el uso de la máquina
de vapor empieza a generalizarse en fábricas, en barcos, trenes y en la explotación
minera.
División del trabajo, enunciado por Adam Smith en su libro Riqueza de las
naciones, en el que expone los principios del capitalismo y explica como la división
del trabajo permitirá una producción más rápida y económica que la artesanal.
Taylor consideraba que si un operario se especializaba en una tarea determinada,
con el tiempo y debido a la experiencia acumulada, podía contribuir al
mejoramiento de la productividad.
Intercambio de partes, las partes de diferentes ejemplares del mismo producto son
intercambiables, sin alterar el funcionamiento del producto si respetan las
especificaciones de diseño. El Francés honoré LeBlanc en 1785 fue el primero en
mostrar este principio a Thomas Jefferson, al intercambiar las partes de dos
mosquetes, no fue hasta 1801 cuando Eli Withney y Simeon North probaron la
factibilidad del método.
La administración científica, con los principios enunciados por Charles Babbge hace
la introducción a esta nueva rama no es hasta A Frederick W. Taylor (1856-1915)
quien la postula formalmente, es por eso que se le considera el padre de la
administración científica, es a quien se le reconoce el logro de generar por primera
vez un marco sistemático para proclamar a la administración como una disciplina.
Su mayor contribución fue la sistematización del principio de la división del trabajo:
estableció que se mejora la eficiencia de un sistema de producción si se
estandariza cada uno de los pasos de un proceso productivo, para lo que es
necesario estudiar científicamente la mejor manera de llevar a cabo cada uno de
estos pasos.
21
Carta de Gantt, herramienta para la programación de actividades propuesta por
Henry Gantt (1861-1919).
Estudio de tiempos y movimientos, propuesto por los esposos Frank y Lillian
Gilbreth (1901), que requieren el examen con detalle de tiempos y movimientos de
los operativos, para proponer los procedimientos más eficientes de producción.
Sistemas en producción en masa, Henry Ford quien aprovecha las ideas de la
administración científica e implanta por primera vez una línea de producción en
masa de alta velocidad para el modelo T en 1913.
Nacimiento de las primeras empresas transnacionales entre 1875 y 1914.
El movimiento por los recursos humanos (mediados de los años treinta hacia fines
de la década de los años cincuentas).
La toma de decisiones con base en modelos, Hugo Munsterberg (1863-1916), fue
el primero en aplicar la psicología al estudio de la eficiencia de los sistemas de
producción industrial, donde se tocan temas como la selección de empleados, el
entrenamiento y las condiciones de trabajo, y la motivación del trabajador para el
logro de las metas de la empresa.
Estudios Hawtgirbe, en este estudio se investigó empíricamente el efecto de la
iluminación de la planta en la productividad de los trabajadores (al aumentar la
intensidad de la luz la productividad aumenta).
La revolución por la calidad (de principios de los años setenta hasta mediados de
los noventa).
La economía basada en el conocimiento, aparición del primer modelo de
investigación de operaciones, la programación lineal elaborada por George Dantzig
durante la segunda guerra mundial.
22
I.II.II CONCEPTOS
La producción es la creación de bienes y servicios, es decir, la transformación de materias
primas en productos (ver Imagen I.II.II.1), así las empresas dedicadas a la producción o
servicios desarrollan procesos de negocios con la finalidad de operar con eficiencia y
satisfacer las necesidades de sus clientes, generando un beneficio económico para la
empresa, por consecuencia, la eficiencia de los procesos productivos están relacionados
con la calidad de estos, así como con el costo de la producción que incurre para su
creación (Muñoz 2009).
Figura I.II.II.1. La producción como proceso de transformación (Muñoz, 2009).
Uno de los métodos para el análisis de datos que se usa es la técnica de la clusterizacion,
ya que esta provee un método robusto y resistente para la clasificación de datos
permitiendo que el mismo punto de datos donde residen múltiples clusters con diferentes
grados de pertenencias.
Un cluster es un grupo de observaciones o cosas que tienen propiedades similares. El
proceso de clusterización consiste en encontrar un conjunto de grupos, cada uno con
todas las observaciones que comparten un conjunto de propiedades especificadas, es
decir, atributos. Cuando un cluster no se encuentra predefinido, el cluster proporciona
una forma de conocer los patrones distribuidos que revelan una variedad de patrones de
comportamiento de los datos (Cox 2005, Bezdek 1973 & 1981, Cherkassky 1998, Devroye
1996, Hoppner 1999, Krishnapuram 1998, Lee 1994, Sato 1966, Yager 1992).
23
El proceso de agrupar un conjunto de objetos físicos o abstractos en clases de objetos
similares es llamado clusterización y un cluster es la colección de datos que son similares
uno del otro dentro del mismo cluster y son diferentes de los objetos de otro cluster.
El análisis de cluster intenta aislar en una región similitudes en una base de datos y
encontrar la relación que hay entre los diferentes clusters.
En general, los métodos de clusterizacion pueden ser clasificados dentro de las siguientes
categorías:
Método de particionamiento
K-mean
K-medoids
Método Jerárquico
Aglomeración jerárquica
División jerárquica
Método Densidad-base
DBSCAN
OPTICUS
DENCLUE
Método Base-Red
STING
WAVECLUSTER
Método Modelo-Base
Expectation-Maximization
Conceptual Clustering
Neutral Network
24
I.V OBJETIVO
La demanda de las tarjetas inteligentes ha crecido desde los años 70’s que fue inventada y
patentada, reflejando los constantes avances en capacidades técnicas y ámbitos de
aplicabilidad. La necesitad de hacer tarjetas más seguras para evitar fraudes,
estandarización, tecnologías de identidad, etc., hacen cada día crezca este mercado.
Por lo tanto, el objetivo de la presente tesis es el Diseñar un algoritmo para agrupar
productos bancarios por familia en la empresa GA, con base en el proceso de la k-mean,
con el fin de reducir costos en la línea de personalización de tarjetas.
25
CAPÍTULO II MÉTODO
A continuación se describirá la metodología a utilizar para la solución del problema
presentado en el capito 1, se describirán los métodos más conocidos para la clusterizacion
y posteriormente se describirá el método del algoritmo de la k-mean.
II.I MÉTODOS PARA LA CLUSTERIZACIÓN
El estudio de la clusterización inició hace más de 40 años en muchas disciplinas gracias a
sus amplias aplicaciones (Hartigan 1975, Jain & Dubes 1988, Kaufman & Rousseeuw 1990,
Jagadish &Koudas 1999, Arabie, Hubert & De Soete y Parsons, Haque & Liu 2004). Los
métodos de clusterización principales se clasifican de la siguiente manera:
II.I.I Método del particionamiento
Dada una base de datos en n objetos o datos tuplas, el método del particionamiento
construye k particiones de los datos, donde cada partición representa un cluster y k ≤ n.
Los datos se clasifican en k grupos, cada uno de estos datos juntos satisfacen los
siguientes requerimientos (Han & Kamber, 2006).
a. Cada grupo debe contener al menos un objeto.
b. Cada objeto debe pertenecer a un grupo exactamente.
El segundo requerimiento puede estar relajado en algunas técnicas de particionamiento
difusos.
Dado k, el número de particiones para construir, el método de particionamiento crea una
partición inicial. A continuación utiliza la técnica de reubicación iterativo que intenta
mejorar el particionamiento mediante el movimiento de objetos de un grupo a otro. En
general, un buen criterio de parcionamiento es, que el objeto en el mismo cluster este
“cerrado” o relacionados entre sí, mientras los objetos de diferentes cluster están
“apartados lejos” o muy diferentes.
26
Para lograr globalmente una óptima partición basada en la agrupación se requiere una
exhaustiva enumeración de todas las posibles particiones. Muchas aplicaciones adoptan
uno de los pocos métodos heurísticos populares como lo son:
a. El algoritmo de la k-means, donde cada cluster es representado por el valor
promedio de los objetos en el cluster. Este algoritmo fue introducido por primera
vez por Lloyd y posteriormente por MacQueen (Lloyd 1982 y MacQueen 1967).
b. El algoritmo de la k-medoids, donde cada cluster es representado por uno de los
objetos y está localizado cerca del centro del cluster. Kaufman y Rousseeuw
propusieron el algoritmo de K-Medoids de OPAM y CLARA (Kaufman y Rousseeuw
1990). Este algoritmo es sensible a valores atípicos, es decir, un objeto con un valor
extremadamente grande puede distorsionar sustancialmente los datos de la
distribución.
Estos métodos heurísticos de clusterizacion trabajan bien para encontrar cluster de
formas esféricas en datos que tienen un tamaño que van desde pequeños hasta
medianos. Para encontrar cluster con formas complejas y para cluster de conjunto de
datos de gran tamaño, la partición basada en métodos deben ser extendidos.
27
II.I.II Método jerárquico
El método jerárquico crea una descomposición jerárquica dada por un conjunto de datos
de objetos. Este método puede clasificar como aglomeración o como divisivo, esto basado
en cómo se forma la descomposición jerárquica (Han & Kamber, 2006).
Los modelos son:
a. El enfoque de aglomeración también llamado enfoque “buttom-up”, empieza con
cada objeto formado un grupo separada. Esto sucesivamente agrupa los objetos o
los grupos que están cerca uno de otros, hasta de que todos los grupos estén
unidos en uno (del nivel más alto de la jerarquía) o hasta que una condición
termine.
b. El enfoque divisivo también llamado enfoque “top-down” inicia con todos los
objetos en el mismo cluster. En cada iteración se van dividiendo el cluster en
cluster más pequeños hasta que eventualmente cada objeto este en un cluster o
hasta que una condición termine.
El método jerárquico adolece del hecho de que una vez que un paso de realiza
(agrupación o separación) nunca se puede deshacer. Esta rigidez es útil para costos más
pequeños ya que no hay que preocuparse acerca de una serie combinatoria de las
diferentes opciones. Sin embargo, esta técnica no puede corregir las decisiones erróneas.
Existen dos enfoques para mejorar la calidad de la clusterización jerárquica:
a. Realizar análisis cuidadoso de objetos “vínculos” para cada partición jerárquica tal
como en Chameleon.
b. Integrar aglomeración jerárquica y otro enfoque usando primero el algoritmo de
aglomeración jerárquica para agrupar los objetos en micro clúster y
posteriormente realizar macro clúster, con los micro clúster, utilizando otro
método de clusterización como la reubicación iterativa, como en BIRCH.
El método jerárquico como AGNES (agrupación jerárquica de aglomeración) y DIANA
(agrupación jerárquica divisiva) fueron introducidos por kaufman y Rousseeuw. Otros
estudios para mejorar la calidad de agrupación en este método han sido por Zhang,
Ramakrishnan y Lyny introduciendo el modelo CF-árbol, Guha, Rastogi y Shim propusieron
28
el modelo CURE y Guha, Rastogi y Shm y Camaleón por Karypis, Han, y Kumar el modelo
ROCK (Ng & Han 1994, Bradley, Fayyad & Reina 1998 y Ester, Kriegel & Xu 1995).
II.I.III Método Densidad-base
La mayoría de los métodos de particionamiento agrupa objetos basado en la distancia
entre objetos. Estos métodos pueden encontrar solo el cluster de forma esférica y
encuentran dificultades para encontrar cluster de formas arbitrarias. Se han desarrollado
otros métodos de clusterización en base a la noción de densidad. La idea general de este
modelo es el de seguir creciendo el cluster dado siempre que densidad (numero de
objetos o puntos de datos) en el “vecindario” superen cierto umbral, es decir, para cada
punto de datos dentro de un cluster dado, el vecindario circundante a un radio dado tenga
contacto al menos con un mínimo número de puntos. Este método puede ser usado para
filtrar el ruido (outliers) y descubrir cluster de formas arbitrarias (Han & Kamber, 2006):
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) y su extensión,
OPTICS (Ordering Points to Identify the Clustering Structure), son métodos típicos de
densidad- base donde crece el clúster de acuerdo con el análisis de la densidad-base.
El modelo DBSCAN fue propuesto por Ester, Kriegel, Saander, y Xu. El algoritmo crece
regiones con suficientemente con alta densidad dentro de una agrupación y descubre
agrupaciones arbitrarias en base de datos espaciales con el ruido. Define una agrupación
mediante un conjunto máximo de puntos de densidad conectado (Ester, Kriegel, Sander &
Xu 1996).
Ankerst, Breuning, Kriegel, y Sander desarrollaron OPTICUS, un método de agrupación de
pedidos que facilita la agrupación basada en la densidad sin tener que preocuparse por la
especificación de parámetros. (Ankerst, Breuning, Kriegel & Sander 1999).
DENCLUE (DENsity-based CLUstEring) es un método de clusterización de objetos basado
en el análisis de distribución de valores en función a la densidad, Hinneburg y Keim fueron
quienes proponen este método (Hinnerburg & Keim 1998).
29
II.I.IV Método Base-Red
El método de la base red cuantifica el espacio de los objetos en un finito numero de celdas
que forman la estructura de la red. Todas las operaciones de clusterización son realizadas
en una estructura de red (en un espacio cuantizado). La mayor ventaja de este enfoque es
el rápido procesamiento, que es típicamente independiente del el número de datos de
objetos y dependiente solo en el número de celdas en cada dimensión en el espacio
cuantizado (Han & Kamber, 2006):
STING (STatistical INformation Grid) es un ejemplo típico del método de la base-
red, un enfoque de múltiples resoluciones basado en la red que recoge
información estadística en celdas de cuadricula. Este modelo fue propuesto por
Wang, Yang y Muntz (Wang, Yang y Muntz, 1997).
WaveCluster aplica transformación waveles para el análisis de clusterización y es a
la vez base-red y densidad-base. WaveCluster, desarrollado por Sheikholeslami,
Chatterjee y Zhang, es un enfoque de agrupación de múltiples resoluciones que
transforman el espacio (Sheikholeslami, Chatterjee y Zhang, 1998).
II.I.V Método Modelo-base
El método de la base-red hipotetiza un modelo para cada uno de los cluster y encuentra el
mejor ajuste para cada dato de cada modelo. El algoritmo modelo-red puede localizar
cluster mediante la construcción de una función de densidad que refleja una especial
distribución de los puntos de datos. También conduce a una manera de determinar
automáticamente el número de cluster basándose en la estadística estándar (Han &
Micheline, 2006). Los métodos de modelo-base son:
El algoritmo EM (Expectation-Maximization), para la agrupación basada en
modelos, fue desarrollado por Dempster, Laird y Rubin. AutoClass es un método
basado en estadísticas bayesiano para el agrupamiento basado en el modelo por
Cheeseman y Stutz que utiliza una variante del algoritmo EM. Hay muchas otras
extensiones y aplicaciones de EM, como Lauritzen. Para un conjunto de trabajos
seminales en la agrupación conceptual esta Shavlik y Dietterich (Dempster, Laird &
Rubin 1977, Cheeseman & Stutz 1996, Lauritzen 1995 y Shavlik & Dietterich 1990).
30
Conceptual clustering se introdujo por primera vez por Michalsky y Stepp. Otros
ejemplos del enfoque de conceptual clustering incluyen COBWEB por Fisher, y
CLASSIT por Gennari, Langley, y Fisher (Michalski & Stepp 1983, Fisher 1987 y
Gennari, Langley & Fisher 1989). Este método es una forma de agrupación donde
dado un conjunto de objetos no marcados produce un esquema de clasificación
sobre estos. Conceptual clustering además de identificar los grupos de objetos,
también encuentra la descripción característica de cada grupo donde cada grupo
representa un concepto o una clase. La calidad de la agrupación no es únicamente
una función de los objetos individuales, más bien se incorporan factores tales
como la generalidad y la simplicidad derivados de la descripción conceptual. Este
tipo de método adopta un enfoque estático que utiliza mediciones de probabilidad
en la determinación de la agrupación de conceptos por lo que las descripciones
probabilísticas suelen utilizarse para representar cada concepto derivado.
Los estudios sobre Neutral Network Approach incluyen SOM (Self-Organizing Maps
característica) por Kohonen, por Carpenter y Grossberg, y por Kohonen, Kaski, Lago
y Competitive learning por Rumelhart y Zipser (Hinton & Sejnowski 1999, Kohone
1982 y 1995, Carpenter & Grossberg 1991, Cheng, Fu & Zhang 1999, Kohonen,
Kaski, Lagus, Solojärvi, Paatero & Saarela 2000 y Rumelhart & Zipser 1985). Este
método está inspirado por las redes neuronales bilógicas. Neutral Network
Approach es un conjunto de unidades conectadas de entrada/salida, donde cada
conexión tiene un peso asociado con él. Algunas de las propiedades de este
método son:
- Neutral networks son inherentemente paralelas y son distribuidas.
- Aprenden mediante el ajuste del peso de sus interconexiones con la
finalidad de ajustar los datos lo mejor posible. Esto permite normalizar los
patrones y actuar como atributos de las extracciones de varias
agrupaciones.
- Procesa vectores numéricos y requiere patrones de objetos para ser
representados solamente por rasgos cuantitativos.
El enfoque de este método para la agrupación tiende a representar cada grupo
como un ejemplar. Un ejemplar actúa como un prototipo de la agrupación y no
necesariamente tiene que corresponder a un ejemplar partículas de datos u
objetos. Un nuevo objeto puede ser distribuido a una agrupación donde se tenga
mayor parecido con el ejemplar, basado en una medida de distancia. Los atributos
de un objeto asignado a un grupo puede se predicho mediante los atributos el
ejemplar de la agrupación.
31
II.II ANÁLISIS – EVALUACIÓN
A continuación se presenta los resultados de la comparación de los diferentes métodos analizados anteriormente, en la matriz de comparación de
métodos del clusterización.
MATRIZ DE COMPARACION DE METODOS DE CLUSTERIZACIÓN
Método Objetivo Características Aplicaciones Enfoque practico
Particionamiento
- Construye k particiones de datos.
- Se crea en base a la distancia entre
datos.
- Se basa en la distancia entre objetos
con un centroide o centro de gravedad
-Tiene la capacidad de mover objetos
de un cluster a otro.
- Uno define la cantidad de grupos a
crear.
- El cluster es de forma esférica.
- Hay dificultades para encontrar
cluster de manera arbitraria.
Algoritmo de la k-mean. Particiona los n objetos en k numero de
clusters
Algoritmo k-medoids.
Es muy sensitivo a salirse, si existe un
objeto con un valor extremadamente
grande, se puede distorsionar la
distribución de los datos.
Jerárquico - Descomposición jerárquica dada por
un conjunto de datos de objetos.
Cuando se ha realizado el cluster ya
no se puede deshacer
Aglomeración jerárquica
Coloca cada objeto en un cluster y los va
haciendo más grandes hasta que todos los
objetos se encuentran en el mismo cluster
División jerárquica Subdivide los clusters ya existentes
Densidad-base
- El objetivo de este método es tener la
mayor cantidad de objetos en el
cluster.
- Sigue creciendo el cluster.
- Busca regiones de baja densidad
para separar los clusters.
DBSCAN
El algoritmo crece regiones con alta
densidad dentro de un cluster y descubre
figuras arbitrarias de clusters (máximo set
de densidad de puntos conectados)
OPTICUS
Crece el clúster de acuerdo con el análisis
de la densidad-base
DENCLUE
Es un método de clusterización de objetos
basado en el análisis de distribución de
valores en función a la densidad.
32
32
Método Objetivo Características Aplicaciones Enfoque practico
Base Red
Cuantifica el espacio de los objetos en
un finito número de celdas que forman
la estructura de la red.
- Todas las operaciones de
clusterización son realizadas en una
estructura de red (en un espacio
cuantizado).
- Rápido procesamiento,
independiente del número de datos
de objetos y dependiente solo en el
número de celdas en cada dimensión
en el espacio cuantizado.
STING Es un ejemplo típico del método de la
base-red.
WaveCluster
Aplica transformación waveles para el
análisis de clusterización y es a la vez base-
red y densidad-base.
Modelo Base
Hipotetiza un modelo para cada uno de
los cluster y encuentra el mejor ajuste
para cada dato de cada modelo.
- El algoritmo modelo-red puede
localizar cluster mediante la
construcción de una función de
densidad que refleja una especial
distribución de los puntos de datos.
- También conduce a una manera de
determinar automáticamente el
número de cluster basándose en la
estadística estándar.
Expectation-
Maximization
Para la agrupación basada en modelos, es
un método basado en estadísticas
bayesiano para el agrupamiento basado en
el modelo por Cheeseman y Stutz que
utiliza una variante del algoritmo EM.
Conceptual Clustering
Forma de agrupación donde dado un
conjunto de objetos no marcados produce
un esquema de clasificación sobre estos.
Neural Network
Approach
Conjunto de unidades conectadas de
entrada/salida, donde cada conexión tiene
un peso asociado con él.
33
Los diferentes métodos de clusterización mencionados anteriormente al aplicarlos producen
diferentes resultados, todos ellos son capaces de analizar los datos y clasificarlos según cada
uno de los métodos y algoritmos. Sin embargo, los clusters incrementales como lo es el
método del particionamiento (K-means), es el único método que puede generar una
estructura explicita del cluster generado, representado visualmente para poder ser
razonado, mientras otros modelos pueden ser visualizados siempre y cuando su dimensión
no sea demasiado grande (Wittem & Frank, 2005).
Debido a que el método de particionamiento se basa en la distancia entre objetos con un
centroide o centro de gravedad, y se tiene la facilidad de elegir la cantidad de clusters a
realizar se elige este modelo para implementarlo en la problemática presentada en este
trabajo.
II.III ALGORITMO DE LA K-MEAN
La K en el algoritmo de k-mean destaca el número de semillas de cluster inicialmente
previstos para el algoritmo. El algoritmo de la k-mean involucra los parámetros de la
siguiente tabla (Cox 2005, Bezdek 1973 & 1981, Cherkassky 1998, Devroye 1996, Hoppner
1999, Krishnapuram 1998, Lee 1994, Sato 1966, Yager 1992):
Tabla II.III.1 Parámetros básicos el algoritmo de la k-media. (Earl, 2005).
Xi Vector de datos de entrenamiento, donde i = 1, 2,…, n. Estos son los atributos de un grupo
seleccionado de elementos de los elementos de datos encontrados.
K El número de fuzzy cluster especificados como parte del algoritmo.
Cj El centro de un cluster (j = 1, 2,…, k). Este valor es calculado repetidas veces por el
algoritmo.
Sj Un cluster en el mismo espacio. Este es un grupo de puntos asociado con el clúster que su
centro es Cj.
δsj() La función característica del conjunto de δj. Tenga en cuenta que la función característica
del conjunto A es como sigue,
En otras palabras, la función es 1 para todo el conjunto de puntos, pero 0 para el conjunto
de datos que sale.
(2.3.1)
34
El objetivo del algoritmo de la k-mean es la asignación de cada punto de datos en uno y solo
en un cluster. El centro del los cluster se mueven de acuerdo a la función de proximidad o
similitud, definiendo la distancia desde un centro de la agrupación para el punto de datos.
Existen dos ecuaciones fundamentales usadas para gestionar la partición de puntos de tatos.
La expresión 2.1 determina los miembros del cluster.
(2.3.2)
Donde
Sj(t) Es el grupo de miembros en el j-ésimo clúster central en fase de desarrollo.
t Es el valor de ciclo de iteración actual. El valor de t puede variar de 1 a P, el número
máximo de iteraciones usadas para definir el clúster final.
Xi Es el i-ésimo punto de datos.
Cj Es el centro del el j-ésimo clúster.
Ck Es el centro del k-ésimo clúster.
Esto es, en la iteración de tiempo (t) un punto Xi pertenece al cluster Sj si la distancia del
centro del clúster Sj (indicada por Cj) es menor que la distancia de k-ésimo centro del cluster
(para Sk). La distancia es generalmente calculada usando la métrica Euclidiana pero también
puede ser calculada mediante el método cualquier método estándar de distancia.
El centro del cluster es inicialmente una semilla, generalmente con una configuración
random dibujada desde el dominio de los atributos.
El centro es pues actualizado en cada ciclo (t) usando la siguiente expresión:
(2.3.3)
35
Donde:
Cj(t+1) Es el miembro determinado in el j-ésimo centro del cluster bajo desarrollo.
t Es la iteración actual del valor del ciclo. El valor de t puede variar de 1 a P, el máximo
número de iteraciones usadas para definir el cluster final.
Xi Es el i-ésimo punto de datos.
δ() Es la característica o el determinado miembro.
Sj(t) Es la función del determinado miembro (ver expresión 2.3.2).
El grupo de datos puede pertenecer al menos a un cluster, de otra manera, debemos dividir
entre cero. El algoritmo por sí mismo es muy sencillo: el centro del cluster se inicializa
aleatoriamente y nosotros asignamos un grupo de datos (xi) en el cluster (Sj; j = 1 para k)
resolviendo la expresión 2.2.1. Esto lo podemos ver ilustrado en la figura II.III.1. La línea
representa la asignación inicial de puntos en el centro del clúster C1 y C2.
Figura II.III.1 Partición inicial de la k-mean (Earl, 2005).
36
Cuando todos los puntos han sido asignados a un cluster, un nuevo centro del cluster es
calculado usando la expresión 2.3.2. Como lo muestra la figura II.III.2, el cálculo del centro del
cluster hace que el centroide anterior se mueva hacia el centro del conjunto de cluster. Esto
cambia la partición del espacio.
Figura II.III.2 Reposicionamiento del cetro del cluster después de la iteración (Earl, 2005).
El proceso de calcular el grupo de cluster y el recalculo del centro del cluster continua hasta
que el centro del cluster no difiera tanto al siguiente calculo. Así, el cambio de centro de
cluster empieza a ser menor y menor hasta que queda el valor final, como se ilustra en la
siguiente figura:
Figura II.III.3 Centro del cluster final después de terminar las iteraciones (Earl, 2005).
37
El algoritmo de la k-mean pertenece a una familia de técnicas de clusterización que
únicamente particiona el espacio de punto de datos en disjuntos cluster. La distancia métrica
euclidiana mide que tan lejos se encuentra un punto del centro del cluster y los puntos que
tienen tributos similares naturalmente se encuentran en el mismo cluster.
II.III.I Despliegue del algoritmo
Selecciona al azar k objetos, cada uno de ellos representa inicialmente una media o centro de
un cluster. Para cada uno de los objetos restantes es asignado a un cluster que es el más
similar al objeto, basado en la distancia entre el objeto y la media del cluster, posteriormente
se calcula la nueva media para cada cluster. Este proceso se repite hasta que la función de
criterio converge. Generalmente se utiliza el criterio de square-error (Han & Kamber, 2006):
(2.3.4)
Donde
E Es la sumatoria del error del cuadrado para todos los objetos en el conjunto de datos.
p Es el punto del espacio que representa un objeto dado (es multidimensional).
mi Es la media del clúster Ci (es multidimensional).
(a) (b) (c)
Figura II.III.4 Clusterización de un conjunto de objetos basado en el método de la k-mean (la media de cada cluster está
marcado por un “+”) (Jiawei & Kamber, 2006).
38
En otras palabras para cada objeto de cada cluster, la distancia entre el objeto y el centro del
cluster es al cuadrado y las distancias son sumadas. Este criterio intenta dar el resultado de k
número de cluster lo más compacto y de forma separada sea posible (Imagen II.III.1).
El algoritmo intenta determinar k particiones para minimizar la función de square-error. Esto
funciona bien cuando las nubes de cluster son compactos y que están bastante bien
separados uno de otro. El método es relativamente escalable y eficiente en el procesamiento
de grandes conjuntos de datos debido a que la complejidad del algoritmo es 0 (nkt), donde n
es el número total de objetos, k es el número de clúster y t es el numero de iteraciones.
Normalmente, k<< n y t<<n. El método a menudo termina en un óptimo local.
39
CAPÍTULO III RESULTADOS
En este capítulo se presentan los resultados, para ello, se realizará un análisis de los datos
obtenidos en el último mes, esto con el objeto de realizar el análisis de grupabilidad y la
clasificación que será requerida para realizar esta clasificación por familias.
III.I Modelo agregado
El método agregado consta de 3 fases, como se muestra el diagrama III.I.1. Las dos primeras
fueron creadas internamente ya que en base a esto se analizan todos los productos que
tenemos actualmente y los componentes de estos y la tercera fase se integra el algoritmo de
la k-mean.
Fase I, análisis de estructura del producto, se desglosan las características de los
productos para analizar sus características e irlos agrupando según estas.
Fase II, definición de restricciones, en base con los criterios establecidos de
estructuras y a las familias que se generaron, se definen las restricciones, aquellas
que determinan si pueden ser parte de la familia definida o no.
Fase III, aplicación del algoritmo, se sigue la metodología definida para este método.
Para lograr el objetivo de este proyecto fue necesario seguir el siguiente proceso:
Figura III.I.1 Proceso PSC (GA, 2012).
40
III.II Modelo desagregado
III.II.I - Fase I: Análisis de estructura del producto
El proceso de PSC, se compone de varios factores, dependiendo de las especificaciones del
cliente para cada producto. El proceso se puede componer por uno, varios o todos los
procesos que la componen (ver diagrama III.II.1, Proceso PSC):
Figura III.II.1 Proceso PSC. (GA, 2012).
Chip (Imagen III.II.3) y Banda (Imagen III.II.2), este proceso consiste en la información
colocada en el producto de forma lógica.
Indentado (Imagen III.II.2), Embosado (Imagen III.II.2) y Termografia (Imagen III.II.4),
estos procesos consisten en la personalización grafica del producto así como el color en
el que irán estos.
Fotografía (Imagen III.II.4), es un proceso de personalización grafica (imagen) del
producto.
41
En la imagen III.II.2 se muestra el reverso de una tarjeta, donde podemos ver el elemento
conocido como banda magnética y el procedo de indentado.
La siguiente imagen III.II.3, se muestran los elementos de la tarjeta, chip. Además se puede
ver el proceso de embosado.
En esta última imagen la III.II.4, se muestran varios procesos. El primero de ellos es el
proceso de la fotografía y el segundo de ellos es el proceso de termografía, las letras en color
blanco.
Figura III.II.4 Tarjeta Termografia y Foto (GA, 2012).
Figura III.II.2 Tarjeta Indentado y banda (GA, 2012).
Figura III.II.3 Tarjeta Embosado y Chip (GA, 2012).
42
En la siguiente clasificación va a depender de acuerdo a los envíos y al proceso (ver Imagen
III.II.5, Empaque del proceso). Los procesos principales son:
Altas
Reposiciones
Renovaciones
Urgentes
Figura III.II.5 Empaque del proceso (GA, 2012).
Se tiene esta clasificación dependiendo del estatus de la tarjeta Altas (una cuenta nueva),
Reposiciones (cuando se repone una tarjeta perdida por ejemplo), Renovaciones (cuando la
tarjeta caduco y se da una nueva) y Urgentes (cuando el proceso tiene un nivel de servicio
menor). Esta clasificación es importante ya que según sea el proceso va a ser empaque que
se le va a colocar a este producto.
III.II.II - Fase II: Definición de restricciones
Para poder realizar el cluster debemos considerar las siguientes restricciones. Deberá tener el
mismo proceso de PSC de acuerdo al Imagen III.I.1 (Proceso PSC).
1. Plástico, para poder hacer la agrupación deberá ser el mismo plástico (visual de la
tarjeta).
2. Misma composición del proceso PSC (Embosado, Indentado, Termografía, fotografía,
etc).
3. La tercera condicionante será el de realizar el ordenamiento según su proceso de tal
manera que se de un ordenamiento de la siguiente manera:
a) Urgentes
b) Altas
c) Reposiciones
d) Renovaciones
e) Otros
43
III.II.III -Fase III: Aplicación del algoritmo
Utilizando el algoritmo de la k-mean, cada centro del cluster es representado por el valor
medio del objeto en el cluster (Han and Kamber, 2006):
Pasos:
Paso 1.- Seleccionar arbitrariamente k numero de objetos de D como el centro del cluster
inicial.
Paso 2.- Repetir.
Paso 3.- Reasignar cada objeto en el cluster donde el objeto sea más similar, basado en el
valor de la media de el objeto en el cluster.
Paso 4.- Actualizar el valor de la media del cluster, es decir calcular el valor de la media del
objeto de cada cluster. Hasta que no haya cambios
Se le da las siguientes entradas al algoritmo:
Paso 1
K Número de cluster
K = 3
44
D Conjunto de datos que contiene n objetos
Producto Color Proceso Envió Cnt Ordenada
A Amarillo Alta Sucursal 39
D Amarillo Alta Sucursal 40
E Amarillo Alta Sucursal 4
F Amarillo Alta Sucursal 10
A Azul Alta Sucursal 152
D Azul Alta Sucursal 51
E Azul Alta Sucursal 11
F Azul Alta Sucursal 6
A Blanco Alta Sucursal 156
D Blanco Alta Sucursal 188
F Blanco Alta Sucursal 4
D Naranja Alta Sucursal 19
A Rojo Alta Sucursal 132
D Rojo Alta Sucursal 31
E Rojo Alta Sucursal 15
F Rojo Alta Sucursal 4
A Sin Color Reposición Sucursal 7
B Sin Color Renovación CR 3
C Sin Color Renovación CR 1
D Sin Color Reposición Sucursal 68
F Sin Color Reposición Sucursal 142
Tabla III.II.1 Órdenes de trabajo generadas en un día (Elaboración propia).
45
Paso 3 y Paso 4
Salidas:
Conjunto de k número de cluster
Figura III.II.6 Clusterización de órdenes de trabajo generadas en un día (Elaboración propia).
El calculo de los centroides lo podemos ver en la tabla III.II. 2
X Y
Centroide 1 1.2 4.2
Centroide 2 3.9 3.9
Centroide 3 5.6 3.4
Tabla III.II.2 Coordenadas de los centroides (Elaboración propia).
46
III.III Implicaciones
Para poder llevar a cabo este proceso, es necesario:
Extracción de la información: Para este paso es necesario la interacción de diferentes
áreas, se requerirá la extracción de la matriz de todos los productos de cada uno de
nuestros clientes. Con esto fue posible hacer un análisis de la composición de los
productos así como la cantidad de productos que tenemos registrados y comprarlo
contra lo que se tiene físicamente.
Análisis de productos según lo analizado en la sección III.II, Fase 1, para esto se
requiere diferentes recursos humanos, como supervisor de producción, planeación,
recepción de órdenes de trabajo y procesamiento. Gracias a este análisis pudimos ver
como se componen los productos, partes, procesos, etc.
Definición de restricciones, analizar si todos los productos cumplen con las
restricciones y los requerimientos para la clusterización. El análisis de producto nos
ayudó a definir y darnos cuenta que similitudes existían entre los productos y definir en
base a que se iban a realizar los grupos considerando capacidades tanto de equipo
como de personal.
Corrida piloto, realizar el primer cluster y realizar una prueba productiva. El objetivo de
esto era llevar la teoría en la práctica y observar si no nos encontrábamos con
problemas operacionales o de sistema.
Capacitación, debido a que esto fue un cambio de cultura respecto a su forma de
trabajo fue necesario explicar el nuevo esquema de familias.
Recepción de OT y procesamiento, ellos deberán realizar la función de
agrupamiento.
Supervisores, la administración de los clusters vs ordenes de trabajo.
Operadores, la operación va a ser diferente a la actual, la carga de los archivos
de trabajo al equipo, la operación de reprocesar, etc.
47
CAPÍTULO IV DISCUSIÓN
En el presente capítulo se presentará la implementación de la mejora propuesta en la
empresa de estudio así como los resultados obtenidos a partir del año 2013. Se hablará sobre
el resultado que se obtuvo por clientes de trabajo y se hará una comparación con otras
plantas que han implementado el método de familias de productos para elevar la
productividad y eliminar el tiempo de setup (tiempo de arranque de un equipo). Se
presentarán los resultados obtenidos respecto al implementar este método así como las
futuras investigaciones que trajo consigo la implementación de esto y de la investigación que
se llevo a cabo.
IV.I Análisis Interno
Se realizó el análisis a todos los clientes que maneja la empresa y de 21 de ellos solo 8 tenían
las características en sus productos para la clusterización. Mediante la implementación del
algoritmo como se presentó en los capítulos anteriores se tomaron los parámetros para la
creación de las familias de productos (clusterización). Se colocaron los parámetros en el
sistema que maneja internamente la empresa y durante el año 2013 se tuvieron, en las
graficas que se presentaran a continuación por cliente veremos reflejados la cantidad de
órdenes de trabajo con la implementación de la clusterización llamada internamente pack y
la cantidad de ordenes de trabajo que se trabajarían si no se hubiera realizado la
clusterización “Pack”. Las graficas que se presentan a continuación corresponden al año
2013.
Como primera etapa se realizó la labor para los clientes con mayor producción así como con
mayor cantidad de familias de productos y donde pudimos obtener resultados más grandes.
Cabe mencionar que la planta de México se encuentra segregada en dos áreas, en el área 1
se encuentra solo el cliente 2 y en el área 2 se encuentran los clientes 1, 3, 4, 5, 6, 7 y 8. Esto
debido a que el cliente 2 es un cliente nuevo y muy importante.
48
El cliente 1 (gráfica IV.I.1), fue la prueba piloto y se implemento desde inicios del año, su
comportamiento durante todo el año fue estable y los resultados de la clusterización
dependían de la cantidad de órdenes que entraban así como de los productos que solicitaba
el cliente.
Figura IV.I.1 Ordenes de trabajo vs clusters Cliente 1 (Elaboración propia).
Al ver los resultados obtenidos con el cliente 1, se empezaron a realizar análisis para otros
clientes y se implementó para el más importante y del cual se manejan mayores volúmenes
de producción. Debido a su importancia, este se encuentra segregado de los demás clientes y
se considera como área uno. La implementación de la clusterización con el cliente 2 fue a
partir de abril. En el mes de abril no se puede observar gran ventaja debido a que fue la fase
de pruebas, al ver que los parámetros obtenidos mediante el algoritmo fueron los correctos y
no se tuvo problema alguno en la producción se implemento a todos los productos del
cliente y los resultados fueron los siguientes (gráfica IV.I.2):
Figura IV.I.2 Ordenes de trabajo vs clusters Cliente 2 (Elaboración propia).
49
Finalmente, se implementó el mismo procedimiento para el cliente 3 (gráfica IV.I.3). La
implementación no se realizo hasta que se 2 no tuviera ninguna situación que afectara la
producción y el personal que trabajaba con este cliente se adaptara a la nueva forma de
trabajo, después de esto se iniciaron con pruebas para el cliente 3 que se realizaron en el
mes de agosto, porsterior a esto, se establecio un tiempo de 3 meses para el monitoreo de
este cliente que habia migrado a esta nueva forma de trabajo. Los resultados obtenidos son
los siguientes.
Figura IV.I.3 Ordenes de trabajo vs clusters Cliente 3 (Elaboración propia).
Después de ver los logros obtenidos con estos 3 clientes que representaban el 80% de
nuestra producción y ver los ahorros obtenidos mediante la clusterización, se tomó la
decisión de analizar el resto de los clientes que representaban el 20% del volumen de
producción en la empresa.
Al realizar el análisis al resto de los clientes nos dimos cuenta que no todos podían entrar al
esquema de la clusterización debido a los parámetros que son requeridos para poder realizar
las familia, es decir, los paquetes “Pack”.
Se inició con el plan de migración de los demás clientes en a inicios del año 2014, donde en el
primer mes se realizó el análisis así como la implementación de la clusterización con pruebas
a partir de febrero, se ordenan los clientes según sus resultados empezando con el cliente en
el que se obtienen mayores resultados dejando al final al cliente con menores resultados, las
graficas de los resultados obtenidos del resto de los clientes son:
50
El cliente 4 (gráfica IV.I.4), es uno de los clientes que maneja la mayor cantidad de familias,
aunque sus volúmenes son pocos podemos ver que es uno de los clientes donde mayor
beneficio trae el proyecto de la creación de familias de productos.
Figura IV.I.4 Ordenes de trabajo vs clusters Cliente 4 (Elaboración propia).
El cliente 5 (gráfica IV.I.5), tiene un comportamiento similar a los demas, ya que se logra
hacer familias de productos y los ahorros son similares a los otros clientes. Todo esto debido
a los productos que maneja el cliente y a los criterios que se definieron en un principio.
Figura IV.I.5 Ordenes de trabajo vs clusters Cliente 5 (Elaboración propia).
51
Con el cliente 6 (gráfica IV.I.6), pudimos observar que no era posible realizar muchas familias
de productos ya que este cliente maneja productos totalmente diferentes que no entran en
el esquema definido de restricciones desde el inicio.
Figura IV.I.6 Ordenes de trabajo vs clusters Cliente 6 (Elaboración propia).
Los ahorros de este cliente son muy pocos, debido a que una de nuestras restricciones es el
tamaño de lote, con este cliente pudimos observar que cuando envia sus ordenes de trabajo
son de lotes grandes y que aunque se pudiera hacer mayores familias de productos no es
posible debido a la restricción del tamaño de lote. Ver gráfica IV.I.7
Figura IV.I.7 Ordenes de trabajo vs clusters Cliente 7 (Elaboración propia).
52
Al igual que el cliente 7 (gráfica IV.I.7), el cliente 8 maneja tamaño de lotes muy grandes
desde el origen, por lo que no se logra realizar la familia de productos aunque exista.
Figura IV.I.8 Ordenes de trabajo vs clusters Cliente 8 (Elaboración propia).
IV.II Análisis Externo
Debido a que la empresa en estudio es una empresa transnacional, se encuentra en varios
puntos del mundo, fue posible realizar una comparación de los resultados obtenidos en otras
plantas. El método que ellos utilizaron para la creación de los parámetros para las familias es
diferente al que se utilizo en la empresa de estudio “algoritmo de la k-mean”.
También, es complicado realizar una comparación con los resultados de la clusterización
debido a que en cada país los clientes son diferentes así como los volúmenes de producción,
por lo cual, los ahorros obtenidos no pueden compararse. Se eligieron las plantas que han
implementado el proceso de pack así como las empresas que tienen el mismo nivel de
volúmenes para que la comparación sea más parecida a lo obtenido en la planta de México.
53
A continuación, se presentará una tabla IV.II.1 donde se encuentran los resultados obtenidos
en la semana 23 en otras plantas:
PLANTA MÉTODO ORDENES
REDUCIDAS
HORAS AHORRADAS REDUCCION EN %
México 1 K MEDIA 284 23 21
México 2 K MEDIA 78 6 12
GCS OTRO 1127 93 36
Tabla IV.II.1 Comparación de plantas (Elaboración propia).
En la tabla anterior, se presentan 3 plantas donde se realizo el proceso de familia de
productos y donde podemos observar los beneficios obtenidos mediante la implementación
de este nuevo proceso.
IV.III Aportaciones
Gracias a la implementación del algoritmo de la k mean, se pudo automatizar el proceso para
la creación de parámetros para la formación de familias.
Al implementar los parámetros obtenidos mediante el algoritmo en el sistema interno de
generación de órdenes de trabajo se obtuvieron los siguientes beneficios:
Se implementó una nueva estructura de trabajo, ya que anteriormente se trabajaba
por órdenes de trabajo y cada orden de trabajo correspondía a un producto y con la
implementación de la clusterización, el operador trabaja varias órdenes de trabajo que
corresponden a diferentes productos.
Se redujo el tiempo de setup de los equipos que procesan las órdenes de trabajo.
Tiempo de arranque de equipo así como el cambio de consumibles se hace ahora por
cluster y anteriormente se realizaba por órdenes de trabajo.
Se tiene una mejor planeación de la producción ya que la clusterización agrupa
productos con mismas características y estas son enviadas a trabajar al mismo equipo
cuando antes se enviaban las órdenes a diferentes equipos.
Se redujo el tiempo de llenado de controles y bitácoras ya que ahora se realiza por
cluster y anteriormente se realizaba por orden de trabajo.
54
Al aplicar el algoritmo de la k-mean, descrito en esta tesis, se obtuvieron los siguientes resultados:
Reducción de OT
OT ahorradas Tiempo de Setup (min)
Tiempo ahorrado
(hr)
Costo maquina (pesos)
Ahorro anual (pesos)
Cliente 1 29% 2240
3.30
123.2
$ 400
$ 49,280
Cliente 2 18% 11946 657.03 $ 262,812
Cliente 3 9% 1305 71.77 $ 28,708
Cliente 4 80% 853 46.91 $ 18,764
Cliente 5 21% 78 4.29 $ 1,716
Cliente 6 15% 9 0.495 $ 198
Cliente 7 3% 1 0.055 $ 22
Cliente 8 3% 1 0.055 $ 22
Total 22% 16433 3.30 903.805 $ 400 $ 361,522
Tabla IV.II.2 Resultados obtenidos (Elaboración propia).
Se obtuvo una reducción del 22% en promedio de las órdenes de trabajo, es decir, de
130,277 generadas durante la implementación, se realizaron 113,844, implementando la
clusterización, ahorrando 16,433 órdenes de trabajo. Se logro reducir 16,433 horas al año y
un ahorro de 361,522 pesos.
IV. IV Futuras Investigaciones
Gracias a la implementación del algoritmo de la k-mean, pudimos observar que si ampliamos
las restricciones que actualmente fueron establecidas los cluster pueden ser más grandes y
obtener mayores ventajas en ellas.
IV.IV.1 Futuros trabajos en la empresa
Se realizará un análisis realizando un cambio en las restricciones iniciales y mediante la
implementación del algoritmo de la k-mean obtener los parámetros y realizar el análisis de
beneficio ampliando las restricciones puestas en esta primera etapa.
Al realizar esta primera etapa pudimos observar que existen productos que tienen las
mismas características para ser producidos en el mismo paquete. La primera restricción
implementada era que el plástico debía tener el mismo visual, si eliminamos esta restricción
pero conservando las anteriores es posible hacer los cluster mas grandes.
55
El realizar este cambio de restricciones puede crear problemas en la producción como mezcla
de material y que sea personalizado un plástico con información que debía llevar otro
plástico por lo que se deberán implementar controles para que no suceda esto incluso
analizar la posibilidad de colocar un pokayoke.
IV.IV.2 Futuras investigaciones teóricas
Gracias a la investigación realizada previamente, nos damos cuenta de la necesidad de
implementar o estudiar más a fondo el tema de simulación, ya que con esta herramienta es
posible la recreación de la situación actual de la empresa introduciendo resultados obtenidos
en el pasado y poder ver la tendencia que habrá para la empresa en un futuro.
Con la simulación también será posible la recreación de propuestas y saber los beneficios que
estos traerán consigo después de la implementación.
56
REFERENCIAS
Anderson, J., Durston, B.H., & Poole, M. (1984). Redacción de tesis y trabajos escolares. México: Editorial Diana.
Ankerst M., Breuning M., Kriegel H.-P., & Sander J. (June 1999). OPTICS: Ordering points to identify the clustering structure. In Proc. 1999 ACM-SIGMOD Int. Conf. Management of Data (SIGMOD’99), pages 49-60, Philadelphia, PA.
Arabie P., Hubert L.J., and De Soete G. Clustering and Classification. World Scientific, 1996.
Bezdek J.C. (1981). Pattern Recognition with Fuzzy Objective Function Algorithms. Plenum Press.
Bezdek, J. C. (1973). “Fuzzy Mathematics in Pattern Classification,” Ph.D. thesis, Cornell University, Ithaca, NY.
Bezdek, J. C. (1981). Pattern Recognition with Fuzzy Objective Function. New York: Plenum Press.
Bezdek J.C. & Pal S. K. (1992). Fuzzy Models for Pattern Recognition: Methods That Search for Structures in Data. IEEE Press.
Blackstone Hoffmann, F. (2005). Administración de la producción e inventarios. (2da ed.). Editorial CECSA.
Bradley P., Fayyad U., & Reina C. (Aug. 1998). Scaling clustering algorithms to large databases. In Proc. 1998 Int. Conf. Knowledge and Data Mining (KDD’98), pages 9-15, New York, NY.
By Business Wire. Chip Card Manufacturers, The Nilson Report. Retrived November 2011, from: http://nilsonreport.com.
Carpenter G. A., & Grossberg S. (eds.) (1991). Pattern Recognition by Self-Organizing Neural Networks. MIT Press.
Casares Garcia, E. (2012). Nuevas Tecnologías en el sector financiero: http://mipymesenlinea.tripod.com/sitebuildercontent/sitebuilderfiles/documentoboletinn5.pdf.
Chaturvedi A., Green P., & Carroll J. (1994). K-mean, k-medians and k-modes: Special cases of partitioning multiway data. In The Classification Society of North America (CSNA) Meeting Presentation, Houston, TX.
Chaturvedi A., Green P., & Carroll J. (2001). K-modes clustering. J. Classification, 18:35-55.
Cheeseman P., & Stutz J. (1996). Bayesian classification (AutoClass): Theory and results. In U.M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, editors, Advances in Knowledge Discovery and Data Mining, pages 153-180. AAAI/MIT Press.
Cherkassky, V., & F. Mulier. (1998). Learning from Data: Concepts, Theory and Methods. New York: John Wiley and Son.
57
Cox, E. (2005). Fuzzy modeling and genetic algorithms for data mining and exploration. Editorial Elsevier Inc.
Day, R. A., & Gastel, B. (2006). How to write and publish a scientific paper (6th ed.). Westport, Conn.: Greenwood Press.
Day W.H.E., & Edelsbrunner H. (1984). Efficient algorithms for agglomerative hierarchical clustering methods. J. Classification, 1:7-24.
Delgado, Porter, Stern, 2010. Clusters, Convergence and Economic Performance.
Dempster A., Laird N., & Rubin D. (1977). Maximum likelihood from incomplete data via the EM algorithm. J. Royal Statistical Society, 39:1-38.
Devroye, L., L. Gyorfi, & G. Lugosi. (1996). A Probabilistic Theory of Pattern Recognition. New York: Springer-Verlag.
Docherty, M., & Smith, R. (1999). The case for structuring the discussion of scientific papers. BMJ, 318 (7193), 1224-1225.
Docherty, M., & Smith, R. (1999). The case for structuring the discussion of scientific papers. BMJ, 318 (7193), 122-1225.
Esther M., Kriegel H.-P., Sander J., & Xu X. (Aug 1996). A density-based algorithm for discovering clusters in large spatial databases. In Proc. 1996 Int. Conf. Knowledge Discovery and Data Mining (KDD’96) pages 226-231, Portland, OR.
Esther M., Kriegel H.-P., and Xu X. (Aug. 1995). Knowledge discovery in large spatial databases: Focusing techniques for efficient class identification. In Proc. 1995 Int. Symp. Large Spatial Databases (SSD’95), pages 67-82, Portland, ME.
Evans, D., & Gruba, P. (2002). How to write a better thesis (2 ed.). Carlton, Victoria, Australia: Melbourne University Press.
Fisher D. (July 1987). Improving inference through conceptual clustering. In Proc. 1987 Nat. Conf. Artificial Intelligence (AAAI´87), pages 461-465, Seattle, WA.
Forbes, S. (2013). Competencia en tarjetas de crédito: http://www.forbes.com.mx/sites/competencia-en-tarjetas-de-credito/.
Ganti V., Gehrke J.E., & Ramakrishnan. (1999). CACTUS- clustering categorical data using summaries. In Proc. 1999 Int. Conf. Knowledge Discovery and Data Mining (KDD’99), pages 73-83, San Diego, CA.
Gemalto (2012). Líder mundial en seguridad digital. Acerca de Gemalto. Retrived 2012/04/16. From: http://www.gemalto.com/latam/acerca/
Gennari J., Langley P., & Fisher D. (1989). Models of incremental concept formation. Artificial Intelligence, 40:11-61.
Guha S., Rastogi R., & Shim K. (June 1998). Cure: An efficient clustering algorithm for large databases. In Proc. 1998 ACM-SIGMOD Int. Conf. Management of Data (SIGMOD’98), pages 73-84, Seatle, WA.
58
Guha S., Rastogi R., & Shim K. (Mar, 1999). ROCK: A robust clustering algorithm for categorical attributes. In Proc. 1999 Int. Conf. Data Engineering (ICDE’99), pages 512-521, Sydney, Australia.
Han, J. & Kamber, M. (2006). Data Mining Concepts and Techniques. (2th ed.). Editorial Morgan Kaufmann.
Hartigan, J.A. (1975). Clustering Algorithms. John Wile & Sons.
Hawking, S.W. (2003). A Hombros de Gigantes: Las Grandes Obras de la Física Y La Astronomía: Critica (Grijalbo Mondadori).
Hernández Zamora, G. (2004). Pobres pero leídos: La familia (marginada) y la lectura en México. [Electronic Version]. La Hoja Volandera. Retrieved 2007 / 09 / 14 from: http://www.lahojavolandera.com.mx/PROFESORES/pobres_pero_leidos.pdf.
Hinton F. E. & Sejnowski T.J.(eds.) (1999). Unsupervised Learning: Foundation of Neutral Network Computation. MIT Press.
Hinneburg A. & Kein D.A. (Aug. 1998). Am efficient approach to clustering in large multimedia databases with noise. In Proc 1998 Int. Conf. Knowledge Discovery and Data Mining (KDD’98), pages 58-65, New York, NY.
Hoppner, F., & Klawonn F. (1999). Fuzzy Cluster Analysis: Methods for Classification, Data Analysis and Image Recognition. Chicester, UK: John Wiley and Sons Ltd.
International Organization for Standarization. (1976). International Standard ISO 214 Documentation – Abstracts for publications and documentation. Switzerland.
Jain A.K. & Dubes R.C. (1988). Algorithms for Clustering Data. Pretice Hall.
Jain A.K., Murty M.N., & Flynn P.J. (1999). Data clustering: A survey. ACM Comput. Surv., 31:264 – 323.
Kaufman L., & Rousseeuw P.J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. John Wiley & Son.
Karypis, G., Han E.-H., & Kumar V. (1999). CHAMELEON: A hierarchical clusterin algorithm using dynamic modeling. COMPUTER, 32:68-75.
Kohonen T., Kaski S., Lagus K., Solojärvi, Paatero A., & Saarela A. (2000). Self-organization of massive document collection. IEEE Trans. Neutral Networks, 11:574-585.
Krishnapuram, R., & J. A. Keller. (1998). “Possibilistic Approach to Clustering,” IEEE-Transactions of Fuzzy System, vol. 1, pp. 98-110.
Kuhn, T.S. (1987). La tensión esencial: estudios selectos sobre la tradición y el cambio en el ámbito de la ciencia. México: CONACYT, Fondo de Cultura Económica.
Kuhn, T.S. (1992). La estructura de las revoluciones científicas (2 ed.). México: Fondo de Cultura Económica.
Kuhn, T.S. (2002). Qué son las revoluciones científicas y otros ensayos. Barcelona I.C.E. de la Universidad Autónoma de Barcelona: Ediciones Paidós.
59
Kurose, J. (2004, 08/27/2007). Writing a good introduction. Retrieved sep 01, from : http://www.cs.columbia.edu/~hgs/etc/intro-style.html.
Lauritzen S. L. (1995). The EM algorithm for graphical association models with missing data. Computational Statistic and Data Analysis, 19:191-201.
Lee, Y-J. (1994) “An Automated Knowledge Extraction System,” Ph.D. thesis, Computer Science Department, University of Minnesota Minneapolis.
Lloyd S.P. (1982). Least Squares Quantization in PCM. IEEE Trans. Information Theory, 28:128-137, (original version: Technical Report, Bell Labs, 1957).
MacQueen J. Some methods for classification and analysis of multivariate observations. Proc 5th Berkeley Symp. Math. Starist. Prob., 1:281-297, 1967.
Matthews, J. R., Bowen, J. M., & Matthews, R. W. (2000). Succsefull scientific writing. A step-by-step guide for the biological and medical sciences. (2 ed.). Cambridge: Cambridge University Press.
Mendez, F. (2010). Adopción de las tarjetas con chip en América Latina. Portafolio.co. Retrieved 2010/12/28. From: http://www.portafolio.co/opinion/tarjetas-chip-america-latina.
Michalski R. S. and Stepp R. E. (1983). Learning from observation: Conceptual clustering. In R. S. Michalski, J. G. Carbonell, and T. M. Mitchell, editors, Machine Learning: An Artificial Intelligence Approach (Vol. 1). Morgan Kaufmann.
MicroStrategy Incorporated (2009). Giesecke & Devrient de México (G&D) empresa líder proveedora de tarjetas con chip y SIM adquirió el BI de MicroStrategy. From: http://www.microstrategy.com.mx/about-us/press/release/?ctry=105&id=1894.
Muñoz Negron, David F. (2009). Administración de operaciones, enfoque de administración de procesos de negocios. (1ª ed.). Editorial Cengage Learning.
Ng R. & Han J. (Sept. 1994). Efficient and effective clustering meted for spatial data mining. In Proc. 1994 Int. Conf. Very Large Data Bases (VLDB’94), pages 14-155, Santiago, Chile.
Parsons L., Haque R., & Liu H. (2004). Subspace clustering for high dimensional data: A review. SIGKDD Explorations, 6;90-105.
Petersen, C.C. & Brandt, J.C. (1995). Hubble vision: astronomy with the Hubble Space Telescope. Cambridge; New York: Cambridge University Press.
Phillips, E. M., & Pugh, D. S. (2001). Cómo obtener un doctorado. Manual para estudiantes y tutores. Barcelona: Gedisa.
Por redacción portafolio.com (2010). La migración hacia las tarjetas inteligentes en América Latina. Portafolio.com. Retrieved 2010/11/17. From: http://www.portafolio.co/la-migracion-las-tarjetas-inteligentes-america-lati.
Render, Barry y Heizer, Jay (1996). Principios de Administración de operaciones. (1ª ed.). Editorial Pearson Educación.
60
Rymelhart D. E., & Zipser D. (1985). Feature discovery by competitive learning. Cognitive Science, 9:75-112.
Sato, M., Y. Sato, & L. C. Jain. (1966). Fuzzy Clustering Models and Applications. Heidelberg: Physica-Verlag.
Shavlik J. W., & Dietterich T. G. (1990). Readings in Machine Learning. Morgan Kaufmann.
Sheikholeslami, Chatterjee S., & Zhang A. (Aug. 1998). WaveCluster: A multi-resolution clustering approach for very large spatial databases. In Proc. 1998 Int. Conf. Very Large Data Bases (VLDB’98), pages 428-439, New York, NY.
Shoaff, W. D. (2001 2001-08-21). How to write a Master’s Thesis in Computer Science. Retrieved 20 ago, 2007, from: http://www.cs.fit.edu/~wds/guides/howto/howto.html#SECTION00050000000000000000.
Struck, W. (2006). The elements of style. Mineola, NY: Dover Publications.
Vargas M. (Febrero 2000). Un mundo sin novelas. Madrid, Esp.
Wang W., Yang J., & Muntz R. (Aug. 1997). STING: A statistical information grid approach to spatial data mining. In Proc. 1997 Int. Conf. Very Large Data Bases (VLDB’97), pages 186-195, Athens, Greece.
Weissberg, R., & Buker, S. (1990). Writing up research: experimental research report writing for students of English. Englewood Cliffs, NJ: Prentice Hall Regents.
Wilkinson, A. M. (1991). The scientist´s handbook for writing papers and dissertations. Englewood Cliffs, N.J. Prentice Hall.
Witten, I. & Frank, E. (2005). Data mining, Practical machine learning tool and techniques. (2th ed.). Editorial Morgan Kaufmann.
Yager, R., & L. Zadeh (eds.). (1992). An Introduction to Fuzzy Logic Applications in Intelligent Systems. Boston: Kluwer Academic Publishers.
Zhang T., Ramakrishnan R., & Livny M. (June 1996). BIRCH: an efficient data clustering method for very large databases. In Proc. 1996 ACM-SIGMOD Int. Conf. Management of Data (SIGNOD’96), pages 103-114, Montreal, Canada.
Ziman, J. M. (1980). El conocimiento Público: Un ensayo sobre la Dimensión Social de la Ciencia. México, D.F. Fondo de Cultura Económica
61