MÉXICO. DF MARZO, 2015 - 148.204.210.201148.204.210.201/tesis/1436973336129TESISFINALFIN.pdf · T E S I S QUE PARA OBTENER EL GRADO DE MAESTRO EN INGENIERIA ... Pareto de la producción

INSTITUTO POLITECNICO NACIONAL

UNIDAD PROFESIONAL INTERDISCIPLINARIA DE INGENIERÍA Y

CIENCIAS SOCIALES Y ADMINISTRATIVAS

SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN

ALGORITMO PARA LA CLUSTERIZACIÓN DE ÓRDENES DE

PRODUCCIÓN

T E S I S

QUE PARA OBTENER EL GRADO DE MAESTRO EN INGENIERIA

INDUSTRIAL

P R E S E N T A

LUCÍA ENRÍQUEZ LUGO

DIRECTOR DE TESIS: M en C. Mario Aguilar Fernández

M en I Juan José Hurtado Moreno

MÉXICO. DF MARZO, 2015

i

ii

Dedicatorias

Dedico este trabajo a todos mis maestros quienes me han compartido su sabiduría y su

experiencia, a todos ellos que a lo largo de mi vida han cultivado el ímpetu de seguir

aprendiendo y preparándome para la vida, en especial a los más cercanos, mis padres,

quienes han inculcado en mi el amor al estudio.

”Además de uno de los más estimulantes y enriquecedores quehaceres del espíritu, una

actividad irremplazable para la formación del ciudadano en una sociedad moderna y

democrática, de individuos libres”, “para formar ciudadanos críticos e independientes,

difíciles de manipular, en permanente movilización espiritual y con una imaginación

siempre en ascuas” (Vargas, 2000).

Sinceramente

Lucia

iii

RESUMEN

GA es una empresa internacional dedicada a la seguridad digital la cual tiene una planta

México que se dedica a la producción de tarjetas. GA tiene una capacidad máxima anual

de producción superior a la cantidad de tarjetas producidas anualmente. Una de las

razones de la baja productividad es debido a que la mayor cantidad de órdenes

producidas en el centro de manufactura son de 1 unidad. Realizando un análisis sobre los

productos, pudimos darnos cuenta que contaban con ciertas similitudes por lo que era

posible la agrupación de productos por familias. Con esta implementación se pudo

obtener un ahorro en tiempos de setup e incrementar la producción. El objetivo de esta

tesis es Diseñar un algoritmo para agrupar productos bancarios por familias en la

empresa GA caso estudio, con base en el proceso del algoritmo de la k-mean, con el fin de

reducir costos en la línea de personalización de tarjetas. Utilizando este método, fue

posible realizar las agrupaciones de los productos con algunos de los clientes tomando

parámetros básicos necesarios. Al ser implementado este algoritmo se agruparon las

órdenes de trabajo que llegaban diariamente. Con esta propuesta se redujo la cantidad de

órdenes de trabajo mediante la agrupación, así como el tiempo de setup y los costos de

equipo.

iv

ABSTRACT

GA is an international company dedicated to digital security. It has a branch in Mexico

particularly for cards production, that has a maximum annual capacity of production

bigger higher the number of cards that are actually produced. One of the reason for the

low productivity is because the work orders produced in the manufacturing center are 1

unit. In the analysis of the products that we realized, we observed that were some

similarities allowing the clusterization of products by families, that would increase the

company productivity. The objective of this thesis is Design an algorithm to group banking

products into families in GA company using the algorithm of k-mean with the objective to

reduce the cost in the card personalization line. Using these method, it was possible

clustered the products with some of the customers taking basic parameters needed to be

implemented, whit this implementation all the work orders that arriving daily achieving a

reduction in the number of work orders by clusterization, setup time and equipment

costs.

v

INDICE

Dedicatorias iii

Resumen iv

Abstract v

Índice de figuras viii

Índice de tablas x

Prefacio xi

I. Introducción 1

I.I Contexto 1

I.I.I Mercado de fabricación de tarjetas bancarias 1

Mercado mundial 2

Latinoamérica 3

México 5

I.I.II GA a nivel mundial 5

I.I.III GA México 8

Estructura organizacional 11

Áreas de oportunidad 13

I.I.IV Situación Problemática 16

I.II Marco Teórico 20

I.II.I Historia 20

I.II.II Conceptos 23

I.III Objetivo 25

vi

II. Métodos 26

II.I Métodos para la Clusterización 26

II.I.I Método del particionamiento 26

II.I.II Método jerárquico 28

II.I.III Método Densidad-base 29

II.I.IV Método de la Base-Red 30

II.I.V Método del Modelo-base 30

II.II Análisis – Evaluación 32

II.III Algoritmo K-Media 34

II.III.I Despliegue del algoritmo 38

III. Resultados 40

III.I Modelo agregado 40

III.II Modelo desagregado 41

III.II.I. Fase 1 41

III.II.II Fase 2 43

III.II.III Fase 3 44

III.III Implicaciones 47

IV. Discusión 48

IV.I Análisis Interno 48

IV.II Análisis Externo 53

IV.III Aportaciones 54

IV. IV Futuras Investigaciones 55

IV.IV.I Futuros trabajos en la empresa 55

IV.IV.II Futuras investigaciones teóricas 56

Referencias 57

vii

Índice de Figuras

Figura I.I.I.1. Participación en mercado de tarjetas con microprocesador 12

Figura I.I.I.2 Estatus de la implementación de chip por región 13

Figura I.I.I.3 Estatus de la implementación de chip en América Latina 14

Figura I.I.II.1 Presencia de GA en el mundo 15

Figura I.I.III.1 Rollo de holograma 19

Figura I.I.III.2. Tarjeta con banda magnética 20

Figura I.I.III.3. Tarjeta con chip 20

Figura I.I.III.4 Tarjeta sin contacto 21

Figura I.I.III.5 Organigrama general de GA 22

Figura I.I.III.6 Organigrama general de Ingeniería 22

Figura I.I.III.7 Organigrama del área de Producción PSC 23

Figura I.I.III.8 Sistema de gestión de calidad de GA 24

Figura I.I.III.9 Áreas de producción de GA 25

Figura I.I.III.10 Centro de Personalización PSC 25

Figura I.I.III.11 Esquemas de Personalización 26

Figura I.I.IV.1. Pareto de la producción 2011 27

Figura I.I.IV.2 Cantidad de Ordenes por cantidad de tarjetas 28

Figura I.I.IV.3 Cantidad de ordenes respecto a cantidad de tarjetas en cada orden de trabajo

cliente A 29

Figura I.I.IV.4 Cantidad de ordenes respecto a cantidad de tarjetas en cada orden de trabajo

cliente B 30

Figura I.II.II.1. La producción como proceso de transformación 36

Figura II.III.1 Partición inicial de la k-mean 50

Figura II.III.2 Reposicionamiento del cetro del clúster después de la iteración 51

viii

Figura II.III.3 Centro del clúster final después de terminar las iteraciones 52

Figura II.III.4 Clusterización de un conjunto de objetos basado en el método de la k-mean (la media

de cada clúster está marcado por un “+”) 53

Figura III.I.1 Proceso PSC 56

Figura III.II.2 Tarjeta Indentado y banda 58

Figura III.II.3 Tarjeta Embosado y Chip 58

Figura III.II.4 Tarjeta Termografia y Foto 59

Figura III.II.5 Empaque del proceso 59

Figura III.II.6 Clusterización de órdenes de trabajo generadas en un día 63

Figura IV.I.1 Ordenes de trabajo vs clusters Cliente 1 66








ix

Índice de Tablas

Tabla I.I.IV.1 Simulación de ahorro de tiempo agrupando 31

Tabla III.II.1 Órdenes de trabajo generadas en un día 61

Tabla III.II.2 Coordenadas de los centroides 63

Tabla IV.II.1 Comparación de plantas 64

Tabla IV.II.2 Resultados obtenidos 65

x

PREFACIO

La elección del Tema de investigación del presente trabajo, ocurrió bajo la necesidad de

innovación de la empresa caso estudio y bajo la influencia de los conocimientos

adquiridos en el proceso de estudio de la maestría en ingeniería industrial, en la Sección

de Estudios de Posgrado e Investigación de la UPIICSA IPN. Particularmente motivante

fueron los cursos de:

- Fundamentos teóricos y metodológicos para la productividad.

- Gestión de tecnologías

- Estrategias y modelación para la ingeniería

Desde el ingreso a laborar a la empresa caso estudio, la autora se pudo percatar de la

problemática existente: complejidad en las órdenes de producción, desorden en los

procesos productivos, empalme o traslape en algunas operaciones, dificultades

esporádicas en el suministro de materiales y en la distribución del producto, etc.

Circunstancias que se reflejaban en la baja productividad de la empresa. Esta situación

motivó el planteamiento de búsqueda de la solución más adecuada.

La combinación de los dos aspectos anteriores, indujo a la autora, a plantear el proyecto:

“Algoritmo para la clusterización de órdenes de producción”.

El objetivo de esta tesis es Diseñar un algoritmo para agrupar productos bancarios por

familias en la empresa GA caso estudio, con base en el proceso de la k-mean, con el fin de

reducir costos en la línea de personalización de tarjetas.

La estructura utilizada en este trabajo es la conocida por las siglas IMRyD: Introducción, Metodología, Resultados y Discusión (Day & Gastel, 2006; Evans & Gruba, 2002; Matthews, Bowen, & Matthews, 2000; Weissberg & Buker, 1990; Wilkinson, 1991; Docherty & Smith, 1999).

Además de desarrollar la habilidad de buscar información vigente, relevante, pertinente,

suficiente, visible y de alto impacto (Shoaff, 2001). La metodología utilizada para la

realización de este proyecto, consistió de las siguientes etapas, mismas que se describen a

profundidad en los capítulos que forman la tesis:

- Contexto de la empresa.

- Descripción de la problemática.

- Investigación bibliográfica relacionada con la temática.

- Planteamiento de la solución y elaboración del algoritmo.

- Instrumentación e implementación de la solución.

xi

- Análisis de los resultados.

Cabe señalar, que la aplicación de los resultados de este trabajo, se reflejan en el

incremento de la productividad de la empresa caso estudio.

En el presente trabajo se presentan los resultados del estudio teórico, la investigación de

campo y las experiencias en otras empresas similares a la del objeto de estudio, así como

la problemática actual de la empresa caso estudio. En el primer capítulo, se habla del

contexto en que se ubica el problema de investigación para que sea posible valorar su

repercusión. La información sobre el origen y desarrollo del problema ayudaran a

comprender como se ha formado con que se relaciona y cuáles son sus tendencias

(Strunk, 2006). En el segundo capítulo se describen los métodos para la clusterización

existentes, se realiza un análisis te todos los métodos para elegir el que más convenga

según las necesidades de la empresa y la mejor opción para la solución de la problemática.

En el tercer capítulo se hace una presentación de la solución propuesta, reduciendo los

tiempos en ajustes de inicialización y actualización de los equipos (setup), teniendo como

resultado, un incremento considerable en la productividad del sistema. En el cuarto y

último capítulo de se discute sobre el presente trabajo, se realiza un análisis interno y

externo, se hace mención de futuras investigaciones y posibles trabajos a desarrollar en la

empresa caso estudio y futuras aportaciones técnicas.

Por último, es necesario señalar, que este trabajo se ha realizado, gracias a las facilidades

que la empresa caso estudio permitió y a la colaboración invaluable de mis compañeros

de trabajo, así como la orientación y asesoría del director de la tesis y de los profesores

miembros del comité revisor.

xii

CAPÍTULO I

INTRODUCCIÓN

A continuación se describirá la empresa en estudio hasta llegar a la descripción detallada

del área donde se encuentra la problemática y en el que se desarrollara el proyecto.

Presentaremos, en este primer capítulo, el estado actual de la empresa así como

información recolectada años atrás.

I.I CONTEXTO

El objetivo de este primer capítulo, es presentar el estado actual en que se encuentra el

mercado de tarjetas inteligentes en el mundo entero, pasando por Latinoamérica y

México, concluyendo en nuestro caso de estudio. Visualizar la posición en la que se

encuentra la empresa y la importancia de la mejora continua, reducción de costos y la

productividad. Al enfocarnos en la empresa de estudio nos daremos cuenta que esta es

especialista solo de una parte de todo el universo de GA, que es, fabricación de tarjetas

inteligentes, donde el área de estudio es la personalización de estas. Finalmente se realiza

una evaluación de la necesidad que se tiene por agrupar productos por familias para la

reducción de tiempos de operación.

I.I.I MERCADO MUNDIAL DE FABRICACION DE TARJETAS

Durante muchos años uno de los inconvenientes de guardar el dinero en un banco era la

limitada disponibilidad e información puntual que tenía el cliente, ya que dependía de las

horas en que estaban abiertas las oficinas; lo cual provocaba además enormes esperas

con el consiguiente estrangulamiento de las transacciones, del comercio y de la economía

en general. Otro obstáculo importante ha sido la concesión de préstamos toda vez que era

necesario el conocimiento de las posibilidades financieras de las dos partes implicadas en

el negocio, desarrollándose éstos en la mayor parte de los casos de forma lenta y

burocrática. Lo mismo cabría argumentar de las compañías de seguros que en muchas

ocasiones, desconocían el tipo de cliente con el que trataban y faltaban estadísticas o

acopio de información, relevante para proporcionar un trato diferenciado en base a una

estratificación por riesgos de sexo, edad, experiencia, accidentes, zonas geográficas en las

1

que viven etc. Estas situaciones y otras se han visto superadas o cuanto menos aliviadas

por la introducción de las nuevas tecnologías de la información en el sector financiero

(Casares, 2012).

a. Mercado mundial

Las necesidades de nuestra actual cultura para mejorar el nivel de vida de la sociedad,

como pueden ser, agilizando trámites, generando formas de identificación colectiva y

personal, sin olvidar la seguridad de nuestra información y que esta sea viable en todo el

mundo, ha dado lugar al surgimiento de las tarjetas inteligentes.

La venta de tarjetas inteligentes ascendió a 6,610 millones en el 2010, un 18.9% respecto

al año anterior. GA siguió siendo el principal fabricante de tarjetas con chip en el mundo

con un mercado del 30.1% (The Nilson Report, 2011). Ver Imagen I.I.I.1

Figura I.I.I.1. Participación en mercado de tarjetas con microprocesador (The Nilson Report, 2011).

2

A nivel mundial nos encontramos con un sector en el mercado ocupando:

41.1% de tarjetas y 76.7% de terminales en Canadá, Latinoamérica y el Caribe

El 28.2% de tarjetas y 51.4% de terminales en Asia

El 20.6 de tarjetas y el 75.9 de terminales en África y el medio oriente

El 84.4% de tarjetas y el 94.4% de terminales en Europa Zona 1

14.5% de tarjetas y 68.1% de terminales en Europa Zona 2

EUA es un mercado nuevo para nosotros

En la imagen I.I.I.2 podemos ver esta distribución.

Figura I.I.I.2 Estatus de la implementación de chip por región (GA, 2011).

b. Latinoamérica

La seguridad de las transacciones electrónicas siempre ha sido una prioridad para los

consumidores, reguladores, emisores y adquirientes en América Latina, por lo que estos

jugadores de la industria se han visto en la necesidad de poner especial atención a

tecnologías que combatan el fraude y protejan al consumidor. Las Tarjetas Inteligentes

contienen un microprocesador o chip integrado de múltiples aplicaciones, el chip permite

no sólo almacenar una mayor cantidad de información, sino generar y validar datos

dinámicos y así incrementar la seguridad de las transacciones de pago (Portafolio.co,

2010).

3

En América Latina, el Caribe y Canadá se han emitido 182.4 millones de tarjetas

inteligentes, lo que representa el 26.4% del total de tarjetas que circulan en dichas

regiones. Según la SCALA (Smart Card Alliance for Latin América – Alianza de Tarjetas

Inteligentes de América Latina) los dos mercados más grandes de América Latina son:

Brasil y México. Según las estimaciones de SCALA se estima que para el 2013 todas las

tarjetas de crédito en el mercado brasileño tendrán chip, para el caso de México se estima

que para el 2015 el número de tarjetas de crédito con chip alcanzará 27 millones

(Fernando Méndez, 2010). Según proyecciones de crecimiento indican que emisores

esperan migrar 100% de sus portafolios de crédito y débito a chip en los próximos 5 años

(Portafolio.co, 2010).

Hablando solamente de Latinoamérica:

- En Venezuela se tiene un mercado del más del 75%.

- En México y en Brasil tenemos entre el 50% y el 75%.

- Mientras que en los demás países nuestra demás participación es del 0% al 10%.

(Esta información la podemos ver representada en la siguiente imagen I.I.I.3.

Figura I.I.I.3 Estatus de la implementación de chip en América Latina (GA, 2011).

4

c. México

La actividad principal de GA en sus inicios en México fue la producción y venta de tarjetas

telefónicas de prepago y tarjetas bancaria con banda magnética. GA se establece por

primera vez en la ciudad de México hace 50 años, brindando servicios para los sectores de

Telecomunicaciones, Banca, Gobierno y otras áreas relacionadas con Seguridad. Esta

empresa decide incrementar sus inversiones en este país abriendo una nueva planta de

producción, con esto amplia la oferta de servicio y capacidad de producción para

satisfacer estos mercados (GA, 2011).

I.I.II GA A NIVEL MUNDIAL

GA, es una empresa de servicio líder en seguridad digital. Como ellos lo indican, “GA

provee soluciones de seguridad digital integrales diseñadas para que las interacciones

digitales personales sean más prácticas, seguras y placenteras”. Sus productos van desde

el desarrollo de aplicaciones de software, diseño y fabricación de dispositivos personales

seguros como lo son tarjetas inteligentes, SIMs, pasaportes, fichas electrónicos y va más

allá, hasta la administración de servicios personalizados de implantación para sus clientes.

Todos estos productos los podemos ver reflejados en los sectores de telecomunicaciones,

empresas bancarias, seguridad de redes, estacionamientos, transporte y de salud, estas

soluciones que brinda GA ponen en valor la seguridad y la comodidad de todos estos (GA,

2011).

GA además crea dispositivos portables seguros que almacenan aplicaciones específicas del

usuario final, estos productos pueden ser:

- Tarjetas con microprocesador, conocidas como “Smart Cards” como lo son las

tarjetas SIM inalámbricas y tarjetas bancarias EMV.

- Pasaportes, atención de salud, tarjetas de identificación, licencias de conducir en

versión electrónica.

- Fichas, llaves USB y dispositivos OTP.

Esta empresa también brinda otro tipo de productos como:

- software asociado, middleware, y soluciones con base en servers.

- servicios de personalización como administración de datos, manejo de archivos,

servicios de post-emisión y empaque.

- servicios de operación.

5

- consulta, integración, gestión y mantenimiento de proyectos, capacitación y

soporte.

- puntos de venta: una gama completa de terminales, herramientas de software

dedicadas, sistemas y servicios de administración.

- lectoras y chipsets.

- tarjetas de memoria.

- tarjetas pre-pagas para telefonía pública.

El mercado de esta compañía está distribuido alrededor del mundo en más de mil

millones de personas que utilizan sus productos y servicios para telecomunicaciones,

servicios financieros, gobierno electrónico, administración de identidad, contenidos

multimedia, administración de derechos digitales, seguridad informática, tránsito masivo y

muchas otras aplicaciones.

A marzo del 2010 se facturaron 1.906 mil millones de euros, que fueron gracias a más de

10,000 empleados de 90 diferentes nacionalidades localizados en 45 diferentes países. GA

cuenta con 87 oficinas de ventas y marketing; 18 emplazamientos de fabricación, 30

centros de personalización, 13 centros de investigación y desarrollo, como lo podemos ver

en la Imagen I.I.II.1.

Figura I.I.II.1 Presencia de GA en el mundo (GA, 2012).

6

Valores

GA es una sociedad global líder en seguridad digital. La empresa se basa en tres valores

fundamentales para satisfacer las necesidades de sus clientes (GA, 2012):

Nuestros Clientes:

o Poniendo sus necesidades como parte central de lo que hacemos.

o Desarrollando sociedades responsables y confiables para nuestro mutuo

beneficio.

o Asegurando su beneficio de nuestros desarrollos, producción y entregas a

tiempo, eficientes y confiables.

o Excediendo sus mejores expectativas, a través de nuestra atención y

servicio de calidad.

Nuestra Gente:

o Valorando su diversidad, respetando sus cualidades individuales, nutriendo

sus talentos y permitiendo llenar sus expectativas profesionales.

o Alentando el trabajo en equipo, apoyándonos cada uno de nosotros, a

través de la organización y haciendo la mejor combinación potencial.

o Conduciéndonos con la mayor de las integridades y ética, siendo un

ejemplo apropiado de una excepcional empresa internacional.

o Contribuyendo con motivación, compromiso, nuestro deseo y dedicación a

la excelencia.

Nuestra Innovación:

o Continuamente explorando y desarrollando nuevas ideas.

o Siendo pioneros creativos, acensando a retos de negocios y tecnología,

siendo abiertos y adaptables a las oportunidades y a la mejora continua.

o Colaborando con nuestros clientes y socios para formar un nuevo mundo

en seguridad digital.

o Liderando nuestra industria y formando su futuro a través de nuestra

visión, investigación y experiencia.

7

I.I.III GA MÉXICO

Inició operaciones como Tarjetas Inteligentes y Departamento de la Terminal de

Schlumberger, posteriormente fue comprado Sema Group que creó la fusión de

SchlumbergerSema. Cuando Schlumberger vendió el negocio de servicios de

SchlumbergerSema a Atos Origin, el departamento de Terminal y Tarjeta Inteligente se

separó nuevamente para convertirse en Axalto, que salió a la bolsa en el 2004. El 7 de

diciembre del 2005, Axalto anunció su plan de fusión con su principal competidor

Gemplus. El 19 de mayo del 2006, la comisión Europea aprobó la fusión entre Axalto y

Gemplus, dando lugar a la creación de la nueva empresa el 2 de junio del 2006 (GA, 2011).

La especialización en la fábrica GA de México, es la de Secure Transaction Business Unit,

que se refiere al negocio de transacciones seguras.

GA Secure Transactions Business Unit

El sitio es uno de los centros de producción de tarjetas inteligentes la cual se compone de

dos áreas: Card Bodies y Personalización.

Misión Corporativa

GA proporciona dispositivos de seguridad personal, plataformas y servicios, a través de la

innovación y colaboración, permitiendo a sus clientes ofrecer confiables y convenientes

servicios digitales a billones de personas.

Misión Iztapalapa

Asegurar la satisfacción de nuestros clientes de todos los sectores de negocio, a través de

Productos y Servicios personalizados:

Generados con calidad.

Entregados en Oportunidad.

Fabricados con Procesos tecnológicos de alto valor agregado.

Garantizando la Seguridad en toda la cadena productiva.

A través de la participación y compromiso de nuestro personal en equipos de alto

desempeño, para el cumplimiento de las metas de GA.

8

Visión Corporativa

En una sociedad cada vez más conectada, GA será líder en hacer las interacciones

personales digitales seguras y fáciles.

Visión Iztapalapa

Ser la referencia en GA y en el mercado de: Productos & Servicios tecnológicos

personalizados y en Satisfacción del cliente.

Los Productos

Los productos entregados por el sitio de México se manejan a través de las grandes

familias, dentro del perímetro de la certificación ISO de las actividades del sitio. Estas son:

Cuerpo impreso y acabado:

El cuerpo de tarjeta es una tarjeta troquelada de diferentes tamaños y espesores que

incluye una impresión genérica y elementos de acabado como panel de firma, holograma

(Imagen I.I.III.1) y banda magnética. Este producto se entrega a las actividades internas

y/o a clientes finales.

Figura I.I.III.1 Rollo de holograma (GA, 2012).

9

Productos Bancarios / Comerciales & Lealtad

Son cuerpos de tarjetas con banda magnética (Imagen I.I.III.2) y/o “Chip” componente

electrónico, tipo microprocesador. La tecnología utilizada durante el proceso de

operación es la laminación en hojas y personalización de la banda magnética asociada al

cuerpo de tarjeta.

Figura I.I.III.2. Tarjeta con banda magnética (GA, 2012).

En caso de que utilice un “chip” (Imagen I.I.III.3), la tecnología utilizada durante el proceso

de operación es la inserción y personalización del “chip” asociado a un cuerpo de tarjeta

previamente laminado y troquelado. Esos productos están principalmente destinados a

los mercados bancarios y seguridad de redes de datos.

Figura I.I.III.3. Tarjeta con chip (GA, 2012).

Productos Contactless / ID

Son cuerpos de tarjetas con Inlays (Antena) y/o Banda Magnética (imagen I.I.III.4). La

tecnología utilizada durante el proceso de operación es la laminación en hojas y

personalización del chip del inlay ó de la banda magnética asociada al cuerpo de tarjeta.

Figura I.I.III.4 Tarjeta sin contacto (GA, 2012).

10

En caso de que utilice un “chip”, la tecnología utilizada durante el proceso de operación es

la inserción y personalización del “chip” asociado a un cuerpo de tarjeta previamente

laminado y troquelado. Esos productos están principalmente destinados a los mercados

Gubernamentales, transporte y salud.

A. Estructura Organizacional

Organigrama general de la planta (Imagen I.I.III.4)

Figura I.I.III.5. Organigrama general de GA (GA, 2012).

11

El área en que llevara este proyecto de mejora es el de Ingeniería y está compuesto de la

siguiente manera, Imagen I.I.III.5, en el cual también viene marcado el nombre de la

persona que llevara a cabo el proyecto.

Figura I.I.III.6. Organigrama general de Ingeniería (GA, 2012).

Organigrama del área de trabajo en el que se desarrollara el proyecto, situando este en el

área productiva con 105 personas operativas y 3 supervisores (Imagen I.I.III.6).

Figura I.I.III.7. Organigrama del área de Producción PSC (GA, 2012).

12

Áreas de Oportunidad

La imagen I.I.III.7 está hecha en base al Sistema de Gestión de calidad, que es un conjunto

de elementos mutuamente relacionados o que interactúan, para establecer y cumplir con

la Política y los Objetivos, con el fin de dirigir y controlar una organización con respecto a

la calidad (ISO 9000:2005, 2009).

El departamento de ingeniería se encuentra fuera del proceso de producción pero es un

área de soporte para el toda el área productiva.

Figura I.I.III.8. Sistema de gestión de calidad de GA (GA, 2012).

13

El área de producción está dividida en tres áreas como se indica en la Imagen I.I.III.8

Card Body (Cuerpo de Tarjeta): Impresión del grafico sobre el cuerpo según requiera el

cliente, en esta área también se hace el ensamble de overlay (una capa de plástico) y

banda magnética, posteriormente se lamina el ensamble para ser troquelarse al tamaño

de una tarjeta.

Célula Bancaria: En esta área la entrada son los plásticos (tarjetas), según los

requerimientos del cliente en esta área de coloca por medio de estampado el panel de

firmas, el holograma y si el producto lleva chip se realiza la cavidad de este,

posteriormente de inserta el modulo en la cavidad para finalizar con la pre-

personalización del chip.

PSC (Centro de Personalización): Donde como su nombre lo indica, en esta sección se

personalizan los cuerpos, y es aquí donde se realizara el análisis de estudio.

Figura I.I.III.9. Áreas de producción de GA (GA, 2012).

El centro de personalización a su vez está compuesto por las diferentes sub-áreas (Imagen

I.I.III.9):

Mesa de Control: El área segura donde se reciben los archivos de los clientes y donde es

procesada la información.

OTP’s: Ensamble de token’s.

Grabación: Área donde se personalizan las tarjetas.

Acabado: Área donde se agrupa el material por envíos.

Figura I.I.III.10. Centro de Personalización PSC (GA, 2012).

14

A grandes rasgos el proceso de personalización inicia con la recepción de los archivos de

los clientes. Después de haberlos recibidos estos archivos son procesados por unos

servidores, cuando se tiene la información disponible inicia el proceso de personalización

de tarjetas (Imagen I.I.III.10).

Figura I.I.III.11. Esquemas de Personalización (GA, 2012).

Trabajo de Personalización

Proceso y Tecnología:

• Chip: software de personalización específico para cada producto de tarjeta,

aplicación de tarjeta y perfil seleccionado.

• Otros.

– Banda Magnética: común para toda tarjeta.

– Grabado en relieve:

Indentado: Impresión grafica cóncava.

Embozado: Impresión grafica en relieve.

Termoimpresión: Impresión grafica por medio de calor.

Embalaje: específico para cada Cliente (eventualmente para cada producto).

Control de Calidad: basado en los requerimientos del cliente (el Chip debe ser checado).

Entrega: se pueden proveer varios tipos de servicios.

15

I.I.IV SITUACIÓN PROBLEMÁTICA

GA fue fundada en Junio del 2006, mediante la fusión de Axalto y Gemplus International

SA. GA se expandió más allá de sus tradicionales raíces en el mercado de tarjetas

inteligentes. Ahora está centrada en crear soluciones de principio a fin para la seguridad

digital incluyendo el desarrollo de software, middleware, diseño producción de

dispositivos personales seguros y varios servicios de implementación (GA, 2011).

Actualmente más de mil millones de usuarios finales ya usan un producto GA de algún

tipo. Los mercados claves de GA son los proveedores de servicios de telecomunicaciones,

instituciones financieras, de seguridad corporativa, de contenidos de Internet, del sector

público y de transporte.

GA México tiene una capacidad máxima anual de producción de 30, 000,000 tarjetas

personalizadas, en el 2010 se registraron 23, 227,399, en el 2011 29, 671,309 unidades.

En la imagen I.I.IV.1 podemos observar la producción que se tiene por cliente durante el

año 2011, donde el 80% de nuestra producción está concentrada en 4 clientes.

Figura I.I.IV.1. Pareto de la producción 2011 (GA, 2011).

16

Se realizó un análisis de las órdenes producidas en el mes de noviembre del 2011 respecto

a la cantidad de unidades por orden y pudimos apreciar como lo muestra la imagen

I.I.IV.2, que la mayor cantidad de órdenes producidas en nuestro centro de manufactura

son de 1 unidad y en promedio las órdenes de trabajo no superan las 100 unidades.

Figura I.I.IV.2 Cantidad de Ordenes por cantidad de tarjetas (GA, 2012).

Se analizó el tiempo de setup de equipo del cual no se puede reducir de 3.30 minutos,

considerando solamente las 1000 órdenes producidas con una tarjeta, se estaría hablando

de 58 horas dedicadas exclusivamente a realizar el setup para la producción de una

tarjeta, el 12% del tiempo mensual.

17

Enfocándonos en los clientes A y B haciendo una relación entre la cantidad de órdenes

mensuales y la cantidad de producto por orden (1er de 1-100, 2da de 101 a 500, 3era de

501 a 1000 y 4ta > 1000), encontramos lo siguiente:

Para tarjetas de 1-100 unidades encontramos la mayor cantidad de órdenes en todos los

meses, esto significa mayor número de setup, imágenes I.I.IV.3 y I.I.IV.4

Cliente 3

Grafica I.I.IV.3 Cantidad de ordenes respecto a cantidad de tarjetas en cada orden de trabajo cliente 3 (GA, 2012).

Cliente 1

Grafica I.I.IV.4 Cantidad de ordenes respecto a cantidad de tarjetas en cada orden de trabajo cliente 1 (GA, 2012).

18

Para este estudio nos enfocaremos al cliente 2 ya que en la empresa se tiene más facilidad

ya que no es el cliente principal y es el segundo cliente según las compras.

En estas imágenes podemos observar que no existe una relación entre la cantidad de

órdenes por la cantidad de productos producidos, es decir, para el cliente 2 en el mes de

agosto se produjeron 1,350 órdenes de trabajo donde la cantidad de productos fueron de

1 a 100 unidades.

Para el cliente 2 contamos con 423 productos diferentes donde se pueden agrupar en 32

familias.

Si aplicamos la clusterización los ahorros semanales de Agosto a Diciembre del año 2011

hubieran sido de 308 horas mensuales y se hubieran reducido 5,280 órdenes de trabajo.

Mes Ordenes actuales

Ordenes agrupando

Ordenes ahorradas

Tiempo ahorrado (hrs) (Setup de 3'30'’)

Agosto 1662 690 972 56.7

Septiembre 1709 618 1091 63.6

Octubre 1723 615 1108 64.6

Noviembre 1697 590 1107 64.6

Diciembre 1559 557 1002 58.5

Tabla I.I.IV.1 Simulación de ahorro de tiempo agrupando (GA, 2011).

En promedio cada semana se podrían ahorrar 14 horas, ya que en los análisis realizado de

Agosto a Diciembre del 2011 (tabla I.I.IV.1) se produjeron en total 8,350 órdenes, de las

cuales se pudieron reducir a 3,070 órdenes utilizando grupabilidad, quedando 5,280

órdenes, ahorrando 308 horas durante estos 5 meses, que equivaldría a producir 115,500

unidades (tarjetas).

19

I.II MARCO TEORICO

La producción inicia de manera casual por el hombre para satisfacer a sus necesidades

primarias, y se ha llevado a cabo hasta nuestros días ya que esta es el motor de la

economía de las naciones. Debido a la globalización, toda empresa se ha visto obligada a

mejorar continuamente, la flexibilidad de la producción y la calidad del producto, así como

las entregas y los costos (Blackstone 2005, Muñoz 2009, Render, Barry & Heizer 1996).

Los avances tecnológicos que conocemos hoy en día, son el resultado de la reducción del

tiempo para la optimización de sus procesos productivos, todo esto con el objetivo de

perfeccionar los medios para alcanzar sus objetivos buscando siempre la productividad y

la eficiencia.

Dentro este capítulo también se aborda de manera general la historia y los conceptos

claves de la producción, ya que como sabemos la producción y la productividad son efecto

de la administración y las funciones operativas. Se revisará la evolución histórica,

analizando conceptos fundamentales hasta llegar a nuestro tema de interés, la

optimización, clusters.

I.II.I HISTORIA

El hombre ha producido bienes para su consumo desde la era prehistorica. La producción

y distribución de bienes la dominaban las uniones de artesanos y los mercados domésticos

(Hopp & Spearman, 2001). Las diferentes etapas de un proceso de manufactura no se

encontraban integrados en una fábrica, distintos artesanos realizaban cada paso del

proceso de manufactura después de haber comprado y vendido sus productos en los

mercados domésticos, pero es hasta la Revolución Industrial que se considera a la

producción industrial como la base de los sistemas actuales de la producción, que

evoluciona hasta llegar a lo que diversos autores denominan la economía basada en el

conocimiento. Durante este periodo se identifican varias etapas, cada una de ellas se

caracteriza por el desarrollo de técnicas y filosofías predominantes. Las etapas más

importantes en el desarrollo de los métodos de producción son las siguientes (Blackstone

2005, Muñoz 2009, Render, Barry & Heizer 1996):

20

Periodo antiguo, según restos arqueológicos encontrados, el hombre prehistórico

se preocupaba por satisfacer sus necesidades básicas, es decir, sus alimentos y su

vestimenta, basándose de procedimientos para la agricultura y la caza, donde

primero se baso de sus manos para estas labores y conforme el paso del tiempo

incorpora herramientas para facilitarle el trabajo.

La Revolución Industrial, inicia con la invención de la máquina de vapor por el

ingles James Watt en 1769, la máquina de vapor permite reemplazar el trabajo

artesanal por la maquina. A partir de su primera aplicación, el uso de la máquina

de vapor empieza a generalizarse en fábricas, en barcos, trenes y en la explotación

minera.

División del trabajo, enunciado por Adam Smith en su libro Riqueza de las

naciones, en el que expone los principios del capitalismo y explica como la división

del trabajo permitirá una producción más rápida y económica que la artesanal.

Taylor consideraba que si un operario se especializaba en una tarea determinada,

con el tiempo y debido a la experiencia acumulada, podía contribuir al

mejoramiento de la productividad.

Intercambio de partes, las partes de diferentes ejemplares del mismo producto son

intercambiables, sin alterar el funcionamiento del producto si respetan las

especificaciones de diseño. El Francés honoré LeBlanc en 1785 fue el primero en

mostrar este principio a Thomas Jefferson, al intercambiar las partes de dos

mosquetes, no fue hasta 1801 cuando Eli Withney y Simeon North probaron la

factibilidad del método.

La administración científica, con los principios enunciados por Charles Babbge hace

la introducción a esta nueva rama no es hasta A Frederick W. Taylor (1856-1915)

quien la postula formalmente, es por eso que se le considera el padre de la

administración científica, es a quien se le reconoce el logro de generar por primera

vez un marco sistemático para proclamar a la administración como una disciplina.

Su mayor contribución fue la sistematización del principio de la división del trabajo:

estableció que se mejora la eficiencia de un sistema de producción si se

estandariza cada uno de los pasos de un proceso productivo, para lo que es

necesario estudiar científicamente la mejor manera de llevar a cabo cada uno de

estos pasos.

21

Carta de Gantt, herramienta para la programación de actividades propuesta por

Henry Gantt (1861-1919).

Estudio de tiempos y movimientos, propuesto por los esposos Frank y Lillian

Gilbreth (1901), que requieren el examen con detalle de tiempos y movimientos de

los operativos, para proponer los procedimientos más eficientes de producción.

Sistemas en producción en masa, Henry Ford quien aprovecha las ideas de la

administración científica e implanta por primera vez una línea de producción en

masa de alta velocidad para el modelo T en 1913.

Nacimiento de las primeras empresas transnacionales entre 1875 y 1914.

El movimiento por los recursos humanos (mediados de los años treinta hacia fines

de la década de los años cincuentas).

La toma de decisiones con base en modelos, Hugo Munsterberg (1863-1916), fue

el primero en aplicar la psicología al estudio de la eficiencia de los sistemas de

producción industrial, donde se tocan temas como la selección de empleados, el

entrenamiento y las condiciones de trabajo, y la motivación del trabajador para el

logro de las metas de la empresa.

Estudios Hawtgirbe, en este estudio se investigó empíricamente el efecto de la

iluminación de la planta en la productividad de los trabajadores (al aumentar la

intensidad de la luz la productividad aumenta).

La revolución por la calidad (de principios de los años setenta hasta mediados de

los noventa).

La economía basada en el conocimiento, aparición del primer modelo de

investigación de operaciones, la programación lineal elaborada por George Dantzig

durante la segunda guerra mundial.

22

I.II.II CONCEPTOS

La producción es la creación de bienes y servicios, es decir, la transformación de materias

primas en productos (ver Imagen I.II.II.1), así las empresas dedicadas a la producción o

servicios desarrollan procesos de negocios con la finalidad de operar con eficiencia y

satisfacer las necesidades de sus clientes, generando un beneficio económico para la

empresa, por consecuencia, la eficiencia de los procesos productivos están relacionados

con la calidad de estos, así como con el costo de la producción que incurre para su

creación (Muñoz 2009).

Figura I.II.II.1. La producción como proceso de transformación (Muñoz, 2009).

Uno de los métodos para el análisis de datos que se usa es la técnica de la clusterizacion,

ya que esta provee un método robusto y resistente para la clasificación de datos

permitiendo que el mismo punto de datos donde residen múltiples clusters con diferentes

grados de pertenencias.

Un cluster es un grupo de observaciones o cosas que tienen propiedades similares. El

proceso de clusterización consiste en encontrar un conjunto de grupos, cada uno con

todas las observaciones que comparten un conjunto de propiedades especificadas, es

decir, atributos. Cuando un cluster no se encuentra predefinido, el cluster proporciona

una forma de conocer los patrones distribuidos que revelan una variedad de patrones de

comportamiento de los datos (Cox 2005, Bezdek 1973 & 1981, Cherkassky 1998, Devroye

1996, Hoppner 1999, Krishnapuram 1998, Lee 1994, Sato 1966, Yager 1992).

23

El proceso de agrupar un conjunto de objetos físicos o abstractos en clases de objetos

similares es llamado clusterización y un cluster es la colección de datos que son similares

uno del otro dentro del mismo cluster y son diferentes de los objetos de otro cluster.

El análisis de cluster intenta aislar en una región similitudes en una base de datos y

encontrar la relación que hay entre los diferentes clusters.

En general, los métodos de clusterizacion pueden ser clasificados dentro de las siguientes

categorías:

Método de particionamiento

K-mean

K-medoids

Método Jerárquico

Aglomeración jerárquica

División jerárquica

Método Densidad-base

DBSCAN

OPTICUS

DENCLUE

Método Base-Red

STING

WAVECLUSTER

Método Modelo-Base

Expectation-Maximization

Conceptual Clustering

Neutral Network

24

I.V OBJETIVO

La demanda de las tarjetas inteligentes ha crecido desde los años 70’s que fue inventada y

patentada, reflejando los constantes avances en capacidades técnicas y ámbitos de

aplicabilidad. La necesitad de hacer tarjetas más seguras para evitar fraudes,

estandarización, tecnologías de identidad, etc., hacen cada día crezca este mercado.

Por lo tanto, el objetivo de la presente tesis es el Diseñar un algoritmo para agrupar

productos bancarios por familia en la empresa GA, con base en el proceso de la k-mean,

con el fin de reducir costos en la línea de personalización de tarjetas.

25

CAPÍTULO II MÉTODO

A continuación se describirá la metodología a utilizar para la solución del problema

presentado en el capito 1, se describirán los métodos más conocidos para la clusterizacion

y posteriormente se describirá el método del algoritmo de la k-mean.

II.I MÉTODOS PARA LA CLUSTERIZACIÓN

El estudio de la clusterización inició hace más de 40 años en muchas disciplinas gracias a

sus amplias aplicaciones (Hartigan 1975, Jain & Dubes 1988, Kaufman & Rousseeuw 1990,

Jagadish &Koudas 1999, Arabie, Hubert & De Soete y Parsons, Haque & Liu 2004). Los

métodos de clusterización principales se clasifican de la siguiente manera:

II.I.I Método del particionamiento

Dada una base de datos en n objetos o datos tuplas, el método del particionamiento

construye k particiones de los datos, donde cada partición representa un cluster y k ≤ n.

Los datos se clasifican en k grupos, cada uno de estos datos juntos satisfacen los

siguientes requerimientos (Han & Kamber, 2006).

a. Cada grupo debe contener al menos un objeto.

b. Cada objeto debe pertenecer a un grupo exactamente.

El segundo requerimiento puede estar relajado en algunas técnicas de particionamiento

difusos.

Dado k, el número de particiones para construir, el método de particionamiento crea una

partición inicial. A continuación utiliza la técnica de reubicación iterativo que intenta

mejorar el particionamiento mediante el movimiento de objetos de un grupo a otro. En

general, un buen criterio de parcionamiento es, que el objeto en el mismo cluster este

“cerrado” o relacionados entre sí, mientras los objetos de diferentes cluster están

“apartados lejos” o muy diferentes.

26

Para lograr globalmente una óptima partición basada en la agrupación se requiere una

exhaustiva enumeración de todas las posibles particiones. Muchas aplicaciones adoptan

uno de los pocos métodos heurísticos populares como lo son:

a. El algoritmo de la k-means, donde cada cluster es representado por el valor

promedio de los objetos en el cluster. Este algoritmo fue introducido por primera

vez por Lloyd y posteriormente por MacQueen (Lloyd 1982 y MacQueen 1967).

b. El algoritmo de la k-medoids, donde cada cluster es representado por uno de los

objetos y está localizado cerca del centro del cluster. Kaufman y Rousseeuw

propusieron el algoritmo de K-Medoids de OPAM y CLARA (Kaufman y Rousseeuw

1990). Este algoritmo es sensible a valores atípicos, es decir, un objeto con un valor

extremadamente grande puede distorsionar sustancialmente los datos de la

distribución.

Estos métodos heurísticos de clusterizacion trabajan bien para encontrar cluster de

formas esféricas en datos que tienen un tamaño que van desde pequeños hasta

medianos. Para encontrar cluster con formas complejas y para cluster de conjunto de

datos de gran tamaño, la partición basada en métodos deben ser extendidos.

27

II.I.II Método jerárquico

El método jerárquico crea una descomposición jerárquica dada por un conjunto de datos

de objetos. Este método puede clasificar como aglomeración o como divisivo, esto basado

en cómo se forma la descomposición jerárquica (Han & Kamber, 2006).

Los modelos son:

a. El enfoque de aglomeración también llamado enfoque “buttom-up”, empieza con

cada objeto formado un grupo separada. Esto sucesivamente agrupa los objetos o

los grupos que están cerca uno de otros, hasta de que todos los grupos estén

unidos en uno (del nivel más alto de la jerarquía) o hasta que una condición

termine.

b. El enfoque divisivo también llamado enfoque “top-down” inicia con todos los

objetos en el mismo cluster. En cada iteración se van dividiendo el cluster en

cluster más pequeños hasta que eventualmente cada objeto este en un cluster o

hasta que una condición termine.

El método jerárquico adolece del hecho de que una vez que un paso de realiza

(agrupación o separación) nunca se puede deshacer. Esta rigidez es útil para costos más

pequeños ya que no hay que preocuparse acerca de una serie combinatoria de las

diferentes opciones. Sin embargo, esta técnica no puede corregir las decisiones erróneas.

Existen dos enfoques para mejorar la calidad de la clusterización jerárquica:

a. Realizar análisis cuidadoso de objetos “vínculos” para cada partición jerárquica tal

como en Chameleon.

b. Integrar aglomeración jerárquica y otro enfoque usando primero el algoritmo de

aglomeración jerárquica para agrupar los objetos en micro clúster y

posteriormente realizar macro clúster, con los micro clúster, utilizando otro

método de clusterización como la reubicación iterativa, como en BIRCH.

El método jerárquico como AGNES (agrupación jerárquica de aglomeración) y DIANA

(agrupación jerárquica divisiva) fueron introducidos por kaufman y Rousseeuw. Otros

estudios para mejorar la calidad de agrupación en este método han sido por Zhang,

Ramakrishnan y Lyny introduciendo el modelo CF-árbol, Guha, Rastogi y Shim propusieron

28

el modelo CURE y Guha, Rastogi y Shm y Camaleón por Karypis, Han, y Kumar el modelo

ROCK (Ng & Han 1994, Bradley, Fayyad & Reina 1998 y Ester, Kriegel & Xu 1995).

II.I.III Método Densidad-base

La mayoría de los métodos de particionamiento agrupa objetos basado en la distancia

entre objetos. Estos métodos pueden encontrar solo el cluster de forma esférica y

encuentran dificultades para encontrar cluster de formas arbitrarias. Se han desarrollado

otros métodos de clusterización en base a la noción de densidad. La idea general de este

modelo es el de seguir creciendo el cluster dado siempre que densidad (numero de

objetos o puntos de datos) en el “vecindario” superen cierto umbral, es decir, para cada

punto de datos dentro de un cluster dado, el vecindario circundante a un radio dado tenga

contacto al menos con un mínimo número de puntos. Este método puede ser usado para

filtrar el ruido (outliers) y descubrir cluster de formas arbitrarias (Han & Kamber, 2006):

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) y su extensión,

OPTICS (Ordering Points to Identify the Clustering Structure), son métodos típicos de

densidad- base donde crece el clúster de acuerdo con el análisis de la densidad-base.

El modelo DBSCAN fue propuesto por Ester, Kriegel, Saander, y Xu. El algoritmo crece

regiones con suficientemente con alta densidad dentro de una agrupación y descubre

agrupaciones arbitrarias en base de datos espaciales con el ruido. Define una agrupación

mediante un conjunto máximo de puntos de densidad conectado (Ester, Kriegel, Sander &

Xu 1996).

Ankerst, Breuning, Kriegel, y Sander desarrollaron OPTICUS, un método de agrupación de

pedidos que facilita la agrupación basada en la densidad sin tener que preocuparse por la

especificación de parámetros. (Ankerst, Breuning, Kriegel & Sander 1999).

DENCLUE (DENsity-based CLUstEring) es un método de clusterización de objetos basado

en el análisis de distribución de valores en función a la densidad, Hinneburg y Keim fueron

quienes proponen este método (Hinnerburg & Keim 1998).

29

II.I.IV Método Base-Red

El método de la base red cuantifica el espacio de los objetos en un finito numero de celdas

que forman la estructura de la red. Todas las operaciones de clusterización son realizadas

en una estructura de red (en un espacio cuantizado). La mayor ventaja de este enfoque es

el rápido procesamiento, que es típicamente independiente del el número de datos de

objetos y dependiente solo en el número de celdas en cada dimensión en el espacio

cuantizado (Han & Kamber, 2006):

STING (STatistical INformation Grid) es un ejemplo típico del método de la base-

red, un enfoque de múltiples resoluciones basado en la red que recoge

información estadística en celdas de cuadricula. Este modelo fue propuesto por

Wang, Yang y Muntz (Wang, Yang y Muntz, 1997).

WaveCluster aplica transformación waveles para el análisis de clusterización y es a

la vez base-red y densidad-base. WaveCluster, desarrollado por Sheikholeslami,

Chatterjee y Zhang, es un enfoque de agrupación de múltiples resoluciones que

transforman el espacio (Sheikholeslami, Chatterjee y Zhang, 1998).

II.I.V Método Modelo-base

El método de la base-red hipotetiza un modelo para cada uno de los cluster y encuentra el

mejor ajuste para cada dato de cada modelo. El algoritmo modelo-red puede localizar

cluster mediante la construcción de una función de densidad que refleja una especial

distribución de los puntos de datos. También conduce a una manera de determinar

automáticamente el número de cluster basándose en la estadística estándar (Han &

Micheline, 2006). Los métodos de modelo-base son:

El algoritmo EM (Expectation-Maximization), para la agrupación basada en

modelos, fue desarrollado por Dempster, Laird y Rubin. AutoClass es un método

basado en estadísticas bayesiano para el agrupamiento basado en el modelo por

Cheeseman y Stutz que utiliza una variante del algoritmo EM. Hay muchas otras

extensiones y aplicaciones de EM, como Lauritzen. Para un conjunto de trabajos

seminales en la agrupación conceptual esta Shavlik y Dietterich (Dempster, Laird &

Rubin 1977, Cheeseman & Stutz 1996, Lauritzen 1995 y Shavlik & Dietterich 1990).

30

Conceptual clustering se introdujo por primera vez por Michalsky y Stepp. Otros

ejemplos del enfoque de conceptual clustering incluyen COBWEB por Fisher, y

CLASSIT por Gennari, Langley, y Fisher (Michalski & Stepp 1983, Fisher 1987 y

Gennari, Langley & Fisher 1989). Este método es una forma de agrupación donde

dado un conjunto de objetos no marcados produce un esquema de clasificación

sobre estos. Conceptual clustering además de identificar los grupos de objetos,

también encuentra la descripción característica de cada grupo donde cada grupo

representa un concepto o una clase. La calidad de la agrupación no es únicamente

una función de los objetos individuales, más bien se incorporan factores tales

como la generalidad y la simplicidad derivados de la descripción conceptual. Este

tipo de método adopta un enfoque estático que utiliza mediciones de probabilidad

en la determinación de la agrupación de conceptos por lo que las descripciones

probabilísticas suelen utilizarse para representar cada concepto derivado.

Los estudios sobre Neutral Network Approach incluyen SOM (Self-Organizing Maps

característica) por Kohonen, por Carpenter y Grossberg, y por Kohonen, Kaski, Lago

y Competitive learning por Rumelhart y Zipser (Hinton & Sejnowski 1999, Kohone

1982 y 1995, Carpenter & Grossberg 1991, Cheng, Fu & Zhang 1999, Kohonen,

Kaski, Lagus, Solojärvi, Paatero & Saarela 2000 y Rumelhart & Zipser 1985). Este

método está inspirado por las redes neuronales bilógicas. Neutral Network

Approach es un conjunto de unidades conectadas de entrada/salida, donde cada

conexión tiene un peso asociado con él. Algunas de las propiedades de este

método son:

- Neutral networks son inherentemente paralelas y son distribuidas.

- Aprenden mediante el ajuste del peso de sus interconexiones con la

finalidad de ajustar los datos lo mejor posible. Esto permite normalizar los

patrones y actuar como atributos de las extracciones de varias

agrupaciones.

- Procesa vectores numéricos y requiere patrones de objetos para ser

representados solamente por rasgos cuantitativos.

El enfoque de este método para la agrupación tiende a representar cada grupo

como un ejemplar. Un ejemplar actúa como un prototipo de la agrupación y no

necesariamente tiene que corresponder a un ejemplar partículas de datos u

objetos. Un nuevo objeto puede ser distribuido a una agrupación donde se tenga

mayor parecido con el ejemplar, basado en una medida de distancia. Los atributos

de un objeto asignado a un grupo puede se predicho mediante los atributos el

ejemplar de la agrupación.

31

II.II ANÁLISIS – EVALUACIÓN

A continuación se presenta los resultados de la comparación de los diferentes métodos analizados anteriormente, en la matriz de comparación de

métodos del clusterización.

MATRIZ DE COMPARACION DE METODOS DE CLUSTERIZACIÓN

Método Objetivo Características Aplicaciones Enfoque practico

Particionamiento

- Construye k particiones de datos.

- Se crea en base a la distancia entre

datos.

- Se basa en la distancia entre objetos

con un centroide o centro de gravedad

-Tiene la capacidad de mover objetos

de un cluster a otro.

- Uno define la cantidad de grupos a

crear.

- El cluster es de forma esférica.

- Hay dificultades para encontrar

cluster de manera arbitraria.

Algoritmo de la k-mean. Particiona los n objetos en k numero de

clusters

Algoritmo k-medoids.

Es muy sensitivo a salirse, si existe un

objeto con un valor extremadamente

grande, se puede distorsionar la

distribución de los datos.

Jerárquico - Descomposición jerárquica dada por

un conjunto de datos de objetos.

Cuando se ha realizado el cluster ya

no se puede deshacer

Aglomeración jerárquica

Coloca cada objeto en un cluster y los va

haciendo más grandes hasta que todos los

objetos se encuentran en el mismo cluster

División jerárquica Subdivide los clusters ya existentes

Densidad-base

- El objetivo de este método es tener la

mayor cantidad de objetos en el

cluster.

- Sigue creciendo el cluster.

- Busca regiones de baja densidad

para separar los clusters.

DBSCAN

El algoritmo crece regiones con alta

densidad dentro de un cluster y descubre

figuras arbitrarias de clusters (máximo set

de densidad de puntos conectados)

OPTICUS

Crece el clúster de acuerdo con el análisis

de la densidad-base

DENCLUE

Es un método de clusterización de objetos

basado en el análisis de distribución de

valores en función a la densidad.

32

32

Método Objetivo Características Aplicaciones Enfoque practico

Base Red

Cuantifica el espacio de los objetos en

un finito número de celdas que forman

la estructura de la red.

- Todas las operaciones de

clusterización son realizadas en una

estructura de red (en un espacio

cuantizado).

- Rápido procesamiento,

independiente del número de datos

de objetos y dependiente solo en el

número de celdas en cada dimensión

en el espacio cuantizado.

STING Es un ejemplo típico del método de la

base-red.

WaveCluster

Aplica transformación waveles para el

análisis de clusterización y es a la vez base-

red y densidad-base.

Modelo Base

Hipotetiza un modelo para cada uno de

los cluster y encuentra el mejor ajuste

para cada dato de cada modelo.

- El algoritmo modelo-red puede

localizar cluster mediante la

construcción de una función de

densidad que refleja una especial

distribución de los puntos de datos.

- También conduce a una manera de

determinar automáticamente el

número de cluster basándose en la

estadística estándar.

Expectation-

Maximization

Para la agrupación basada en modelos, es

un método basado en estadísticas

bayesiano para el agrupamiento basado en

el modelo por Cheeseman y Stutz que

utiliza una variante del algoritmo EM.

Conceptual Clustering

Forma de agrupación donde dado un

conjunto de objetos no marcados produce

un esquema de clasificación sobre estos.

Neural Network

Approach

Conjunto de unidades conectadas de

entrada/salida, donde cada conexión tiene

un peso asociado con él.

33

Los diferentes métodos de clusterización mencionados anteriormente al aplicarlos producen

diferentes resultados, todos ellos son capaces de analizar los datos y clasificarlos según cada

uno de los métodos y algoritmos. Sin embargo, los clusters incrementales como lo es el

método del particionamiento (K-means), es el único método que puede generar una

estructura explicita del cluster generado, representado visualmente para poder ser

razonado, mientras otros modelos pueden ser visualizados siempre y cuando su dimensión

no sea demasiado grande (Wittem & Frank, 2005).

Debido a que el método de particionamiento se basa en la distancia entre objetos con un

centroide o centro de gravedad, y se tiene la facilidad de elegir la cantidad de clusters a

realizar se elige este modelo para implementarlo en la problemática presentada en este

trabajo.

II.III ALGORITMO DE LA K-MEAN

La K en el algoritmo de k-mean destaca el número de semillas de cluster inicialmente

previstos para el algoritmo. El algoritmo de la k-mean involucra los parámetros de la

siguiente tabla (Cox 2005, Bezdek 1973 & 1981, Cherkassky 1998, Devroye 1996, Hoppner

1999, Krishnapuram 1998, Lee 1994, Sato 1966, Yager 1992):

Tabla II.III.1 Parámetros básicos el algoritmo de la k-media. (Earl, 2005).

Xi Vector de datos de entrenamiento, donde i = 1, 2,…, n. Estos son los atributos de un grupo

seleccionado de elementos de los elementos de datos encontrados.

K El número de fuzzy cluster especificados como parte del algoritmo.

Cj El centro de un cluster (j = 1, 2,…, k). Este valor es calculado repetidas veces por el

algoritmo.

Sj Un cluster en el mismo espacio. Este es un grupo de puntos asociado con el clúster que su

centro es Cj.

δsj() La función característica del conjunto de δj. Tenga en cuenta que la función característica

del conjunto A es como sigue,

En otras palabras, la función es 1 para todo el conjunto de puntos, pero 0 para el conjunto

de datos que sale.

(2.3.1)

34

El objetivo del algoritmo de la k-mean es la asignación de cada punto de datos en uno y solo

en un cluster. El centro del los cluster se mueven de acuerdo a la función de proximidad o

similitud, definiendo la distancia desde un centro de la agrupación para el punto de datos.

Existen dos ecuaciones fundamentales usadas para gestionar la partición de puntos de tatos.

La expresión 2.1 determina los miembros del cluster.

(2.3.2)

Donde

Sj(t) Es el grupo de miembros en el j-ésimo clúster central en fase de desarrollo.

t Es el valor de ciclo de iteración actual. El valor de t puede variar de 1 a P, el número

máximo de iteraciones usadas para definir el clúster final.

Xi Es el i-ésimo punto de datos.

Cj Es el centro del el j-ésimo clúster.

Ck Es el centro del k-ésimo clúster.

Esto es, en la iteración de tiempo (t) un punto Xi pertenece al cluster Sj si la distancia del

centro del clúster Sj (indicada por Cj) es menor que la distancia de k-ésimo centro del cluster

(para Sk). La distancia es generalmente calculada usando la métrica Euclidiana pero también

puede ser calculada mediante el método cualquier método estándar de distancia.

El centro del cluster es inicialmente una semilla, generalmente con una configuración

random dibujada desde el dominio de los atributos.

El centro es pues actualizado en cada ciclo (t) usando la siguiente expresión:

(2.3.3)

35

Donde:

Cj(t+1) Es el miembro determinado in el j-ésimo centro del cluster bajo desarrollo.

t Es la iteración actual del valor del ciclo. El valor de t puede variar de 1 a P, el máximo

número de iteraciones usadas para definir el cluster final.

Xi Es el i-ésimo punto de datos.

δ() Es la característica o el determinado miembro.

Sj(t) Es la función del determinado miembro (ver expresión 2.3.2).

El grupo de datos puede pertenecer al menos a un cluster, de otra manera, debemos dividir

entre cero. El algoritmo por sí mismo es muy sencillo: el centro del cluster se inicializa

aleatoriamente y nosotros asignamos un grupo de datos (xi) en el cluster (Sj; j = 1 para k)

resolviendo la expresión 2.2.1. Esto lo podemos ver ilustrado en la figura II.III.1. La línea

representa la asignación inicial de puntos en el centro del clúster C1 y C2.

Figura II.III.1 Partición inicial de la k-mean (Earl, 2005).

36

Cuando todos los puntos han sido asignados a un cluster, un nuevo centro del cluster es

calculado usando la expresión 2.3.2. Como lo muestra la figura II.III.2, el cálculo del centro del

cluster hace que el centroide anterior se mueva hacia el centro del conjunto de cluster. Esto

cambia la partición del espacio.

Figura II.III.2 Reposicionamiento del cetro del cluster después de la iteración (Earl, 2005).

El proceso de calcular el grupo de cluster y el recalculo del centro del cluster continua hasta

que el centro del cluster no difiera tanto al siguiente calculo. Así, el cambio de centro de

cluster empieza a ser menor y menor hasta que queda el valor final, como se ilustra en la

siguiente figura:

Figura II.III.3 Centro del cluster final después de terminar las iteraciones (Earl, 2005).

37

El algoritmo de la k-mean pertenece a una familia de técnicas de clusterización que

únicamente particiona el espacio de punto de datos en disjuntos cluster. La distancia métrica

euclidiana mide que tan lejos se encuentra un punto del centro del cluster y los puntos que

tienen tributos similares naturalmente se encuentran en el mismo cluster.

II.III.I Despliegue del algoritmo

Selecciona al azar k objetos, cada uno de ellos representa inicialmente una media o centro de

un cluster. Para cada uno de los objetos restantes es asignado a un cluster que es el más

similar al objeto, basado en la distancia entre el objeto y la media del cluster, posteriormente

se calcula la nueva media para cada cluster. Este proceso se repite hasta que la función de

criterio converge. Generalmente se utiliza el criterio de square-error (Han & Kamber, 2006):

(2.3.4)

Donde

E Es la sumatoria del error del cuadrado para todos los objetos en el conjunto de datos.

p Es el punto del espacio que representa un objeto dado (es multidimensional).

mi Es la media del clúster Ci (es multidimensional).

(a) (b) (c)

Figura II.III.4 Clusterización de un conjunto de objetos basado en el método de la k-mean (la media de cada cluster está

marcado por un “+”) (Jiawei & Kamber, 2006).

38

En otras palabras para cada objeto de cada cluster, la distancia entre el objeto y el centro del

cluster es al cuadrado y las distancias son sumadas. Este criterio intenta dar el resultado de k

número de cluster lo más compacto y de forma separada sea posible (Imagen II.III.1).

El algoritmo intenta determinar k particiones para minimizar la función de square-error. Esto

funciona bien cuando las nubes de cluster son compactos y que están bastante bien

separados uno de otro. El método es relativamente escalable y eficiente en el procesamiento

de grandes conjuntos de datos debido a que la complejidad del algoritmo es 0 (nkt), donde n

es el número total de objetos, k es el número de clúster y t es el numero de iteraciones.

Normalmente, k<< n y t<<n. El método a menudo termina en un óptimo local.

39

CAPÍTULO III RESULTADOS

En este capítulo se presentan los resultados, para ello, se realizará un análisis de los datos

obtenidos en el último mes, esto con el objeto de realizar el análisis de grupabilidad y la

clasificación que será requerida para realizar esta clasificación por familias.

III.I Modelo agregado

El método agregado consta de 3 fases, como se muestra el diagrama III.I.1. Las dos primeras

fueron creadas internamente ya que en base a esto se analizan todos los productos que

tenemos actualmente y los componentes de estos y la tercera fase se integra el algoritmo de

la k-mean.

Fase I, análisis de estructura del producto, se desglosan las características de los

productos para analizar sus características e irlos agrupando según estas.

Fase II, definición de restricciones, en base con los criterios establecidos de

estructuras y a las familias que se generaron, se definen las restricciones, aquellas

que determinan si pueden ser parte de la familia definida o no.

Fase III, aplicación del algoritmo, se sigue la metodología definida para este método.

Para lograr el objetivo de este proyecto fue necesario seguir el siguiente proceso:

Figura III.I.1 Proceso PSC (GA, 2012).

40

III.II Modelo desagregado

III.II.I - Fase I: Análisis de estructura del producto

El proceso de PSC, se compone de varios factores, dependiendo de las especificaciones del

cliente para cada producto. El proceso se puede componer por uno, varios o todos los

procesos que la componen (ver diagrama III.II.1, Proceso PSC):

Figura III.II.1 Proceso PSC. (GA, 2012).

Chip (Imagen III.II.3) y Banda (Imagen III.II.2), este proceso consiste en la información

colocada en el producto de forma lógica.

Indentado (Imagen III.II.2), Embosado (Imagen III.II.2) y Termografia (Imagen III.II.4),

estos procesos consisten en la personalización grafica del producto así como el color en

el que irán estos.

Fotografía (Imagen III.II.4), es un proceso de personalización grafica (imagen) del

producto.

41

En la imagen III.II.2 se muestra el reverso de una tarjeta, donde podemos ver el elemento

conocido como banda magnética y el procedo de indentado.

La siguiente imagen III.II.3, se muestran los elementos de la tarjeta, chip. Además se puede

ver el proceso de embosado.

En esta última imagen la III.II.4, se muestran varios procesos. El primero de ellos es el

proceso de la fotografía y el segundo de ellos es el proceso de termografía, las letras en color

blanco.

Figura III.II.4 Tarjeta Termografia y Foto (GA, 2012).

Figura III.II.2 Tarjeta Indentado y banda (GA, 2012).

Figura III.II.3 Tarjeta Embosado y Chip (GA, 2012).

42

En la siguiente clasificación va a depender de acuerdo a los envíos y al proceso (ver Imagen

III.II.5, Empaque del proceso). Los procesos principales son:

Altas

Reposiciones

Renovaciones

Urgentes

Figura III.II.5 Empaque del proceso (GA, 2012).

Se tiene esta clasificación dependiendo del estatus de la tarjeta Altas (una cuenta nueva),

Reposiciones (cuando se repone una tarjeta perdida por ejemplo), Renovaciones (cuando la

tarjeta caduco y se da una nueva) y Urgentes (cuando el proceso tiene un nivel de servicio

menor). Esta clasificación es importante ya que según sea el proceso va a ser empaque que

se le va a colocar a este producto.

III.II.II - Fase II: Definición de restricciones

Para poder realizar el cluster debemos considerar las siguientes restricciones. Deberá tener el

mismo proceso de PSC de acuerdo al Imagen III.I.1 (Proceso PSC).

1. Plástico, para poder hacer la agrupación deberá ser el mismo plástico (visual de la

tarjeta).

2. Misma composición del proceso PSC (Embosado, Indentado, Termografía, fotografía,

etc).

3. La tercera condicionante será el de realizar el ordenamiento según su proceso de tal

manera que se de un ordenamiento de la siguiente manera:

a) Urgentes

b) Altas

c) Reposiciones

d) Renovaciones

e) Otros

43

III.II.III -Fase III: Aplicación del algoritmo

Utilizando el algoritmo de la k-mean, cada centro del cluster es representado por el valor

medio del objeto en el cluster (Han and Kamber, 2006):

Pasos:

Paso 1.- Seleccionar arbitrariamente k numero de objetos de D como el centro del cluster

inicial.

Paso 2.- Repetir.

Paso 3.- Reasignar cada objeto en el cluster donde el objeto sea más similar, basado en el

valor de la media de el objeto en el cluster.

Paso 4.- Actualizar el valor de la media del cluster, es decir calcular el valor de la media del

objeto de cada cluster. Hasta que no haya cambios

Se le da las siguientes entradas al algoritmo:

Paso 1

K Número de cluster

K = 3

44

D Conjunto de datos que contiene n objetos

Producto Color Proceso Envió Cnt Ordenada

A Amarillo Alta Sucursal 39

D Amarillo Alta Sucursal 40

E Amarillo Alta Sucursal 4

F Amarillo Alta Sucursal 10

A Azul Alta Sucursal 152

D Azul Alta Sucursal 51

E Azul Alta Sucursal 11

F Azul Alta Sucursal 6

A Blanco Alta Sucursal 156

D Blanco Alta Sucursal 188

F Blanco Alta Sucursal 4

D Naranja Alta Sucursal 19

A Rojo Alta Sucursal 132

D Rojo Alta Sucursal 31

E Rojo Alta Sucursal 15

F Rojo Alta Sucursal 4

A Sin Color Reposición Sucursal 7

B Sin Color Renovación CR 3

C Sin Color Renovación CR 1

D Sin Color Reposición Sucursal 68

F Sin Color Reposición Sucursal 142

Tabla III.II.1 Órdenes de trabajo generadas en un día (Elaboración propia).

45

Paso 3 y Paso 4

Salidas:

Conjunto de k número de cluster

Figura III.II.6 Clusterización de órdenes de trabajo generadas en un día (Elaboración propia).

El calculo de los centroides lo podemos ver en la tabla III.II. 2

X Y

Centroide 1 1.2 4.2

Centroide 2 3.9 3.9

Centroide 3 5.6 3.4

Tabla III.II.2 Coordenadas de los centroides (Elaboración propia).

46

III.III Implicaciones

Para poder llevar a cabo este proceso, es necesario:

Extracción de la información: Para este paso es necesario la interacción de diferentes

áreas, se requerirá la extracción de la matriz de todos los productos de cada uno de

nuestros clientes. Con esto fue posible hacer un análisis de la composición de los

productos así como la cantidad de productos que tenemos registrados y comprarlo

contra lo que se tiene físicamente.

Análisis de productos según lo analizado en la sección III.II, Fase 1, para esto se

requiere diferentes recursos humanos, como supervisor de producción, planeación,

recepción de órdenes de trabajo y procesamiento. Gracias a este análisis pudimos ver

como se componen los productos, partes, procesos, etc.

Definición de restricciones, analizar si todos los productos cumplen con las

restricciones y los requerimientos para la clusterización. El análisis de producto nos

ayudó a definir y darnos cuenta que similitudes existían entre los productos y definir en

base a que se iban a realizar los grupos considerando capacidades tanto de equipo

como de personal.

Corrida piloto, realizar el primer cluster y realizar una prueba productiva. El objetivo de

esto era llevar la teoría en la práctica y observar si no nos encontrábamos con

problemas operacionales o de sistema.

Capacitación, debido a que esto fue un cambio de cultura respecto a su forma de

trabajo fue necesario explicar el nuevo esquema de familias.

Recepción de OT y procesamiento, ellos deberán realizar la función de

agrupamiento.

Supervisores, la administración de los clusters vs ordenes de trabajo.

Operadores, la operación va a ser diferente a la actual, la carga de los archivos

de trabajo al equipo, la operación de reprocesar, etc.

47

CAPÍTULO IV DISCUSIÓN

En el presente capítulo se presentará la implementación de la mejora propuesta en la

empresa de estudio así como los resultados obtenidos a partir del año 2013. Se hablará sobre

el resultado que se obtuvo por clientes de trabajo y se hará una comparación con otras

plantas que han implementado el método de familias de productos para elevar la

productividad y eliminar el tiempo de setup (tiempo de arranque de un equipo). Se

presentarán los resultados obtenidos respecto al implementar este método así como las

futuras investigaciones que trajo consigo la implementación de esto y de la investigación que

se llevo a cabo.

IV.I Análisis Interno

Se realizó el análisis a todos los clientes que maneja la empresa y de 21 de ellos solo 8 tenían

las características en sus productos para la clusterización. Mediante la implementación del

algoritmo como se presentó en los capítulos anteriores se tomaron los parámetros para la

creación de las familias de productos (clusterización). Se colocaron los parámetros en el

sistema que maneja internamente la empresa y durante el año 2013 se tuvieron, en las

graficas que se presentaran a continuación por cliente veremos reflejados la cantidad de

órdenes de trabajo con la implementación de la clusterización llamada internamente pack y

la cantidad de ordenes de trabajo que se trabajarían si no se hubiera realizado la

clusterización “Pack”. Las graficas que se presentan a continuación corresponden al año

2013.

Como primera etapa se realizó la labor para los clientes con mayor producción así como con

mayor cantidad de familias de productos y donde pudimos obtener resultados más grandes.

Cabe mencionar que la planta de México se encuentra segregada en dos áreas, en el área 1

se encuentra solo el cliente 2 y en el área 2 se encuentran los clientes 1, 3, 4, 5, 6, 7 y 8. Esto

debido a que el cliente 2 es un cliente nuevo y muy importante.

48

El cliente 1 (gráfica IV.I.1), fue la prueba piloto y se implemento desde inicios del año, su

comportamiento durante todo el año fue estable y los resultados de la clusterización

dependían de la cantidad de órdenes que entraban así como de los productos que solicitaba

el cliente.

Figura IV.I.1 Ordenes de trabajo vs clusters Cliente 1 (Elaboración propia).

Al ver los resultados obtenidos con el cliente 1, se empezaron a realizar análisis para otros

clientes y se implementó para el más importante y del cual se manejan mayores volúmenes

de producción. Debido a su importancia, este se encuentra segregado de los demás clientes y

se considera como área uno. La implementación de la clusterización con el cliente 2 fue a

partir de abril. En el mes de abril no se puede observar gran ventaja debido a que fue la fase

de pruebas, al ver que los parámetros obtenidos mediante el algoritmo fueron los correctos y

no se tuvo problema alguno en la producción se implemento a todos los productos del

cliente y los resultados fueron los siguientes (gráfica IV.I.2):


49

Finalmente, se implementó el mismo procedimiento para el cliente 3 (gráfica IV.I.3). La

implementación no se realizo hasta que se 2 no tuviera ninguna situación que afectara la

producción y el personal que trabajaba con este cliente se adaptara a la nueva forma de

trabajo, después de esto se iniciaron con pruebas para el cliente 3 que se realizaron en el

mes de agosto, porsterior a esto, se establecio un tiempo de 3 meses para el monitoreo de

este cliente que habia migrado a esta nueva forma de trabajo. Los resultados obtenidos son

los siguientes.


Después de ver los logros obtenidos con estos 3 clientes que representaban el 80% de

nuestra producción y ver los ahorros obtenidos mediante la clusterización, se tomó la

decisión de analizar el resto de los clientes que representaban el 20% del volumen de

producción en la empresa.

Al realizar el análisis al resto de los clientes nos dimos cuenta que no todos podían entrar al

esquema de la clusterización debido a los parámetros que son requeridos para poder realizar

las familia, es decir, los paquetes “Pack”.

Se inició con el plan de migración de los demás clientes en a inicios del año 2014, donde en el

primer mes se realizó el análisis así como la implementación de la clusterización con pruebas

a partir de febrero, se ordenan los clientes según sus resultados empezando con el cliente en

el que se obtienen mayores resultados dejando al final al cliente con menores resultados, las

graficas de los resultados obtenidos del resto de los clientes son:

50

El cliente 4 (gráfica IV.I.4), es uno de los clientes que maneja la mayor cantidad de familias,

aunque sus volúmenes son pocos podemos ver que es uno de los clientes donde mayor

beneficio trae el proyecto de la creación de familias de productos.


El cliente 5 (gráfica IV.I.5), tiene un comportamiento similar a los demas, ya que se logra

hacer familias de productos y los ahorros son similares a los otros clientes. Todo esto debido

a los productos que maneja el cliente y a los criterios que se definieron en un principio.


51

Con el cliente 6 (gráfica IV.I.6), pudimos observar que no era posible realizar muchas familias

de productos ya que este cliente maneja productos totalmente diferentes que no entran en

el esquema definido de restricciones desde el inicio.


Los ahorros de este cliente son muy pocos, debido a que una de nuestras restricciones es el

tamaño de lote, con este cliente pudimos observar que cuando envia sus ordenes de trabajo

son de lotes grandes y que aunque se pudiera hacer mayores familias de productos no es

posible debido a la restricción del tamaño de lote. Ver gráfica IV.I.7


52

Al igual que el cliente 7 (gráfica IV.I.7), el cliente 8 maneja tamaño de lotes muy grandes

desde el origen, por lo que no se logra realizar la familia de productos aunque exista.


IV.II Análisis Externo

Debido a que la empresa en estudio es una empresa transnacional, se encuentra en varios

puntos del mundo, fue posible realizar una comparación de los resultados obtenidos en otras

plantas. El método que ellos utilizaron para la creación de los parámetros para las familias es

diferente al que se utilizo en la empresa de estudio “algoritmo de la k-mean”.

También, es complicado realizar una comparación con los resultados de la clusterización

debido a que en cada país los clientes son diferentes así como los volúmenes de producción,

por lo cual, los ahorros obtenidos no pueden compararse. Se eligieron las plantas que han

implementado el proceso de pack así como las empresas que tienen el mismo nivel de

volúmenes para que la comparación sea más parecida a lo obtenido en la planta de México.

53

A continuación, se presentará una tabla IV.II.1 donde se encuentran los resultados obtenidos

en la semana 23 en otras plantas:

PLANTA MÉTODO ORDENES

REDUCIDAS

HORAS AHORRADAS REDUCCION EN %

México 1 K MEDIA 284 23 21

México 2 K MEDIA 78 6 12

GCS OTRO 1127 93 36

Tabla IV.II.1 Comparación de plantas (Elaboración propia).

En la tabla anterior, se presentan 3 plantas donde se realizo el proceso de familia de

productos y donde podemos observar los beneficios obtenidos mediante la implementación

de este nuevo proceso.

IV.III Aportaciones

Gracias a la implementación del algoritmo de la k mean, se pudo automatizar el proceso para

la creación de parámetros para la formación de familias.

Al implementar los parámetros obtenidos mediante el algoritmo en el sistema interno de

generación de órdenes de trabajo se obtuvieron los siguientes beneficios:

Se implementó una nueva estructura de trabajo, ya que anteriormente se trabajaba

por órdenes de trabajo y cada orden de trabajo correspondía a un producto y con la

implementación de la clusterización, el operador trabaja varias órdenes de trabajo que

corresponden a diferentes productos.

Se redujo el tiempo de setup de los equipos que procesan las órdenes de trabajo.

Tiempo de arranque de equipo así como el cambio de consumibles se hace ahora por

cluster y anteriormente se realizaba por órdenes de trabajo.

Se tiene una mejor planeación de la producción ya que la clusterización agrupa

productos con mismas características y estas son enviadas a trabajar al mismo equipo

cuando antes se enviaban las órdenes a diferentes equipos.

Se redujo el tiempo de llenado de controles y bitácoras ya que ahora se realiza por

cluster y anteriormente se realizaba por orden de trabajo.

54

Al aplicar el algoritmo de la k-mean, descrito en esta tesis, se obtuvieron los siguientes resultados:

Reducción de OT

OT ahorradas Tiempo de Setup (min)

Tiempo ahorrado

(hr)

Costo maquina (pesos)

Ahorro anual (pesos)

Cliente 1 29% 2240

3.30

123.2

$ 400

$ 49,280

Cliente 2 18% 11946 657.03 $ 262,812

Cliente 3 9% 1305 71.77 $ 28,708

Cliente 4 80% 853 46.91 $ 18,764

Cliente 5 21% 78 4.29 $ 1,716

Cliente 6 15% 9 0.495 $ 198

Cliente 7 3% 1 0.055 $ 22

Cliente 8 3% 1 0.055 $ 22

Total 22% 16433 3.30 903.805 $ 400 $ 361,522

Tabla IV.II.2 Resultados obtenidos (Elaboración propia).

Se obtuvo una reducción del 22% en promedio de las órdenes de trabajo, es decir, de

130,277 generadas durante la implementación, se realizaron 113,844, implementando la

clusterización, ahorrando 16,433 órdenes de trabajo. Se logro reducir 16,433 horas al año y

un ahorro de 361,522 pesos.

IV. IV Futuras Investigaciones

Gracias a la implementación del algoritmo de la k-mean, pudimos observar que si ampliamos

las restricciones que actualmente fueron establecidas los cluster pueden ser más grandes y

obtener mayores ventajas en ellas.

IV.IV.1 Futuros trabajos en la empresa

Se realizará un análisis realizando un cambio en las restricciones iniciales y mediante la

implementación del algoritmo de la k-mean obtener los parámetros y realizar el análisis de

beneficio ampliando las restricciones puestas en esta primera etapa.

Al realizar esta primera etapa pudimos observar que existen productos que tienen las

mismas características para ser producidos en el mismo paquete. La primera restricción

implementada era que el plástico debía tener el mismo visual, si eliminamos esta restricción

pero conservando las anteriores es posible hacer los cluster mas grandes.

55

El realizar este cambio de restricciones puede crear problemas en la producción como mezcla

de material y que sea personalizado un plástico con información que debía llevar otro

plástico por lo que se deberán implementar controles para que no suceda esto incluso

analizar la posibilidad de colocar un pokayoke.

IV.IV.2 Futuras investigaciones teóricas

Gracias a la investigación realizada previamente, nos damos cuenta de la necesidad de

implementar o estudiar más a fondo el tema de simulación, ya que con esta herramienta es

posible la recreación de la situación actual de la empresa introduciendo resultados obtenidos

en el pasado y poder ver la tendencia que habrá para la empresa en un futuro.

Con la simulación también será posible la recreación de propuestas y saber los beneficios que

estos traerán consigo después de la implementación.

56

REFERENCIAS

Anderson, J., Durston, B.H., & Poole, M. (1984). Redacción de tesis y trabajos escolares. México: Editorial Diana.

Ankerst M., Breuning M., Kriegel H.-P., & Sander J. (June 1999). OPTICS: Ordering points to identify the clustering structure. In Proc. 1999 ACM-SIGMOD Int. Conf. Management of Data (SIGMOD’99), pages 49-60, Philadelphia, PA.

Arabie P., Hubert L.J., and De Soete G. Clustering and Classification. World Scientific, 1996.

Bezdek J.C. (1981). Pattern Recognition with Fuzzy Objective Function Algorithms. Plenum Press.

Bezdek, J. C. (1973). “Fuzzy Mathematics in Pattern Classification,” Ph.D. thesis, Cornell University, Ithaca, NY.

Bezdek, J. C. (1981). Pattern Recognition with Fuzzy Objective Function. New York: Plenum Press.

Bezdek J.C. & Pal S. K. (1992). Fuzzy Models for Pattern Recognition: Methods That Search for Structures in Data. IEEE Press.

Blackstone Hoffmann, F. (2005). Administración de la producción e inventarios. (2da ed.). Editorial CECSA.

Bradley P., Fayyad U., & Reina C. (Aug. 1998). Scaling clustering algorithms to large databases. In Proc. 1998 Int. Conf. Knowledge and Data Mining (KDD’98), pages 9-15, New York, NY.

By Business Wire. Chip Card Manufacturers, The Nilson Report. Retrived November 2011, from: http://nilsonreport.com.

Carpenter G. A., & Grossberg S. (eds.) (1991). Pattern Recognition by Self-Organizing Neural Networks. MIT Press.

Casares Garcia, E. (2012). Nuevas Tecnologías en el sector financiero: http://mipymesenlinea.tripod.com/sitebuildercontent/sitebuilderfiles/documentoboletinn5.pdf.

Chaturvedi A., Green P., & Carroll J. (1994). K-mean, k-medians and k-modes: Special cases of partitioning multiway data. In The Classification Society of North America (CSNA) Meeting Presentation, Houston, TX.

Chaturvedi A., Green P., & Carroll J. (2001). K-modes clustering. J. Classification, 18:35-55.

Cheeseman P., & Stutz J. (1996). Bayesian classification (AutoClass): Theory and results. In U.M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, editors, Advances in Knowledge Discovery and Data Mining, pages 153-180. AAAI/MIT Press.

Cherkassky, V., & F. Mulier. (1998). Learning from Data: Concepts, Theory and Methods. New York: John Wiley and Son.

57

http://nilsonreport.com/

http://mipymesenlinea.tripod.com/sitebuildercontent/sitebuilderfiles/documentoboletinn5.pdf

http://mipymesenlinea.tripod.com/sitebuildercontent/sitebuilderfiles/documentoboletinn5.pdf

Cox, E. (2005). Fuzzy modeling and genetic algorithms for data mining and exploration. Editorial Elsevier Inc.

Day, R. A., & Gastel, B. (2006). How to write and publish a scientific paper (6th ed.). Westport, Conn.: Greenwood Press.

Day W.H.E., & Edelsbrunner H. (1984). Efficient algorithms for agglomerative hierarchical clustering methods. J. Classification, 1:7-24.

Delgado, Porter, Stern, 2010. Clusters, Convergence and Economic Performance.

Dempster A., Laird N., & Rubin D. (1977). Maximum likelihood from incomplete data via the EM algorithm. J. Royal Statistical Society, 39:1-38.

Devroye, L., L. Gyorfi, & G. Lugosi. (1996). A Probabilistic Theory of Pattern Recognition. New York: Springer-Verlag.

Docherty, M., & Smith, R. (1999). The case for structuring the discussion of scientific papers. BMJ, 318 (7193), 1224-1225.

Docherty, M., & Smith, R. (1999). The case for structuring the discussion of scientific papers. BMJ, 318 (7193), 122-1225.

Esther M., Kriegel H.-P., Sander J., & Xu X. (Aug 1996). A density-based algorithm for discovering clusters in large spatial databases. In Proc. 1996 Int. Conf. Knowledge Discovery and Data Mining (KDD’96) pages 226-231, Portland, OR.

Esther M., Kriegel H.-P., and Xu X. (Aug. 1995). Knowledge discovery in large spatial databases: Focusing techniques for efficient class identification. In Proc. 1995 Int. Symp. Large Spatial Databases (SSD’95), pages 67-82, Portland, ME.

Evans, D., & Gruba, P. (2002). How to write a better thesis (2 ed.). Carlton, Victoria, Australia: Melbourne University Press.

Fisher D. (July 1987). Improving inference through conceptual clustering. In Proc. 1987 Nat. Conf. Artificial Intelligence (AAAI´87), pages 461-465, Seattle, WA.

Forbes, S. (2013). Competencia en tarjetas de crédito: http://www.forbes.com.mx/sites/competencia-en-tarjetas-de-credito/.

Ganti V., Gehrke J.E., & Ramakrishnan. (1999). CACTUS- clustering categorical data using summaries. In Proc. 1999 Int. Conf. Knowledge Discovery and Data Mining (KDD’99), pages 73-83, San Diego, CA.

Gemalto (2012). Líder mundial en seguridad digital. Acerca de Gemalto. Retrived 2012/04/16. From: http://www.gemalto.com/latam/acerca/

Gennari J., Langley P., & Fisher D. (1989). Models of incremental concept formation. Artificial Intelligence, 40:11-61.

Guha S., Rastogi R., & Shim K. (June 1998). Cure: An efficient clustering algorithm for large databases. In Proc. 1998 ACM-SIGMOD Int. Conf. Management of Data (SIGMOD’98), pages 73-84, Seatle, WA.

58

http://www.forbes.com.mx/sites/competencia-en-tarjetas-de-credito/

http://www.gemalto.com/latam/acerca/

Guha S., Rastogi R., & Shim K. (Mar, 1999). ROCK: A robust clustering algorithm for categorical attributes. In Proc. 1999 Int. Conf. Data Engineering (ICDE’99), pages 512-521, Sydney, Australia.

Han, J. & Kamber, M. (2006). Data Mining Concepts and Techniques. (2th ed.). Editorial Morgan Kaufmann.

Hartigan, J.A. (1975). Clustering Algorithms. John Wile & Sons.

Hawking, S.W. (2003). A Hombros de Gigantes: Las Grandes Obras de la Física Y La Astronomía: Critica (Grijalbo Mondadori).

Hernández Zamora, G. (2004). Pobres pero leídos: La familia (marginada) y la lectura en México. [Electronic Version]. La Hoja Volandera. Retrieved 2007 / 09 / 14 from: http://www.lahojavolandera.com.mx/PROFESORES/pobres_pero_leidos.pdf.

Hinton F. E. & Sejnowski T.J.(eds.) (1999). Unsupervised Learning: Foundation of Neutral Network Computation. MIT Press.

Hinneburg A. & Kein D.A. (Aug. 1998). Am efficient approach to clustering in large multimedia databases with noise. In Proc 1998 Int. Conf. Knowledge Discovery and Data Mining (KDD’98), pages 58-65, New York, NY.

Hoppner, F., & Klawonn F. (1999). Fuzzy Cluster Analysis: Methods for Classification, Data Analysis and Image Recognition. Chicester, UK: John Wiley and Sons Ltd.

International Organization for Standarization. (1976). International Standard ISO 214 Documentation – Abstracts for publications and documentation. Switzerland.

Jain A.K. & Dubes R.C. (1988). Algorithms for Clustering Data. Pretice Hall.

Jain A.K., Murty M.N., & Flynn P.J. (1999). Data clustering: A survey. ACM Comput. Surv., 31:264 – 323.

Kaufman L., & Rousseeuw P.J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. John Wiley & Son.

Karypis, G., Han E.-H., & Kumar V. (1999). CHAMELEON: A hierarchical clusterin algorithm using dynamic modeling. COMPUTER, 32:68-75.

Kohonen T., Kaski S., Lagus K., Solojärvi, Paatero A., & Saarela A. (2000). Self-organization of massive document collection. IEEE Trans. Neutral Networks, 11:574-585.

Krishnapuram, R., & J. A. Keller. (1998). “Possibilistic Approach to Clustering,” IEEE-Transactions of Fuzzy System, vol. 1, pp. 98-110.

Kuhn, T.S. (1987). La tensión esencial: estudios selectos sobre la tradición y el cambio en el ámbito de la ciencia. México: CONACYT, Fondo de Cultura Económica.

Kuhn, T.S. (1992). La estructura de las revoluciones científicas (2 ed.). México: Fondo de Cultura Económica.

Kuhn, T.S. (2002). Qué son las revoluciones científicas y otros ensayos. Barcelona I.C.E. de la Universidad Autónoma de Barcelona: Ediciones Paidós.

59

http://www.lahojavolandera.com.mx/PROFESORES/pobres_pero_leidos.pdf

Kurose, J. (2004, 08/27/2007). Writing a good introduction. Retrieved sep 01, from : http://www.cs.columbia.edu/~hgs/etc/intro-style.html.

Lauritzen S. L. (1995). The EM algorithm for graphical association models with missing data. Computational Statistic and Data Analysis, 19:191-201.

Lee, Y-J. (1994) “An Automated Knowledge Extraction System,” Ph.D. thesis, Computer Science Department, University of Minnesota Minneapolis.

Lloyd S.P. (1982). Least Squares Quantization in PCM. IEEE Trans. Information Theory, 28:128-137, (original version: Technical Report, Bell Labs, 1957).

MacQueen J. Some methods for classification and analysis of multivariate observations. Proc 5th Berkeley Symp. Math. Starist. Prob., 1:281-297, 1967.

Matthews, J. R., Bowen, J. M., & Matthews, R. W. (2000). Succsefull scientific writing. A step-by-step guide for the biological and medical sciences. (2 ed.). Cambridge: Cambridge University Press.

Mendez, F. (2010). Adopción de las tarjetas con chip en América Latina. Portafolio.co. Retrieved 2010/12/28. From: http://www.portafolio.co/opinion/tarjetas-chip-america-latina.

Michalski R. S. and Stepp R. E. (1983). Learning from observation: Conceptual clustering. In R. S. Michalski, J. G. Carbonell, and T. M. Mitchell, editors, Machine Learning: An Artificial Intelligence Approach (Vol. 1). Morgan Kaufmann.

MicroStrategy Incorporated (2009). Giesecke & Devrient de México (G&D) empresa líder proveedora de tarjetas con chip y SIM adquirió el BI de MicroStrategy. From: http://www.microstrategy.com.mx/about-us/press/release/?ctry=105&id=1894.

Muñoz Negron, David F. (2009). Administración de operaciones, enfoque de administración de procesos de negocios. (1ª ed.). Editorial Cengage Learning.

Ng R. & Han J. (Sept. 1994). Efficient and effective clustering meted for spatial data mining. In Proc. 1994 Int. Conf. Very Large Data Bases (VLDB’94), pages 14-155, Santiago, Chile.

Parsons L., Haque R., & Liu H. (2004). Subspace clustering for high dimensional data: A review. SIGKDD Explorations, 6;90-105.

Petersen, C.C. & Brandt, J.C. (1995). Hubble vision: astronomy with the Hubble Space Telescope. Cambridge; New York: Cambridge University Press.

Phillips, E. M., & Pugh, D. S. (2001). Cómo obtener un doctorado. Manual para estudiantes y tutores. Barcelona: Gedisa.

Por redacción portafolio.com (2010). La migración hacia las tarjetas inteligentes en América Latina. Portafolio.com. Retrieved 2010/11/17. From: http://www.portafolio.co/la-migracion-las-tarjetas-inteligentes-america-lati.

Render, Barry y Heizer, Jay (1996). Principios de Administración de operaciones. (1ª ed.). Editorial Pearson Educación.

60

http://www.cs.columbia.edu/%1f~hgs/etc/intro-style.html

http://www.portafolio.co/opinion/tarjetas-chip-america-latina

http://www.microstrategy.com.mx/about-us/press/release/?ctry=105&id=1894

http://www.portafolio.co/la-migracion-las-tarjetas-inteligentes-america-lati

http://www.portafolio.co/la-migracion-las-tarjetas-inteligentes-america-lati

Rymelhart D. E., & Zipser D. (1985). Feature discovery by competitive learning. Cognitive Science, 9:75-112.

Sato, M., Y. Sato, & L. C. Jain. (1966). Fuzzy Clustering Models and Applications. Heidelberg: Physica-Verlag.

Shavlik J. W., & Dietterich T. G. (1990). Readings in Machine Learning. Morgan Kaufmann.

Sheikholeslami, Chatterjee S., & Zhang A. (Aug. 1998). WaveCluster: A multi-resolution clustering approach for very large spatial databases. In Proc. 1998 Int. Conf. Very Large Data Bases (VLDB’98), pages 428-439, New York, NY.

Shoaff, W. D. (2001 2001-08-21). How to write a Master’s Thesis in Computer Science. Retrieved 20 ago, 2007, from: http://www.cs.fit.edu/~wds/guides/howto/howto.html#SECTION00050000000000000000.

Struck, W. (2006). The elements of style. Mineola, NY: Dover Publications.

Vargas M. (Febrero 2000). Un mundo sin novelas. Madrid, Esp.

Wang W., Yang J., & Muntz R. (Aug. 1997). STING: A statistical information grid approach to spatial data mining. In Proc. 1997 Int. Conf. Very Large Data Bases (VLDB’97), pages 186-195, Athens, Greece.

Weissberg, R., & Buker, S. (1990). Writing up research: experimental research report writing for students of English. Englewood Cliffs, NJ: Prentice Hall Regents.

Wilkinson, A. M. (1991). The scientist´s handbook for writing papers and dissertations. Englewood Cliffs, N.J. Prentice Hall.

Witten, I. & Frank, E. (2005). Data mining, Practical machine learning tool and techniques. (2th ed.). Editorial Morgan Kaufmann.

Yager, R., & L. Zadeh (eds.). (1992). An Introduction to Fuzzy Logic Applications in Intelligent Systems. Boston: Kluwer Academic Publishers.

Zhang T., Ramakrishnan R., & Livny M. (June 1996). BIRCH: an efficient data clustering method for very large databases. In Proc. 1996 ACM-SIGMOD Int. Conf. Management of Data (SIGNOD’96), pages 103-114, Montreal, Canada.

Ziman, J. M. (1980). El conocimiento Público: Un ensayo sobre la Dimensión Social de la Ciencia. México, D.F. Fondo de Cultura Económica

61

http://www.cs.fit.edu/~wds/guides/howto/howto.html#SECTION00050000000000000000

Documents

MÉXICO. DF MARZO, 2015 - 148.204.210.201148.204.210.201/tesis/1436973336129TESISFINALFIN.pdf · T E S I S QUE PARA OBTENER EL GRADO DE MAESTRO EN INGENIERIA ... Pareto de la producción