Story Transcript
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
EL DIAGRAMA DE PARETO REDISEÑADO
MAYRA ANGÉLICA PACHECO MEJÍA
PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE INGENIERÍA INGENIERÍA INDUSTRIAL BOGOTÁ 2013
1
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
EL DIAGRAMA DE PARETO REDISEÑADO
Autor: MAYRA ANGÉLICA PACHECO MEJÍA
Trabajo de Grado para optar por el título de Ingeniero Industrial
Director: Ingeniero Jorge Andrés Alvarado Valencia .
PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE INGENIERÍA INGENIERÍA INDUSTRIAL BOGOTÁ 2013 2
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
CONTENIDO
1.
INTRODUCCIÓN ............................................................................................................... 10
2.
OBJETIVOS ....................................................................................................................... 11 2.1 OBJETIVO GENERAL ..................................................................................................... 11 2.2 OBJETIVOS ESPECÍFICOS ............................................................................................ 11
3. PLANTEAMIENTO DEL PROBLEMA .................................................................................... 12 4. JUSTIFICACIÓN DEL PROYECTO ....................................................................................... 17 5. MARCO TEÓRICO ................................................................................................................ 18 5.1.1 Distribuciones Power Law y Zipf’s Law ......................................................................... 18 5.1.2
La distribución lognormal ......................................................................................... 19
5.1.3 Distribución Multinomial ................................................................................................ 20 5.3
Métodos para identificar que una muestra sigue la regla de los pocos vitales ............. 22
5.3.3. Entropía ....................................................................................................................... 24 5.3.4. Índice de Gini ............................................................................................................... 25 5.3.5 Regla 80-20 .................................................................................................................. 26 5.3.6 Gráficos P-P ................................................................................................................. 26 5.3.7 Bondad de Ajuste.......................................................................................................... 26 5.4 Regresión Logística ......................................................................................................... 26 5.5 Métricas de la calidad de una predicción ......................................................................... 28 5.5.1 Curva Cor ..................................................................................................................... 28 5. 5.2 RMSE .......................................................................................................................... 29 5.6 Métodos para identificar el punto de corte en un diagrama de Pareto .............................. 29 5.6.1 Cómo establecer el punto de corte en un diagrama de Pareto según el profesor de ingeniería industrial Carlos Navarrete. ................................................................................... 29 3
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
5.6.2 Análisis Estadístico de los diagramas de Pareto .......................................................... 30 5.7 Patrones EBC (Entity-Control-Boundary) ......................................................................... 30 5.7.1 Elementos Entidad ........................................................................................................ 31 5.7.2 Elementos de Control.................................................................................................... 31 5.7.3 Elementos de Frontera.................................................................................................. 31 6. EVALUACIÓN DE REGLAS CANDIDATAS .......................................................................... 32 6.1 CONJUNTO DE CRITERIOS MÍNIMOS PARA SABER SI UNA REGLA ES SUSCEPTIBLE DE SER USADA. .......................................................................................... 32 6.2 EVALUACIÓN DE LAS REGLAS CANDIDATAS PARA PARETIZACIÓN ...................... 33 6.3 REGLAS CANDIDATAS PARA DEFINIR PUNTO DE CORTE ........................................ 35 6.3.1 Regla de corte según cambio de la pendiente en la curva del diagrama ...................... 35 6.3.2 Regla de Corte 80-20 basada en la frecuencia acumulada de las causas .................... 37 6.3.3 Regla de Corte 80-20 basada en el número de causas................................................. 37 7. LA SIMULACIÓN ................................................................................................................... 38 7.1. Desarrollo de la simulación de los modelos generativos ................................................ 39 7.1.1 Parámetros de la simulación ......................................................................................... 39 7.2 Diseño experimental de la simulación .............................................................................. 44 7.2.1 Objetivos del estudio ..................................................................................................... 44 7.2.2. Factores ....................................................................................................................... 44 7.2.3 Réplicas ........................................................................................................................ 46 7.3 DATOS TÉCNICOS DE LA SIMULACIÓN ....................................................................... 48 8. ANÁLISIS DE LOS DATOS ................................................................................................... 49 8.1 RESULTADOS REGLAS DE PARETIZACIÓN ................................................................ 49 8.1.1 Regla de Oro ................................................................................................................ 49 8.1.2 Regresión Logística Binaria .......................................................................................... 50 8.1.3 Análisis de la Curva Cor ............................................................................................... 52
4
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
8.1.4 Punto de corte según el análisis de la Curva Cor .......................................................... 53 8.1.5 Índice de Gini aplicado a Casos Reales ........................................................................ 55 8.2 RESULTADOS TAMAÑO DE MUESTRA ........................................................................ 56 8.2.1 ANOVA ......................................................................................................................... 56 8.2.2 Prueba DHS de Tukey para el número de categorías ................................................... 57 8.2.3 Prueba DHS de Tukey para la relación número de elementos-número de categorías .. 58 8.2.4 Análisis de Curva Cor ................................................................................................... 60 8.3 RESULTADOS PUNTO DE CORTE ................................................................................ 61 8.3.1 Regla de Oro ................................................................................................................ 61 8.3.2 Porcentaje de Aciertos de las Reglas............................................................................ 61 8.3.3
RMSE ...................................................................................................................... 61
9. DESARROLLO DE APLICACIÓN DE SOFTWARE ............................................................... 64 9.2. Diseño del sistema.......................................................................................................... 65 9.2.1. Representación Arquitectural ....................................................................................... 65 9.2.1.1. Vista lógica: .............................................................................................................. 65 9.2.1.2 Vista de proceso ....................................................................................................... 66 9.2.1.3 Vista de implementación .......................................................................................... 67 9.2.1.4 Vista de despliegue .................................................................................................. 68 9.2.1.5 Vista de casos de uso ................................................................................................ 69 9.3 Implementación del sistema ............................................................................................. 71 9.4 Pruebas del sistema: verificación y validación. ................................................................ 71 9.4.1 Escenario 1: el conjunto de datos sí es paretizable y la relación número total de elementos- número de categorías cumple con los requisitos de estar entre 2 y 4. ................. 72 9.4.2 Escenario 2: el conjunto de datos sí es paretizable y la relación número total de elementos- número de categorías no cumple con los requisitos de estar entre 2 y 4. ............ 72 9.4.3 Escenario 3: el conjunto de datos no es paretizable. .................................................... 73 9.5 Documentación del sistema (implementación y manuales de uso). ................................. 73 5
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
10. CONCLUSIONES ................................................................................................................ 74 ANEXOS ................................................................................................................................... 76 ANEXO A: Diagrama Entidad Relación Base de Datos Objetivos 1 y 2 ..................................... 77 ANEXO B: Diagrama Entidad Relación Base de Datos Objetivo 3 ............................................ 78 ANEXO C: Caso Real 1: Destinatarios Correos Electrónicos de una Persona .......................... 79 ANEXO D: Caso Real 2: Número de Trabajos de Grado dirigidos en los años 2010, 2011 y 2012 en la carrera de Ingeniería Industrial ......................................................................................... 80 ANEXO E: Caso Real 3: Número de Trabajos de Grado Evaluados en los años 2010, 2011 y 2012 en la carrera de Ingeniería Industrial ................................................................................ 86 ANEXO F: Conjunto de datos sí paretizable y relación número total de elementos- número de categorías que sí cumple con los requisitos de estar entre 2 y 4. .............................................. 91 ANEXO G: Conjunto de datos sí paretizable y relación número total de elementos- número de categorías que no cumple con los requisitos de estar entre 2 y 4. ............................................ 93 ANEXO H: Conjunto de datos no paretizable. ........................................................................... 96 REFERENCIAS ......................................................................................................................... 97
6
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
LISTA DE TABLAS Tabla 1- Contraste entre métodos para llevar a cabo el Diagrama de Pareto ............................ 14 Tabla 2- Parámetros generales de estudio de las distribuciones ............................................... 22 Tabla 3- CCDF de las
muestras
de las distribuciones
Lognormal
y
Pareto con
comportamiento de la cola similar. ............................................................................................ 23 Tabla 4- Límites de Control basados en entropía ...................................................................... 24 Tabla 5- Listado de Criterios que debe cumplir una regla de paretización: propiedades de los algoritmos.................................................................................................................................. 33 Tabla 6- Evaluación de los criterios en las posibles reglas de paretización ............................... 34 Tabla 7- Datos ejemplo punto de corte ...................................................................................... 35 Tabla 8- Parámetros simulación multinomial ............................................................................. 39 Tabla 9- Parámetros simulación normal .................................................................................... 41 Tabla 10-Parámetros simulación lognormal............................................................................... 42 Tabla 11- Parámetros simulación Preferential attachment......................................................... 43 Tabla 12- Descripción de factores simulación multinomial ......................................................... 45 Tabla 13- Descripción de factores simulación normal ................................................................ 45 Tabla 14- Descripción de factores simulación lognormal ........................................................... 46 Tabla 15- Descripción de factores simulación Preferential attachment ...................................... 46 Tabla 16- Réplicas simulación multinomial ................................................................................ 47 Tabla 17- Tabla 15- Réplicas simulación normal ....................................................................... 47 Tabla 18- Réplicas simulación lognormal .................................................................................. 47 Tabla 19- Réplicas simulación Preferential attachment ............................................................. 48 Tabla 20- Réplicas simulación multinomial ................................................................................ 48 Tabla 21- Reglas de Oro paretización para cada distribución .................................................... 49 Tabla 22- Variables en la ecuación resultado de la regresión para el parámetro Alpha ............. 51 Tabla 23- Variables en la ecuación de la regresión para el índice de Gini ................................. 51 Tabla 24- Variables en la ecuación de la regresión para la entropía.......................................... 51 Tabla 25- Áreas bajo la Curva Cor reglas de paretización ......................................................... 53 Tabla 26- ANOVA para el índice de Gini ................................................................................... 57 Tabla 27- DHS de Tukey para el número de categorías ............................................................ 58
7
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Tabla 28- Prueba DHS de Tukey para la relación número de elementos-número de categorías .................................................................................................................................................. 59 Tabla 29- Porcentaje de aciertos reglas punto de corte ............................................................. 61 Tabla 30- RMSE reglas punto de corte...................................................................................... 62 Tabla 31- Prueba de Proporciones para las Reglas 1y 2 ........................................................... 62 Tabla 32- Prueba de Proporciones para las Reglas 1 y 3 .......................................................... 62 Tabla 33- Prueba de Proporciones para las Reglas 2 y 3 .......................................................... 63 Tabla 34- Especificación de requerimientos de la aplicación .................................................... 65 Tabla 35- Vista de casos de uso ............................................................................................... 71 Tabla 36- Prueba 1 aplicación "El Diagrama de Pareto Rediseñado ......................................... 72 Tabla 37- Prueba 2 aplicación "El Diagrama de Pareto Rediseñado ......................................... 73 Tabla 38- Prueba 3 aplicación "El Diagrama de Pareto Rediseñado ......................................... 73
8
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
LISTA DE ILUSTRACIONES
Ilustración 1- Funciones de densidad de probabilidad para diferentes α con xm = 1 (Wikipedia, 2012) ......................................................................................................................................... 14 Ilustración 2-Diagrama de Pareto diferenciado y diagrama de Pareto casi uniforme (GrosfeldNir, Ronen, & Kozlovsky, 2007) ................................................................................................. 15 Ilustración 3- Límites de control basados en entropía ................................................................ 25 Ilustración 4- Tabla de contingencia resultado de un análisis Cor ............................................. 29 Ilustración 5- Diagrama de barras ejemplo punto de corte ......................................................... 36 Ilustración 6- Línea de pendiente ejemplo punto de corte.......................................................... 36 Ilustración 7- Ejemplo inserción parámetros simulación multinomial.......................................... 40 Ilustración 8- Ejemplo inserción parámetros simulación normal................................................. 41 Ilustración 9- Ejemplo inserción parámetros simulación lognormal ............................................ 42 Ilustración 10- Ilustración 8- Ejemplo inserción parámetros simulación Preferential Attachment 43 Ilustración 11- Visualización Excel Base de Datos con la regla de oro ...................................... 50 Ilustración 12- Curva Cor para las tres reglas candidatas.......................................................... 52 Ilustración 13- Coordenadas de la Curva Cor con el punto de corte .......................................... 54 Ilustración 14- Diagrama de caja área bajo la Curva Cor del índice de Gini .............................. 59 Ilustración 15-Áreas bajo la Curva Cor ...................................................................................... 60 Ilustración 16- Overview de la vista lógica de la aplicación ........................................................ 66 Ilustración 17- Diagrama EBC de la vista lógica ........................................................................ 66 Ilustración 18- Diagrama de componentes UML vista de proceso ............................................. 67 Ilustración 19- Diagrama de componentes UML vista de implementación ................................. 68 Ilustración 20- Diagrama de componentes UML vista de despliegue ......................................... 68
9
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
1. INTRODUCCIÓN El Principio de los Pocos Vitales y los Muchos Triviales, más conocido como Principio de Pareto, representa una herramienta importante dentro de la ingeniería industrial, puesto que permite determinar prioridades de acción en las compañías donde el uso eficiente de los escasos recursos resulta de suma importancia. Dada la naturaleza empírica de este principio, existen actualmente varias metodologías para la elaboración y el análisis del diagrama de Pareto, pero no hay una estandarización de esta herramienta. Este hecho es lamentable, dado el uso extensivo que muchas profesiones, incluyendo la Ingeniería Industrial, hacen de esta herramienta. El presente trabajo de grado se realizó con base en tres enfoques que permitieran dar solución al problema de la no estandarización del diagrama de Pareto. El primero consistió en dar respuesta a si determinado problema es susceptible de ser paretizable o no, para poder continuar con los pasos siguientes de elaboración del diagrama; para ello se realizó una simulación en la que se contrastaron diferentes distribuciones de probabilidad con el objetivo de analizar bajo qué conjunto de situaciones y con qué combinación de parámetros daban origen a problemas paretizables. Una vez se determinó correctamente si un problema que está siendo estudiado es paretizable o no, el estudio se enfocó en analizar diversos tamaños de muestra, según el número de causas de un problema para garantizar la realización de un diagrama de Pareto adecuado. Con base en la simulación descrita en el punto anterior se estudió la susceptibilidad y las variaciones que tenían lugar en los resultados cuando el número de causas y el tamaño de muestra se modificaban. En tercer lugar, se evaluaron diversas reglas para determinar el punto de corte de un diagrama de Pareto para detectar la más acertada. Esto se realizó con el estudio de los resultados de la simulación descrita anteriormente, pero únicamente para casos paretizables.
Finalmente, como última instancia de este trabajo, se implementaron los resultados obtenidos durante todo el desarrollo en una aplicación cuya principal funcionalidad fuese la obtención de diagramas de Pareto que cumplieran con las reglas acá estudiadas.
10
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
2. OBJETIVOS 2.1 OBJETIVO GENERAL Elaborar una propuesta que contenga el rediseño formal de la metodología de aplicación del principio de los Pocos Vitales y los Muchos Triviales con base en los avances que existen actualmente en distribuciones Power Law y Zipf’s Laws.
2.2 OBJETIVOS ESPECÍFICOS 1. Proponer una solución en forma de regla basada en la calidad relativa de diferentes criterios factibles que permita determinar si un problema en el que se desea priorizar es paretizable o no. 2. Determinar un tamaño de muestra adecuado, según el número de causas de un problema, que garantice la realización de un diagrama de Pareto adecuado. 3. Proponer una solución en forma de regla que esté basada en la calidad relativa de diferentes criterios para determinar el punto de corte del diagrama de Pareto. 4. Automatizar el uso de las reglas determinadas en los puntos anteriores en el proceso de elaboración de un diagrama de Pareto.
11
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
3. PLANTEAMIENTO DEL PROBLEMA Existe una amplia variedad de fenómenos en las ciencias exactas, naturales y sociales que siguen distribuciones Power Law. Se dice que una variable aleatoria X no negativa tiene una distribución Power Law si: -α
P [X ≥ x] ≈ cx
Ecuación 1
Donde c, α ≥ 0. En este tipo de distribuciones las colas caen de acuerdo al índice α, lo que genera que éstas sean más pesadas en comparación con las de otros modelos más comunes tales como la distribución exponencial. En algunos contextos y dependiendo del área de estudio, las Power Law son conocidas también como Distribuciones de Pareto, Heavy-Tailed Distributions (Distribuciones de cola pesada) o Zipf Laws. A finales del siglo XIX y principios del siglo XX varios autores realizaron trabajos e investigaciones sobre las distribuciones Power Law en diferentes contextos y diversas disciplinas. Uno de los más reconocidos descubrimientos sobre las distribuciones Power Law se le atribuye a George Kingsley Zipf (1902-1950), un lingüista que observó en su estudio acerca de la frecuencia de la aparición de palabras en un texto, que se dio a conocer con el nombre de Zipf’s law (Zipf, 1932). Sin embargo, veinte años antes, el economista italiano Vilfredo Pareto (1848–1923) había intentado explicar la forma cómo se distribuían los ingresos entre los habitantes de un país, lo que proporcionó como resultado la Distribución de Pareto que básicamente es una Power Law. Tal fenómeno, que Pareto había descubierto en la distribución de la riqueza, fue identificado por el experto en calidad Joseph Juran (1904-2008) como un principio universal, aplicable a muchos campos. Por ello, en el año 1950 estableció y formuló de forma empírica el Principio de Pareto (Jurán, 1951), un poderoso criterio para la toma de decisiones que se ha utilizado principalmente en áreas como control de calidad, producción, criptoanálisis, ingeniería industrial, administración pública, gestión de la investigación, entre otras. El principio, también conocido como La Regla del 80-20, establece que la mayor parte de los problemas (80%) son el resultado de unos pocos fenómenos o fuentes (20%), por lo tanto para obtener mayores beneficios en la búsqueda de la calidad y la productividad hay que centrarse en trabajar en ese 80%. Años después de su formulación y dado que el principio fue una observación empírica, Juran reconoció que éste no debía llevar el nombre de Principio de Pareto sino Principio de los Pocos Vitales y los Muchos Triviales y la aplicó inicialmente al control de la calidad, señalando que con mucha frecuencia, la mayoría de los defectos y el costo que generan se deben a unas pocas causas. Dada la naturaleza empírica del principio de Pareto, existen actualmente varias metodologías para la elaboración y el análisis de dicho diagrama. Por ejemplo Hitoshi Kume, conocido 12
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
experto en calidad, propone la siguiente forma para elaborar diagramas de Pareto (Kume, 1992):
Paso1: Decidir qué problemas va a investigar y cómo recoger los datos Paso 2: Diseñar una tabla para conteo de datos, con espacio suficiente para registrar totales. Paso 3: Diligenciar la tabla y calcular los totales. Paso 4: Elaborar una tabla de datos para el diagrama con la lista de ítems, los totales individuales, los totales acumulados, la composición porcentual y los porcentajes acumulados. Paso 5: Organizar los ítems por orden de cantidad. Paso 6: Dibujar dos ejes verticales y uno horizontal. Paso 7: Construir un diagrama de barras. Paso 8: Dibujar la curva acumulada (curva de Pareto). Marcar los valores acumulados en la parte superior y conectar los puntos con una línea. Paso 9 (final): Escribir en el diagrama cualquier información necesaria.
Después del noveno paso no existe ninguna otra instrucción ni explicación alguna. Por lo tanto no se describe ninguna técnica sobre cómo escoger las causas acerca de las que se va a trabajar ni cómo interpretar correctamente el diagrama. Para visualizar más a fondo esta situación, se presenta a continuación, una tabla comparativa en la que se llevó a cabo un contraste sobre las instrucciones para realizar el diagrama de Pareto, tomadas de libros de tres importantes autores en materia de ingeniería industrial, más específicamente de gestión de calidad.
LIBROS
Control Estadístico Calidad (Carot, 1998) Vicente Carot Alonso
de
Estadística industrial Administración y moderna diseño y control la Control de la Calidad de la calidad y la (Evans, 2008). confiabilidad (Kenett). Ron S. Kenett
¿Cómo se debe elaborar el diagrama de Pareto? 1. Definir el tipo de problema que Cuando se reúnen se va a investigar. observaciones y se en distintas 2. Definir el método y el período clasifican categorías de acuerdo con de recolección de los datos.
James R. Evans,William M. Lindsay Un diagrama de Pareto es un histograma de los datos ordenados de la frecuencia mayor a la
13
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
3. Construir una tabla de conteo criterios válidos y claros se menor. de datos. puede trazar un Diagrama 4. Construir el diagrama: gráfico de Pareto de barras y una curva acumulada. El diagrama pondrá de manifiesto la desigual distribución de la frecuencia entre las clases establecidas en el eje de abscisas. Tabla 1- Contraste entre métodos para llevar a cabo el Diagrama de Pareto
En el primer libro se especifican los pasos de elaboración, en los otros dos solo se define qué es el diagrama y su utilidad y luego, en los tres, se muestra un ejemplo ya elaborado. Ninguno de los autores habla de cómo se van a escoger o cómo se deberían agrupar las causas y tampoco existe una instrucción clara de en dónde se debe hacer el corte en el diagrama. Esto es otro ejemplo de la baja estandarización y definición del Principio de los Pocos Vitales y los Muchos Triviales. Se muestra a continuación la figura 1 con la función de densidad de la Distribución de Pareto para diferentes valores del índice α: ( )
{
Ecuación 2
Donde xm es el valor mínimo posible y α es un parámetro positivo.
Ilustración 1- Funciones de densidad de probabilidad para diferentes α con xm = 1 (Wikipedia, 2012)
De la gráfica anterior se observa que al variar los parámetros, cambia considerablemente el diagrama obtenido. Por lo tanto, al elaborar un diagrama de Pareto sí se debe prestar atención 14
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
en la forma en cómo se escogen las causas y en la forma en cómo éstas se agrupan, y en general en la forma en cómo se va a trabajar el problema; ya que, así se trate de la misma situación, los resultados van a ser diferentes y, por lo tanto, también el análisis. Dada su importancia como herramienta para establecer prioridades en la ingeniería industrial resulta inconveniente que no exista un principio y un proceso unificado para el uso del mismo, lo que puede generar elaboración e interpretaciones erróneas al usar este diagrama. Tres de los puntos más importantes que no están estandarizados para el correcto uso esta herramienta son: No existe una forma clara para determinar si un problema es paretizable o no: se usa el diagrama sin saber si se trata de un problema que es susceptible de abordar mediante un diagrama del Principio de los Pocos Vitales y los Muchos Triviales; por tanto, puede haber un abuso de esta regla (Grosfeld, 2007). En este sentido, un gerente que esté observando un diagrama de Pareto puede preguntarse qué tanta es la utilidad de este diagrama para guiarlo en cómo se va a concentrar en un pequeño número de atributos que son una fuente importante de problemas. Por ejemplo, la figura 2 describe una situación en la que, intuitivamente, sería conveniente centrarse en los tres primeros atributos (20%). En contraste, la figura 3 muestra una realidad donde el diagrama de Pareto es casi uniforme y, por lo tanto, el principio de Pareto no debe ser utilizado. En este aspecto ya se han realizado algunos estudios que se encuentran en publicaciones científicas, dos de interés en este trabajo son: The Pareto Principle: Its Use And Abuse (Sanders, 1987) donde se habla acerca de cómo, en muchas ocasiones, se da un mal uso a esta herramienta ya que se discute la importancia de la Regla de 80/20 y se examina la importancia de la norma aplicada al control estadístico de la calidad y las aplicaciones potenciales en la comercialización. Aquí se concluye que, si bien la Regla de 80/20 es una guía valiosa, es obviamente limitada ya que las circunstancias están en constante evolución. La segunda es The Pareto managerial principle: when does it apply? (Grosfeld, 2007) donde se explica que, a veces, un diagrama de Pareto es menos informativo de lo que podría ser, ya que la frecuencia relativa es casi uniforme en el gráfico. El objetivo del estudio es proporcionar una herramienta de análisis (índice) basado en la entropía.
Ilustración 2-Diagrama de Pareto diferenciado y diagrama de Pareto casi uniforme (Grosfeld-Nir, Ronen, & Kozlovsky, 2007)
15
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
No hay un criterio para escoger las causas con las que se va a realizar el análisis y cómo se deben agrupar o si se deben agrupar las mismas. Cabe señalar aquí que, en la creación de un diagrama de Pareto, la clasificación es generalmente una simple acción de recolección de información. Sin embargo, como de la selección de los atributos que son candidatos a las medidas correctivas dependen los resultados presentados en el diagrama de Pareto, el esfuerzo de recopilación de información necesita atención ya que los errores en la clasificación pueden dar lugar a medidas de corrección irrelevantes. Más específicamente, si se va a realizar un análisis de Pareto, se puede dar el caso de que se tenga una cantidad grande de causas y muy pocos datos para realizar el análisis, lo que traería como resultado un diagrama y un análisis de la situación incorrectos; al igual que si se posee un número extenso de datos y sólo unas pocas causas. Por eso resulta necesario identificar el número adecuado de datos con respecto a la cantidad de causas identificadas en el problema a tratar.
No existe una forma estándar para determinar, después de elaborado el diagrama, cuáles son las causas sobre las que realmente se debe trabajar (los pocos vitales). Existen algunas técnicas empíricas aplicadas por profesores, una de las cuales se explicará en el marco teórico. Dicho de otro modo, no está claro analíticamente cuál debe ser el punto de corte en la línea de frecuencia acumulada que se obtiene al realizar el diagrama. Por ejemplo, en la figura 2, donde se presenta un típico diagrama de Pareto si el 80% de la frecuencia estuviese, aproximadamente originado por las cuatro primeras causas, no se tendría plena certeza de si allí se debería hacerse el corte. Podría alguien, a criterio personal, decidir trabajar únicamente en las tres primeras causas o sólo en la primera, dado que no se utilizó una herramienta de tipo matemática para establecer dónde debería hacerse el corte.
16
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
4. JUSTIFICACIÓN DEL PROYECTO El Principio de los Pocos Vitales y los Muchos Triviales representa una herramienta importante dentro de la ingeniería industrial para efectuar mejoras. En general, el diagrama puede ser usado dentro de esta disciplina (Carot, 1998): Como herramienta para realizar priorizaciones, por ejemplo, priorizar productos dentro de una cadena de abastecimiento, problemas a ser atacados, entre otros. Como técnica de análisis de problemas de calidad pero también de los problemas de la más diversa naturaleza: causas de defectos en procesos de manufactura, causas del absentismo laboral, causas de accidentes, causas en las paradas de las máquinas, etc. Todos estos son también problemas que pueden ser abordados desde la perspectiva del Principio de Pareto. Para marcar objetivos concretos: se deben obtener mejoras teniendo en cuenta que se dispone de recursos materiales y humanos limitados. Para evaluar los efectos de las mejoras. Dada la naturaleza empírica de este principio, existen actualmente varias metodologías para la elaboración y el análisis del diagrama de Pareto, pero no hay una estandarización de esta herramienta, como se observa en el planteamiento del problema. Por ello, el impacto que puede tener la estandarización del Principio de los Pocos Vitales y los Muchos Triviales resulta importante porque llevaría a un correcto uso de esta herramienta en diferentes áreas del conocimiento, por lo que se pretende generalizar y perfeccionar esta metodología para que deje de ser solo un principio empírico y sus conclusiones adquieran mayor validez. Finalmente, cabe resaltar que es importante generar avances en esta herramienta, dado que existe una indiscutible relación histórica y matemática entre este diagrama y las distribuciones Power Law, sobre las cuales sí se ha realizado un amplio estudio reciente y se ha demostrado su importancia. Esto se puede ver en trabajos como Zipf’s law unzipped (Baek, 2011) que serán definidos en el marco teórico y usados para los fines de este trabajo. Una refinación del Principio de los pocos vitales y los muchos triviales generaría un impacto en la toma de decisiones empresariales, en todos los niveles de la organización.
17
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
5. MARCO TEÓRICO
5.1 DISTRIBUCIONES DE PROBABILIDAD 5.1.1 Distribuciones Power Law y Zipf’s Law (Mitzenmacher, 2004) Cuando la probabilidad de medir un valor particular de cierta cantidad varía inversamente como una potencia de ese valor, se dice que dicha cantidad sigue una distribución Power Law, la cual, para el caso discreto es también conocida como Zipf’s Law o distribución de Pareto. Las distribuciones Power Law aparecen frecuentemente en física, biología, ciencias de la tierra, economía, finanzas, ciencias de la computación y ciencias sociales. Es por eso que la distribución del tamaño de las ciudades, los terremotos, los cráteres lunares, las guerras y la fortuna personal de los individuos resultan ser todos, un conjunto de fenómenos que siguen esta distribución. (Newman, 2005)
Una variable aleatoria X no negativa tiene una distribución Power Law si: P [X ≥ x] ≈ cx-α
Ecuación 3
Para c, α ≥ 0. Aquí, f(x) ≈ g(x) representa que el límite de la proporción tiende a 1 cuando x aumenta de tamaño. En términos generales, en una Power Law las colas bajan asintóticamente de acuerdo al índice α. Esta distribución da lugar a colas mucho más pesadas que otros modelos comunes, tales como la distribución exponencial. Una distribución Power Law de uso específico, es la distribución de Pareto, que satisface P [X ≥ x] = ( )
Ecuación 4
Para k, α > 0. La distribución de Pareto requiere X ≥ k. La función de densidad para la distribución de Pareto es f(x) = . Para una distribución Power Law, α usualmente se encuentra en el rango 0< α0,9) no se configura perfectamente una Power Law (Mitzenmacher, 2004), por lo que se escogió este punto para determinar la posibilidad de priorización. En la base de datos se creó una nueva columna que, según los criterios anteriores, señalaba si cada réplica era paretizable o no según la Regla de Oro así: 1: Sí es paretizable 0: No es paretizable
Ilustración 11- Visualización Excel Base de Datos con la regla de oro
8.1.2 Regresión Logística Binaria Para determinar cuál de las tres reglas: cálculo del índice de Gini, cálculo de la entropía, cálculo del parámetro de escala era la mejor en determinar si un problema puede ser paretizable o no se realizó una regresión logística binaria en SPSS v. 19. 50
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
La regresión logística es adecuada para hace predicciones binarias, -en este caso, predecir si el problema es paretizable o no-, a partir de variables escalares (en este caso, los índices respectivos). Esto nos permite evaluar si es posible hacer predicciones de paretización a partir de los índices, y adicionalmente permite realizar dicha predicción calculando una probabilidad; ésta probabilidad es la que permitirá realizar la Curva Cor. I.
Resultados Parámetro Alpha
Variables en la ecuación B a
Paso 1
E.T.
Wald
gl
Sig.
Exp(B)
parametroAlpha
,001
,000
1199,798
1
,000
1,001
Constante
,758
,005
23762,307
1
,000
2,133
Tabla 22- Variables en la ecuación resultado de la regresión para el parámetro Alpha
II.
Resultados Índice de Gini
Variables en la ecuación B a
Paso 1
E.T.
Wald
gl
Sig.
Exp(B)
indiceGini
6,517
,027
58884,848
1
,000
676,531
Constante
-2,132
,013
28526,158
1
,000
,119
Tabla 23- Variables en la ecuación de la regresión para el índice de Gini
III.
Resultados Entropía Variables en la ecuación B a
Paso 1
entropia
-,769
E.T. ,005
Wald 20164,229
Constante 3,101 ,018 30027,147 Tabla 24- Variables en la ecuación de la regresión para la entropía
gl
Sig.
Exp(B)
1
,000
,463
1
,000
22,212
Como se observa en las tablas de resultados anteriores los parámetros en todos los casos resultan significativos, esto implica que es posible realizar predicciones a partir de cada uno de los tres índices; debido a esto se procedió a realizar un análisis Cor que permitiera escoger al mejor de los tres.
51
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
8.1.3 Análisis de la Curva Cor A continuación se presenta el gráfico resultado de la elaboración de la Curva Cor para las tres reglas candidatas. El eje Susceptibilidad hace referencia a la potencia y el eje 1-Especificad es el error tipo I.
Ilustración 12- Curva Cor para las tres reglas candidatas
Área bajo la curva Variables contraste
resultado
Probabilidad pronosticadaAlpha
de Área ,649
52
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Probabilidad pronosticadaGini Probabilidad pronosticadaEntropia
,906 ,732
La variable (o variables) de resultado de contraste: Probabilidad pronosticadaAlpha, Probabilidad pronosticadaGini, Probabilidad pronosticadaEntropia tiene al menos un empate entre el grupo de estado real positivo y el grupo de estado real negativo. Los estadísticos pueden estar sesgados. Tabla 25- Áreas bajo la Curva Cor reglas de paretización
En la gráfica se observa claramente que el Índice de Gini constituye el parámetro superior de los tres ya que su área bajo la Curva Cor es superior, esto representa una alta capacidad de predicción. Debido a los resultados obtenidos en los análisis realizados se escogió al Índice de Gini como el indicador más adecuado y confiable para determinar si un problema determinado es susceptible de ser paretizado.
8.1.4 Punto de corte según el análisis de la Curva Cor Para hallar el límite por debajo del cual el valor del índice de Gini indica si un problema es paretizable o no, se utilizaron las coordenadas resultantes del gráfico de la Curva Cor con el objetivo de escoger un punto en el cuál la sensibilidad y el valor de 1-especificidad tuvieran una suma igual a 1. A continuación se muestra el punto escogido:
53
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Ilustración 13- Coordenadas de la Curva Cor con el punto de corte
Por lo tanto todo cálculo del Índice de Gini, para un problema de paretización, cuyo valor sea superior a 0,7108 después de utilizar la regresión logística se considerará como paretizable; 54
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
asimismo si el cálculo del Índice de Gini se encuentra por debajo de dicho valor el problema deberá ser considerado como no paretizable.
8.1.5 Índice de Gini aplicado a Casos Reales Para evaluar el desempeño del índice de Gini en casos reales se estudiaron dos conjuntos de datos que están relacionados a continuación: 1. Una investigación donde se estudia a qué áreas se envían los correos electrónicos de una persona (Ver Anexo C: Caso Real 1: Destinatarios Correos Electrónicos de una Persona) El cálculo del índice de Gini en este caso fue igual a 0,765 y al convertirlo con la ecuación de la regresión para que su valor sea comparable con el del valor de corte del índice de Gini se obtiene el siguiente resultado: (
(
))
Ecuación 18
Por lo tanto se considera que este problema si es susceptible de ser paretizado ya que el valor del índice está por encima del límite 0,7108 después de ser aplicado en la ecuación de la regresión logística.
2. El consolidado de los trabajos y proyectos de grado de la carrera de ingeniería industrial: acumulación de profesores, directores o evaluadores (Ver Anexo D: Caso Real 2: Número de Trabajos de Grado dirigidos en los años 2010, 2011 y 2012 en la carrera de Ingeniería Industrial) El cálculo del índice de Gini en este caso fue igual a 0,502 y al convertirlo con la ecuación de la regresión para que su valor sea comparable con el del valor de corte del índice de Gini se obtiene el siguiente resultado: (
(
))
Ecuación 19
Por lo tanto se considera que este problema si es susceptible de ser paretizado ya que el valor del índice está por encima del límite 0,7108 después de ser aplicado en la ecuación de la regresión logística.
55
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
3. El consolidado de trabajos de grado evaluados en los años 2010, 2011 y 2012 de la carrera de ingeniería industrial (Ver Anexo E: Caso Real 3: Número de Trabajos de Grado Evaluados en los años 2010, 2011 y 2012 en la carrera de Ingeniería Industrial) El cálculo del índice de Gini en este caso fue igual a 0,447 y al convertirlo con la ecuación de la regresión para que su valor sea comparable con el del valor de corte del índice de Gini se obtiene el siguiente resultado: (
(
Ecuación 20
))
Por lo tanto se considera que este problema no es susceptible de ser paretizado ya que el valor del índice está por debajo del límite 0,7108 después de ser aplicado en la ecuación de la regresión logística.
8.2 RESULTADOS TAMAÑO DE MUESTRA
Para determinar un tamaño de muestra adecuado, según el número de causas de un problema de Pareto, que garantice la realización de un diagrama adecuado se realizaron una serie de análisis estadísticos para determinar la susceptibilidad de los resultados al tamaño de muestra escogido. A continuación se presentan los análisis y sus resultados. 8.2.1 ANOVA Para llevar a cabo los análisis se hizo una segmentación por grupos en SPSS para evaluar el área bajo la Curva Cor en función del tamaño de muestra, considerando importante la relación entre número de elementos y categorías.
Se realizó un análisis de varianza (ANOVA) a los resultado de la simulación con el objetivo de determinar si los factores categorías (CATEGORÍAS) y la relación elementos/categorías (MN) influían sobre la variable de respuesta Índice de Gini. Los resultados se muestran a continuación: Pruebas de los efectos inter-sujetos Variable dependiente: Índice de Gini Suma de cuadrados tipo Origen Modelo corregido
Media
III
gl ,055
a
cuadrática 16
,003
F
Sig. 55,044
,000
56
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Intersección
72,455
1
72,455
1149960,684
,000
CATEGORÍAS
,004
9
,000
6,743
,000
MN
,052
7
,007
117,145
,000
Error
,004
63
6,301E-5
Total
72,514
80
,059
79
Total corregida
a. R cuadrado = ,933 (R cuadrado corregida = ,916) Tabla 26- ANOVA para el índice de Gini
Como se puede observar los resultados sí son significativos, por lo tanto, se puede concluir que el número de categorías y la relación de éstas con la cantidad de elementos en una muestra sí influyen en la variable de respuesta, el Índice de Gini.
8.2.2 Prueba DHS de Tukey para el número de categorías Junto con el ANOVA se llevó a cabo una prueba de Tukey con el objetivo de determinar en detalle cómo los niveles de la variable categorías influían en la variable de respuesta. A continuación se muestran los resultados obtenidos:
DHS de Tukey
a,b
Subconjunto
CATEG ORÍAS
N
1
2
3
10
8
,935375
20
8
,942500
30
8
,950625
,950625
40
8
,951375
,951375
60
8
,954625
,954625
50
8
,954875
,954875
80
8
,956250
70
8
,956500
100
8
,957000
90
8
,957625
Sig.
,736
,942500
,076
,755
57
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Se muestran las medias de los grupos de subconjuntos homogéneos. Basadas en las medias observadas. El término de error es la media cuadrática (Error) = 6,30E005. a. Usa el tamaño muestral de la media armónica = 8,000 b. Alfa = ,05. Tabla 27- DHS de Tukey para el número de categorías
De los resultados obtenidos se concluye que a medida que aumenta el número de categorías en un diagrama de Pareto aumenta el valor del índice. Asimismo, el resultado con 10 ó 20 categorías es estadísticamente similar, pero el valor del índice de Gini aumenta a partir de 30 categorías. A partir de este número el valor de índice no varía significativamente, por lo tanto un número de categorías igual a 30 o superior se considera adecuado.
8.2.3 Prueba DHS de Tukey para la relación número de elementos-número de categorías Se realizó una prueba de Tukey con el objetivo de determinar en detalle cómo los niveles de la variable número de elementos- número de categorías influían en la variable de respuesta. A continuación se muestran los resultados obtenidos:
a,b
DHS de Tukey
Subconjunto M/N
N
1
2
3
4
5
64,0
10
32,0
10
16,0
10
8,0
10
1,0
10
,967300
4,0
10
,969400
,5
10
,978200
2,0
10
,978300
Sig.
,905500 ,922000 ,938400 ,954300
1,000
1,000
1,000
1,000
,055
58
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Se muestran las medias de los grupos de subconjuntos homogéneos. Basadas en las medias observadas. El término de error es la media cuadrática (Error) = 6,30E-005. a. Usa el tamaño muestral de la media armónica = 10,000 b. Alfa = ,05. Tabla 28- Prueba DHS de Tukey para la relación número de elementos-número de categorías
De los resultados obtenidos en la prueba de Tukey se puede concluir que la relación número de elementos- número de categorías de ser de máximo 4. Para reafirmar este resultado se elaboró un diagrama de caja y bigotes, éste se presenta a continuación:
Ilustración 14- Diagrama de caja área bajo la Curva Cor del índice de Gini
59
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Apoyado en el diagrama anterior y con base en los resultados de la prueba de Tukey se observa que la mejor relación para el número de elementos y el número de categorías es de 2 ó de 4 porque en este rango es donde se presenta la menor variabilidad. Las demás resultados permiten obtener valores menores para el índice de Gini y a pesar de que las relaciones de 0,5 y 1 presentan un valor del índice igual de bueno que con 2 y 4, tienen una mayor variabilidad.
8.2.4 Análisis de Curva Cor
A continuación se presenta el gráfico que se elaboró con las tablas de resultados de las áreas bajo la Curva Cor. Se gráfica la relación número de número total de elementos en la muestranúmero de categorías (M/N):
Ilustración 15-Áreas bajo la Curva Cor
El gráfico reafirma las conclusiones obtenidas anteriormente, pero mostrando adicionalmente la combinación de categorías y la relación categorías/elementos, donde se puede apreciar que al aumentar las categorías en valores bajos de la relación M/N, mejora el área bajo la Curva Cor, 60
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
lo cual no ocurre en valores altos; y simultáneamente, se puede ver que las relaciones M/N bajas son mejores, de acuerdo a lo escrito anteriormente.
8.3 RESULTADOS PUNTO DE CORTE
8.3.1 Regla de Oro Para el análisis de los datos y la comparación de las posibles reglas se estableció como Regla de Oro el parámetro que se le ingresó al sistema para correr la simulación.
8.3.2 Porcentaje de Aciertos de las Reglas Para evaluar los resultados se decidió usar dos criterios: porcentaje de aciertos y RMSE. La siguiente tabla muestra los resultados de cada criterio en cuanto a porcentaje de aciertos:
Porcentaje Partición uno y Porcentaje Categorías
Aciertos Regla Pendiente
Aciertos Regla Frecuencia Acumulada 80%
70%- 30%
3,43%
5,56%
0,00%
75%- 25%
0,68%
4,36%
0,00%
80%- 20%
5,93%
39,11%
100%
85%- 15%
3,66%
13,59%
0,00%
90%- 10%
19,78%
31,61%
0,00%
Aciertos Regla Categorías 20%
Tabla 29- Porcentaje de aciertos reglas punto de corte
8.3.3 RMSE La tabla que se muestra a continuación contiene el cálculo del RMSE para cada una de las reglas:
61
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
RMSE Regla Pendiente
RMSE Regla Frecuencia Acumulada 80%
RMSE Regla Categorías 20%
10,600
3,195
4,387
Tabla 30- RMSE reglas punto de corte
De hecho, al comparar las proporciones de éxito con una prueba de proporciones se demuestra que la diferencia es significativa; dicha prueba se muestra a continuación:
Prueba de Proporciones para las Reglas 1 y 2 Casos buenos
Total casos
División Varianza
2677
40000 0,066925 0,002320551
7539
40000 0,188475
Diferencia -0,12155 -52,37980835 valor z si hay diferencia entre 1 las reglas
Tabla 31- Prueba de Proporciones para las Reglas 1y 2
Prueba de Proporciones para las Reglas 1 y 3 Casos buenos
Total casos
División Varianza
2677
40000 0,066925 0,002358209
8000
40000
0,2
Diferencia -0,133075 -56,43052969 valor z si hay diferencia entre 1 las reglas
Tabla 32- Prueba de Proporciones para las Reglas 1 y 3
Prueba de Proporciones para las Reglas 2 y 3 Casos buenos
Total casos
División Varianza
Diferencia 62
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
7539
40000 0,188475 0,002797106
8000
40000
0,2
-0,011525 -4,120329456 valor z si hay diferencia entre 0,999981083 las reglas
Tabla 33- Prueba de Proporciones para las Reglas 2 y 3
Como se puede observar en los resultados obtenidos, de las tres reglas aquí contrastadas para encontrar el punto de corte en un diagrama de Pareto, la mejor aquella donde se efectúa el corte cuando se haya acumulado el 80% de la frecuencia, sin embargo es importante resaltar que la capacidad de predicción de las tres reglas es aún baja. La regla de la pendiente obtuvo resultados poco favorables en comparación con las otras dos.
63
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
9. DESARROLLO DE APLICACIÓN DE SOFTWARE
Como última instancia de este trabajo se implementaron los resultados obtenidos durante el desarrollo en una sencilla aplicación cuya principal funcionalidad fuese la obtención de diagramas de Pareto que cumplieran con las reglas acá estudiadas. Para llevar a cabo la aplicación se siguieron las siguientes etapas que serán explicadas posteriormente: 1. 2. 3. 4. 5.
Captura y análisis de requerimientos con base en las reglas definidas anteriormente Diseño del sistema: elaborar el modelo del sistema Implementación del sistema Pruebas del sistema: verificación y validación. Documentación del sistema (implementación y manuales de uso).
9.1 Captura y análisis de Requerimientos En esta primera fase se utilizó como documento guía la plantilla hacer y usos es una plantilla creada por los ingenieros Luis Carlos Díaz, Deicy Alvarado y Ángela Carrillo del grupo de investigación ISTAR del departamento de Ingeniería de Sistemas de la Pontificia Universidad Javeriana (Chaparro, Alvarado, & Ramos, 2010). Con base en ésta se definieron los requerimientos que constituyen las características funcionales y no funcionales que debe contener un sistema. Dada esta definición se procedió a definir los requerimientos, estos se presentan en la siguiente tabla:
R
Requerimientos:
Especificación de las necesidades identificadas en la situación problema
CódigoRequerimiento
Especificación Requerimiento
F : Funcional U : Facilidad de "Uso" R : Fiabilidad P : Rendimiento S : Soporte + : (Imple, Interfaz, Empaq, ...)
64
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
R01
El sistema debe permitir el ingreso de la información: número de categorías y cantidad de elementos por categoría (frecuencia)
F
R02
El sistema debe determinar si un conjunto de datos es paretizable o no, empleando el criterio del índice de Gini
F
R03
El sistema debe determinar si el tamaño de muestra es adecuado para el análisis de Pareto
F
R04
El sistema debe establecer el punto de corte del diagrama de Pareto
F
R05
El sistema debe generar el gráfico del diagrama de Pareto
F
Tabla 34- Especificación de requerimientos de la aplicación
9.2. Diseño del sistema
9.2.1. Representación Arquitectural Teniendo en cuenta modelo de vistas arquitecturales “4+1” de Philippe Kruchten (Kruchten, 1995), las vistas usadas para documentar la arquitectura del proyecto a desarrollar son:
9.2.1.1. Vista lógica: En la vista lógica se representa la funcionalidad que el sistema proporcionara a los usuarios finales. Esta representa lo que el sistema debe hacer así como las funciones y servicios que este ofrece. Para una mejor documentación de esta vista, se usaran los patrones EBC (Entity, control, boundary). Se presenta un Overview de la arquitectura del sistema propuesto en el proyecto. Este es un primer vistazo a lo que podría ser una posible partición de responsabilidades dentro del sistema. El Overview de la vista lógica se presenta a continuación:
65
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
SWING Interfaz gráfica
Analizador del Índice de Gini
Analizador del tamaño de muestra
J FREE CHART Component
Ilustración 16- Overview de la vista lógica de la aplicación
continuación se muestra diagrama EBC la vista lógica: EA A10.0 Unregistered Trialel Version EA de 10.0 Unregistered Trial Version EA 10.0 Unregistered analysis Domain Model
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered SWING Interfaz gráfica
Analizador del Índice
Analizador tamaño de
J FREE CHART
de Gini muestra EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Component
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Ilustración 17- Diagrama EBC de la vista lógica
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
Vista de proceso EA 9.2.1.2 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA En 10.0 Trial Version (como EA 10.0 Unregistered VersionqueEA la Unregistered vista de procesos se muestran su nombre lo indica) Trial los procesos hay10.0 en elUnregistered
sistema y la forma en la que estos se comunican, es decir, el flujo de trabajo paso a paso de y de operaciones los componentes conforman elTrial sistema. Para ofrecer unaUnregistered EA negocio 10.0 Unregistered TrialdeVersion EA 10.0que Unregistered Version EA 10.0 mejor documentación de esta vista, se muestra a continuación el diagrama de componentes 5 EA UML 10.0: Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered 5
Un diagrama de componentes UML representa cómo un sistema de software es dividido en componentes y EA muestra 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered las dependencias entre estos componentes. Los componentes físicos incluyen archivos,
cabeceras, bibliotecas compartidas, módulos, ejecutables, o paquetes. Los diagramas de Componentes en el campo de la arquitectura de software pero pueden ser usados para modelar y documentar EA prevalecen 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered cualquier arquitectura de sistema.
66Unregistered EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered class Domain Model
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Capturar la información
Calcular el Índice de Gini
Cumple el criterio (Índice
Analizar Índice de Gini
de Gini mayor a 0,7108) EA 10.0 Unregistered Trial Version Trial Version EA 10.0 Unregistered (categorías y frecuencia) de EA 10.0 Unregistered Trial Version EA 10.0 Unregistered para ser paretizable? Inicio
la interfaz gráfica
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Si No
EA 10.0 Unregistered Trial Version
Excepción de EA Pareto 10.0 Unregistered Version MostrarTrial mensaje de error
EA 10.0 Unregistered Trial Version EA
para indicar que no es posible elaborar el diagrama 10.0 Unregistered Trial Version Final de Pareto
EA 10.0 Analizar Unregistered Trial Version EA 10.0 Unregistered la relación tamaño de muestra/número de categorías
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered El tamaño de
es 2 ó EA 10.0 Unregistered Trial Version EA 10.0 Unregistered EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial muestra Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
4 veces mayor al número de Trial categorías? Version
EA 10.0 Unregistered Si Trial Version EA 10.0 Unregistered
No
Calcular el punto de corte
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered del diagrama Indicar al usuario que el tamaño de muestra no es
el adecuado EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered No
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered El usuario
Elaborar diagrama de EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered decide Pareto terminar el
proceso? EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered EA 10.0 Unregistered Si Trial Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 UnregisteredFinal Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
Ilustración 18- Diagrama de componentes UML vista de proceso EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA9.2.1.3 10.0 Unregistered Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Vista deTrial implementación
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EALa 10.0 Unregistered Trial Version EA 10.0desde Unregistered Trial VersiondeEA UnregisteredyTrial vista lógica muestra el sistema la perspectiva un10.0 programador se Version encargaEA de10.0 Unregistered
mostrar cómo está dividido el sistema (componentes) y su relación (dependencias). A continuación se muestra el diagrama de componentes UML de esta vista:
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
67
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
analysis Domain Model EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria pareto.j ar
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria SWING Interfaz gráfica Analizador del Índice de Gini
Analizador tamaño de muestra
J FREE CHART Component
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
EA 10.0 Unregistered Ilustración Trial Version EA de 10.0 Unregistered Version EA 10.0 Unregistered Tria 19- Diagrama componentes UML vistaTrial de implementación
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria 9.2.1.4 Vista de despliegue
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
esta vista se Trial muestran todos los físicos del Trial sistema, así comoEA las10.0 conexiones EA 10.0 En Unregistered Version EAcomponentes 10.0 Unregistered Version Unregistered Tria físicas entre esos componentes según la perspectiva de un ingeniero de sistemas. A continuación se muestra el diagrama de componentes UML de esta vista:
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria analysis Domain Model
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria PC EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
ar EA 10.0 Unregistered Trial Version EA 10.0pareto.j Unregistered Trial Version EA 10.0 Unregistered Tria EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Trial Version 10.010.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered VersionEA EA Unregistered Tria EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
SWING Interfaz gráfica Analizador Índice Unregistered Analizador tamaño deTrial EA 10.0 Unregistered Trial Version EA del 10.0 Version EA 10.0 Unregistered Tria J FREE CHART de Gini
muestra
Component
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Trial Version 10.010.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered VersionEA EA Unregistered Tria Ilustración 20- Diagrama de componentes UML vista de despliegue
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
68 EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version
EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Trial Version EA 10.0 Unregistered Tria
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
9.2.1.5 Vista de casos de uso
Los casos de uso modelan las funcionalidades del sistema, teniendo en cuenta el objetivo a cumplir en el sistema, los actores involucrados, las precondiciones y pos condiciones del sistema, el flujo básico de éxito entre los actores y el sistema, los casos de excepción, caminos alternativos y requerimientos relacionados con la funcionalidad descrita (Chaparro et al., 2010) La vista de casos de uso se encarga de relacionar y unir las 4 vistas anteriores. Gracias a esto se puede tener una trazabilidad de componentes, clases, equipos, etc., para cada caso de uso que se tenga. A continuación se muestra el caso de uso de la aplicación:
CU-1
Especificación de Caso de Uso
Id Caso de CU-1 Uso: Objetivo en (Resumen):
Nombre:
Elaboración Diagrama de Pareto
Contexto Con base en la evaluación de los criterios predefinidos, elaborar, de ser posible, el diagrama de Pareto.
Actores Participantes
Usuario de la aplicación
Entradas
Número de Frecuencia de cada Categoría
Salidas
Diagrama de Pareto
Pre-Condiciones
Las categorías debe tener una etiqueta de tipo numérico o alfanumérico La frecuencia de cada categoría debe ser un número entero positivo
Categorías
Condición final de éxito: Generación del diagrama de Pareto Post-Condiciones Condición final de fallo: No generación del diagrama de
69
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Pareto
FLUJO BÁSICO DE ÉXITO No.
Actor
1
Ingresa las categorías con su respectiva frecuencia
No.
Sistema
2
Calcula el Índice de Gini
3
Calcula la relación tamaño de la muestra/número de categorías
4
Determina el punto de corte del diagrama de Pareto
5
Elabora el diagrama de Pareto
3.1 Informar que la relación tamaño de la muestra/número de categorías no es adecuada para elaborar el diagrama de Pareto. Variaciones (Caminos 3.1.1 El sistema pregunta al usuario si desea continuar en Alternativos): el proceso de generación del diagrama. 3.1.2 Continuar con el paso 4 del flujo básico de éxito si el usuario desea continuar con la operación. 2.1 Si el Índice de Gini es menor a 0,7108 el sistema debe indicar al usuario que el conjunto de datos no es paretizable. 2.1.1 El sistema muestra al usuario un mensaje de erro Variaciones (Caminos de indicando el índice de Gini calculado y la razón por la que excepción): no es paretizable. 2.1.2 Finaliza la operación actual. 3.1.3 Si el usuario desea terminar la operación finaliza la operación actual.
70
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Requerimientos Asociados:
R01, R02, R03, R04, R05
Tabla 35- Vista de casos de uso
9.3 Implementación del sistema Una vez definidos los requerimientos de la aplicación “El Diagrama de Pareto Rediseñado” y de tener claro el diseño de la misma se procedió a su implementación. Se realizó con el lenguaje de programación JAVA en el compilador NetBeans IDE v. 7.2.1. La aplicación se encuentra en el CD anexo a este trabajo, en la ruta: El Diagrama de Pareto Rediseñado\pareto\dist. En esta carpeta se encuentra la aplicación que es: pareto.jar. Nota importante: para poder ejecutar la aplicación se debe descomprimir previamente toda la carpeta “El Diagrama de Pareto Rediseñado”.
9.4 Pruebas del sistema: verificación y validación. Las pruebas de software son las investigaciones empíricas y técnicas cuyo objetivo es proporcionar información objetiva sobre la calidad del producto a la parte interesada. Las pruebas se llevaron a cabo teniendo en cuenta los tres escenarios que pueden tener lugar cuando se ejecuta la aplicación:
Escenario 1: el conjunto de datos sí es paretizable y la relación número total de elementos- número de categorías cumple con los requisitos de estar entre 3 y 4. Escenario 2: el conjunto de datos sí es paretizable y la relación número total de elementos- número de categorías no cumple con los requisitos de estar entre 3 y 4. Escenario 3: el conjunto de datos no es paretizable.
Se generó una tabla de control que contiene los resultados obtenidos al llevar a cabo los cálculos con los datos de prueba sin usar la aplicación, o sea los resultados que debería obtener la aplicación de estar funcionando exitosamente. Se corrió la aplicación con los datos y se hizo un chequeo de los resultados.
71
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
9.4.1 Escenario 1: el conjunto de datos sí es paretizable y la relación número total de elementos- número de categorías cumple con los requisitos de estar entre 2 y 4. A continuación se presentan los resultados de la prueba. El conjunto de datos y las capturas de pantalla se encuentran en el Anexo F: Conjunto de datos sí paretizable y relación número total de elementos- número de categorías que sí cumple con los requisitos de estar entre 2 y 4.
Prueba 1
Resultados de los cálculos
Resultados obtenidos por la aplicación
Valor de Índice de Gini
0,799
0,799
¿Paretizable?
Sí
Sí
Relación elementos- cantidad de categorías
4
4
¿Cumple con lo establecido para la relación?
Sí
Sí
Punto de corte
C, acumula el 80% de la frecuencia 16
C
¿Correcto?
Tabla 36- Prueba 1 aplicación "El Diagrama de Pareto Rediseñado
9.4.2 Escenario 2: el conjunto de datos sí es paretizable y la relación número total de elementos- número de categorías no cumple con los requisitos de estar entre 2 y 4.
A continuación se presentan los resultados de la prueba. El conjunto de datos y las capturas de pantalla se encuentran en el Anexo G: Conjunto de datos sí paretizable y relación número total de elementos- número de categorías que no cumple con los requisitos de estar entre 2 y 4.
Prueba 2
Resultados de los cálculos
Resultados obtenidos por la aplicación
Valor de Índice de Gini
0,945
0,945
¿Paretizable?
Sí
Sí
¿Correcto?
72
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Relación elementos- cantidad de categorías
458,04
458
¿Cumple con lo establecido para la relación?
No
No, se generó ventana de advertencia
Punto de corte
CEDI, acumula el 80% de la frecuencia 8428
CEDI
9.4.3 Escenario 3: el conjunto de datos no es paretizable. A continuación se presentan los resultados de la prueba. El conjunto de datos y las capturas de pantalla se encuentran en el Anexo Tabla 37- Prueba 2 aplicación "El Diagrama de Pareto Rediseñado H: Conjunto de datos no paretizable.
Prueba 3
Resultados de los cálculos
Resultados obtenidos por la aplicación
Valor de Índice de Gini
0,106
0,106
No
No, se genera ventana de error
NA
NA
NA
NA
NA
NA
¿Paretizable? Relación elementos- cantidad de categorías ¿Cumple con lo establecido para la relación? Punto de corte
¿Correcto?
Tabla 38- Prueba 3 aplicación "El Diagrama de Pareto Rediseñado
La aplicación fue verificada y validada para su uso, ésta sí cumple con los requisitos requeridos. 9.5 Documentación del sistema (implementación y manuales de uso). En el CD anexo al trabajo de grado se encuentra la documentación de la implementación al igual que el manual de uso de la misma. La documentación se encuentra en la ruta: El Diagrama de Pareto Rediseñado\pareto\dist\javadoc. Asimismo, el manual de uso es el documento PDF titulado: “Manual de Uso Aplicación El diagrama de Pareto Rediseñado”.
73
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
10. CONCLUSIONES
Aunque en el origen del principio de los pocos vitales Joseph Juran se inspiró en procesos generativos Power Law, en este trabajo se evidenció que existe por lo menos una alternativa de proceso generativo de un problema de Pareto: una distribución multinomial con porcentajes divididos de acuerdo a una regla de priorización. Esto abre las puertas para la investigación subsiguiente en fenómenos relacionados con el principio de los pocos vitales.
Queda claro que el Índice de Gini, constituye la mejor regla, de las aquí estudiadas, para decidir si un fenómeno es susceptible de ser paretizable o no debido a que tiene la capacidad de medir de forma acertada la desigualdad categórica en cualquier tipo de distribución. En este trabajo se determinó, mediante la regresión logística, que todo problema es susceptible de ser paretizable si su Índice de Gini tiene un valor igual o superior a 0,7108 una vez aplicada la ecuación de regresión logística-.
Los criterios de punto de corte aún son insuficientes para garantizar que se están diferenciando correctamente los pocos vitales de los muchos triviales. Sin embargo el criterio de la acumulación del 80% de la frecuencia fue escogido como el mejor de los tres debido a que presenta la mayor cantidad de aciertos en la identificación del punto de corte en problemas paretizables. Es importante resaltar que la regla de la pendiente aquí planteada puede ser refinada matemáticamente y estudiada en trabajos de investigación posteriores debido a que, a pesar de que sus resultados en este trabajo no fueron los mejores, sí se comprobó que tiene determinada capacidad para identificar el punto de corte en el diagrama de Pareto.
El resultado del tamaño de muestra indica una conclusión paradójica en la que aumentar la relación elementos/categorías genera una distorsión estadísticamente significativa; sin embargo, al observar los resultados, el área bajo la Curva Cor del Índice de Gini baja de 98% a 91% de lo que no es tan significativo desde el punto de vista práctico. El aumento del número de categorías en un diagrama de Pareto ofrece los mejores resultados: a medida que aumenta el número de categorías en un diagrama de Pareto aumenta el valor del área bajo la Curva Cor. Asimismo, la mejor relación para el número de elementos y el número de categorías es de 2 ó de 4.
74
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Mediante este trabajo se evidenció la escasa comunicación entre las ciencias y disciplinas; si bien el índice de Gini es ampliamente utilizado en las ciencias económicas, se desconoce su funcionalidad en la ingeniería industrial a pesar de ser uno de los indicadores más utilizados para el análisis estadístico de la desigualdad debido - entre otros motivos- a su facilidad de cálculo y de interpretación.
75
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXOS
76
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXO A: Diagrama Entidad Relación Base de Datos Objetivos 1 y 2
77
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXO B: Diagrama Entidad Relación Base de Datos Objetivo 3
78
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXO C: Caso Real 1: Destinatarios Correos Electrónicos de una Persona
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
16 17 18 19 20 21 22 23
Área Presidente Cliente Tecnología Regalías Administrativo Financiero Producción Gestión Humana Crédito Promoción Exportacione s Diseño Costos Operaciones Personal Planeación De La Demanda Ventas Editorial CEDI Varios Mercadeo Proveedor COMPRAS Total general
Frecuenc sumato sumato ia delta x delta y ria x ria y 4 0,043 0,000 0,043 0,000 10 0,043 0,001 0,087 0,001 11 0,043 0,001 0,130 0,002 14 0,043 0,001 0,174 0,004 14 0,043 0,001 0,217 0,005 14 0,043 0,001 0,261 0,006 14 0,043 0,001 0,304 0,008
X+x 0,043 0,130 0,217 0,304 0,391 0,478 0,565
Y-y 0,000 0,001 0,001 0,001 0,001 0,001 0,001
x*y 0,000 0,000 0,000 0,000 0,001 0,001 0,001
23 25 31
0,043 0,043 0,043
0,002 0,002 0,003
0,348 0,391 0,435
0,010 0,012 0,015
0,652 0,739 0,826
0,002 0,002 0,003
0,001 0,002 0,002
77 78 88 100 225
0,043 0,043 0,043 0,043 0,043
0,007 0,007 0,008 0,009 0,021
0,478 0,522 0,565 0,609 0,652
0,022 0,030 0,038 0,048 0,069
0,913 1,000 1,087 1,174 1,261
0,007 0,007 0,008 0,009 0,021
0,007 0,007 0,009 0,011 0,027
226 237 599 618 730 1149 2288 3960 10535
0,043 0,043 0,043 0,043 0,043 0,043 0,043 0,043
0,021 0,022 0,057 0,059 0,069 0,109 0,217 0,376
0,696 0,739 0,783 0,826 0,870 0,913 0,957 1,000
0,091 0,113 0,170 0,229 0,298 0,407 0,624 1,000
1,348 1,435 1,522 1,609 1,696 1,783 1,870 1,957
0,021 0,022 0,057 0,059 0,069 0,109 0,217 0,376
0,029 0,032 0,087 0,094 0,117 0,194 0,406 0,735 1,765
Índice de Gini
0,765
79
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXO D: Caso Real 2: Número de Trabajos de Grado dirigidos en los años 2010, 2011 y 2012 en la carrera de Ingeniería Industrial
Directore s 1 2 3 4 5
6 7
8 9
1 0 1 1 1 2 1
Antonio Rivera Marroquín Alberto Gabriel Zambrano López Mauricio Lizarazu Cesar Germán Felipe de las Casas Jorge David Hernánde z Ruiz Alex Toro David Hernánde z Olga Lucía Araoz Robledo Diego González Sergio Carlos
Trabajo s dirigido s 201011-12 1
delta x delta y
sumatori ax
sumatori ay
X+x
Y-y
x*y
0,01 2 0,03 7 0,06 2 0,08 6 0,11 1
0,002
0,000
0,002
0,000
0,002
0,000
0,002
0,000
0,002
0,000
0,13 6 0,16 0
0,002
0,000
0,002
0,000
0,18 5 0,21 0
0,002
0,000
0,002
0,000
0,012
0,002
0,012
0,002
1
0,012
0,002
0,025
0,005
1
0,012
0,002
0,037
0,007
1
0,012
0,002
0,049
0,009
1
0,012
0,002
0,062
0,011
1
0,012
0,002
0,074
0,014
1
0,012
0,002
0,086
0,016
1
0,012
0,002
0,099
0,018
1
0,012
0,002
0,111
0,020
1
0,012
0,002
0,123
0,023
0,23 5
0,002
0,001
1
0,012
0,002
0,136
0,025
0,002
0,001
1
0,012
0,002
0,148
0,027
0,002
0,001
1
0,012
0,002
0,160
0,030
0,25 9 0,28 4 0,30
0,002
0,001
80
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
3 1 4 1 5 1 6 1 7 1 8
1 9 2 0 2 1 2 2 2 3 2 4 2 5 2 6 2 7 2 8
2 9
Fúquene Carlos Fúquene Andrés Torres Civil Páez Alejandro Martínez Ramón Quintero Araujo Carlos Leonardo Fernando Rodríguez Carlos Nieto Porras Jorge Silva Guido Lacorazza Leonardo Quintana José Manuel Medina Bula Carlos Mauro Rangel Daniel Castro Carlos Eduardo Romero Rojas Vanegas Pablo Emilio
1
0,012
0,002
0,173
0,032
1
0,012
0,002
0,185
0,034
1
0,012
0,002
0,198
0,036
1
0,012
0,002
0,210
0,039
1
0,012
0,002
0,222
0,041
1
0,012
0,002
0,235
0,043
2
0,012
0,005
0,247
0,048
2
0,012
0,005
0,259
0,052
2
0,012
0,005
0,272
0,057
2
0,012
0,005
0,284
0,061
2
0,012
0,005
0,296
0,066
2
0,012
0,005
0,309
0,070
2
0,012
0,005
0,321
0,075
2
0,012
0,005
0,333
0,080
2
0,012
0,005
0,346
0,084
2
0,012
0,005
0,358
0,089
9 0,33 3 0,35 8
0,002
0,001
0,002
0,001
0,38 3 0,40 7 0,43 2
0,002
0,001
0,002
0,001
0,002
0,001
0,45 7 0,48 1
0,002
0,001
0,005
0,002
0,50 6 0,53 1 0,55 6 0,58 0
0,005
0,002
0,005
0,002
0,005
0,003
0,005
0,003
0,60 5 0,63 0 0,65 4 0,67 9
0,005
0,003
0,005
0,003
0,005
0,003
0,005
0,003
0,70 4
0,005
0,003
81
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
3 0 3 1
3 2 3 3 3 4 3 5 3 6 3 7
3 8 3 9 4 0 4 1 4 2
4 3 4 4
José Andrés Huzgame Lina Marcela Rangel Martínez Coronado Néstor Fernando Mariño Fernando Salazar Arrieta Forero Estrada Jairo Martha Inés Vera Guillermo Andrés Zapata Pérez Álvaro Gil
2
0,012
0,005
0,370
0,093
0,72 8
0,005
0,003
2
0,012
0,005
0,383
0,098
0,75 3
0,005
0,003
2
0,012
0,005
0,395
0,102
0,005
0,004
2
0,012
0,005
0,407
0,107
0,005
0,004
2
0,012
0,005
0,420
0,111
0,77 8 0,80 2 0,82 7
0,005
0,004
2
0,012
0,005
0,432
0,116
0,85 2
0,005
0,004
3
0,012
0,007
0,444
0,123
0,007
0,006
3
0,012
0,007
0,457
0,130
0,87 7 0,90 1
0,007
0,006
3
0,012
0,007
0,469
0,136
0,007
0,006
Juan Pablo Caballero Carlos Ruiz Jairo Roa León Juan Carlos Mora Uscátegui Cristina Martínez Jairo Rafael Montoya
3
0,012
0,007
0,481
0,143
0,92 6 0,95 1
0,007
0,006
3
0,012
0,007
0,494
0,150
0,007
0,007
3
0,012
0,007
0,506
0,157
0,007
0,007
4
0,012
0,009
0,519
0,166
0,97 5 1,00 0 1,02 5
0,009
0,009
4
0,012
0,009
0,531
0,175
0,009
0,010
4
0,012
0,009
0,543
0,184
1,04 9 1,07 4
0,009
0,010
82
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
4 5 4 6 4 7
4 8 4 9
5 0 5 1 5 2 5 3 5 4
5 5 5 6 5 7 5 8 5 9
Torres Enrique Romero Motta Urrea Morales Mónica Lope Hugo Barrero Solano Fabio Aldana Jorge Andrés Alvarado Valencia Santiago Aguirre Mauricio López García Juan Carlos Juan Guillermo Galán José Alejandro Páez Rodríguez Emilio Arévalo Carlos Rey Andrés Posada Ramón Mantilla Oscar Javier
4
0,012
0,009
0,556
0,193
1,09 9
0,009
0,010
4
0,012
0,009
0,568
0,202
1,12 3
0,009
0,010
4
0,012
0,009
0,580
0,211
1,14 8
0,009
0,010
4
0,012
0,009
0,593
0,220
0,009
0,011
4
0,012
0,009
0,605
0,230
1,17 3 1,19 8
0,009
0,011
5
0,012
0,011
0,617
0,241
0,011
0,014
5
0,012
0,011
0,630
0,252
0,011
0,014
5
0,012
0,011
0,642
0,264
1,22 2 1,24 7 1,27 2
0,011
0,014
5
0,012
0,011
0,654
0,275
1,29 6
0,011
0,015
6
0,012
0,014
0,667
0,289
1,32 1
0,014
0,018
6
0,012
0,014
0,679
0,302
0,014
0,018
6
0,012
0,014
0,691
0,316
0,014
0,019
6
0,012
0,014
0,704
0,330
0,014
0,019
7
0,012
0,016
0,716
0,345
0,016
0,023
7
0,012
0,016
0,728
0,361
1,34 6 1,37 0 1,39 5 1,42 0 1,44 4
0,016
0,023
83
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
6 0 6 1
6 2 6 3
6 4
6 5 6 6 6 7
6 8 6 9 7 0 7 1 7 2
Jamocó Ángel Carlos Romero Vega Mejía Carlos Alberto Andrés Zapata Javier Hernando Padilla Bohórque z Manuel Alejandro Martá Quiroz Ricardo Ladino García Rafael Guillermo Jiménez Gordillo José Fernando Martha Lucía Morales Nicolás Rincón Mabel Olano Parra Luis Enrique Fajardo Oswaldo Prieto
7
0,012
0,016
0,741
0,377
1,46 9 1,49 4
0,016
0,023
7
0,012
0,016
0,753
0,393
0,016
0,024
7
0,012
0,016
0,765
0,409
1,51 9 1,54 3
0,016
0,024
7
0,012
0,016
0,778
0,425
0,016
0,025
7
0,012
0,016
0,790
0,441
1,56 8
0,016
0,025
7
0,012
0,016
0,802
0,457
0,016
0,025
0,018
0,815
0,475
1,59 3 1,61 7
8
0,012
0,018
0,029
9
0,012
0,020
0,827
0,495
1,64 2
0,020
0,034
9
0,012
0,020
0,840
0,516
1,66 7
0,020
0,034
10
0,012
0,023
0,852
0,539
0,023
0,038
10
0,012
0,023
0,864
0,561
1,69 1 1,71 6
0,023
0,039
10
0,012
0,023
0,877
0,584
1,74 1
0,023
0,040
12
0,012
0,027
0,889
0,611
1,76 5
0,027
0,048
84
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
7 3 7 4 7 5 7 6 7 7 7 8 7 9 8 0 8 1
Carlos Navarrete Martha Manrique John Eduardo Peña Martha Patricia Caro Camilo Merchán Juan Bernardo Merino Rafael Eduardo Sandino Luis Manuel Pulido Gabriel Gómez Total general
13
0,012
0,030
0,901
0,641
1,79 0 1,81 5 1,84 0
0,030
0,053
14
0,012
0,032
0,914
0,673
0,032
0,058
16
0,012
0,036
0,926
0,709
0,036
0,067
18
0,012
0,041
0,938
0,750
1,86 4
0,041
0,076
18
0,012
0,041
0,951
0,791
0,041
0,077
0,043
0,963
0,834
1,88 9 1,91 4
19
0,012
0,043
0,083
23
0,012
0,052
0,975
0,886
1,93 8
0,052
0,101
25
0,012
0,057
0,988
0,943
1,96 3
0,057
0,112
25
0,012
0,057
1,000
1,000
1,98 8
0,057
0,113
440
1,5025 3 Índice de Gini
0,502
85
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXO E: Caso Real 3: Número de Trabajos de Grado Evaluados en los años 2010, 2011 y 2012 en la carrera de Ingeniería Industrial
1 2 3 4 5 6 7 8
Trabajos evaluados 2010, Rótulos de 2011, delta fila 2012 x Daniel Castro 1 0,009 Juan Pablo Garzón 1 0,009 Daniel Remolina 1 0,009 Javier Moreno 1 0,009 Sandra Jarro 1 0,009 Martha Lucia Morales 1 0,009 Paola Hernández 1 0,009 Fernando Mariño 1 0,009
Carlos Alberto 9 Bula Gazabón Leonardo 10 Quintana Enrique 11 Romero Lindsay 12 Álvarez María Paula Ramírez 13 Tovar Vladimir 14 Castro Daniel Fernando 15 Maya Cerón 16 Javier Padilla Wolfang 17 Pfizenmaier Cristina 18 González Eliana 19 González
delta sum sum y x y X+x 0,002 0,009 0,002 0,009
Y-y x*y 0,002 0,000
0,002 0,018 0,005 0,027
0,002 0,000
0,002 0,027 0,007 0,045 0,002 0,036 0,009 0,064 0,002 0,045 0,011 0,082
0,002 0,000 0,002 0,000 0,002 0,000
0,002 0,055 0,014 0,100
0,002 0,000
0,002 0,064 0,016 0,118
0,002 0,000
0,002 0,073 0,018 0,136
0,002 0,000
1 0,009 0,002 0,082 0,020 0,155
0,002 0,000
1 0,009 0,002 0,091 0,023 0,173
0,002 0,000
1 0,009 0,002 0,100 0,025 0,191
0,002 0,000
1 0,009 0,002 0,109 0,027 0,209
0,002 0,000
1 0,009 0,002 0,118 0,030 0,227
0,002 0,001
1 0,009 0,002 0,127 0,032 0,245
0,002 0,001
1 0,009 0,002 0,136 0,034 0,264 1 0,009 0,002 0,145 0,036 0,282
0,002 0,001 0,002 0,001
1 0,009 0,002 0,155 0,039 0,300
0,002 0,001
1 0,009 0,002 0,164 0,041 0,318
0,002 0,001
1 0,009 0,002 0,173 0,043 0,336
0,002 0,001
86
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
20 Carlos Muñoz César 21 Guzmán Nelson Arce 22 Cortés Alexander 23 Lizcano Jazmín 24 Gaitán Samuel 25 Tirado 26 Carlos Parra Jaime A. 27 Rubiano 28 Jaime Lara Martha Helena 29 Carrillo Oscar Yecid 30 Buitrago Mauricio 31 Rodríguez Alfonso 32 Murillo John Iván 33 Hernández José Manuel 34 Medina 35 Rafael García Oscar Javier 36 Jamocó Juan José 37 Obagi Guido 38 Lacorazza Juliana 39 Sánchez Claudia Liliana Romero 40 Ardila Karen 41 González 42 Paula Mateus Clara Mabel 43 Solano
1 0,009 0,002 0,182 0,045 0,355
0,002 0,001
1 0,009 0,002 0,191 0,048 0,373
0,002 0,001
1 0,009 0,002 0,200 0,050 0,391
0,002 0,001
1 0,009 0,002 0,209 0,052 0,409
0,002 0,001
1 0,009 0,002 0,218 0,055 0,427
0,002 0,001
1 0,009 0,002 0,227 0,057 0,445 1 0,009 0,002 0,236 0,059 0,464
0,002 0,001 0,002 0,001
1 0,009 0,002 0,245 0,061 0,482 1 0,009 0,002 0,255 0,064 0,500
0,002 0,001 0,002 0,001
1 0,009 0,002 0,264 0,066 0,518
0,002 0,001
1 0,009 0,002 0,273 0,068 0,536
0,002 0,001
1 0,009 0,002 0,282 0,070 0,555
0,002 0,001
1 0,009 0,002 0,291 0,073 0,573
0,002 0,001
1 0,009 0,002 0,300 0,075 0,591
0,002 0,001
2 0,009 0,005 0,309 0,080 0,609 2 0,009 0,005 0,318 0,084 0,627
0,005 0,003 0,005 0,003
2 0,009 0,005 0,327 0,089 0,645
0,005 0,003
2 0,009 0,005 0,336 0,093 0,664
0,005 0,003
2 0,009 0,005 0,345 0,098 0,682
0,005 0,003
2 0,009 0,005 0,355 0,102 0,700
0,005 0,003
2 0,009 0,005 0,364 0,107 0,718
0,005 0,003
2 0,009 0,005 0,373 0,111 0,736 2 0,009 0,005 0,382 0,116 0,755
0,005 0,003 0,005 0,003
2 0,009 0,005 0,391 0,120 0,773
0,005 0,004 87
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
44 45
46 47 48 49 50 51 52 53 54 55
Diego Ernesto Mendoza Patiño Carlos Fúquene José Fernando Jiménez Martha Manrique Alejandro Páez Álvaro Gil Carlos Navarrete Natalia Tirado Esteban Acuña Oscar Buitrago Hernán Arias Santiago Aguirre
Jairo Enrique 56 Roa León Jorge Andrés 57 Alvarado Marcela 58 Cabrera Ricardo 59 Bernal María Olga 60 Silva Ricardo 61 Vásquez Gabriel 62 Zambrano Jean Alexander 63 Pulido Luís Enrique 64 Fajardo Lope Hugo 65 Barrero 66 Ricardo
2 0,009 0,005 0,400 0,125 0,791
0,005 0,004
2 0,009 0,005 0,409 0,130 0,809
0,005 0,004
2 0,009 0,005 0,418 0,134 0,827
0,005 0,004
2 0,009 0,005 0,427 0,139 0,845
0,005 0,004
2 0,009 0,005 0,436 0,143 0,864 2 0,009 0,005 0,445 0,148 0,882
0,005 0,004 0,005 0,004
2 0,009 0,005 0,455 0,152 0,900 3 0,009 0,007 0,464 0,159 0,918
0,005 0,004 0,007 0,006
3 0,009 0,007 0,473 0,166 0,936
0,007 0,006
3 0,009 0,007 0,482 0,173 0,955 3 0,009 0,007 0,491 0,180 0,973
0,007 0,007 0,007 0,007
3 0,009 0,007 0,500 0,186 0,991
0,007 0,007
3 0,009 0,007 0,509 0,193 1,009
0,007 0,007
3 0,009 0,007 0,518 0,200 1,027
0,007 0,007
3 0,009 0,007 0,527 0,207 1,045
0,007 0,007
3 0,009 0,007 0,536 0,214 1,064
0,007 0,007
3 0,009 0,007 0,545 0,220 1,082
0,007 0,007
3 0,009 0,007 0,555 0,227 1,100
0,007 0,007
3 0,009 0,007 0,564 0,234 1,118
0,007 0,008
3 0,009 0,007 0,573 0,241 1,136
0,007 0,008
3 0,009 0,007 0,582 0,248 1,155
0,007 0,008
4 0,009 0,009 0,591 0,257 1,173 4 0,009 0,009 0,600 0,266 1,191
0,009 0,011 0,009 0,011 88
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Ladino 67 Mauro Rangel Andrés Eduardo 68 Posada Juan Guillermo 69 Galán Gabriel 70 Gómez Martha Inés 71 Vera Gustavo 72 Vivas Cristina 73 Martínez Jairo Rafael Montoya 74 Torres 75 Ángela Niño Juan Carlos 76 García Díaz Oswaldo 77 Prieto Pablo Emilio 78 Vanegas Carlos Alberto 79 Vega Mejía 80 Carlos Rey Andrés 81 Zapata Sergio Remolina 82 Prada Fernando Salazar 83 Arrieta 84 Felipe Nieto 85 NN Camilo 86 Merchán Edgard 87 Jaramillo 88 Manuel Martá 89 Andrés Albán
4 0,009 0,009 0,609 0,275 1,209
0,009 0,011
4 0,009 0,009 0,618 0,284 1,227
0,009 0,011
4 0,009 0,009 0,627 0,293 1,245
0,009 0,011
4 0,009 0,009 0,636 0,302 1,264
0,009 0,011
4 0,009 0,009 0,645 0,311 1,282
0,009 0,012
4 0,009 0,009 0,655 0,320 1,300
0,009 0,012
4 0,009 0,009 0,664 0,330 1,318
0,009 0,012
4 0,009 0,009 0,673 0,339 1,336 4 0,009 0,009 0,682 0,348 1,355
0,009 0,012 0,009 0,012
4 0,009 0,009 0,691 0,357 1,373
0,009 0,012
5 0,009 0,011 0,700 0,368 1,391
0,011 0,016
5 0,009 0,011 0,709 0,380 1,409
0,011 0,016
5 0,009 0,011 0,718 0,391 1,427 5 0,009 0,011 0,727 0,402 1,445
0,011 0,016 0,011 0,016
5 0,009 0,011 0,736 0,414 1,464
0,011 0,017
5 0,009 0,011 0,745 0,425 1,482
0,011 0,017
5 0,009 0,011 0,755 0,436 1,500 5 0,009 0,011 0,764 0,448 1,518 5 0,009 0,011 0,773 0,459 1,536
0,011 0,017 0,011 0,017 0,011 0,017
6 0,009 0,014 0,782 0,473 1,555
0,014 0,021
6 0,009 0,014 0,791 0,486 1,573 6 0,009 0,014 0,800 0,500 1,591 6 0,009 0,014 0,809 0,514 1,609
0,014 0,021 0,014 0,022 0,014 0,022 89
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Ramón 90 Mantilla 91 Fabio Aldana Emilio 92 Arévalo Mónica 93 Morales Claudia 94 González 95 Carlos Nieto Martha 96 Patricia Caro 97 Mabel Olano Mauricio 98 López Rafael Andrés 99 Martínez Camilo 100 Arguello Carlos 101 Rodrigo Ruiz 102 Jorge Silva Carlos 103 Romero Darío 104 Lombana 105 John Peña Nicolás 106 Rincón Alberto 107 Marroquín Juan Bernardo 108 Merino Rafael 109 Sandino Luis Manuel Pulido 110 Moreno Total general
7 0,009 0,016 0,818 0,530 1,627 7 0,009 0,016 0,827 0,545 1,645
0,016 0,026 0,016 0,026
8 0,009 0,018 0,836 0,564 1,664
0,018 0,030
8 0,009 0,018 0,845 0,582 1,682
0,018 0,031
8 0,009 0,018 0,855 0,600 1,700 8 0,009 0,018 0,864 0,618 1,718
0,018 0,031 0,018 0,031
9 0,009 0,020 0,873 0,639 1,736 9 0,009 0,020 0,882 0,659 1,755
0,020 0,036 0,020 0,036
9 0,009 0,020 0,891 0,680 1,773
0,020 0,036
9 0,009 0,020 0,900 0,700 1,791
0,020 0,037
9 0,009 0,020 0,909 0,720 1,809
0,020 0,037
10 0,009 0,023 0,918 0,743 1,827 11 0,009 0,025 0,927 0,768 1,845
0,023 0,042 0,025 0,046
11 0,009 0,025 0,936 0,793 1,864
0,025 0,047
11 0,009 0,025 0,945 0,818 1,882 11 0,009 0,025 0,955 0,843 1,900
0,025 0,047 0,025 0,047
12 0,009 0,027 0,964 0,870 1,918
0,027 0,052
12 0,009 0,027 0,973 0,898 1,936
0,027 0,053
14 0,009 0,032 0,982 0,930 1,955
0,032 0,062
14 0,009 0,032 0,991 0,961 1,973
0,032 0,063
17 0,009 0,039 1,000 1,000 1,991 440
0,039 0,077 1,447 Índice de Gini 0,447
90
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXO F: Conjunto de datos sí paretizable y relación número total de elementos- número de categorías que sí cumple con los requisitos de estar entre 2 y 4.
Categorías Frecuencia delta x
delta y
sum x
sum y
X+x
Y-y
x*y
A
1
0,2
0,05
0,2
0,05
0,2
0,05
0,01
B
1
0,2
0,05
0,4
0,1
0,6
0,05
0,03
C
2
0,2
0,1
0,6
0,2
1
0,1
0,1
D
2
0,2
0,1
0,8
0,3
1,4
0,1
0,14
E
14
0,2
0,7
1
1
1,8
0,7
1,26
20
1
1,54
16
0,54
(
(
))
Capturas de pantalla de la aplicación:
91
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
92
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXO G: Conjunto de datos sí paretizable y relación número total de elementos- número de categorías que no cumple con los requisitos de estar entre 2 y 4.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Categorías Presidente Cliente Tecnología Regalías Administrativo Financiero Producción Gestión humana Crédito Promoción Exportaciones Diseño Costos Operaciones Personal Planeación de la demanda Ventas Editorial CEDI Varios Mercadeo Proveedor Compras Total general
Frecuencia 4 10 11 14 14 14 14 23 25 31 77 78 88 100 225 226 237 599 618 730 1149 2288 3960 10535
delta x delta y 0,043 0,000 0,043 0,001 0,043 0,001 0,043 0,001 0,043 0,001 0,043 0,001 0,043 0,001 0,043 0,002 0,043 0,002 0,043 0,003 0,043 0,007 0,043 0,007 0,043 0,008 0,043 0,009 0,043 0,021 0,043 0,043 0,043 0,043 0,043 0,043 0,043 0,043
0,021 0,022 0,057 0,059 0,069 0,109 0,217 0,376
sum x sum y 0,043 0,000 0,087 0,001 0,130 0,002 0,174 0,004 0,217 0,005 0,261 0,006 0,304 0,008 0,348 0,010 0,391 0,012 0,435 0,015 0,478 0,022 0,522 0,030 0,565 0,038 0,609 0,048 0,652 0,069 0,696 0,739 0,783 0,826 0,870 0,913 0,957 1,000
(
0,091 0,113 0,170 0,229 0,298 0,407 0,624 1,000
(
X+x 0,043 0,130 0,217 0,304 0,391 0,478 0,565 0,652 0,739 0,826 0,913 1,000 1,087 1,174 1,261
Y-y 0,000 0,001 0,001 0,001 0,001 0,001 0,001 0,002 0,002 0,003 0,007 0,007 0,008 0,009 0,021
x*y 0,000 0,000 0,000 0,000 0,001 0,001 0,001 0,001 0,002 0,002 0,007 0,007 0,009 0,011 0,027
1,348 1,435 1,522 1,609 1,696 1,783 1,870 1,957
0,021 0,022 0,057 0,059 0,069 0,109 0,217 0,376
0,029 0,032 0,087 0,094 0,117 0,194 0,406 0,735 1,765 0,765
))
93
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Capturas de pantalla de la aplicación:
94
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
95
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
ANEXO H: Conjunto de datos no paretizable. Categorías Frecuencia delta x
delta y
sum x
sum y
X+x
Y-y
x*y
1
1
0,2
0,2
0,2
0,2
0,2
0,2
0,04
2
1
0,2
0,2
0,4
0,4
0,6
0,2
0,12
3
1
0,2
0,2
0,6
0,6
1
0,2
0,2
4
1
0,2
0,2
0,8
0,8
1,4
0,2
0,28
5
1
0,2
0,2
1
1
1,8
0,2
0,36
5
1
1 0
(
(
))
Capturas de pantalla de la aplicación:
96
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
REFERENCIAS Chang, S. K. (2003). Data structures and algorithms World Scientific.
Chaparro, L. C. D., Alvarado, D., & Ramos, A. C. (2010). Diseño de una asignatura basado en aprendizaje activo que separa el análisis y diseño de la programación orientada a objetos active learning design of a course which separates the analysis and the design from the object oriented. Revista Avances En Sistemas e Informática, 7(1), 59-70.
Dean, A. M., & Voss, D. (1999). Design and analysis of experiments Springer Verlag.
Downey, A. B. (2001). Evidence for long-tailed distributions in the internet. Proceedings of the 1st ACM SIGCOMM Workshop on Internet Measurement, 229-241.
Grosfeld-Nir, A., Ronen, B., & Kozlovsky, N. (2007). The pareto managerial principle: When does it apply? International Journal of Production Research, 45(10), 2317-2325. doi:10.1080/00207540600818203
Kruchten, P. B. (1995). The 4+1 view model of architecture. Software, IEEE, 12(6), 42-50. doi:10.1109/52.469759
Mitzenmacher, M. (2004). A brief history of generative models for power law and lognormal distributions. Internet Mathematics, 1(2), 226-251. doi:10.1080/15427951.2004.10129088
Mohan Pandey, H. (2008). Desing, analysisand algorithms (1st ed.) Firewall Media.
Newman, M. E. (2005). Power laws, pareto distributions and zipf's law. Contemporary Physics, 46(5), 323-351. 97
Pontificia Universidad Javeriana
El Diagrama de Pareto Rediseñado
____________________________________________________________________________
Puntambekar, A. A. (2008). Analysis and design of algorithms Technical Publications.
Xhafa, F., & Vazquez, P. (2006). In Editorial Paraninfo (Ed.), Programacion en C++ para ingenieros (1st ed.)
98