ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el área de Probabilidad y Estadística, con más de 40 años de experiencia en las más reconocidas universidades del área metropolitana de Caracas. Universidad Católica “Andrés Bello” : Profesor Titular Jubilado 1970 a 2003 Universidad Central de Venezuela: Profesor por Concurso de Oposición desde 1993 al presente Universidad Simón Bolívar: Profesor desde 2005 al presente Universidad Metropolitana: Profesor desde 1973 a 1987 Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004 Sus datos personales son : Lugar y Fecha de Nacimiento: Caracas, 16-02-1947 Correo electrónico:
[email protected] Teléfono: 58 416 6357636 Estudios realizados: Ingeniero Industrial. UCAB Caracas 1968 Máster en Estadística Matemática CIENES , Universidad de Chile 1972 Cursos de Especialización en Estadística No Paramétrica Universidad de Michigan 1982 Doctorado en Gestión Tecnológica: Universidad Politécnica de Madrid 2006 al Presente El Profesor Arvelo fue Director de la Escuela de Ingeniería Industrial de la Universidad Católica “Andrés Bello” (1974-1979) , Coordinador de los Laboratorios de esa misma Universidad especializados en ensayos de Calidad, Auditor de Calidad, y autor del libro “Capacidad de Procesos Industriales” UCAB 1998. En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales en el área de “Estadística General” y “Control Estadístico de Procesos”. Una mayor información, puede ser obtenidos en la siguiente página web: www.arvelo.com.ve
Medidas de Posición Angel Francisco Arvelo Luján
2
MEDIDAS DE POSICION Las medidas de tendencia central son en realidad, un caso particular de un tipo de medidas más amplias , llamadas “de posición “ . Estas medidas de posición, tienen también la propiedad de ubicarse entre los dos extremos de variación de los datos , pero ya no necesariamente hacia el centro del intervalo como las de tendencia central. Se utilizan principalmente para indicar la posición relativa de un dato dentro del conjunto. Así por ejemplo, si alguien nos informa que en la prueba de admisión a una Universidad ,un determinado alumno obtuvo 453 puntos ; esta información es insuficiente , si no conocemos la escala utilizada , y las calificaciones obtenidas por los demás alumnos . En un caso como el anterior, una información mucho más precisa , sería que nos informaran que este alumno ocupó el tercer lugar dentro de dos mil aspirantes , pues de esta manera , tendríamos la posición relativa el alumno dentro del grupo, y sabríamos que la calificación obtenida por él , es significativamente alta en comparación con la del resto de los aspirantes. Las medidas a estudiar en este capítulo, buscan justamente este objetivo , de medir o indicar la posición relativa de un dato dentro del conjunto.
1 Percentiles . Dado un conjunto de datos , se define como percentil “p” , a aquel valor Pp , que supera al p% de los datos a lo más , y simultáneamente es superado por el (100 - p) % de los datos a lo más . En esta definición , el término “a lo más” , es muy importante , pues significa que como máximo el p% de los datos son estrictamente menores que el percentil P p, y que como máximo el (100 - p) % son estrictamente mayores que él . Así por ejemplo, si en un grupo de personas el percentil 70 de las estaturas es de 1.73 metros ; esto significa que a lo sumo el 70% de las personas es más baja que 1,73 , y que a lo sumo el 30% , es más alta que 1.73. El cálculo de un percentil es diferente, según los datos estén sin agrupar o agrupados. Cálculo de percentiles para datos sin agrupar : Supongamos que tener un conjunto de datos sin agrupar { x1, x2 , x3 , ......, xn } . Para calcular Pp, es necesario seguir los siguientes pasos: 1°) Ordenarlos de menor a mayor. Los datos ordenados se designaran por { x(1) , x( 2) , x( 3 ) ,, x(n) } . 2°) Calcular el p % de n . Al hacer este cálculo, puede ocurrir que resulte o no un número entero. 3°) Si el p% de n, no resulta entero entonces Pp es único , y es el valor que ocupa la posición entera siguiente dentro del conjunto de datos ordenados de menor a mayor . np Pp x np Es decir , si: , entonces : 100 1 100
Medidas de Posición Angel Francisco Arvelo Luján
3
np np significa “parte entera” de . 100 100 En caso de que el p% de n resulte entero, se toma como Pp , al punto medio np entre el dato que ocupe la posición , y el siguiente . 100
En la notación anterior
np Es decir , si 100
x (
, entonces :
Pp
np ) 100
x (
np ) 1 100
2
La justificación de este procedimiento será considerada a continuación, mediante la aplicación de la definición de “percentil “ , en los ejemplos siguientes : Ejemplo 1 Al medir las estaturas de 9 personas , se encuentran los siguientes resultados : 1.83 , 1.72 , 1.76 , 1.62 , 1.56 , 1.78 , 1.60 , 1.66 y 1.58 . Encuentre el percentil 30 . Solución : Se ordenan de menor a mayor : 1.56 , 1.58 , 1.60 , 1.62 , 1.66 , 1.72 , 1.76 , 1.78 , 1.83 A continuación se calcula el 30 % de 9 , que resulta ser 2.70 . Como 2.70 no es entero, entonces el percentil 30 es el valor que ocupa la posición entera siguiente , es decir , la tercera que corresponde al valor 1.60 . En conclusión P30 = 1.60 . Este valor 1.60 es el único que cumple con la definición de percentil 30 , pues supera a 2 valores de 9 que es menos del 30 % , y es superado 6 valores de 9 , que es menos del 70 % . Cualquier otro valor diferente de 1.60 , perteneciente o no al conjunto de datos, sobrepasa el 30 % por debajo , o el 70 % por encima . Ya se explicó , en la Sección V.4 , que el valor de una medida de tendencia central , como por ejemplo , la media o la mediana , no tiene necesariamente que pertenecer al conjunto de datos . Esta misma explicación, es válida para las medidas de posición; y así por ejemplo , 1.59 no pertenece al conjunto de datos , pero pudiera ser percentil. En este caso 1.59 no cumple los requisitos para ser percentil 30 , pues es superado por 7 datos de 9 , que representan más del 70 % . Un valor mayor que 1.60 tampoco pudiera ser percentil 30 , pues superaría a 3 datos de 9 , que constituyen más del 30 % . Por las consideraciones anteriores, el único en cumplir con la definición es 1.60. Ejemplo 2 . Al tomar a 20 alumnos un examen de Matemática, las calificaciones fueron : 54 , 21 , 34 , 78 , 93 , 45 , 66 , 38 , 50 , 87 , 63 , 88 , 31 , 62 , 96 , 80 , 71 , 59 , 35 y 42 . Halle el percentil 60 de las calificaciones obtenidas . Solución : Se comienza ordenándolas de menor a mayor . 21, 31 ,34 ,35 ,38 ,42 , 45 ,50 ,54 , 59 , 62 , 63 , 66 , 71 ,78 ,80 , 87 , 88 , 93 , 96 En este paso , de existir valores repetidos , hay que colocar cada uno tantas veces como se repita .
Medidas de Posición Angel Francisco Arvelo Luján
4
Como se está buscando el percentil 60 , se calcula el 60% de 20 , que resulta ser un número entero 12 . En este caso , existen infinitos percentiles 60 , que son todos aquellos valores comprendidos entre el que ocupa la posición 12 y el que ocupa la posición 13 , ambos inclusive , es decir , todos los valores comprendidos en el intervalo cerrado [ 63 , 66 ] . En efecto , el valor 63 es un percentil 60 , pues supera a 11 datos de 20 que representan el 55% de los datos (no sobrepasa el 60%) , y es superado por 8 datos de 20 que representan exactamente el 40% . El valor 66 , también es percentil 60 , pues supera a 12 datos de 20 , que equivalen al 60 % ( no lo sobrepasa ) , y es superado por 7 datos de 20 que constituyen el 35 % ( no sobrepasa el 40% ) . Cualquier valor comprendido entre 63 y 66 , aunque no pertenezca al conjunto de datos , también cumple con la definición, pues por ejemplo , 64 supera a 12 datos de 20 ( 60% ) , y es superado por 8 datos de 20 ( 40%) . Por este motivo , al existir infinitos percentiles 60 , se toma como representante de 63 66 todos ellos , al punto medio del intervalo , y por tanto : P 60 = = 64.50 2 Algunos autores , recomiendan en este caso , tomar como percentil , a aquel valor que divide al intervalo , en la misma razón que lo hace el percentil con los datos , y así por ejemplo , en un caso como el anterior , se tomaría como percentil 60 , a aquel valor que divide al intervalo [ 63 , 66] , en la razón 60 : 40 , y por lo tanto , 60 bajo este criterio : P60 = 63 + ( 66 - 63 ) = 64.80 100 A pesar de que este último criterio es más lógico , el criterio de tomar el punto medio es el más difundido , y es que generalmente se utiliza para dar el percentil en caso de que el p % de “n” resulte entero , y existan infinitos percentiles. Ejemplo 3 El peso en kilogramos , de un grupo de 15 personas es el siguiente : 75 , 56 , 66 , 75 , 61 , 66 , 78 , 83 , 60 , 66 , 56 , 60 , 91 , 56 y 70 . Hallar el percentil 25 y el percentil 80 de los datos . Solución: Al ordenar de menor a mayor, hay algunos valores que se repiten . Estos se colocan tantas veces como se repitan. 56 , 56 , 56 , 60 , 60 , 61 , 66 , 66 , 66 , 70 , 75 , 75 , 78 , 83 , 91 Para hallar P25 , se calcula el 25 % de 15 , que es 3.75 . Como este valor no es entero , entonces P25 , es el que ocupe la cuarta posición P25 = 60 . Para hallar P80 , se calcula el 80 % de 15 , que es 12 . Como este valor es entero , entonces P80 , es la media entre los que ocupen la décima segunda y la décima 75 78 tercera posición P80 = = 76,50 . 2 Se deja al lector la verificación de que estos valores cumplen con las definiciones correspondientes. Cálculo de percentiles para datos agrupados : Cuando los datos están agrupados en una tabla de frecuencias , la determinación del percentil P p , se puede hacer gráficamente , entrando el eje vertical de la “Ojiva de frecuencias relativas
Medidas de Posición Angel Francisco Arvelo Luján
5
porcentuales acumuladas” con el p% , y leyendo en el eje horizontal el valor correspondiente a Pp , tal como se muestra en la figura : 100 %
hi %
Hi % p% Hi-1 %
Valor de los datos, en intervalos de clase
Pp El valor así determinado, es obviamente el percentil Pp , pues supera exactamente al p% de los valores , y es superado por el ( 100 - p) % restante . Para determinar analíticamente al percentil Pp, se sigue un procedimiento de interpolación análogo al ya visto para determinar la mediana , que consiste en plantear una semejanza de triángulos dentro del intervalo que contiene al percentil buscado Pp , y que da por resultado la siguiente expresión : p% Hi 1% Pp L i 1 c hi % Li-1 = Límite real inferior del intervalo donde cae el percentil . Hi-1 = Frecuencia relativa porcentual acumulada hasta el intervalo anterior . hi = Frecuencia relativa del intervalo donde cae el percentil . c = Ancho de clase . El intervalo donde cae el percentil, es aquel en donde la frecuencia relativa porcentual acumulada alcanza el p%. Si se multiplica numerador y denominador por “n” , se obtiene una fórmula más cómoda para calcular el percentil Pp , en función de las frecuencias absolutas: np Fi 1 100 Pp Li 1 c fi Donde : Li-1 = Límite real inferior del intervalo donde cae el percentil . Fi-1 = Frecuencia absoluta acumulada hasta el intervalo anterior . fi = Frecuencia absoluta del intervalo donde cae el percentil . c = Ancho de clase. En el caso de intervalos con diferente amplitud, la interpolación dentro de la “Ojiva” es igual que cuando se tienen intervalos con igual amplitud ; sólo que ahora , la fórmula se modifica pues en lugar de “c” , se tiene “ci” , que corresponde a la amplitud del intervalo donde cae el percentil buscado . np Fi 1 ci Para intervalos con diferente amplitud: Pp Li 1 100 fi Tanto en el caso de intervalos con igual amplitud , como en el de diferente amplitud , al hacer la interpolación se ha supuesto que los datos se distribuyen de
Medidas de Posición Angel Francisco Arvelo Luján
6
manera uniforme dentro de cada intervalo , y que en consecuencia , el crecimiento de la “Ojiva” es lineal , lo cual es obviamente una aproximación . Ejemplo 4 : Determinar el percentil 40 y el percentil 75 , en la siguiente distribución de frecuencias: Clase Frecuencia
10-19 12
20-29 26
30-39 55
40-49 61
50-59 40
60-69 28
70-79 4
Solución: Se construye la tabla de frecuencias acumuladas , con sus respectivos límites reales : Límites reales F. Acumulada
< 19.50
< 29.50
< 39.50
< 49.50
< 59.50
< 69.50
< 79.50
12
38
93
154
194
222
226
Existen 226 datos y se quiere encontrar el “Percentil 40” ; por tanto , hay que calcular el 40% de 226 , que resulta ser 90.40 . El intervalo donde cae P40 es el tercero , pues en él en donde se alcanza esta frecuencia acumulada . Este intervalo comienza con una frecuencia acumulada de 38 , y termina con una de 93 . np 226 40 Fi 1 38 100 Pp Li 1 100 c P40 29.50 10 = 39.03 fi 55 El resultado anterior significa que en el conjunto de datos , el 40% de ellos es menor que el valor 39.03 , y el 60% restante mayor que 39.03 . Para hallar el percentil 75, se procede de manera análoga , y se encuentra que éste se encuentra en el 5° intervalo , pues comienza con una frecuencia acumulada de 154 y termina con una de 194 . El 75% de 226 , que es 169.50 se ubica entre los límites de frecuencia acumulada de este intervalo . 226 75 154 100 P75 49.50 10 = 53.38 40 Ejemplo 5: La siguiente tabla muestra la antigüedad en años , del personal dentro de una empresa: Años Frecuencia
0a1
1a3
3a5
5a8
8 a 15
15 a 20
20 a 30
850 380 210 110 100 80 30 Al firmar el contrato colectivo , se conviene en darle un bono por antigüedad equivalente al 80% de su sueldo , a los empleados que estén en el grupo 10% más antiguo , al 50% de su sueldo, al grupo que esté en el siguiente 30% más antiguo, y al 30% de sueldo, al grupo del 40% siguiente en antigüedad . Encontrar la antigüedad que debe tener el empleado, para recibir cada uno de estos bonos. Solución: Los empleados que reciben un bono equivalente al 80% de su sueldo son los que están del “Percentil 90” hacia arriba , pues ellos representan el 10% más antiguo .
Medidas de Posición Angel Francisco Arvelo Luján
7
Los que reciben un bono equivalente al 50% de su sueldo , son los que están entre el “Percentil 60” y el “Percentil 90” en antigüedad , pues ellos representan el 30% siguiente en antigüedad. Por último, los que reciben un bono equivalente al 30% de su sueldo , son aquellos que tienen una antigüedad comprendida entre el “Percentil 20” y el “Percentil 60” , pues este grupo representa el 40% siguiente en antigüedad. Los que se encuentren por debajo del “Percentil 20” son los empleados con menor antigüedad, no reciben este bono , y representan el 20 % del personal. Para calcular estos percentiles , se elabora la tabla de frecuencias absolutas acumuladas. Antigüedad
Menor que 1
Menor que 3
Menor que 5
Menor que 8
Menor que 15
Menor que 20
Menor que 30
Frecuencia
850 1230 1440 1550 1650 1730 1760 Como en total hay 1760 empleados , el percentil 20 se ubica en el primer intervalo , pues el 20% de 1760 es 352. np 1760 20 Fi 1 0 100 100 Pp Li 1 ci P20 0 1 = 0.41 años 151 días fi 850 P60 cae en el segundo intervalo , pues el 60% de 1760 es 1056 ; mientras que el P90 cae en el quinto intervalo , pues el 90 % de 1760 es 1584 . Haciendo los cálculos se tiene : 1760 60 850 100 P60 1 2 = 2.08 años 2 años y un mes . 380 1760 90 1550 100 P90 8 7 = 10.38 años 10 años y 5 meses . 100 La conclusión es entonces, que los empleados con una antigüedad menor 151 días 5 meses , no reciben bono , los de antigüedad comprendida entre 5 meses y 2 años con un mes reciben un bono equivalente al 30 % de sueldo , los de antigüedad comprendida entre 2 años con un mes y 10 años con cinco meses , un bono del 50 % de su sueldo , y los de antigüedad 10 años con cinco meses o mas, un bono del 80% de su sueldo .
2 Cuartiles y Deciles : Existen ciertos percentiles que por su especial ubicación dentro del conjunto de datos , reciben un nombre particular ; tal es el caso de los “cuartiles” y de los “deciles” . Los “cuartiles” son aquellos valores que dividen al conjunto de datos en cuatro partes iguales , y al histograma en cuatro partes de igual área. El primer cuartil se representa por “Q1” y corresponde al “Percentil 25”, el segundo cuartil “Q2” al “Percentil 50”, que a su vez también coincide con la “mediana” , y el tercer cuartil “Q3” con el “Percentil 75” . Para calcularlos, se procede igual que para calcular un percentil cualquiera , según lo explicado en la sección precedente , y así por ejemplo , en el caso de datos agrupados , se tiene :
Medidas de Posición Angel Francisco Arvelo Luján
8
n n 3n Fi 1 Fi 1 Fi 1 Q1 L i 1 4 c ; Q 2 Med Li 1 2 c ; Q 3 Li 1 4 c fi fi fi Los “deciles” son aquellos valores que dividen al conjunto de datos en décimas partes , y así por ejemplo, “el primer decil” D1 corresponde al “Percentil 10” , “el segundo decil” D2 al “Percentil 20” , “el quinto decil” D5 al “Percentil 50“ o “segundo cuartil” o “mediana”, y así sucesivamente . Ejemplo 6 Calcular el 3° cuartil , y el 2° decil , en la siguiente tabla de frecuencias: Clases Frecuencia
50-100 25
100-150 80
150-200 102
200-250 156
250-300 91
300-350 27
350-400 19
< 300 454
< 350 481
< 400 500
Solución : La tabla de frecuencias acumuladas es : Valor Frecuencia
< 100 25
< 150 105
< 200 207
< 250 363
Q3 = P75 , se halla en el 5° intervalo , pues el 75% de 500 es 375 . 3 500 363 4 Q3 250 50 = 256.59 91 D2 = P20 , se halla en el 3° intervalo , pues el 20% de 500 es 100 . 2 500 25 10 D2 100 50 = 146.88 80
3 La posición Percentil : Cuando no se tiene información acerca del orden de magnitud de un conjunto de datos , no sabemos si un determinado valor es grande o es pequeño con relación a los demás . Así por ejemplo , si alguien nos dice que un determinado bombillo duró 50 horas , esta información es insuficiente , pues si no sabemos cual es la duración promedio de un bombillo , y entre que valores se encuentra dicha duración , no podremos concluir si una duración de 50 horas es mucha , o es poca . “La posición percentil” designada por “p” , indica el “percentil” que le corresponde a un determinado valor , es decir el porcentaje de datos que son menores que dicho valor. En el ejemplo anterior , una información mucho más completa , es decir que un bombillo que dure 50 horas ocupa el “Percentil 80” , pues esto nos dice que a lo más el 80 % de los bombillos dura 50 horas , y a lo más el 20% de los bombillos sobrepasa las 50 horas de duración . Con esta información , podríamos concluir que un bombillo que dure 50 horas es en términos relativos , un bombillo de buena calidad , pues su posición dentro del grupo es alta , al superar al 80% de los restantes . Para calcular la “Posición percentil” que le corresponde a un datos dentro del conjunto , debemos distinguir entre datos no agrupados y datos agrupados . En el caso de datos no agrupados, la determinación de la “Posición percentil” que le corresponde a un determinado valor es muy simple , pues basta con calcular el
Medidas de Posición Angel Francisco Arvelo Luján
9
porcentaje de datos dentro del conjunto , que son estrictamente menores que el valor en cuestión . Ejemplo 7 : Para las calificaciones del examen de Matemática dadas en el Ejemplo 6.2 , hallar la “Posición percentil” que le corresponde al alumno que obtuvo la calificación de 45 puntos . Solución : Al igual que en Ejemplo 6.2 , hay que ordenar los datos de menor y mayor, teniendo en cuenta que de existir valores repetidos , hay que colocarlos tantas veces como se repitan . 21, 31 ,34 ,35 ,38 ,42 , 45 ,50 ,54 , 59 , 62 , 63 , 66 , 71 ,78 ,80 , 87 , 88 , 93 , 96 Supera a 6 datos de 20 = 30 %
Es superado por 13 datos de 20 = 65% .
En consecuencia, el valor 45 ocupa el percentil 30 . Algunos autores1 , en este caso de datos sin agrupar, recomiendan una corrección en el cálculo de la “Posición percentil” , cuando ésta se calcula para un valor perteneciente al conjunto de datos . Esta corrección es para tomar en consideración que este valor 45 no es el único “Percentil 30 “. Existen infinitos, y 45 es el mayor de ellos , pues cualquier valor comprendido entre 42 y 45 , aunque no pertenezca al conjunto de datos , también es “Percentil 30” . Un valor como por ejemplo 43, supera a 6 datos de 30 que representa el 30% , y es superado por 14 datos de 20 que representa el 70% . Esta corrección es exclusiva para el caso de que el dato pertenezca al conjunto , y j 0.50 100% ; siendo “j” el puesto que viene dada por la siguiente expresión: p n ocupa el dato cuando se ordenan de menor a mayor. En el ejemplo anterior, tomando en cuenta esta corrección , la “Posición percentil” que le corresponde al alumno que obtuvo la calificación de 45 puntos, y que ocupó el 7° puesto de 20 , ordenado de menor a mayor es : 7 0.50 p 100% = 32.50 20 En el caso de datos agrupados , el cálculo de la “Posición percentil” , puede hacerse gráficamente o analíticamente . La determinación gráfica se hace , entrando en el eje horizontal de la “Ojiva” , con el valor dado y el cual designaremos por “Pp” , y leyendo sobre el eje vertical , el porcentaje “p %” al cual supera este valor “Pp” .
1
Douglas C. Montgomery & Geoge C. Runner Probabilidad y Estadística aplicadas a la Ingeniería. Editorial “Mac. Graw Hill” . Sección 8-11.2
Medidas de Posición Angel Francisco Arvelo Luján
10
100 %
hi %
p% Hi-1 %
Valor de los datos, en intervalos de clase
Pp La determinación analítica, se hace por interpolación lineal , y se llega a : Pp Li 1 p Hi 1% hi % c o también , en función de las frecuencias absolutas : Pp Li 1 100 p Fi 1 fi n c Ejemplo 8 : La siguiente tabla muestra los sueldos mensuales de los empleados administrativos en una cierta organización. Sueldo ($) Frecuencia
500 a 999
1.000 a 1.499 1.500 a 1.999 2.000 a 2.499 2.500 a 2.999 3.000 a 3.499
12 56 45 32 21 8 a) ¿Cuál es la posición percentil que le corresponde a un empleado que tenga un sueldo mensual de $ 1.230. b) ¿ Qué porcentaje de los empleados ganan entre $1.300 y $ 2.400 ?. Solución: Comenzamos definiendo los límites reales, y calculando las frecuencias acumuladas. Límites Acumulada
< 999,50
< 1.499,50
< 1.999,50
< 2.499,50
< 2.999,50
< 3.499,50
12
68
113
145
166
174
Para hallar la posición percentil correspondiente a un sueldo de $1.230, tenemos que: n = 174 , Pp= 1.230 c = 500 ( Ancho de clase) f2 = 56 ( frecuencia del intervalo al que pertenece 1.230, en este caso el 2°) F1=12 ( frecuencia acumulada hasta el intervalo anterior, en este caso el 1°)
FG H
IJ K
100 1.230,00 - 999,50 12 + 56 = 21,73 % 174 500 Este resultado significa que una persona cuyo sueldo sea de $ 1.230 , supera al 21,73 % de los empleados, y le corresponde aproximadamente el percentil 22 dentro de esta organización . Para encontrar el porcentaje de empleados que se encuentran entre $1.300 y $ 2.400 de sueldo; basta con determinar el porcentaje que se encuentra por debajo de cada uno de estos valores, y luego restarlos. Así, el porcentaje de empleados que ganan menos de $ 1.300 es: 100 1.300,00 - 999,50 12 + 68 = 30,38 % p1= 174 500 y el porcentaje por debajo de $ 2.400 es :
Reemplazando : p =
FG H
IJ K
Medidas de Posición Angel Francisco Arvelo Luján
FG H
11
IJ K
100 2.400,00 - 1.999,50 113 + 32 = 75,67 % 174 500 Dentro del intervalo, es en consecuencia: 75,67% - 30,38% = 49,29%
p2=
Un comentario final con relación a los percentiles y a la posición percentil, se refiere a que siempre que se haga un cálculo de esta naturaleza es imprescindible hacer referencia al grupo con relación al cual se hizo el cálculo, pues esta información es vital para medir su relevancia. Así por ejemplo, no tiene la misma relevancia que un estudiante ocupe el percentil 95 en las calificaciones de un examen de Matemática, si el grupo estaba integrado por un conjunto de estudiantes de diversas disciplinas, o si el grupo estaba formado por aspirantes a un doctorado en Matemática.
4 Distribuciones truncadas de frecuencia : En muchas oportunidades interesa analizar a un subconjunto de los datos y no a la totalidad de ellos. Por lo general, cuando se presenta tal situación, existe una condición que divide al conjunto de datos en dos categorías, los que cumplen y los que no cumplen la condición. La situación más frecuente suele ser cuando la condición establecida es estar por encima o por debajo de un determinado valor; y en tal caso, se dice que ese valor trunca a la distribución de frecuencias. Por ejemplo, si un grupo de aspirantes presenta el examen de admisión a una Universidad, y se exige una calificación mínima para ser admitido; no es lo mismo la distribución de frecuencia en las calificaciones para la totalidad de aspirantes, que la distribución de frecuencia en las calificaciones para los alumnos admitidos, pues la calificación mínima de ingreso trunca a la distribución original. Para construir una distribución truncada de frecuencias, debe analizarse dentro de la distribución original cuales son los datos que cumplen la condición exigida. Un problema que suele presentarse es cuando el valor que trunca a la distribución no coincide con uno de los límites de clase, y por tanto, el intervalo queda recortado. En este caso, para calcular la frecuencia que le corresponde al intervalo recortado, es necesario suponer que dentro del intervalo original la frecuencia se reparte de manera uniforme, y que por lo tanto al intervalo recortado le corresponde una frecuencia proporcional a lo que su amplitud representa a la amplitud total; es decir: Amplitud del intervalo recortado Frecuencia del intervalo recortado = f Amplitud Total del intervalo Siendo: f = frecuencia del intervalo sin recortar. El resultado de este cálculo puede no ser un número entero, y por lo tanto debe ser redondeado para obtener una aproximación de la frecuencia del intervalo recortado. Sin embargo, si esta frecuencia va a ser utilizada para un cálculo posterior, no conviene redondearla para evitar acumulación de errores de aproximación.
Medidas de Posición Angel Francisco Arvelo Luján
12
Ejemplo 9 : La siguiente tabla de frecuencias corresponde al contenido de unos envases. C.C Frecuencia
200 a 210 12
210 a 220 45
220 a 230
76
230 a 240 70
240 a 250 51
250 a 260 30
260 a 270 16
Supóngase que existe un dispositivo de control que separa aquellos envases con un contenido inferior a 222 c.c . Encuentre la distribución de frecuencia de los envases que aprueban el control. Solución: El valor 222 trunca a la distribución, y como no coincide con un límite de clase, hay que calcular la frecuencia del intervalo 222 a 230. El intervalo recortado tiene amplitud 8 y el original 10. 8 Frecuencia entre 222 y 230 = 76 = 60,80 61 10 Como los demás intervalos superiores cumplen la condición de ser mayor que 222, la distribución de frecuencia truncada queda: cc Frecuencia
222 a 230 61
230 a 240 70
240 a 250 51
250 a 260 30
260 a 270 16
A partir de la distribución truncada de frecuencias pueden ser calculadas las mismas medidas de tendencia central y de posición ya conocidas, tales como media, mediana, percentiles, etc. El cálculo de tales medidas es idéntico al ya conocido en una distribución cualquiera, sólo que para distinguirlo de aquel, es necesario utilizar un calificativo, tal como ejemplo, media condicionada , mediana de la distribución truncada, etc. Alguno programas de computación, como por ejemplo el MINITAB, utilizan el término “Media Recortada”, traducido del inglés “Trimmed Mean” , que se refiere a la media de la distribución cuando se eliminan los datos inferiores al percentil 5 y los superiores al percentil 95 , dando por resultado una distribución truncada en dos extremos y que contiene al 90% central de los datos. Ejemplo 10 : Calcular la media de la distribución truncada del ejercicio 6.9 Solución : Una vez obtenida la distribución truncada de frecuencia, el cálculo de su media se hace de la forma convencional con las marcas de clase. Para evitar acumulación de errores por redondeo, conviene utilizar como frecuencia del intervalo recortado 60,80 en lugar de la redondeada 61. 222 230 (60,80) (235)(70) (245)(51) (255)(30) (265)(16) 2 =239,58 X 222 60,80 70 51 30 16
Es frecuente truncar la distribución con sus propios percentiles, y obtener así distribuciones truncadas que reciben nombres específicos. Así por ejemplo si se trunca con el percentil 70, por arriba obtendríamos la distribución del 30% superior y por abajo del 70% inferior.
Medidas de Posición Angel Francisco Arvelo Luján
13
Si se trunca con la mediana, obtendríamos por arriba la mitad superior y por abajo la mitad inferior. Si se trunca con el primer y tercer cuartil, obtendríamos la distribución del 50% central.
EJERCICIOS RESUELTOS Ejemplo 11 : Dada la siguiente tabla de frecuencias: Límites Reales
Frecuencia
19,5 a 29,5 23
29,5 a 39,5 31
39.5 a 49,5 76
49,5 a 59,5 60
59,5 a 69,5 42
69,5 a 79,5 12
a) Encuentre el Percentil 40 de la distribución. b) El Porcentaje de observaciones que caen entre 32 y 68. c) El intervalo 50 % central de la distribución. d) La media del intervalo 80 % central. Solución: a) La tabla de frecuencias acumuladas es: Límites
Acumulada
< 29,5 23
< 39,5 54
< 49,5 130
< 59,5 190
< 69,5 232
< 79,5 244
Como el 40% de 244 es 97,60 , el P 40 se encuentra en el 3° intervalo, pues hasta su límite inferior 39,5 hay una frecuencia acumulada de 54 , y hasta su límite superior 49,5 la frecuencia acumulada es de130 . 40 244 - 54 P40 = 39,50 + 100 10 = 45,24 76 b) 32 cae en el 2° intervalo , y el porcentaje de observaciones por debajo es: 100 32.00 - 29.50 23 + 31 = 12,60 % p1 = 244 10 68 cae en el 5° intervalo , y el porcentaje de observaciones por debajo es: 100 68.00 - 59.50 190 + 42 = 92,50 % p2 = 244 10 Entre 32 y 68 se encuentran 92,50 % - 12,60 % = 79,90 % .
FG H FG H
IJ K
IJ K
c) El intervalo 50 % central de la distribución es el que tiene como extremo inferior al primer cuartil, y como superior al tercer cuartil, pues en él se encuentra el 50% de los datos, y el otro 50 % se reparte por igual para cada lado, 25% por debajo y 25 % por arriba, tal como se muestra en la figura :
Q1 cae en el 3° intervalo , mientras que Q3 lo hace en el 4°
Medidas de Posición Angel Francisco Arvelo Luján
14
244 54 Q1= P25 = 39,50 + 4 10 = 40,42 76 3 244 130 4 Q3= P75 = 49,50 + 10 = 58,33 60 El intervalo 50% central es entonces : [ 40,42 ; 58,33] . d) Se quiere la media del intervalo 80% central, lo que equivale a truncar la distribución en el “Percentil 10” y en el “Percentil 90”, y considerar sólo los datos que se encuentran entre ellos.
P10 cae el 2° intervalo, mientras que P90 en el 5° . 10 244 23 100 P10 = 29,50 + 10 = 29,95 31 90 244 190 P90 = 59,50 + 100 10 = 66,55 42 El intervalo 80% central es entonces [ 29,95 ; 66,55], y hay que calcular la distribución truncada de frecuencia. En la distribución original, los límites del 2° intervalo eran desde 29,5 hasta 39,5 con una frecuencia de 31. Suponiendo que dentro del intervalo existe uniformidad, la frecuencia correspondiente al segmento recortado desde 29,95 hasta 39,5 es la parte 39,50 29,95 proporcional, es decir: 31 = 29,60 39,50 29,50 Los intervalos que van desde 39,5 hasta 49,50 , y desde 49,50 hasta 59,50 caen completos dentro del intervalo 80% central con sus frecuencias de 76 y 60 respectivamente. El intervalo desde 59,50 hasta 69,50 quedó recortado en P 90= 66,55 , y su parte 66,55 59,50 proporcional de frecuencia es: 42 = 29,60 . 69,50 59,50 La distribución truncada de frecuencias queda entonces: Intervalo 29,95 a 39,50 39,50 a 49,50 49,50 a 59,50 59,50 a 66,55 Frecuencia 29,60 76 60 29,60 Nótese que la suma de las frecuencias es: 29,60 + 76 + 60 + 29,60 = 195,20 , que corresponde al 80 % de los datos. Por este motivo, no conviene redondear las frecuencias a enteros.
Medidas de Posición Angel Francisco Arvelo Luján
15
El 20% que no va a ser considerado para el cálculo de la media, se reparte en 10% por lado izquierdo y 10% por el derecho. Por último, con las marcas de clase, la media del intervalo 80% central es: 29,95 39,50 39,50 49,50 49,50 59,50 59,50 66,55 29,60 76 60 29,60 2 2 2 2 X 10% 90% 29,60 76 60 29,60 = 48,90 Ejemplo 12: En un examen de Estadística sobre 100 puntos, las calificaciones de un grupo de 180 estudiantes fueron: Calificación 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 a 89 Frecuencia 27 52 55 25 14 7 El Profesor debe convertir estas calificaciones a una escala literal, de manera que el grupo 10% mejor reciba la mención “A” (Sobresaliente), el siguiente 30% la mención “B”(Meritorio), el siguiente 35% la “C”(Aprobado), y el 25% peor “D” (Reprobado). a) Encuentre los límites para caer en cada una de estas cuatro menciones. b) Calcule la calificación media de los que recibieron la mención “D”. Solución : a) Los que reciben la mención “A” son quienes caen del percentil 90 en adelante, la mención “B” quienes caen entre los percentiles 60 y 90, la mención “C” entre los percentiles 25 y 60, mientras que “D” para quienes caen por debajo del percentil 25. La Tabla de frecuencia acumuladas es: Calificación < 39.5 < 49.5 < 59.5 < 69.5 < 79.5 < 89.5 Frecuencia 27 79 134 159 173 180 El 90% de 180 es 162, y por consiguiente el P90 cae entre 69.5 y 79.5 90 180 - 159 100 P90 = 69.5 + 10 = 71,64 14 El 60 % de 180 es 108 , y por tanto P60 cae entre 49.5 y 59.5 60 180 - 79 100 P60 = 49,5 + 10 = 54,77 55 25 180 - 27 Por último: P25 = Q1 = 39.5 + 100 10 = 42,96 52 Redondeando las cifras, los límites para recibir cada una de las menciones es 72 ó mas : A Entre 55 y 71 ambos inclusive : B entonces: Entre 43 y 54 ambos inclusive: C 42 ó menos : D
R| |S || T
Medidas de Posición Angel Francisco Arvelo Luján
16
b) El cálculo de la calificación media para quienes reciben la mención “D” es sobre una distribución truncada, pues elimina a todos aquellos que tienen 43 ó más . Sin redondear cifras para hacer más preciso el cálculo, se tiene que reciben la mención “D” los 27 estudiantes que caen en el intervalo real 29,5 a 39,5 , y la parte proporcional del intervalo real de 39,50 hasta 42,96 , cuya cuota de 42,96 39,50 frecuencia es: 52 = 18. 49.50 39,50 La distribución de frecuencia de quienes reciben la mención “D” es: Intervalo Real 29,50 a 39,50 39,50 a 42,96 Frecuencia 27 18 En el referido intervalo caen en total 27 + 18 = 45 , que representa el 25 % 29,50 39,50 39,50 42,96 27 18 2 2 inferior, y su media es : X 25% = 37,19 27 18 Ejemplo 13: Dada la siguiente tabla puntual tabla puntual de frecuencias: Valor 0 1 2 3 4 5 6 7 frecuencia 8 14 25 13 20 12 6 2 a) Determine el primer cuartil , el percentil 60 y el octavo decil . b) ¿ Cual es el percentil que le corresponde al valor 4 ?. c) Halle la media de los valores comprendidos entre 2 y 5 ambos inclusive. Solución: En este caso los datos no están agrupados. a) Para determinar los percentiles se deben ordenar de menor a mayor, y en caso de que un dato se repita hay que colocarlo tantas veces como sea su frecuencia. La tabla acumulada de frecuencias es : Valor 0 1 2 3 4 5 6 7 acumulada 8 22 47 60 80 92 98 100 Esta tabla indica que se tienen 100 datos, y si se ordenan de menor a mayor , el valor 0 ocupa los puestos del 1° al 8°, el valor 1 los puestos del 9° al 22° , el valor 2 los puestos del 23° al 47° , y así sucesivamente. Para hallar Q1 se debe calcular el 25% de 100 es decir 25, y como el resultado es entero, Q1 es la semisuma entre los valores que ocupen el puesto 25° y 26°. En este caso el puesto 25° y el 26° son ocupados ambos por el valor 2, y por lo tanto: Q1 = 2. Nótese que el valor 2 es el único que cumple con la definición de primer cuartil, pues existen 22% de datos menores que él , y 53% de datos mayores que él. Cualquier otro valor tendría un porcentaje de datos mayor al 25% por debajo de él, o mayor al 75% por arriba de él. Para hallar P60, se debe calcular el 60% de 100 , y como el resultado da exacto 60, P60 es la semisuma entre los valores que ocupen los puestos 60° y 61°. El puesto 60° lo ocupa el valor 3 , mientras que el puesto 61° el valor 4 ; en 3 4 consecuencia : P60 = = 3,50 . 2 Por debajo de 3,50 caen el 60% de los datos, y por arriba el 40%.
Medidas de Posición Angel Francisco Arvelo Luján
17
Recuérdese que se toma la semisuma como un valor convencional, pero en realidad existen infinitos percentiles 60, que en este caso son todos aquellos valores reales comprendidos entre 3 y 4 . Siguiendo el procedimiento explicado: D8 = P80 = 4,50 b) En la sección 3 se explicó como calcular el percentil que le corresponde a un determinado valor perteneciente al conjunto de datos, cuando estos están sin j 0.50 100% ; siendo “j” el puesto que ocupa agrupar, mediante la expresión: p n el dato cuando se ordenan de menor a mayor. En este caso se quiere calcular el percentil que le corresponde al valor 4. Como el valor 4 está repetido 20 veces, ocupa igual número de puestos dentro del conjunto de n = 100 datos. La primera vez que aparece el 4 es en el puesto j= 61 , y a este le corresponde el 61 0,5 percentil: p = 100% = 60,50 % ; y la última vez que aparece el 4 es en el 100 80 0,5 puesto j= 80 al que le corresponde el percentil : p = = 79,50 %. 100 Haciendo un promedio aritmético concluimos que el percentil que le corresponde 60,5 79,50 al valor 4 es: = 70 . 2 Este percentil asignado al valor 4 es realmente convencional , pues en realidad él cumple con las exigencias para ser cualquier percentil entre 60 y 80 , dado que supera al 60 % de los datos, y es superado por el 20% . El procedimiento de asignación de percentiles es muy importante en el uso de ciertos papeles especiales usados en “Control Estadístico de Calidad”, como por ejemplo el “Papel Probabilístico”, cuyo uso y aplicaciones puede encontrarse en la referencia bibliográfica dada en la sección VI.3 . c) Los valores 2 y 5 truncan a la distribución, dando lugar a la siguiente: Valor 2 3 4 5 Frecuencia 25 13 20 12 2 (25) 3 (13) 4 (20) 5 (12) X2 x 5 = 3,27 25 13 20 12 Por ser una tabla puntual, no se usan marcas de clase.
Preguntas de Revisión 1°) El percentil “p” se define como aquel valor que supera al p% de los datos a lo más, y simultáneamente es superado por el (100-p) % de los datos a lo más. ¿Por qué debe utilizarse en cada oportunidad el término “a lo más”?. ¿Cómo quedaría la definición si no se utilizara el término “a lo más”?. 2°) Si se quiere definir un intervalo que contenga a un cierto porcentaje p% de los datos, ¿cuántas soluciones existen? .
Medidas de Posición Angel Francisco Arvelo Luján
18
3°) ¿Qué puede decirse del intervalo [P30 , P80] . 4°) ¿Puede garantizarse que: Q 2
Q1
Q3
?. 2 5°) Si Ud. tiene una Ojiva del tipo “mayor que” para datos agrupados, ¿cómo podría obtener gráficamente un determinado percentil ?. 6°) Haga la interpolación requerida, para deducir la fórmula que se utiliza en el cálculo de un percentil, en una tabla agrupada de frecuencias. ¿ Qué supuestos deben hacerse ?. 7°) Explique y justifique el procedimiento para calcular un percentil, cuando se tiene un conjunto de “n” datos sin agrupar. 8°) Suponga que se tiene un conjunto de “n” datos sin agrupar y se le calcula un percentil. Posteriormente los datos se agrupan en una tabla de frecuencias, y se vuelve a calcular el mismo percentil. ¿Coinciden los resultados?. 9°) ¿Por qué la fórmula para calcular un percentil en una tabla agrupada de frecuencias, no es válida cuando la tabla de frecuencias se refiere a valores puntuales? . 10°) En una tabla agrupada de frecuencias, ¿cuándo coincide el percentil “p” con uno de los límites de clase?. 11°) ¿Puede ocurrir que la media de una distribución truncada de frecuencias sea igual a la media de la distribución original?. 12°) Si de un conjunto de datos se eliminan todos aquellos que sean menores que percentil 15 y los mayores que el percentil 85, ¿qué nombre recibiría la media de los datos sobrantes? . 13°) 1 2
¿Qué
(Q1 Q 3 )
porcentaje 1 2
(Q 3
de
las
observaciones,
caen
en
Q1 ) ?.
Temas complementarios para investigar Investigue las aplicaciones de los percentiles en las siguientes áreas: 1°) Administración de sueldos y salarios. 2°) Resultado de los exámenes de laboratorio para fines médicos. 3°) Establecimiento del plazo de garantía en componentes.
el
intervalo
Medidas de Posición Angel Francisco Arvelo Luján
19
Problemas Propuestos I. Nivel Elemental 14) Los siguientes datos representan las edades de un grupo de personas: 23, 42, 15, 41 , 18, 25 , 32 , 20 , 29 , 40 , 33 , 16 Determine: a) El percentil 40. b) Los cuartiles. c) El octavo decil. d) El percentil que le corresponde dentro del grupo, a la persona de 32 años. Solución: a) P40= 23 b) Q1= 19 ; Q2= 27 ; Q3= 36,50 c) D8= 40 ; d) 62,50 15) A continuación se presentan los puntajes de cociente de inteligencia de 40 adolescentes seleccionados al azar: 80 92 98 103 106 108 113 121 83 93 98 103 106 108 116 122 86 93 101 103 107 111 116 123 87 96 102 106 107 112 117 126 88 96 102 106 108 112 118 129 a)¿Cuál es el valor del cociente de inteligencia por debajo del cual se encuentra el 20% de los adolescentes? . b) ¿ Por encima de qué valor se encuentra el 10%?. d) Un adolescente cuyo cociente de inteligencia sea 111 , ¿qué percentil ocupa dentro del grupo?. e) ¿Qué percentil ocupa un adolescente de cociente de inteligencia 103?. Solución : a) 94,50 b) 121,50 c) 68,75 d) 38,75 16) Los siguientes datos representan la duración en horas de 50 bombillos. 75 97 71 65 84 27 108 91 122 82 96 58 94 43 116 123 91 120 94 43 74 73 68 54 50 49 81 128 103 76 120 94 79 80 82 71 88 88 47 73 71 106 86 108 84 93 77 107 44 127 a) Halle los cuartiles. b) Calcule el percentil 56. c) ¿Por cuánto tiempo pudiera garantizarse la vida de un bombillo, de manera sólo el 10 % falle antes de ese plazo?. d) ¿Qué porcentaje de los bombillos sobrevive las 100 horas de uso? . Solución : a) Q1= 71 ; Q2= 83 ; Q3= 97 b) P56= 87 c) 48 horas d) 24 % 17) La siguiente tabla se refiere al nivel de colesterol en sangre, en las muestras tomadas a los pacientes de un cierto laboratorio: m.g /dl 120 a 139 140 a 159 160 a 179 180 a 199 200 a 219 220 a 239 240 a 259 260 a 279 Frecuencia 12 67 96 83 42 27 15 8 a) Halle los cuartiles
Medidas de Posición Angel Francisco Arvelo Luján
20
b) ¿Cual es la posición percentil que le corresponde a una persona con un nivel de colesterol en 187 m.g/dl ? c) Encuentre el intervalo 80 % central. d) ¿ Qué porcentaje de estas personas tiene su nivel colesterol por encima de 210 m.g /dl ?. Solución: a) Q1= 161,27 ; Q2= 179,50 ; Q3= 201,64 b) 58,89 c) [146,37; 230,61 ] d) 19,99 % 18) La tabla siguiente, muestra la resistencia de 150 cuerdas Resistencia(Kgs) Frecuencia a)Calcule el porcentaje de cuerdas cuya 160 - 170 8 resistencia esta comprendida en el 170 - 180 13 intervalo: (205 ±12) Kgs 180 - 190 17 b) Encuentre el percentil 10. 190 - 200 26 c) Calcule la resistencia media de las 200 - 210 34 cuerdas comprendidas en la cuarta 210 - 220 23 parte superior. 220 - 230 19 230 - 240 10 Solución: a) 45,53% b) P10= 175,39 Kgs. c) 226,11 kgs. 19 ) En un examen de Estadística, las calificaciones fueron: Calificación : 12 08 05 14 10 07 16 15 19 11 Frecuencia : 6 5 4 3 7 4 3 4 1 3 Encuentre el segundo decil , la mediana , el tercer cuartil, el percentil 80 , y la media de los que aprobaron (10 puntos ó mas) . Solución: D2 = 7,5 , Q2= 10,5 , Q3 = 14 , P80 = 14,5 , X 10 12,74 20) En un estudio, se hizo una encuesta entre un grupo de conductores acerca de la cantidad de litros de gasolina que consumían mensualmente en sus vehículos. Los resultados de dicha encuesta fueron: Litros 10 a 30 30 a 50 50 a 70 70 a 90 90 a 110 110 a 130 frecuencia 16 43 58 41 30 12 a) Determine un intervalo central que contenga al consumo del 50% de los conductores. b) Calcule el consumo medio de la mitad inferior. c) ¿ Qué porcentaje de los conductores tienen un consumo entre [80 ± 14 ] litros mensuales ? . Solución : a) [34,19 ; 86,10] b) 43,80 c) 29,30 % II. Nivel Intermedio 21) La siguiente tabla se refiere a la edad de un grupo de personas por años cumplidos: Intervalo 0a9 10 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 frecuencia 12 56 125 112 48 36 11
Medidas de Posición Angel Francisco Arvelo Luján
21
a) Determine el primer cuartil e interprete el resultado. b) ¿Cuál es la posición percentil que le corresponde dentro del grupo, a una persona cuya edad sea de 36 años? . c) ¿ Qué porcentaje de las personas son mayores de 18 años ?. d) ¿ Cual es la media de edad para las personas mayores de 18 años ?. Solución: a) Q1 = 22,56 b) 65,05 c) 85,80 % d) 35,29 22)El siguiente gráfico de tallo y hoja da el resultado de la medición del contenido (c.c) de líquido en 120 botellas de refresco. Frecuencia 4 13 19 29 34 16 3 2
Tallo 48 . 49 * 49 . 50 * 50 . 51 * 51 . 52 *
Hoja 6689 0001123334444 5666777777888888999 00001111111122223333444444444 5555555666666666677777777778888999 0001112222223333 678 01
Determine los cuartiles , el percentil 40 , y la posición percentil que le corresponde a una botella con un contenido de 500 c.c . Solución : Q1=498; Q2= 504 ; Q3= 507 ; P40= 501,50 ; 31,67 23) En la siguiente tabla acumulada de frecuencias relativas porcentuales , determine el percentil 38 , el noveno decil , y la posición percentil del valor 73. Valor Hi %
< 29,50 0%
< 39,5 12 %
< 49,5 47 %
< 59,5 63 %
< 69,5 82 %
< 79,5 94 %
< 89,5 100%
Solución : P38 = 46,93 ; D9 = 76,17 ; 86,20 6.24) La distribución en los ingresos diarios para el personal de una Industria es como sigue: Obreros Empleados Ingresos (Bs) Frecuencia Ingresos(Bs) Frecuencia 80 - 100 30 120-150 50 100 - 120 80 150-180 20 120 -140 40 180-210 10 140 - 160 10 a) ¿Cual es el porcentaje del personal cuyos ingresos están entre 130 y 170 ? b) Una persona cuyos ingresos diarios sean de Bs. 145, ¿qué puesto percentil ocupa dentro del personal de la industria ? .