ANGEL FRANCISCO ARVELO LUJAN

Gráficos Estadísticos Angel F. Arvelo L ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el área

0 downloads 221 Views 532KB Size

Recommend Stories


ANGEL FRANCISCO ARVELO LUJAN
ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el área de Probabilidad y Estadística, con más de

Imagen de la Virgen de Lujan, (original) que esta en la Basílica de Lujan, Argentina
Imagen de la Virgen de Lujan, (original) que esta en la Basílica de Lujan, Argentina NUESTRA SEÑORA DE LUJÁN Fiesta el 8 de Mayo ARGENTINA El Milagro

Story Transcript

Gráficos Estadísticos Angel F. Arvelo L

ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el área de Probabilidad y Estadística, con más de 40 años de experiencia en las más reconocidas universidades del área metropolitana de Caracas. Universidad Católica “Andrés Bello” : Profesor Titular Jubilado 1970 a 2003 Universidad Central de Venezuela: Profesor por Concurso de Oposición desde 1993 al presente Universidad Simón Bolívar: Profesor desde 2005 al presente Universidad Metropolitana: Profesor desde 1973 a 1987 Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004 Sus datos personales son : Lugar y Fecha de Nacimiento: Caracas, 16-02-1947 Correo electrónico: [email protected] Teléfono: 58 416 6357636 Estudios realizados: Ingeniero Industrial. UCAB Caracas 1968 Máster en Estadística Matemática CIENES , Universidad de Chile 1972 Cursos de Especialización en Estadística No Paramétrica Universidad de Michigan 1982 Doctorado en Gestión Tecnológica: Universidad Politécnica de Madrid 2006 al Presente El Profesor Arvelo fue Director de la Escuela de Ingeniería Industrial de la Universidad Católica “Andrés Bello” (1974-1979) , Coordinador de los Laboratorios de esa misma Universidad especializados en ensayos de Calidad, Auditor de Calidad, y autor del libro “Capacidad de Procesos Industriales” UCAB 1998. En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales en el área de “Estadística General” y “Control Estadístico de Procesos”. Una mayor información sobre otras publicaciones del Prof. Arvelo, pueden ser obtenida en la siguiente página web: www.arvelo.com.ve

2

Gráficos Estadísticos Angel F. Arvelo L.

CONSTRUCCION DE GRAFICOS ESTADISTICOS 1 Tablas de Frecuencias para datos cualitativos

Al observar una

variable cualitativa, no obtenemos como resultado un valor numérico, sino un dato perteneciente a una determinada clase o categoría; en virtud de lo cual, al clasificar los datos muestrales , o poblacionales , de una variable cualitativa, lo que se obtiene es una tabla que señala el número de veces que se ha encontrado cada clase o categoría dentro de la muestra o dentro de la población , según sea el caso. El número de veces que se observa una determinada clase o categoría se llama “frecuencia” , y la tabla que señala la frecuencia de cada clase o categoría “tabla de frecuencias”. Por ejemplo, supongamos que hemos tomado una muestra de estudiantes universitarios, y le hemos preguntado a cada uno de ellos la carrera que cursan. Al finalizar nuestra encuesta, encontraremos una tabla, como la siguiente: Carrera

Frecuencia

Derecho

34

Para construir la tabla es necesario contar el

Medicina

56

número de estudiantes pertenecientes a cada

Ingeniería

47

carrera, y transcribir en ella el resultado del conteo.

Economía

26

La frecuencia de cada carrera representa el total de

Sociología

17

estudiantes encontrados en ella.

Administración

20

TOTAL

200

Tabla 1

Puesto que la ubicación de cada elemento dentro de cada categoría se supone que es una y solo una*1, es decir, que un mismo elemento no puede pertenecer simultáneamente a dos categorías diferentes, resulta obvio que la suma de las frecuencias da por resultado el total de observaciones realizadas. Designando por: n = Número total de observaciones realizadas k= Número de categorías fi = Frecuencia de la categoría “i” . i k

fi

Se tiene: n = i 1

1

De no cumplirse esta exigencia , tendrá que definirse algún criterio que permita definir la categoría única

a la cual pertenece cada elemento.

3

Gráficos Estadísticos Angel F. Arvelo L.

Se define como frecuencia relativa de una determinada categoría, a la razón entre su frecuencia, y el total de observaciones ; es decir :

Frecuencia Relativa =hi=

f

fi n

i j k

fj j 1

Generalmente esta frecuencia relativa se expresa en forma porcentual, y representa cuantas partes por cada 100 del total , le corresponden a la categoría en cuestión .

Frecuencia Relativa Porcentual = hi% =

fi

100%

j k

fj

fi 100% n

j 1

i k

hi = 1

Para las frecuencias relativas se cumple: i 1 i n

i k

hi =

Demostración: i 1

fi

i n

i

fi 1 n

i 1

n

n n

1

Para las frecuencias relativas porcentuales, por una demostración análoga, se i k

hi % = 100 %

verifica: i 1

Ejemplo 1: Calcular las frecuencias relativas, y la frecuencias relativas porcentuales, para las categorías de la Tabla 1 . i k

fi = 200

n= i 1

La frecuencia relativa , y la relativa porcentual de la categoría “Derecho” es: 34 hi = = 0,17 , hi% = 17%. 200 56 Para Medicina: hi = 0.28, hi %= 28.00% 200 Al hacer los cálculos para las demás categorías se encuentra:

4

Gráficos Estadísticos Angel F. Arvelo L.

Frecuencia Relativa Carrera

Frecuencia Absoluta

Frecuencia Relativa

Porcentual

Derecho

34

0,170

17,00%

Medicina

56

0,280

28,00%

Ingeniería

47

0,235

23,50%

Economía

26

0,130

13,00%

Sociología

17

0,085

8,50%

Administración

20

0,100

10,00%

TOTAL

200

1,000

100,00%

2 Representación Gráfica de Datos Cualitativos. Uno de los objetivos primordiales de la “Estadística Descriptiva”, es la elaboración de gráficas que de una manera clara y precisa describan el comportamiento de los datos. Para representar el comportamiento de datos cualitativos, los principales gráficos son: 1º) El Histograma : Este gráfico conocido también como “gráfico de barras” constituye la representación de la tabla de frecuencias, y según utilice frecuencias, frecuencias relativas, o relativas porcentuales puede ser de tres tipos: De frecuencias absolutas De frecuencias relativas. De frecuencias relativas porcentuales. Lo más frecuente es que sea de frecuencias relativas porcentuales, por la gran aceptación que tiene el uso de porcentajes. Para construirlo, se trazan dos ejes cartesianos. En eje horizontal se representan las categorías, y para ello se divide en tantos segmentos de igual amplitud como categorías se tengan. Cada segmento representa a una categoría. En el eje vertical se representan las frecuencias. A cada categoría se le asigna un rectángulo, de igual ancho (menor que la amplitud del segmento ), centrado , y de altura igual a su frecuencia. Así por ejemplo, para los datos de la Tabla 1, el histograma de frecuencias relativas porcentuales, es el siguiente:

Gráficos Estadísticos Angel F. Arvelo L.

5

Normas para construir un Histograma a) Ancho de las clases : El ancho de las barras es arbitrario , pero debe ser igual para todas las categorías, por dos razones fundamentales: a.1 Para no establecer diferencias entre categorías. a.2 Para que las áreas de los rectángulos resulten proporcionales a sus A i fi frecuencias. Al tener todos los rectángulos igual ancho, se verifica: , A j fj siendo “A” el área y “f” la frecuencia de las categorías “i” y “j” . b) Separación entre las barras o rectángulos: Para variables cualitativas, las barras o rectángulos deben quedar separadas para no dar una sensación de continuidad. Esta separación debe ser la misma para todas las barras. c) Orden de colocación de las clases: El orden de colocación de las clases dentro del histograma puede ser usado para manipular el mensaje de la gráfica, y así por ejemplo , si se quiere disimular que una clase tiene baja frecuencia basta con colocarla entre dos que tengan menos , o si se quiere resaltar que una clase tiene mucha frecuencia se coloca entre las dos que tengan poca . Por la razón anterior, al colocar las diferentes clases hay que respetar la siguiente regla: Si se trata de una variable nominal hay que ordenar en orden alfabético las distintas categorías de la variable. Si se trata de una variable ordinal, hay que colocar las diferentes categorías en su orden natural, por lo general de menor a mayor. d) Escala vertical: “Regla de los tres cuartos”: La selección de la escala vertical tiene una gran influencia en la apariencia de la gráfica, pues si se elige una escala demasiado grande, todos los rectángulos van a resultar con una altura insignificante, y las diferencias de frecuencia entre ellos no será perceptible.

Gráficos Estadísticos Angel F. Arvelo L.

6

Por ejemplo, los mismos datos de la tabla 1, representados con una escala vertical hasta 100%, tendrían la siguiente apariencia:

El lector puede fácilmente apreciar que a pesar de ser los mismos datos, las dos gráficas son significativamente diferentes, con distintos mensajes. Para evitar que las escalas elegidas den lugar a gráficos que resulten desproporcionados, se da esta regla conocida como “regla de los tres cuartos de altura”: En la construcción de un histograma de frecuencias (absolutas, relativas o porcentuales), la escala vertical correspondiente a las frecuencias, debe ser tal que la altura correspondiente al rectángulo de mayor frecuencia (el más alto), debe ser aproximadamente igual a tres cuartos del ancho total del eje horizontal. e) Ubicación del origen: La escala vertical del histograma debe ser aritmética, y partir del origen “cero”. Lo anterior significa que debe ser una escala de razón, y que iguales proporciones entre las alturas de los rectángulos deben reflejar iguales proporciones entre las frecuencias de las categorías.. Una de las maneras más fáciles de sorprender al lector de una gráfica en su buena fe, es utilizar un origen diferente del cero, o utilizar una escala no aritmética. Así por ejemplo, si la tabla de frecuencias relativas porcentuales correspondiente a los datos de la Tabla 1, los representamos tomando como origen el 5%, encontraremos la siguiente gráfica:

Gráficos Estadísticos Angel F. Arvelo L.

7

Esta gráfica no se corresponde con la realidad de los datos, pues da la sensación de que por ejemplo, hay el triple de estudiantes en “Derecho” que en “Sociología”, que no es lo realmente encontrado en la muestra. 2°) Gráficos Circulares: Los gráficos circulares conjuntamente con los histogramas constituyen la forma más frecuente de representar datos cualitativos. Su construcción se fundamenta en que el área de un sector circular guarda con el área de todo el círculo, la misma relación que su arco con toda la circunferencia:

En un gráfico circular , el círculo completo representa al conjunto total de datos, mientras que el sector representa a una de las categorías , y se construye de manera que el área del sector guarde con el área del círculo la misma proporción que la frecuencia de la categoría guarda con el número total de datos; es decir: Area del Sector "i" fi fi i 2 . i = Area del Circulo 2 n n Como lo más frecuente es trabajar con el ángulo expresado en “grados” y no en “radianes”, se concluye que para calcular el ángulo central “ i” correspondiente a cada categoría “i”, se aplica a 2 = 360° , la frecuencia relativa de la categoría “i”: fi 360 = hi 360 i = n Lo anterior puede ser resumido en los siguientes pasos para construir un gráfico circular: Paso 1: Se dibuja un círculo de radio arbitrario “R” . Paso 2: Se calcula la frecuencia relativa de cada categoría . Paso 3 : Se multiplica cada frecuencia relativa por 360° , obteniéndose así el ángulo central correspondiente a cada categoría .

8

Gráficos Estadísticos Angel F. Arvelo L.

Paso 4: Con un transportador se miden sobre el circulo, uno a continuación del otro, los ángulos centrales correspondientes . Por lo general, los ángulos se miden en el mismo sentido de las manecillas del reloj, y comenzando desde el punto más alto de la circunferencia. Jamás se señala sobre el gráfico, el valor del ángulo central. Paso 5: Se trazan los radios correspondientes a cada sector, y se rellenan sus áreas con colores que guarden cierta relación con la categoría representada. Si se quiere, se puede indicar sobre el área de cada categoría, su frecuencia relativa porcentual. Ejemplo 2: Construir un gráfico circular para los datos de la Tabla 1 . Una vez calculadas las frecuencias relativas de cada categoría, es necesario calcular su ángulo central correspondiente: i = hi . 360° . Los resultados después de ordenar a las categorías por orden alfabético, son los siguientes: CARRERA

Frecuencia Relativa Angulo Central (°)

Administración

0.10

36.00

Derecho

0.17

61.20

Economía

0.13

46.80

Ingeniería

0.24

84.60

Medicina

0.28

100.80

Sociología

0.09

30.60

Total

1.00

360.00

Seguidamente, se dibuja un círculo de un radio cualquiera, dependiendo del tamaño con que quiera hacer la gráfica, y comenzando por el punto más alto de la circunferencia, y en sentido del reloj, se van midiendo uno a continuación del otro, los diferentes ángulos centrales ,hasta cubrir la circunferencia completa.

Gráficos Estadísticos Angel F. Arvelo L.

9

Es importante destacar que estos gráficos también son conocidos bajo el nombre de "Gráficos de Pastel o de Torta" por la gran similitud que presentan con un pastel picado en pedazos, señalando cuál pedazo le corresponde a cada categoría. 3º) Gráficos de Figuras geométricas proporcionales: El principio básico en que se fundamenta la construcción de gráficas estadísticas para representar frecuencias, es el de proporcionalidad de áreas, según el cual las áreas de los sectores deben guardar la misma relación que sus frecuencias. Es decir, en todo gráfico estadístico de frecuencias debe cumplirse la siguiente Area del sec tor " i" Frecuencia de la categoria" i" relación: Area del sec tor " j" Frecuencia de la categoria" j" El lector puede fácilmente demostrar que tanto el histograma, como el gráfico circular respetan este principio. El gráfico de figuras geométricas proporcionales se utiliza fundamentalmente para comparar las frecuencias o tamaños de las diferentes categorías, y para ello selecciona un figura geométrica, generalmente un círculo o un cuadrado, y cada figura representa a una categoría; no como en el caso del gráfico circular , donde el sector representa a la categoría , y el círculo al total de datos. El procedimiento para construir este tipo de gráficas es el siguiente: Paso N° 1: Se selecciona el tipo de figura a utilizar Paso N° 2: Las diferentes categorías se ordenan de menor a mayor frecuencia. Paso N° 3: A la categoría de menor frecuencia se le asigna una figura de dimensiones arbitrarias. Paso N° 4: Se calculan las dimensiones que deben tener las figuras correspondientes a las demás categorías, según el principio de proporcionalidad de áreas. Paso N° 5: Se representan las diferentes figuras, sobre un mismo eje, y dispuestas de menor a mayor frecuencia. Ejemplo 3: Representar los datos de la tabla 1, en un gráfico de cuadrados proporcionales. Solución: Según el procedimiento descrito anteriormente, tenemos: Paso1:La figura a utilizar es el cuadrado

.

Gráficos Estadísticos Angel F. Arvelo L

Paso 2 : Se ordenan las categorías de menor a mayor frecuencia . Carrera

Frecuencia Absoluta

Sociología

17

Administración

20

Economía

26

Derecho

34

Ingeniería

47

Medicina

56

TOTAL

200

Paso N° 3: A la categoría de menor frecuencia, en este caso “Sociología” le asignamos arbitrariamente un cuadrado de lado 30 mm. Paso N° 4: Para calcular las dimensiones de los demás cuadrados, hay que tener en cuenta de que el área de un cuadrado de lado "L" es L2 y por lo tanto, según el principio de proporcionalidad de áreas, debe verificarse:

L2i L2j

fi fj

Lj

Li

fj fi

El lado del

cuadrado correspondiente a la segunda categoría, en este caso 20 Administración será: L 2 L1 = 32.54, pues L1= 30 mm. 17 Procediendo en forma análoga para las demás categorías se tiene: 26 34 Economía : L 3 L1 = 37.10 . Derecho: L 4 L1 = 42.43 17 17 Ingeniería: L 5

L1

47 = 49.88 . 17

Medicina : L 6

L1

56 = 54.45 17

Paso N° 5: Por último se procede a dibujar los seis cuadrados , con centro sobre un mismo eje, y en forma ascendente .

11

Gráficos Estadísticos Angel F. Arvelo L

Otra situación en donde los gráficos de figuras geométricas proporcionales son particularmente útiles, es cuando se quiere representar la evolución que ha experimentado una cierta variable a lo largo del tiempo. Ejemplo 4 : Supongamos que una canasta familiar está formada por un conjunto de artículos de primera necesidad, y que el precio de esta canasta se ha ido incrementando con el tiempo. Supongamos que el precio de esta canasta en los últimos cinco años ha sido: Año

1

2

3

4

5

Precio

2500

3700

4100

5000

6000

Representar en un gráfico de círculos proporcionales la evolución en el precio de esta canasta familiar. Solución: En este caso, el procedimiento a seguir es idéntico al descrito con anterioridad, con la única diferencia que el área en lugar de representar frecuencia, va a representar precio. Al círculo correspondiente al año 1, se le asigna un radio arbitrario, y el radio de los demás círculos se determina por proporcionalidad de áreas. (Pr ecio)i ri2 (Pr ecio)i Como el área de un círculo es A= r2 ri r1 2 (Pr ecio)1 (Pr ecio)1 r1 Haciendo los cálculos, se obtiene: r1 = 40 mm ( arbitrario) 3700 4100 r2 r1 r3 r1 = 48.66 ; = 51.22 ; 2500 2500

r4

r1

5000 = 56.57 2500

;

r5

r1

6000 = 61.97 2500

El gráfico de círculos proporcionales resulta:

4°) Diagramas de Pareto: Cuando se investigan las posibles causas que pueden generar un determinado problema, es frecuente que el investigador desee identificar cuáles son las causas más importantes , a fin de centrar su atención en ellas, y no diluir su esfuerzo en la corrección de causas de poca importancia.

Gráficos Estadísticos Angel F. Arvelo L

12

El economista italiano Vilfredo Pareto ( 1848 - 1923) estableció que las causas que ocasionan un determinado problema pueden ser clasificadas como las “pocas vitales” y las “muchas triviales”. Las primeras son aquellas pocas causas que ocasionan el problema la mayor parte de las veces; mientras que las segundas son aquellas muchas causas que ocasionan el problema raras veces. Este principio de Pareto dio origen a una regla conocida como bajo el nombre del 80-20 , según la cual , el 80% de las veces el problema es ocasionado por el 20% de las causas. El objetivo del diagrama de Pareto, es identificar los “pocos vitales”, es decir ese 20% de causas importantes, a fin de centrar la acción correctiva en ellas. En un diagrama de Pareto, la variable cualitativa en estudio, es la causa que ocasionó un determinado problema, y para construirlo se procede como sigue: Paso N°1: Se elabora una tabla de frecuencias para las causas que han ocasionado un determinado problema. Se supone que cada vez que se ha presentado el problema ha sido por una y sola una de las causas. Paso N° 2: Se ordenan estas causas de mayor a menor frecuencia. Paso N° 3 : Se calcula la frecuencia relativa porcentual de cada causa. Paso N°4 : Las frecuencias relativas porcentuales se acumulan, sumando la frecuencia relativa porcentual de cada causa con todas las anteriores. Paso N° 5: El eje horizontal se divide en segmentos de igual amplitud, tantos como causas se tengan . Cada segmento representa a una causa, y estas quedan ordenadas de mayor a menor frecuencia. Paso N° 6 : Para cada causa se construye un rectángulo de altura igual a su frecuencia relativa porcentual . Paso N° 7: Para cada causa , sobre la recta vertical que pasa por el punto medio de su segmento , se ubica un punto a una altura igual a su frecuencia relativa porcentual acumulada. Paso N° 8 : Los diferentes puntos obtenidos en el paso anterior se unen mediante segmentos rectos . Ejemplo 5 : Supongamos que en una industria se hizo un seguimiento, acerca de las causas que ocasionaron la interrupción del trabajo en una cierta máquina. Los resultados obtenidos fueron:

13

Gráficos Estadísticos Angel F. Arvelo L

Causa de la interrupción

Frecuencia

Falta de energía eléctrica

4

Fatiga del operario

32

Manejo incorrecto

17

Falta de suministro

30

Falta de lubricación

7

Falta de calibración

11

Falla mecánica

6

Operador ausente

3

Otros

6

Hacer el Diagrama de Pareto correspondiente, e interpretarlo. Solución: Hay que ordenar las causas por orden de frecuencia, de mayor a menor, calcular la frecuencia relativa porcentual de cada una, y luego acumularlas, tal como se muestra en la tabla a continuación. Causa de la interrupción

Frecuencia

Frecuencia Relativa

Frecuencia relativa porcentual

porcentual

acumulada

Fatiga del Operario

32

27.59 %

27.59 %

Falta de suministro

30

25.86 %

53.45 %

Manejo incorrecto

17

14.66 %

68.10 %

Falta de calibración

11

9.48 %

77.59 %

Falta de lubricación

7

6.03 %

83.62 %

Falla mecánica

6

5.17 %

88.79 %

Otras

6

5.17 %

93.97 %

Falta de energía eléctrica

4

3.45 %

97.41 %

Operador ausente

3

2.59 %

100.00 %

TOTAL

116

100.00 %

De la tabla se deduce que las causas más importantes son las cuatro primeras, pues entre ellas acumulan el 77.59 % de las interrupciones, de manera que a la hora de tomar las medidas correctivas necesarias para combatir estas interrupciones , se tendrán identificadas las causas más importantes. El diagrama de Pareto correspondiente es el siguiente:

14

Gráficos Estadísticos Angel F. Arvelo L

5°) Gráficos polares : Este tipo de gráficas se utiliza principalmente para representar la evolución de una cierta variable en el tiempo. Para construirlo los pasos son los siguientes: Paso N° 1: Se traza una circunferencia cualquiera. Paso N° 2: Comenzando desde el punto más alto de la circunferencia, y en el sentido de giro de las manecillas del reloj , se divide la circunferencia en tantos arcos como clases se tengan , para lo cual se divide 360 ° en tantas partes como clases se tengan . Paso N° 3 : Se trazan los radios correspondientes a cada uno de los puntos que dividen a la circunferencia en partes iguales . Estos radios representan a las diferentes clases de la variable en estudio. Paso N° 4: Sobre cada uno de esos radios, y tomando como origen el centro de la circunferencia, se construyen segmentos de longitud igual a la frecuencia, o al valor de la variable, para cada categoría. Paso N° 5: Se borra la circunferencia inicial, y los puntos extremos de los diferentes segmentos consecutivos se unen mediante trazos rectos. Ejemplo 6 : Supongamos que el precio de un artículo a lo largo del año ha venido experimentando sucesivos aumentos, y que la siguiente tabla expresa cual ha sido su precio al cierre de cada uno de los meses del año: Mes

Enero

Precio 100

Feb.

Marzo Abril

Mayo

Junio

Julio

Agosto Sept.

Oct.

Nov.

Dic.

105

108

110

114

115

120

150

170

184

108

133

Gráficos Estadísticos Angel F. Arvelo L

15

Construir un gráfico polar para mostrar la evolución de los precios de este artículo durante el año. Solución : En este caso , como se tienen doce categorías , cada radio va a ser 360 trazado con centro en el origen , y con una separación de 30° . 12 Sobre cada uno de ellos, y en forma consecutiva se va a representar un segmento de longitud igual al precio del artículo en ese mes, y siguiendo los pasos antes señalados se obtendrá la siguiente gráfica polar:

Es de hacer notar que en este caso, como hubo un continuo aumento en el precio del artículo a lo largo de todo el año, el radio correspondiente a cada mes fue cada vez mayor, dando lugar a una curva en forma de espiral, que es la llamada “espiral inflacionaria”, tan conocida en nuestro país . 7º) Pictogramas: Son gráficos en donde se utiliza un símbolo, que generalmente guarda cierta relación con la variable que se quiere representar, para expresar su frecuencia o valor. Así por ejemplo, si se quisiera representar la población de diversos países, podríamos hacerlo dibujando una silueta humana, y diciendo que cada una de ellas representa una población de digamos 1.000.000 habitantes; de esa forma en lugar de indicar la cifra numérica que corresponde a la población de cada país, lo

16

Gráficos Estadísticos Angel F. Arvelo L

haríamos colocando tantas siluetas humanas como millones de habitantes tenga ese país. 8º) Cartogramas: Este tipo de gráfica se utiliza cuando la variable cualitativa que se quiere representar es la ubicación geográfica . Para construirlo, se dibuja el mapa de la región y se van colocando sobre las diferentes localidades señales que indiquen el valor de la variable en esa localidad. También es posible, en lugar de indicar el valor numérico o frecuencia de la variable para cada localidad , colocar un símbolo que guarde relación con la variable, y sobre el mapa colocar tantas veces el símbolo como frecuencia o valor tenga la variable en esa localidad , dando, lugar así a un pictograma dibujado sobre un mapa. Así por ejemplo, si quisiéramos representar como se distribuye la producción petrolera de Venezuela en las diferentes regiones del país, podríamos seleccionar un símbolo, como por ejemplo el barril “”, hacer una equivalencia y decir que cada barril dibujado representa una producción de por ejemplo “ = 50.000 barriles diarios “ en esa región, y luego dibujar sobre cada región en el mapa de Venezuela , tantos barriles como sea su producción . 9º) Dos variables Cualitativas: En este caso, los datos se organizan en una tabla llamada “tabla de contingencia”, la cual tiene una forma matricial con filas y columnas, que corresponden a cada categoría de las variables cualitativas en consideración. En cada cruce de fila de con columna, se coloca la frecuencia absoluta que le corresponde a esa combinación. Por ejemplo, supongamos que las dos variables cualitativas en consideración son “A” y “B”, y que “A” tiene “k” categorías, mientras que “B” tiene “h”. La tabla de contingencia tiene por consiguiente “k” filas y “h” columnas , y en cada casilla se coloca la frecuencia que le corresponde a la fila y columna correspondiente. ....... B1 B2 Bh Total El total de la fila representa el A1

f11

f12

.......

f1h

f1.

número de observaciones que se

A2

f21

f22

.......

f2h

f2.

encontraron en cada una de las

.......

.......

.......

fij

.......

.......

categorías de “A” , y se llama

Ak

fk1

fk2

.......

fkh

fk.

“Frecuencia marginal” de “A”.

Total

f.1

f.2

.......

f.h

n

17

Gráficos Estadísticos Angel F. Arvelo L

Análogamente, el total de la columna, representa la frecuencia de cada una de las categorías de la variable “B”, y recibe el nombre de “Frecuencia marginal de B”. La notación a seguir es la siguiente: fij = Frecuencia de casilla ubicada en la fila “i”, y la columna “j”. j h

fij = Frecuencia marginal de la fila “i” .

fi. = j 1 i k

f.j =

fij = i 1 i k j h

n=

Frecuencia marginal de la columna “j” .

i 1 j 1

j h

i k

fij =

fi. = i 1

f.j = Número total de observaciones. j 1

Una tabla de contingencia, puede ser representada gráficamente de varias maneras, como en el siguiente ejemplo. Ejemplo 7 A un grupo de estudiantes universitarios, se le preguntó la carrera que cursan y su sexo. Los resultados se dan en la siguiente tabla: CARRERA SEXO

Derecho Economía Ingeniería Hombre 71 63 84 Mujer 95 52 57 Total 166 115 141 Hacer la representación gráfica de estos datos.

Letras 16 31 47

Medicina 53 78 131

Total 287 313 600

Solución: Los totales de fila y de columna representan las frecuencias marginales de cada variable. Para hacer la representación gráfica, existen las siguientes alternativas: a) El histograma tridimensional : En este gráfico, se selecciona a uno de los ejes, por ejemplo el “X” para una de las variables, al eje “Y” para la otra variable, y al eje “Z” para las frecuencias. Los ejes “X” y “Y” se dividen en tantos segmentos de igual longitud como categorías tengan cada una de las variables, quedando así el plano “XY” cuadriculado. Sobre cada cuadro, se construye un prisma rectangular con altura igual a la frecuencia, obteniendo el siguiente gráfico:

18

Gráficos Estadísticos Angel F. Arvelo L

100 90 80 70 60 Frecuencias50 40 Hombre

30

Mujer

20 10 0 Derecho

Economía

Ingeniería

Mujer SEXO Hombre Letras Medicina

CARRERA

b) El Histograma Doble. Con las frecuencias marginales de una de las variables se construye un histograma convencional, y luego el rectángulo que corresponda a cada categoría de esta variable se divide en partes proporcionales según la otra variable. Así por ejemplo, si se construye el histograma para las carreras, y luego el rectángulo que señala que señala la frecuencia de cada carrera se divide según el sexo de los estudiantes que la cursan, se obtiene el siguiente gráfico: Frecuencias 180 160 140 120 100

Mujer

80

Hombre

60 40 20 0 Derecho

Economía

Ingeniería

Letras

Medicina

CARRERA

Si en lugar de construir el histograma para las carreras, se construye el del sexo, se obtiene este otro gráfico:

19

Gráficos Estadísticos Angel F. Arvelo L

frecuencia

350 300

Medicina

250

Letras

200

Ingeniería

150

Economía

100 50

Derecho

0 Hombre

Mujer SEXO

frecuencia

También es posible construir el histograma doble, colocando en el eje horizontal a una de las variables y luego, en lugar de representar su frecuencia marginal, construir tantos rectángulos como categorías tenga la otra variable, colocándolos uno al lado del otro sin suponerlos, dando lugar a los siguientes gráficos: 100 90 80 70 60 50 40 30 20 10 0

Hombre Mujer

Derecho

Economía

Ingeniería

Letras

Medicina

frecuencia

CARRERAS

100 90 80 70 60 50 40 30 20 10 0

Derecho Economía Ingeniería Letras Medicina

Hombres

Mujeres

SEXO

20

Gráficos Estadísticos Angel F. Arvelo L

c) Gráficos Circulares. Estos consisten en utilizar un gráfico circular, para representar la forma como se distribuye cada categoría de una de las variables según la otra. Así por ejemplo, para representar la distribución de la población masculina y femenina, según las diferentes carreras, tendríamos: Población Femenina

Población Masculina

Derecho

Derecho

18% 6%

25%

Economía

25%

30%

Ingeniería

Ingeniería

29%

22%

Economía

10% Letras Medicina

18%

17%

Letras Medicina

Otra posibilidad es señalar la distribución por sexo en cada carrera, dando lugar a los siguientes gráficos circulares: Derecho

43% 57%

Economía

Hombres Mujeres

45%

Hombres

55%

Mujeres

y así sucesivamente, con las demás carreras. También es posible construir gráficos con las frecuencias marginales de cada variable, en donde no se tome en consideración a la otra.

21

Gráficos Estadísticos Angel F. Arvelo L Distribución de estudiantes por carreras

22%

Distribución de estudiantes por sexo

Derecho

28%

Economía

48%

Ingeniería

8% 23%

19%

Letras

52%

Hombres Mujeres

Medicina

Obviamente, la decisión acerca de cuál es el gráfico más conveniente, depende del mensaje que se quiera trasmitir con él, y de los aspectos que más se quieran resaltar. No hay que olvidar el objetivo de la Estadística Descriptiva, cual es el de proporcionar técnicas que permitan de una manera fácil y precisa, resumir el comportamiento de los datos. Ejemplos Resueltos Ejemplo 7: Los siguientes datos representan el grado de instrucción de una muestra de personas adultas: Grado de Instrucción Frecuencia Secundaria 237 Post-grado 31 Ninguna 2 Primaria 43 Universitaria 187 Total 500 Construir un Histograma de Frecuencias Absolutas, y otro de Frecuencias Relativas porcentuales para estos datos. Solución: En este caso, estamos en presencia de una variable cualitativa, pero ordinal, y por tanto hay que ordenar las diferentes clases en orden creciente en lugar de orden alfabético. El Histograma de Frecuencias absolutas es como sigue:

22

Gráficos Estadísticos Angel F. Arvelo L

Va ria ble Ord ina l

250 200 150 Fre cue ncia 100 50 0 Ning una

Prima ria

Se cund aria Unive rsit.

Po st-g ra d o

Gra do d e Instrucció n

En lo que se refiere al histograma de frecuencias relativas porcentuales, es necesario calcular el porcentaje de cada clase con relación al total de adultos observados, en este caso 500,y se encuentra :

Ejemplo 8 : En una encuesta, se le preguntó a un grupo de familias acerca de su nivel de ingresos. Una vez procesada la encuesta, se encontró que el 5 % de las familias eran de muy altos ingresos, el 25 % eran de altos ingresos, el 40 % eran de ingresos medios y el 30% restante eran de bajos ingresos.

Gráficos Estadísticos Angel F. Arvelo L

23

Graficar estos resultados en: a) Un histograma de frecuencias relativas porcentuales . b) Un gráfico circular . c) En un gráfico de cuadrado proporcionales. d) En un gráfico de círculos proporcionales. Solución: a) Para construir el histograma es necesario tomar de nuevo en consideración que se trata de una variable ordinal , y que por lo tanto las diferentes clases deben ser representadas en orden creciente , y no en orden alfabético.

b) Para construir el gráfico circular se le aplica la frecuencia relativa porcentual correspondiente de cada categoría a 360° , obteniendo sus respectivos ángulos centrales , que resultan ser 108° , 144° , 90° y 18° respectivamente .

24

Gráficos Estadísticos Angel F. Arvelo L

c) Para construir tanto el gráfico de cuadrados como el de círculos proporcionales, se toma como base la clase de menor frecuencia en este caso “muy altos ingresos” . A esta categoría se le da un lado , o un radio arbitrario de por ejemplo 20 mm , y las demás se calculan en proporción obteniendo: 25 Altos Ingresos : Lado ó Radio = 20 = 44.72 5 Bajos ingresos : Lado ó Radio = 20

30 = 48.99 mm . 5

Ingresos medios : Lado ó Radio = 20

40 = 56.57 mm. 5

Las respectivas gráficas resultan :

Ejemplo 9 : En un estudio de calidad se hizo un seguimiento acerca de los defectos presentados por los automóviles ensamblados en una cierta fábrica. Los resultados fueron Tipo de defecto

Frecuencia

Pintura defectuosa

8

Ruidos

86

No cierran bien las puertas

11

Cables defectuosos

6

No funciona el radio

36

Batería defectuosa

15

Falla de bujías

19

25

Gráficos Estadísticos Angel F. Arvelo L

Amortiguadores defectuosos

6

Aire acondicionado defectuoso

45

No encienden las luces

10

Frenos defectuosos

4

Otros

12

Construir un diagrama de Pareto, para identificar aquellos defectos que mas afectan la calidad de los automóviles ensamblados en esta fábrica . Solución : Según lo ya explicado , se ordenan los defectos de mayor a menor frecuencia , se calculan las frecuencias relativas porcentuales , y las porcentuales acumuladas, tal como en la tabla a continuación : Tipo de defecto

Frecuencia

Porcentaje

Acumulado

Ruidos

86

33.33 %

33.33 %

Aire Acondicionado defectuoso

45

17.44 %

50.78%

No funciona el radio

36

13.95 %

64.73 %

Falla de Bujías

19

7.36 %

72.09 %

Batería defectuosa

15

5.81 %

77.91 %

Otros

12

4.65 %

82.56 %

No cierran bien las puertas

11

4.26 %

86.82 %

No encienden las luces

10

3.88 %

90.70 %

Pintura defectuosa

8

3.10 %

93.80 %

Amortiguadores defectuosos

6

2.33 %

96.12 %

Cables defectuosos

6

2.33 %

98.45%

Frenos defectuosos

4

1.55 %

100.00 %

TOTAL

258

100.00 %

En la tabla puede apreciarse que las cuatro primeras causas ocasionan el 72.09% de los defectos, y el diagrama de Pareto es el siguiente

Gráficos Estadísticos Angel F. Arvelo L

26

Ejemplo 10 : Los siguientes datos representan las ventas de una empresa distribuidas en los cuatro trimestres del año: Trimestre Primero Segundo Tercero Cuarto Ventas 600.000 750.000 800.000 1.000.000 Representar el crecimiento de las ventas en esta empresa, mediante : a) Un gráfico de círculos proporcionales. b) Un gráfico polar. Solución : a) Para construir el gráfico de círculos proporcionales , tomamos como base el primer trimestre, le damos un radio arbitrario de 30 mm, y los demás resultan ser de: 750 800 1000 r2 = 30 = 33.54 ; r3 = 30 = 34.64 ; r4 = 30 = 38.73 600 600 600

El gráfico polar estará formado por cuatro radios polares separados a 90° , y de longitud igual a las ventas de cada trimestre .

27

Gráficos Estadísticos Angel F. Arvelo L

Ejemplo 11 : Complete la siguiente tabla de frecuencias: Categoría

Frecuencia

Frecuencia relativa porcentual

A B C D Total

? 57 ? ? 200

19.0% ? 32.0% ? ?

Solución : La suma de las frecuencia relativas porcentuales debe ser 100% . 57 100% = 28.50 % hB% = hD % = 100% - 19.0% -28.5%- 32.0% = 20.50% 200 fi hi % 100% fi n Para cada categoría debe verificarse : hi % n 100% 19% 32% fA 200 = 38 ; fC 200 = 64 ; En nuestro caso: n = 200 100% 100% 20.5% fD 200 = 41 , lo que completa la tabla. 100% Ejemplo 12 : Complete la siguiente tabla de frecuencia: Categoría

Frecuencia

Frecuencia relativa porcentual

A B C

x 2x 3x

? 16% ?

D E

100 30

? ?

28

Gráficos Estadísticos Angel F. Arvelo L

Total

?

?

Solución : El total de datos n= x + 2 x + 3 x + 100 + 30 = 6 x + 130 fB 2x 100% 100% 16% Para la categoría B se tiene : hB % n 6 x 130 Despejando “x” se obtiene: 2 x = 0.16 (6 x + 130) = 0.96 x + 20.80 De donde : 1,04 x = 20.80 x = 20 Por lo tanto los valores que faltan en la tabla son: fA = 20 ; fB = 40 ; fC = 60 ; n = 250 ; hA % = 8% ; hc % = 24% ; hD % = 40% hE % = 12% . Total = 100% . Ejemplo 13 En una encuesta electoral , se le preguntó a personas de ambos sexos , su preferencia entre tres candidatos A, B y C encontrándose:

Suponiendo que en esta población existen 45% de hombres y 55% de mujeres , calcule el porcentaje de votos a favor de cada candidato . Solución : No se dice cuantos habitantes hay en esta población , pero en realidad no hace falta , pues basta con tomar un número cualquiera “N” , de por ejemplo 100.000 . Sobre esta base , tenemos que 55.000 son mujeres y 45.000 hombres . La preferencia de las 55.000 mujeres entre los tres candidatos es como sigue: Para A : 39% de 55.000 = 21.450 ; para “B” : 28% de 55.000 = 15.400 , mientras que para el candidato “C” : 33% de 55.000 = 18.150 . Para los 45.000 hombres se tiene : Para “A” : 52% de 45.000 = 23.400 , para el candidato “B”: 29% de 45.000 = 13.050 ; y para “C” : 19% de 45.000 = 8550 .

29

Gráficos Estadísticos Angel F. Arvelo L

En consecuencia , por cada 100.000 habitantes , el número total de simpatizantes para cada candidato es : Para A : 23.400 hombres + 21.450 mujeres = 44.850 simpatizantes . Para B : 13.050 hombres + 15.400 mujeres = 28.450 simpatizantes . Para C: 8.550 hombres + 18.150 mujeres = 26.700 simpatizantes . En consecuencia , sobre la población total, el porcentaje de simpatizantes para cada candidato es : 48.85 % para “A” , 28.45 % para “B” y 26.70 % para “C” . Ejemplo 14 En un estudio electoral, se clasificó a un grupo de personas seleccionadas al azar , según su condición económica, y según el candidato de su preferencia. Los resultados fueron : Condición Económica

Candidato “A”

Candidato “B”

Candidato “C”

Candidato “D”

Baja 95 32 235 58 Media 143 12 94 21 Alta 72 15 9 14 a) Construya un diagrama circular que señale las preferencias hacia a cada candidato , en base a toda la muestra . b) Construya un gráfico circular , que señale las preferencias hacia cada candidato, entre las personas de condición económica baja. c) Construya un histograma de frecuencias relativas que señale la composición por niveles socio económicos, para los simpatizantes del candidato “D. Solución: a) La distribución marginal de frecuencias para cada candidato se obtiene sumando sobre las filas, y se obtiene: Candidato “A”

Frecuencia

310

Candidato “B”

59

Candidato “C”

Candidato “D”

338

93

800

D 11,63%

Con las frecuencias marginales correspondientes a cada candidato, se procede a construir el gráfico circular.

A 38,75% C 42,25% B 7,38%

Total

30

Gráficos Estadísticos Angel F. Arvelo L

b) La preferencia de las personas de condición socio económica baja, aparecen señaladas en la primera fila de la tabla bidimensional de frecuencias, y con ella se elabora el correspondiente gráfico circular, tomando en consideración que la frecuencia marginal es 420, lo que arroja para el candidato “A” por ejemplo, una frecuencia relativa 95 100% = 22,62 % . de: 420

D 13,81% A 22,62% C 55,95%

B 7,62%

Porcentaje

Simpatizantes Candidato "D"

c) La distribución de los simpatizantes del candidato “D” por niveles socio económicos viene dada en la última columna de la tabla, con una frecuencia marginal de 93, lo que da para el nivel “Bajo”, por ejemplo, una frecuencia 58 100% = 62,37 % relativa de : 93

70 60 50 40 30 20 10 0

62,37

22,58 15,05

Baja

Media

Alta

Condición Economica

Preguntas de Revisión 1°) ¿ Por qué es importante que en un histograma de frecuencias, la escala vertical sea lineal , y su origen sea el cero ? . De ejemplos . 2°) Si se construye un histograma de frecuencias dándole diferente ancho a las categorías, ¿ se cumple el principio de proporcionalidad de áreas ? . 3°) ¿ Cual es la diferencia entre un gráfico circular , y uno de círculos proporcionales ? . 4°) ¿ Cual es el objetivo de un Diagrama de Pareto ? . 5°) ¿ Porqué es recomendable colocar en orden alfabético a las diferentes categorías de una variable nominal ? .

Gráficos Estadísticos Angel F. Arvelo L

31

6°) En gráfico polar , ¿ como se representan las frecuencias correspondientes a cada categoría ? . 7°) Si un gráfico polar resulta ser un polígono regular que puede ser inscrito en una circunferencia , ¿ como lo interpreta Ud. ? . 8°) ¿ Cuando conviene utilizar un cartograma ? . 9°) Si se decide utilizar triángulos isósceles de igual base , para representar a las diferentes categorías de una variable cualitativa en un gráfico de figuras proporcionales, ¿que relación deben guardar sus alturas ? . 10°) Al clasificar a los elementos de una población en una tabla de frecuencias según categorías de una variable cualitativa , ¿ qué debe hacerse y por qué , si existe la posibilidad de que un mismo elemento pertenezca simultáneamente a dos ó mas categorías a la vez ? . De ejemplos. PROBLEMAS PROPUESTOS I - Nivel Elemental 1 Una empresa de artículos del hogar vendió durante el año pasado, los siguientes montos, en cada una de sus líneas: Neveras…………………............. 1.200.000 Cocinas...................................... 500.000 Lavadoras................................. 200.000 Secadoras................................. 350.000 Televisores............................. 800.000 a) Construya un gráfico circular, que exprese la forma como se distribuyen las ventas de esta empresa entre los diferentes artículos que vende. b) Construya un gráfico de cuadrados proporcionales, para expresar como son, en proporción, las ventas de los diferentes artículos. 2 Suponga que al leer un gráfico circular, en donde intervienen cuatro categorías, Ud. encuentra que por error no aparecen señalados sobre él, las frecuencias relativas porcentuales correspondientes a cada categoría ,y que Ud. para averiguarlas, toma un transportador y mide los ángulos centrales, encontrando 130º ,75º , 60º y 95º respectivamente. ¿Cuáles son las frecuencias relativas porcentuales correspondientes ?. Respuesta : 36.11 % , 20.83 % , 16.67 % y 26.39%

32

Gráficos Estadísticos Angel F. Arvelo L

3 En la sala de emergencias de un hospital, se hizo un seguimiento sobre las causas que motivaron el ingreso de los pacientes. Los resultados fueron :

Motivo del ingreso Herida por arma de fuego Herida por arma blanca Accidente de transito Coma diabético Problemas cardíacos Convulsiones Intoxicación Fiebre alta Otros

Frecuencia 63 25 96 11 83 8 13 6 14

Haga un diagrama de Pareto para esta situación , e interprete el resultado. 4 En un estudio económico se analizó el precio de la canasta básica durante los últimos ocho años, encontrándose : Año 1 2 3 4 5 6 7 8 Precio 520 610 650 700 830 850 1000 1240 Represente la evolución en el precio de la canasta básica en: a) Un gráfico de círculos proporcionales. b) Un gráfico polar. I I- Nivel Intermedio 5 Demuestre que en un gráfico circular, las áreas de los sectores que corresponden a cada categoría, están en la misma proporción que sus respectivas frecuencias. 6 En una encuesta electoral donde intervienen tres candidatos, se encontró que los electores a favor de ellos, están en proporción 2:3:5 .Represente este resultado en: a) Un histograma de frecuencias relativas porcentuales b) Un diagrama circular. c) Un gráfico de círculos proporcionales. 7 Complete la siguiente tabla de frecuencias : Categoría

Frecuencia absoluta

Frecuencia relativa porcentual

A B C D E Total

? 48 36 ? 39 ?

8.00 % 32.00 % ? ? ? ?

33

Gráficos Estadísticos Angel F. Arvelo L

Respuesta: fA = 12 , hC%= 24.00% , fD= 15 ,hD%= 10.00% , hE%= 26.00% , n=150 I I I- Nivel Avanzado 8 Suponga que al interpretar un gráfico de cuadrados proporcionales en donde intervienen tres categorías, Ud. encuentra que el cuadrado correspondiente a la primera categoría tiene 4 cms. de lado, el correspondiente a la segunda categoría 7 cms. de lado, y el correspondiente a la tercera categoría 10 cms. de lado. ¿Que porcentaje de la población corresponde a cada categoría? . Respuesta: 9.70 % , 29.69 % y 60.61 % 9 Complete la siguiente tabla de frecuencias: Categoría A B C D Total

Frecuencia Absoluta x 2x 40 ? 5x

Frecuencia relativa porcentual (%) ? ? ? 15% ?

Respuesta: x= 32 , fD= 24 10 En un estudio de mercado , se consideraron cuatro marcas de jabón detergente A, B , C y D . Las amas de casa entrevistadas fueron clasificadas en tres categorías según su condición económica, en : Baja, Media y Alta . El resultado de la encuesta se muestra en la siguiente gráfica:

Suponiendo que las clases baja , media y alta están en razón de 4:5:1 respectivamente, calcule el porcentaje de mercado que le corresponde a cada una de estas cuatro marcas de jabón detergente, y utilícelas para construir: a) Un gráfico circular. b) Un gráfico de cuadrados proporcionales. Respuesta: A :17.50% , B: 31.10% , C: 33.10 % , D: 18.30% .

34

Gráficos Estadísticos Angel F. Arvelo L

11 Complete la siguiente tabla de frecuencias: Categoría A B C D E Total

Frecuencia Absoluta x y 3y 5 2x ?

Frecuencia Relativa Porcentual 25% ? 18% ? ? ?

Respuesta: x = 125 ; y = 30

3 . Tablas de Frecuencias para datos cuantitativos Un dato cuantitativo es el resultado de medir una variable cuantitativa , como por ejemplo , una estatura , un peso , etc., y será siempre un valor numérico , dentro de una escala de intervalos , o dentro de una escala de razón. Hay que recordar sin embargo, que la distinción entre datos provenientes de una variable discreta y datos provenientes de una variable continua, tiene más un valor teórico que práctico, ya que en la práctica todos los datos son discretos, debido que al medir una variable continua, los instrumentos de medida no permiten pasar más allá de un cierto límite de precisión, y por lo tanto el resultado de nuestra observación no podrá tener más cifras decimales que las que el instrumento de medición nos permita apreciar. Cuando se tiene una colección de datos cuantitativos, existen tres posibilidades para realizar el tratamiento: a) Tratamiento puntual o sin agrupar : Esta forma de tratamiento consiste en conservar todas las mediciones , sin efectuar ningún tipo de clasificación ni agrupamiento . El tratamiento puntual , o sin agrupar tiene la ventaja de que es más preciso pues conserva cada dato en su valor exacto ( con las limitaciones de medición ya mencionadas anteriormente para el caso continuo) , pero tiene la gran desventaja de que resulta incómodo el tratamiento . Solo es recomendable en el caso de muestras muy pequeñas, en donde cualquier otro tipo de tratamiento provocaría una pérdida casi total de la información . b) Tabla puntual o discreta de frecuencias : Esta segunda alternativa consiste en elaborar una tabla de frecuencias del mismo estilo ya explicado anteriormente para el caso de “Variables Cualitativas” . Este tipo de tabla de frecuencias expresa el número de veces que se repite cada valor de la variable cuantitativa, y sólo es recomendable para variables discretas que toman un número muy reducido de valores diferentes, y que al tener un rango de variación pequeño no permite efectuar un agrupamiento.

35

Gráficos Estadísticos Angel F. Arvelo L

En una tabla puntual de frecuencias , el dato conserva su valor exacto, y la frecuencia le corresponde exclusivamente a él. Al igual que en el caso cualitativo, la frecuencia relativa expresa la fracción de observaciones que le corresponden a un determinado valor , y la frecuencia f f relativa porcentual su porcentaje: hi i ; hi % i 100% n n Donde : fi = Frecuencia absoluta del valor “i” n = f1+f2+…..+fk =

i k

fi = Número total de observaciones . i 1

k = Número de valores diferentes que puede tomar la variable. hi = Frecuencia relativa del valor “i” hi % = Frecuencia relativa porcentual del valor “i” Ejemplo 1: Supongamos que se administra una encuesta en 50 hogares , y se pregunta el número de automóviles que posee, y que las respuestas obtenidas fueron: 1 2 1 0 1 3 1 0 0 0 1 2 1 0 0 1 2 0 1 3 0 1 2 0 0 0 0 1 3 1 2 1 0 1 0 2 2 3 0 1 0 0 0 2 1 1 1 1 0 1 Construir la tabla de frecuencias correspondiente. Solución : La variable “número de automóviles que posee la vivienda” es discreta, y presenta un rango de variación muy reducido : 0 , 1 , 2 y 3 , por lo que conviene construir una tabla puntual de frecuencias . Para construir la tabla basta con contar el número de veces que se ha encontrado cada valor, y proceder de la misma manera como ya se explicó en el caso de tablas de frecuencias para “Variables Cualitativas” : N° de automóviles

Frecuencia

Frecuencia Relativa

Frecuencia Relativa Porcentual

0 1 2 3 Total

19 19 8 4 50

0.38 0.38 0.16 0.08 1.00

38.00 % 38.00 % 16.00 % 8.00 % 100.00 %

c) Tratamiento agrupado : Esta tercera forma de tratamiento consiste en clasificar los datos en intervalos , lo que trae como consecuencia que se pierde la información acerca de su verdadero valor, pero se hace más cómodo el tratamiento . El tratamiento agrupado permite obtener una mejor visión de conjunto acerca del comportamiento de los datos, y conviene cuando se tiene una colección grande de datos ( 30 ó mas ) ; especialmente en el caso de variables continuas que tengan un rango amplio de variación, y no sea necesario distinguir entre valores parecidos de la variable. Para agrupar los datos hay que responder las siguientes preguntas: ¿ Cuantos intervalos tomar ? .

36

Gráficos Estadísticos Angel F. Arvelo L

¿ Qué amplitud deben tener estos intervalos ? . ¿ Cuales deben ser los límites de los intervalos ? . La respuesta a cada una de estas preguntas es la siguiente: c.1 Número de intervalos : No existe una fórmula matemática que permita calcular de manera exacta y precisa el número de intervalos que deben ser definidos al hacer un agrupamiento de datos cuantitativos, pero es posible definir algunos criterios que de una manera aproximada permitan establecer el número de intervalos a considerar. De una manera general , puede decirse que el número de intervalos no debe ser tan excesivamente grande que se pierdan las ventajas del agrupamiento , ni tan pequeño que se pierda la información, y para definirlo se dan las siguientes alternativas: c.1.1 Fórmula empírica de Sturges . Según el autor Herbert A. Sturges (1926) , si se designa por : n= Número total de datos. k= Número de intervalos a considerar. Entonces : k

1 + 3.32 log n

Esta fórmula es completamente arbitraria, se recomienda para n 500, y proporciona una buena orientación inicial acerca del número de intervalos a considerar . Así por ejemplo , según ella , para una muestra de 1000 datos , es necesario definir : k 1 + 3.32 log 1000 = 10.96 11 intervalos. c.1.2 Fórmula de la raíz. Otro criterio que proporciona una buena aproximación inicial acerca del número de intervalos a tomar , especialmente en el caso de muestras pequeñas , es el que establece que el número de intervalos necesarios para hacer el agrupamiento debe ser aproximadamente igual a la raíz cuadrada n . del número de datos : k Según este criterio , una muestra de por ejemplo 100 datos debe agruparse en 10 intervalos . c.1.3 Agrupamiento a criterio. En el agrupamiento a criterio , el número de intervalos se define a juicio de la persona que lo esta haciendo . Se recomienda tomar entre 5 y 15 intervalos , siendo lo más frecuente ocho ; y en ningún caso es recomendable tomar más de 20 intervalos . c.2 Amplitud de los intervalos . Una vez definido el número de intervalos a tomar, su amplitud puede ser calculada de manera aproximada , de la siguiente manera: Se calcula el rango de los datos , haciendo la diferencia entre el mayor y el menor valor . R = Xmax. - Xmin .

37

Gráficos Estadísticos Angel F. Arvelo L

El rango se divide entre el número de intervalos a tomar. c

X max

X min

R k

k c = Amplitud de los intervalos . El resultado obtenido se aproxima al número cómodo más cercano; entendiendo por número cómodo a un número entero múltiplo de 5 ó de 10, o de una potencia de 10 , según el orden de magnitud de los datos , y que sea fácil de recordar. En caso de que se aproxime a un número menor, es posible que resulten más intervalos de lo previsto, y en caso de que se aproxime a uno mayor , menos de lo previsto. Se acostumbra que la amplitud de cada uno de los intervalos sea la misma, aunque es posible construir tablas de frecuencias con intervalos de amplitud diferente. Este caso será considerado más adelante.

c.3 Límites de clase. Se entiende por límites de clase a los extremos de los intervalos donde quedan clasificados los datos. Como no es necesario que el límite inferior del primer intervalo coincida exactamente con menor valor de los datos , ni que el límite superior del último intervalo con el mayor , es usual arrancar el primer intervalo desde un número exacto múltiplo de 5 , de 10 o de una de sus potencias , que sea ligeramente inferior al menor valor de los datos, , y a partir de allí definir los siguientes límites de clase , según sea la amplitud . Para definir los límites de clase , existen dos criterios: c.3.1 Definir los intervalos como cerrados en su extremo inferior y abiertos en el superior , sin interrumpir la continuidad entre un intervalo y el siguiente. Bajo este criterio una variable como por ejemplo la estatura de un grupo de personas, quedaría clasificada en intervalos que van desde 1.40 m a 1.50 m el primero, desde 1.50 m a 1.60 m el segundo , desde 1.60 m a 1.70 m , el tercero y así sucesivamente ; y de darse una medición igual a la frontera por decir 1.60 m, ésta quedaría clasificada en el intervalo que la tenga como límite inferior, es decir el intervalo 1.60 a 1.70 , por ser cerrado en el límite inferior. Este criterio tiene la ventaja de que no interrumpe la continuidad de los datos, y equivale a definir los datos dentro de un intervalo como “mayor o igual que el límite inferior y estrictamente menor que el límite superior” . c.3.2 Definir los intervalos como cerrados en sus dos extremos . Bajo este criterio, en un caso como el anterior , los límites de clase quedarían definidos como desde 1.40 hasta 1.49 el primero , desde 1.50 hasta 1.59 el segundo, etc. . Este segundo criterio es más claro desde el punto de vista que no presenta la ambigüedad que pudiera presentar el anterior , cuando una observación es igual a la frontera y no se señale claramente sobre la tabla que el intervalo es cerrado en el extremo inferior y abierto en el superior.

Gráficos Estadísticos Angel F. Arvelo L

38

La desventaja de este criterio es que interrumpe la continuidad de los datos , al dejar un vacío entre el extremo superior de un intervalo y el inferior del siguiente, lo que distorsiona los gráficos , como el histograma. Quienes utilicen este criterio para definir los límites de clase deberán distinguir entre límites reales y límites aparentes de un intervalo, para no interrumpir la continuidad de los datos. En las gráficas, las fronteras entre un intervalo y el siguiente vendrán dadas por los límites reales. Por esta razón , un intervalo definido por sus extremos aparentes como podrían ser desde 1.40 hasta 1.49 , cubre en realidad mediciones reales en el intervalo [1.395 ; 1.495) que son sus límites reales , mientras que el intervalo aparente de 1.50 a 1.59 cubre valores reales en [1.495 ; 1.595) . De lo anterior se deduce entonces que para hallar los límites reales de un intervalo: 1 Límite Real Inferior = L.r.i = Límite Aparente Inferior - Sensibilidad 2 1 Límite Real Superior = L.r.s= Límite Aparente Superior + Sensibilidad 2 Es importante destacar que cuando se utiliza este criterio , la amplitud del intervalo viene dada por la diferencia entre sus límites reales , y no por la de sus límites aparentes , en consecuencia : c = L.r.s - L.r.i . Lo anterior significa que si un intervalo está definido por los límites 1.50 a 1.59 , su amplitud aparente es 1.59 - 1.50 = 0.09 ; pero su amplitud real es 1.595 - 1.495 = 0.10 .. Para distinguir si los datos están agrupados por el primer o segundo criterio, basta con observar la tabla de frecuencias. Si los límites de clase están definidos sin interrupción de continuidad , están agrupados según el primer criterio, y si los límites de clase presentan una interrupción en la continuidad , están agrupados según el segundo criterio. Ejemplo 2 : Los siguientes 60 datos , representan la estatura de los estudiantes en un curso de Estadística , medidas con una sensibilidad de 0.01 metro , es decir 1 centímetro . 1.66 1.69 1.76 1.82 1.54 1.63 1.80 1.60 1.71 1.63 1.75 1.74 1.70 1.66 1.68 1.80 1.57 1.53 1.61 1.93 1.72 1.61 1.69 1.68 1.73 1.60 1.66 1.59 1.47 1.50 1.67 1.48 1.61 1.73 1.80 1.66 1.60 1.63 1.78 1.79 1.46 1.89 1.73 1.78 1.65 1.90 1.57 1.74 1.61 1.62 1.61 1.81 1.53 1.59 1.66 1.77 1.70 1.65 1.68 1.53 Agrupar estos datos en una tabla de frecuencias . Solución : El primer paso es definir cuantos intervalos se van a tomar . Para una muestra de 60 datos , según la fórmula de la raíz , habría que tomar: 60 8 intervalos . k El paso siguiente es definir su amplitud . El mayor valor es 1.93 , el menor valor 1.46 , y por tanto el rango : R = 1.93 - 1.46 = 0.47 .

39

Gráficos Estadísticos Angel F. Arvelo L

0.47 = 0.0588 8 La amplitud 0.0588 se aproxima a un valor que resulte más cómodo para trabajar, como por ejemplo 0.05 , con lo que posiblemente resulten más intervalos de lo previsto. El tercer paso es definir los límites de clase. Supongamos que decidimos seguir el primer criterio . A continuación hay que decidir donde arrancar el primer intervalo. Como el menor valor es 1.46 , podríamos arrancar el primer intervalo desde 1.45 que resulta más cómodo, y de esta manera quedarían los siguientes límites de clase: desde 1.45 hasta 1.50 el primero , desde 1.50 hasta 1.55 el segundo , y así sucesivamente . El paso siguiente es contar cuantas observaciones caen en cada uno de estos intervalos, teniendo en cuenta que es cerrado en el extremo inferior y abierto en el superior. La tabla de frecuencias resulta:

Para 8 intervalos , la amplitud debería ser entonces : c

Estatura 1.45 a 1.50 1.50 a 1.55 1.55 a 1.60 1.60 a 1.65 1.65 a 1.70 1.70 a 1.75 1.75 a 1.80 1.80 a 1.85 1.85 a 1.90 1.90 a 1.95 TOTAL

Frecuencia 3 5 4 12 13 9 6 5 1 2 60

Frecuencia Relativa Porcentual 5.00 % 8.33 % 6.67 % 20.00 % 21.67 % 15.00 % 10.00% 8.33 % 1.67 % 3.33 % 100.00

De haber definido los límites de clase por el segundo criterio, la tabla hubiese quedado: Estatura 1.45 a 1.49 1.50 a 1.54 1.55 a 1.59 1.60 a 1.64 1.65 a 1.69 1.70 a 1.74 1.75 a 1.79 1.80 a 1.84 1.85 a 1.89 1.90 a 1.94 TOTAL

Límites Reales 1.445 a 1.495 1.495 a 1.545 1.545 a 1.595 1.595 a 1.645 1.645 a 1.695 1.695 a 1.745 1.745 a 1.795 1.795 a 1.845 1.845 a 1.895 1.895 a 1.945

Frecuencia 3 5 4 12 13 9 6 5 1 2 60

Frecuencia Relativa Porcentual 5.00 % 8.33 % 6.67 % 20.00 % 21.67 % 15.00 % 10.00% 8.33 % 1.67 % 3.33 % 100.00 %

Tabla de frecuencias acumuladas: Una vez que se ha construido la tabla de frecuencias, bien sea puntual o agrupada por cualquiera de los dos criterios , es

40

Gráficos Estadísticos Angel F. Arvelo L

posible complementar la información contenida en ella , mediante las frecuencias acumuladas . La frecuencia absoluta acumulada de un intervalo expresa el número total de observaciones que son iguales o menores que su límite superior. Para obtenerla basta con sumar todas las frecuencias absolutas correspondientes a los intervalos anteriores , con la frecuencia propia : i j

Fj

f1 f2

fj

fi . i 1

Donde : Fj = Frecuencia absoluta acumulada hasta el intervalo “j” . fi= Frecuencia absoluta del intervalo “i” . De manera análoga , la frecuencia relativa acumulada de un intervalo expresa la fracción de observaciones que son iguales o menores que el límite superior del intervalo ; y la frecuencia relativa porcentual acumulada , el porcentaje de observaciones que son iguales o menores que el límite superior del intervalo . i j

Hj

h1 h 2

hj

i j

hi

;

Hj % h1 % h2 %

hj %

i 1

hi % i 1

Hj = Frecuencia relativa acumulada hasta el intervalo “j” =

Fj n

Hj %= Frecuencia relativa porcentual acumulada hasta el intervalo “j” =

Fj

100% n Ejemplo 3 : Completar la tabla del Ejemplo 2 , incluyendo la frecuencias absolutas acumulada , y la frecuencia relativas porcentuales acumuladas . Solución: La frecuencia acumulada del primer intervalo es: F1 = f1 = 3 , y significa que 3 personas miden 1.49 ó menos , que es el límite superior del primer intervalo . La frecuencia acumulada del segundo intervalo es : F2 = f1 + f2 = 3 + 5 = 8 ; y su interpretación es que 8 personas en la muestra , tienen una estatura igual o menor que el límite superior del intervalo 1.54 . La frecuencia relativa porcentual acumulada del primer intervalo es : H1 % = h1 % = 5 % , y significa que el 5% de las observaciones son iguales o menores que el límite superior del primer intervalo, que es 1.49 ; es decir , que el 5% de las personas en la muestra miden 1.49 ó menos . La frecuencia relativa porcentual acumulada del segundo intervalo es : H2 % = h1 % + h2 % = 5 % + 8.33 % = 13.33 %, y significa que el 13.33 % de las personas en la muestra , miden 1.54 ó menos . Procediendo de manera análoga con los demás intervalos , se completa la tabla obteniendo: Estatura

Límites Reales

Frecuencia

Frecuencia acumulada

1.45 a 1.49 1.50 a 1.54 1.55 a 1.59 1.60 a 1.64

1.445 a 1.495 1.495 a 1.545 1.545 a 1.595 1.595 a 1.645

3 5 4 12

3 8 12 24

Frecuencia Relativa Porcentual 5.00 % 8.33 % 6.67 % 20.00 %

Frecuencia Relativa Porcentual Acumulada 5.00 % 13.33 % 20.00 % 40.00 %

41

Gráficos Estadísticos Angel F. Arvelo L 1.65 a 1.69 1.70 a 1.74 1.75 a 1.79 1.80 a 1.84 1.85 a 1.89 1.90 a 1.94 TOTAL

1.645 a 1.695 1.695 a 1.745 1.745 a 1.795 1.795 a 1.845 1.845 a 1.895 1.895 a 1.945

13 9 6 5 1 2 60

37 46 52 57 58 60

21.67 % 15.00 % 10.00% 8.33 % 1.67 % 3.33 % 100.00 %

61.67% 76.67 % 86.67 % 95.00 % 96.67 % 100.00 %

Tabla 4.4

Ejercicios Propuestos: 4) Los siguientes datos representan el número de hijos que tienen cada uno de los 100 empleados de una organización industrial: 2 1 2 2 2 0 1 1 1 1 1 0 3 0 2 3 1 2 4 1 1 1 1 1 2 3 1 2 0 2 2 4 2 1 0 1 2 2 3 2 1 0 0 0 3 1 2 2 1 0 1 0 3 2 1 0 3 1 2 1 2 0 2 2 2 1 1 3 0 2 2 2 1 0 0 1 1 2 1 3 2 1 1 4 1 0 1 1 0 1 1 2 2 1 2 2 2 2 1 2 a) Construya la tabla de frecuencias , indicando frecuencias absolutas , relativas porcentuales , absolutas acumuladas y relativas porcentuales acumuladas . b) Construya un gráfico circular . 5) Los siguientes datos representan el peso de un grupo de personas, expresados en Kilogramos, y redondeados al entero más cercano: 53 76 85 59 82 75 66 61 59 63 79 68 63 71 87 67 71 79 60 53 57 62 69 52 59 70 61 66 63 75 65 60 72 88 70 53 77 86 51 67 78 89 50 76 64 71 78 57 53 69 94 68 75 70 81 67 55 57 60 52 68 64 80 77 67 93 77 55 72 64 63 70 72 46 51 53 87 71 69 60 55 73 59 52 55 62 91 60 50 86 74 73 83 55 67 70 59 62 90 65 78 77 66 57 50 61 67 70 63 72 88 78 54 77 58 48 56 58 63 90 66 68 57 55 68 70 61 84 76 59 75 50 56 73 79 98 60 57 69 73 78 51 68 70 80 65 59 48 67 72 Agrupar estos datos en una tabla de frecuencias, indicando frecuencias absolutas , relativas y acumuladas .

4 Representación Gráfica de Datos Cuantitativos:

Existen varias alternativas para representar gráficamente datos cuantitativos, entre las cuales pueden ser citadas: 1°) El Histograma : Esta es la representación gráfica de la tabla de frecuencias absolutas o de las relativas según se quiera , sus normas de construcción son las mismas que fueron analizadas en el capítulo anterior para datos cualitativos ; y que el caso de datos cuantitativos presenta dos casos: 1.a ) Tabla puntual o discreta de frecuencias . Este es el caso en donde toda la frecuencia le corresponde exclusivamente a un valor puntual y no a un intervalo.

Gráficos Estadísticos Angel F. Arvelo L

42

Aunque toda la frecuencia debería concentrarse en el valor puntual, generalmente se dibuja una barra de espesor grueso , a fin de resaltar la frecuencia , y por ello este histograma también se suele llamar “Gráfico de barras”. Ejemplo 6. Representar las frecuencias relativas del Ejemplo 1 , en un Histograma. Solución :

1.b ) Tabla agrupada de frecuencias . En este caso, a diferencia del anterior, la frecuencia le corresponde a todo el intervalo , y no al valor puntual. Por este motivo , la frecuencia debe ser representada como un rectángulo cuya base debe ser todo el intervalo , y cuya altura igual a la frecuencia . Las normas de construcción son las ya conocidas , y el único detalle que hay que cuidar es el que se refiere al caso en que los límites de clase hayan sido definidos por el segundo criterio, en donde los límites que representan a cada intervalo son los límites reales , a fin de mantener la continuidad en el gráfico. Representar los intervalos por sus límites aparentes, no sería correcto, pues quedaría un vacío entre un intervalo y el siguiente , que alteraría la continuidad . Ejemplo 7 : Representar los datos del Ejemplo 2 en un Histograma de Frecuencias Relativas Porcentuales .

Gráficos Estadísticos Angel F. Arvelo L

43

2°) Polígonos de frecuencia , y gráficos de área : El polígono de frecuencias es una gráfica obtenida a partir del histograma , cuando se unen los puntos medios de los lados superiores consecutivos , tal como se muestra en la figura :

El polígono de frecuencias se utiliza principalmente para destacar las fluctuaciones de frecuencias que existen entre los intervalos consecutivos, y también puede ser construido aisladamente sin el histograma , en cuyo caso se suele llamar “gráfico de área” , tal como el siguiente:

Gráficos Estadísticos Angel F. Arvelo L

44

El gráfico de áreas tiene la propiedad de que su área es igual al área total del histograma, es decir igual a la suma de las áreas de todos los rectángulos que lo integran. Es importante destacar que las técnicas de “Estadística Matemática” , han desarrollado una serie de curvas conocidas bajo el nombre de “Distribuciones teóricas de Probabilidad” , que vienen a constituir una especie de modelo teórico para el “Polígono de Frecuencia” , pues a medida que la amplitud de los intervalos se reduce , el polígono tiene cada vez mas lados , y la curva de probabilidad viene a ser una aproximación teórica para la posición límite del polígono cuando la amplitud del intervalo tienda a cero. 3°) Gráficos de tallo y hoja : Cuando se agrupa un conjunto de datos en una tabla de frecuencias , se pierde la información de su verdadero valor , y lo que queda registrado es una observación dentro del intervalo de clase donde cae. El diagrama de tallo y hoja , es una técnica de representación , cuyo nombre original en idioma inglés es “ stem and leaf” , y que fué propuesta por el estadístico John Tukey en 1977 en su clásico trabajo titulado “ Exploratory Data Analysis”, en donde se analizan una serie de novedosas maneras para el análisis de datos . En el diagrama de tallo y hoja , cada dato tiene dos partes : el tallo y la hoja. La hoja esta definida por su último dígito , y existen dos hojas , la inferior que corresponde a los dígitos 0 , 1 , 2 , 3 y 4 y que se representa en el diagrama por él símbolo “ ” , y la superior que corresponde a los dígitos 5 , 6 , 7 ,8 y 9 , y se representa por el símbolo “ ” . El tallo representa todos los demás dígitos , y se colocan en el gráfico en forma de filas ordenadas , desde el valor más bajo hasta el más alto . Ejemplo 8 : Representar los datos del Ejemplo 2, en un diagrama tallo y hoja. Solución : Para cada dato , se define su tallo y su hoja . así por ejemplo , el dato 1.54 pertenece al tallo 1.5 y a la hoja inferior “ ” , mientras que el dato 1.79 al

45

Gráficos Estadísticos Angel F. Arvelo L

tallo 1.7 y a la hoja superior “o” . En cada hoja se conserva el valor exacto del último dígito ; y se anota a la izquierda , la frecuencia absoluta de cada tallo y hoja , tal como se muestra en la tabla a continuación : Frecuencia 3.00 5.00 4.00 12.00 13.00 9.00 6.00 5.00 1.00 2.00

Tallo 1.4 1.5 1.5 1.6 1.6 1.7 1.7 1.8 1.8 1.9

Hoja

* * * * *

678 03334 7799 000111112333 55666666788899 001233344 567889 00012 9 33

Nótese que la información contenida en este diagrama es más detallada que la dada en la tabla de frecuencias, pues informa cual es el valor exacto de las observaciones que caen en cada intervalo ; y así por ejemplo, se sabe que las cinco observaciones que caen en la hoja inferior del tallo 1.50 , que cubre el intervalo aparente 1.50 a 1.54 son : 1.50 , 1.53 , 1.53 , 1.53 y 1.54 . También es posible construir el diagrama con una sola hoja para cada tallo, o con cinco hojas para cada tallo. La construcción con una sola hoja para cada tallo , no discrimina entre hoja inferior y hoja superior , y en un caso como el del ejemplo anterior quedaría de la siguiente forma : Frecuencia 3.00 9.00 25.00 15.00 6.00 2.00

Tallo 1.4 1.5 1.6 1.7 1.8 1.9

Hoja 678 033347799 0001111123335566666788899 001233344567889 000129 03

La construcción con cinco hojas para cada tallo , distingue las siguientes hojas: La hoja “ ” donde caen las observaciones cuyo último dígito es 0 ó 1 . La hoja “T” ,del inglés “Two y Three” correspondiente al 2 y al 3 . La hoja “F”, del inglés “Four y Five” , correspondiente al 4 y 5 . La hoja “S”, del inglés “Six y Seven” correspondiente al 6 y 7 . La hoja “ ” que corresponde a las observaciones terminadas en 8 y 9. Este estilo de diagrama con cinco hojas para cada tallo , conviene sólo en caso de disponer de un número grande de datos , pues puede dar lugar a un excesivo número de filas . 4°) La Ojiva : Esta gráfica es la representación de la tabla de frecuencias acumuladas , y expresa el número de observaciones que son iguales o menores

46

Gráficos Estadísticos Angel F. Arvelo L

que un cierto límite en caso de representar las frecuencias absolutas acumuladas, o el porcentaje de observaciones que son iguales o menores que un límite en caso de representar las frecuencias relativas porcentuales acumuladas. En la construcción de la ojiva, deben distinguirse dos casos: 4.1 Tabla discreta de frecuencias : En este caso , la frecuencia corresponde exclusivamente a un valor puntual , y la ojiva adopta un aspecto de escalera . Ejemplo 9 : Construir la Ojiva para los datos del Ejemplo 1 Solución: La tabla de frecuencias acumuladas para estos datos es la siguiente: N° de automóviles

Frecuencia

Frecuencia Relativa Porcentual

0 1 2 3 Total

19 19 8 4 50

38.00 % 38.00 % 16.00 % 8.00 % 100.00 %

Frecuencia acumulada 19 38 46 50

Frecuencia Relativa Porcentual Acumulada 38.00 % 76.00 % 92.00 % 100.00 %

De la tabla se desprende , que por ejemplo , de las 50 viviendas observadas 46 de ellas tienen 2 vehículos o menos , lo que equivale al 92.00 % . Como entre 0 y 1 , ó entre 1 y 2 , etc., no existen observaciones , la frecuencia acumulada permanece constante entre los valores consecutivos , pues por ejemplo , el porcentaje de viviendas que poseen 1,5 vehículos o menos , es el mismo que posee 1 vehículo o menos, es decir 76.00 % ; y por ello, la ojiva queda de la siguiente forma :

Para 3 vehículos o más , la ojiva permanece constante en 100% , pues evidentemente, el porcentaje de viviendas que poseen por ejemplo, 5 vehículos o menos es el 100% . 4.2 Tabla agrupada de frecuencias : En este caso , la frecuencia corresponde a todo un intervalo , y por lo tanto se produce un crecimiento de la frecuencia

Gráficos Estadísticos Angel F. Arvelo L

47

acumulada dentro de él . Como al agrupar , se perdió la información acerca del valor exacto de los datos , se supone que este crecimiento es lineal. Es importante destacar que en caso de haber utilizado el segundo criterio de definición de los límites de clase , la Ojiva debe ser construida con los límites reales, pues si se construyera con los límites aparentes , entre el límite superior de un intervalo y el inferior del siguiente , quedaría un zona de crecimiento nulo en la frecuencia acumulada. Ejemplo 10 : Construir la Ojiva , para los datos del Ejemplo 2 Solución : La tabla de frecuencias relativas acumuladas , al representarla gráficamente da lugar a la siguiente Ojiva:

Ojivas como la anterior , se suelen llamar “menor o igual que” , para distinguirlas de otras llamadas “mayor o igual que” , en donde lo que se representa es el porcentaje de observaciones que son mayores o iguales que un límite de clase. Para construir una Ojiva “mayor o igual que” , el procedimiento es idéntico, sólo que hay que restar del 100% la frecuencia acumulada de cada intervalo, y representarla para el límite real superior del intervalo. Ejemplo 11 Construir una Ojiva del tipo “mayor o igual que” , para los datos del ejercicio anterior. Solución: Siguiendo el procedimiento anterior, se obtiene:

Gráficos Estadísticos Angel F. Arvelo L

48

En lo sucesivo , cuando se haga referencia a la Ojiva , salvo indicación en contrario , se sobreentenderá que es del tipo “ menor o igual que” . 4. Tablas de Frecuencia con intervalos de diferente amplitud Aunque lo común es construir las tablas de frecuencias con intervalos de igual amplitud , a veces se dan circunstancias en donde se hace necesario construir la tabla con intervalos de diferente amplitud, lo que ocasionas ciertas modificaciones en las técnicas de representación gráfica, y muy especialmente en el histograma. Cuando los intervalos tienen diferente amplitud, hay que mantener el principio de proporcionalidad de áreas , ya enunciado en el capítulo anterior, y según el cual , las áreas de los rectángulos que representan a cada una de las clases deben estar en la misma proporción que sus frecuencias. Según este principio, si el intervalo “i” tiene una frecuencia “fi” con una amplitud “ci” , y otro intervalo “j” una frecuencia “f j” con una amplitud “cj” , no sería correcto construir el histograma con rectángulos de altura igual a su frecuencia, pues no se cumpliría la proporcionalidad de áreas. Para resolver el problema, y poder construir correctamente el histograma, es necesario introducir el concepto de densidad de frecuencia “d i” para un intervalo, y el cual se define como el cociente entre la frecuencia del intervalo y su amplitud. fi di ci Calculada la densidad de frecuencias para cada intervalo , el histograma se construye dibujando para cada clase un rectángulo de altura igual a su densidad de frecuencias. Al construir el histograma de esta manera se respeta la proporcionalidad de áreas, pues el área de cada rectángulo será: Area = Base x Altura = Amplitud x Densidad de frecuencias = ci x di

49

Gráficos Estadísticos Angel F. Arvelo L

fi ( Area)i ci di ci fi y por lo tanto : fj ( Area) j c j dj fj cj cj Ejemplo 12 : La siguiente tabla de frecuencias muestra la distribución de sueldos mensuales en una empresa: ci

Sueldo Mensual Frecuencia

300 a 500

400

500 a 1.000

1000 a 2000

2000 a 3000

3.000 a 5.000

5.000 a 10.000

10.000 a 20.000

900

700

300

180

75

45

Construir el Histograma correspondiente . Solución : Se comienza calculando la densidad de frecuencia correspondiente a cada intervalo: Sueldo Mensual 300 a 500 500 a 1.000 1.000 a 2.000 2.000 a 3.000 3.000 a 5.000 5.000 a 10.000 TOTAL

Frecuencia 400 900 700 300 180 20 2500

Amplitud 200 500 1.000 1.000 2.000 5.000

Densidad de frecuencia 2.00 1.80 0.70 0.30 0.09 0.004

El histograma se construye dibujando rectángulos de ancho igual a la amplitud de cada intervalo, y de altura igual a su densidad de frecuencias , como en el gráfico a continuación:

Resulta obvio que en el caso de intervalos con igual amplitud, las densidades de frecuencia de los diferentes intervalos resultan directamente proporcionales a sus respectivas frecuencias, y por ello no se altera la razón entre las alturas , si

Gráficos Estadísticos Angel F. Arvelo L

50

en lugar de representar la densidad de frecuencias como altura del rectángulo, se representa directamente la frecuencia. Otra alternativa que se presenta cuando el rango de variación de los datos es muy amplia como en el ejemplo anterior, en donde tomar intervalos de igual amplitud , daría lugar a un excesivo número de intervalos , o a una pérdida considerable de la información porque la gran mayoría de las observaciones caen dentro de un mismo intervalo, es definir alguno de los intervalos extremos como abierto, es decir “menor que” el izquierdo , o “mayor que” el derecho. Así por ejemplo, el último intervalo del ejemplo anterior , se hubiese podido definir como “5.000 ó más” . Esta alternativa sin embargo, no es recomendable pues no permite la representación gráfica, al tener este último intervalo una amplitud infinita y una densidad de frecuencias igual a cero; y además tampoco permite calcular ciertos indicadores muestrales , tales como promedios, etc., que serán analizados en el capítulo siguiente.

IV.5

Transformaciones y cambios de escala: Cuando un dato cuantitativo va ser representado sobre un eje de números reales , existen varias alternativas en lo que a la escala se refiere. Se llama escala, a la razón entre la longitud del segmento que representa al dato y su verdadero valor. Existen varios tipos , tales como : a) La escala aritmética : Se dice que una escala es aritmética cuando la relación entre la longitud del segmento que representa al dato y su verdadero valor es constante. Así por ejemplo, una escala aritmética de 1:200 significa que cada unidad de longitud para el segmento representa 200 unidades del dato. Este tipo de escala conserva la proporcionalidad entre los valores que representa; y así por ejemplo, si la magnitud de un valor es el doble de la magnitud de otro , entonces la longitud del segmento que lo representa es el Longitud de " a" a = doble de la longitud del otro. Longitud de "b" b El Histograma por ejemplo, utiliza este tipo de escala para representar la densidad de frecuencias, pues si un intervalo tiene doble densidad de frecuencias que otro, entonces la altura del rectángulo que lo representa es doble de la del otro . El uso de la escala aritmética es la más frecuente y común , pero puede resultar inconveniente en algunos casos , especialmente cuando la magnitud de los datos presenta un alto grado de variación. La situación anterior puede presentarse tanto en datos cualitativos , como cuantitativos, como se muestra en el ejemplo siguiente:

Gráficos Estadísticos Angel F. Arvelo L

51

Ejemplo 13 : Los siguientes datos representan las ventas anuales de un grupo de empresas , expresadas en millones de unidades monetarias: Empresa A B C D E F Ventas 1.36 1007.61 85.40 105.40 453.98 10.53 Representar estos datos en un histograma con escala aritmética . Solución : Como estos datos presentan un alto grado de variación , el histograma con escala aritmética , va a quedar distorsionado , y no será posible apreciar los valores pequeños.

b) La escala logarítmica : Se dice que una escala es logarítmica cuando al representar las magnitudes en el eje de números reales , las longitudes de los segmentos que las representan, están en la misma proporción que sus logaritmos.

Longitud de " a" log a = Longitud de "b" log b En una escala logarítmica solo se pueden representar valores positivos, y el cero corresponde a la unidad, pues log 1 = 0 . Generalmente se utilizan logaritmos decimales, y por lo tanto cuando un segmento es doble que otro , esto debe interpretarse como que la magnitud es 10 veces más que la otra. En consecuencia:

La escala logarítmica en base diez se utiliza principalmente para representar cuantas veces más grande, en potencias de diez, es una clase con relación a otra. Como los logaritmos en bases diferentes son múltiplos unos de otros, un cambio de base , equivale a un cambio en la unidad de longitud en la escala logarítmica.

52

Gráficos Estadísticos Angel F. Arvelo L

Ejemplo 13 : Representar los datos del Ejemplo 12 utilizando una escala logarítmica . Solución : Para construir la gráfica , es necesario previamente transformar los datos , y calcular sus respectivos logaritmos. Empresa A B C D E F

Ventas 1.36 1007.61 85.40 105.40 453.98 10.53

Logaritmo de Ventas 0.13 3.00 1.93 2.02 2.66 1.02

y al representar gráficamente resulta:

Nótese que en el eje vertical se coloca el valor real de las ventas , pero las alturas de los rectángulos no guardan proporción con los valores reales , sino con sus logaritmos; y así por ejemplo , en el gráfico , puede apreciarse que la altura de la empresa “B” es aproximadamente el triple de la “F” , lo que se interpreta en un gráfico logarítmico como que las ventas reales de las empresa “B” están con las de la empresa “F” en la proporción 103:101 ; es decir de 100 a 1 , o lo que es lo mismo, que son 100 veces más .

Ejemplo 14 : Suponga que al leer un gráfico , en donde los valores de las clases están en escala logarítmica , Ud. encuentra que una clase tiene una altura negativa de -1 , y otra clase una altura positiva de +2 . ¿ Cual es la razón entre el valor de la segunda y la primera clase ? . Solución : Si la primera clase “A” , tiene una altura negativa -1 , esto significa que su verdadero valor es 10-1 = 0.1 ; mientras que si la segunda clase “B” tiene una altura de +2 , entonces su verdadero valor es 102 = 100 .

53

Gráficos Estadísticos Angel F. Arvelo L

Por lo tanto, la razón entre el valor de la segunda y el de la primera clase es de 100 1000 . ; lo que significa que el tamaño de la segunda clase es mil veces el 01 . de la primera. c) Escala de raíz cuadrada : Aquí , en lugar de representar el verdadero valor , se representa su raíz cuadrada , y por lo tanto la longitud de los segmentos que representan a los diferentes valores quedan en proporción a sus raíces Longitud de " a" a cuadradas : = Longitud de "b" b Este tipo de escala se utiliza principalmente cuando existen diferencias acentuadas entre los diferentes valores , y se quiere suavizarlas o amortiguarlas.

Ejemplo 14 : Representar los datos del Ejemplo 12 , en una escala de raíz cuadrada. Solución : Para construir la gráfica , es necesario calcularle la raíz cuadrada a las ventas , y luego graficar: Empresa A B C D E

Ventas 1.36 1007.61 85.40 105.40 453.98

Raíz Cuadrada de Ventas 1.17 31.74 9.24 10.27 21.31

Gráficos Estadísticos Angel F. Arvelo L

54

Sobre el eje vertical se señalan las ventas reales , pero los rectángulos que representan a las ventas de cada una de las empresas se construyen con alturas proporcionales a sus raíces cuadradas . d) Escalas funcionales : Las escalas anteriores son casos particulares de una situación más general , conocida como escala funcional , en donde los valores reales de una variable “x” se representan en proporción a los valores de una función : y = f(x) . Los únicos requisitos que debe cumplir esta función f(x) es ser continua, monótona, y por consiguiente tener inversa. Así por ejemplo el caso de la escala aritmética es cuando f(x) = x , el de la escala logarítmica cuando f(x) = log x , y el de escala raíz , cuando f(x) = x . Por este procedimiento ,es posible definir otras escalas como por ejemplo la 1 2 escala recíproca cuando : f(x) = , o la escala cuadrática cuando f(x)=x . x Una aplicación muy importante de esta escala funcional es la llamada “escala gaussiana” , que permite transformar la ojiva de un conjunto de datos en una recta; y que se utiliza para identificar cuando una muestra proviene de una “Distribución Normal” mediante el uso de un papel especial conocido como “papel probabilístico” . Ejemplo 15 : Suponga que en un histograma de frecuencias construidos con escala de raíz cuadrada , existen tres clases , y que la altura de la primera clase es la mitad de la altura de la segunda ; y que la altura de la tercera clase es una vez y media la de la segunda . Calcule la frecuencia relativa porcentual de cada una de las tres clases. Solución : Al ser un histograma con escala de raíz cuadrada , las alturas están en proporción a la raíz cuadrada de las frecuencias ; por lo tanto: f1 1 f3 3 9 9 f2 = 4f = 9 f1 y f2 = 4 f1 y f3 4 4 1 f2 2 f2 2 Lo anterior significa entonces , que por cada unidad en la primera clase , hay cuatro en la segunda y nueve en la tercera ; lo que nos lleva a la conclusión de que por cada 14 unidades en la población , 1 pertenece a la primera clase , 4 a la segunda y 9 a la tercera. La frecuencia relativa porcentual de cada clase es por consiguiente: 1 4 h1 100% = 7.14 % ;h2 100% = 28.57 % ; 14 14 9 h3 100% = 64.29 % 14

Gráficos Estadísticos Angel F. Arvelo L

55

Transformaciones: Se dice que un conjunto de datos ha sido sometido a una transformación , cuando por efecto de la aplicación de alguna función matemática, el valor original de los datos ha sido convertido en otro conjunto distinto de datos. Generalmente la transformación de un conjunto de datos se hace con el objetivo de facilitar su tratamiento, o de suavizar las fluctuaciones existentes en los datos originales, y es un artificio muy frecuente en Estadística, debido a que a veces resulta más fácil describir los datos transformados que los datos originales. Las transformaciones más importantes son : a) La transformación lineal : Esta es una transformación según la cual , un dato “X” se transforma en otro “Y” , mediante una función lineal del tipo: Y = a + b X . Ejemplos de transformaciones lineales son todos aquellos que consisten en un cambio de unidades al multiplicar por un factor de conversión. Si un conjunto de mediciones han sido tomadas originalmente en “pulgadas” , y se decide pasarlas a “centímetros” , esto equivale a multiplicar cada dato original “X” por el factor 2.54 que convierte pulgadas en centímetros, y obtener otro nuevo dato Y = 2.54 X . Igual situación se presenta si un conjunto de datos relacionados con temperatura, se encuentra expresado en °F , y por algún motivo se decide convertirlos en °C, lo que equivale a transformar los datos mediante la función 5 (X - 32) . lineal: Y 9 b) La transformación logarítmica: Esta consiste en someter a los datos originales a una función del tipo Y = log X , o del tipo Y = ln X . c) La transformación de potencias : Esta consiste en someter a los datos p originales a una función del tipo : Y = a X + b . (p 0) .

Preguntas de Revisión 1°) ¿Cual es la diferencia entre el valor real y el valor aparente de una medición?. 2°) Comente la veracidad o falsedad de la siguiente afirmación : “ A pesar de que las variables cuantitativas se clasifican en discretas y continuas , las observaciones provenientes de ellas siempre son discretas.” 3°) Explique el procedimiento para pasar de un conjunto de datos puntuales a una tabla agrupada de frecuencias . ¿ Es posible el proceso inverso ? . 4°)¿Cual es la diferencia entre una tabla discreta de frecuencias y una agrupada?.

Gráficos Estadísticos Angel F. Arvelo L

56

5°) ¿ Es posible obtener la tabla de frecuencias a partir de la tabla de frecuencias acumuladas ? . Explique el procedimiento. 6°)¿Qué ventaja presenta el diagrama de tallo hoja con relación al histograma ? . 7°) ¿ Qué comentarios haría Ud. sobre una distribución de frecuencias que arroje un polígono en forma de : a) U b) J c) ?. 8°) ¿ Qué comentarios haría Ud. sobre una distribución de frecuencias que arroje como polígono de frecuencias un trapecio isósceles: 9°) ¿ Porque la Ojiva correspondiente a una tabla discreta de frecuencias resulta en forma de escalera, y la correspondiente a una tabla agrupada, no ? . 10°) Comente la veracidad o falsedad de la siguiente afirmación : “ Si dos clases tienen igual frecuencia , pero la segunda tiene doble amplitud que la primera , entonces al construir el histograma , la primera debe tener doble altura que la segunda.” 11°) ¿ Por qué no es posible dibujar el histograma , cuando algunas clases han sido definidas como intervalos abiertos del tipo “mayor que” o “menor que” ? . 12°) ¿ Es posible construir la Ojiva a partir de un diagrama de tallo y hoja ? . Explique el procedimiento. ¿ Es posible el procedimiento inverso ? . 13°) Si unos datos estaban originalmente en “libras” , y Ud. decide convertirlos en “Kilogramos” . ¿ Qué tipo de transformación se ha efectuado sobre ellos ? . ¿ Se mantiene la razón entre ellos ? . 14°) ¿ Es lineal la conversión de frecuencias absolutas en relativas ? . ¿ Se mantiene la razón entre las frecuencias absolutas y las relativas de las clases ? . 15°) Si un conjunto de datos varía entre 20 y 90 . ¿ Conviene hacer una transformación logarítmica ? . Justifique . 16°) ¿ Cuales son las ventajas y desventajas de una escala logarítmica frente a una escala aritmética ? . ¿ En qué casos conviene utilizar una u otra ? . 17°) Explique cómo se construye una escala cuadrática . Temas complementarios para investigar 18°) Investigue acerca de las “ Curvas de Concentración de Lorenz” . ¿ Para qué se utilizan ? . ¿Cómo se construyen? . ¿ Qué representan? .¿ Qué representa el llamado “índice de Gini” ? .

57

Gráficos Estadísticos Angel F. Arvelo L

19°) ¿ Para qué se utiliza el papel semilogarítmico ? . ¿ Cómo se construye ? . 20°) ¿ Para qué se utiliza el papel logarítmico ? . ¿ Cómo se construye ? . Problemas Propuestos I. Nivel Elemental 1) En una encuesta entre hogares , se preguntó el número de aparatos de televisión existentes . Las respuestas fueron : 3 1 4 2 2 3 1 4 2 1 2 2 3 1 4 5 3 3 2 1 2 2 2 1 2 2 1 1 3 3 2 2 2 1 2 2 2 2 4 1 3 2 2 2 4 1 0 1 1 2 2 2 2 2 2 1 5 1 1 2 2 3 2 1 2 2 4 3 1 1 3 2 2 1 3 1 4 3 3 1 2 2 0 1 4 3 3 5 2 2 1 1 2 2 3 2 1 2 3 2 3 3 2 1 2 2 2 1 2 2 1 1 4 1 3 3 3 3 2 1 3 2 2 2 1 0 1 1 3 3 2 2 2 4 4 3 3 3 0 3 1 1 5 1 1 2 2 3 1 4 a) Construir la tabla de frecuencias absolutas y relativas . b) Construir la tabla de frecuencias acumuladas absolutas y relativas . c) Dibujar la gráfica de barras y la Ojiva . d) Dibujar una Ojiva “mayor o igual que” e interpretarla . 2) Construya un diagrama de tallo y hoja para los pesos del Ejercicio 5 de la Pag 41.

3 ) Considere la siguiente tabla de frecuencias porcentuales acumuladas: Límites Reales Hi %

49.5 - 99.5 12%

99.5-149.5 38%

149.5-199.5 199.5-249.5 249.5-299.5 299.5-349.5 349.5-399.5 45% 63% 80% 96% 100%

Si se sabe que la muestra está formada por 500 datos , obtenga la tabla de frecuencias absolutas , y dibuje el histograma . 4) Los siguientes datos representan las edades de un grupo de personas, expresadas por “años cumplidos” : 23 29 41 35 26 18 46 53 30 29 46 20 66 42 20 17 21 48 33 28 25 39 50 22 27 40 25 19 26 55 28 15 37 60 34 25 21 35 31 25 29 18 36 31 24 33 48 29 56 32 19 23 58 36 21 29 16 24 60 27 35 16 45 22 24 38 30 31 24 19 53 38 17 33 68 37 44 16 25 18 36 47 28 59 23 24 22 35 31 24 58 25 47 39 17 27 32 45 31 16 40 28 42 63 27 34 49 21 23 26 33 37 22 36 20 43 19 21 25 30 29 31 37 32 59 17 34 26 38 46 35 64 20 41 28 37 49 21 38 24 19 44 23 50 19 47 28 36 61 29 a) Agrupe convenientemente estos datos en una tabla de frecuencias.

58

Gráficos Estadísticos Angel F. Arvelo L

b) Construya el Polígono de frecuencias, la Ojiva , y un “diagrama de tallos y hojas” , con dos hojas para cada tallo . 5) Los siguientes datos representan el ingreso mensual en unidades monetarias de una muestra de 200 personas , seleccionadas al azar. 508

575

671

980

426

700

6.540

930

650

643

875

745

1.245

690

1.000

439

860

2.785

760

1.458 695 437 567 490 920 549 465 905 1.500 700

903 786 3.050 834 670 755 700 520 2.150 906 475 512 967 4.800 973 783 3.000 712

500 705 870 829 500 425 610 1.900 865 605 650 620 760 930 805 610 790 829

606 904 685 990 520 640 985 712 730 990 2.000 853 958 655 697 555 491 1.900

850 900 704 690 675 917 3.250 1.300 915 455 503 712 419 995 5.000 2.000 830 473

754 2.700 700 550 1.850 763 475 450 5.800 610 715 614 678 450 679 571 1.070 820

437 761 910 700 530 859 900 810 438 635 413 976 600 873 925 940 6.100 916

950 510 545 750 2.050 658 1.000 721 614 1.150 900 906 860 604 408 603 560 904

942 920 780 940 590 830 750 1.400 853 602 1.450 604 436 3.600 400 1.625 828 745

5.300 625 650 600 715 690 895 685 764 929 908 2.100’ 945 1.040 945 870 893 796

1.310

439 700 706 1.970 500 420

1.056

a)¿ Qué tipo de agrupamiento recomendaría Ud. para estos datos ? . Justifique. b) Elabore una tabla de frecuencia, según el criterio de agrupamiento sugerido por Ud. c) Dibuje un histograma , una ojiva y un polígono de frecuencias para la tabla construida por Ud. . 6) A continuación se da un diagrama de tallo y hoja, para el contenido en gramos de unas cajas de jabón detergente : Frecuencia 7.00 10.00 17.00 21.00 23.00 19.00 13.00 6.00 5.00 3.00 1.00

Tallo 49 49 50 50 51 51 52 52 53 53 54

Hoja * * * * * *

0001134 6888888899 00011112222234444 555677777788889999999 00011111233333334444444 5555666666677788899 0011111233344 567889 00012 589 3

a) Construya la tabla agrupada de frecuencias relativas y de frecuencias relativas porcentuales acumuladas. b) Dibuje el Polígono de Frecuencias y la Ojiva

59

Gráficos Estadísticos Angel F. Arvelo L

7) Los siguientes datos representan el ingreso mensual en unidades monetarias de una muestra de 200 personas, seleccionadas al azar. 508 575 671 980 426 700 643 875 745 1.245 690 1.000 1.458 903 500 606 850 754 695 786 705 904 900 2.700 437 3.050 870 685 704 700 567 834 829 990 690 550 490 670 500 520 675 1.850 920 755 425 640 917 763 549 700 610 985 3.250 475 465 520 1.900 712 1.300 450 905 2.150 865 730 915 5.800 1.500 906 605 990 455 610 700 475 650 2.000 503 715 1.310 512 620 853 712 614 439 987 760 958 410 670 700 4.800 930 655 995 450 706 973 805 697 5.000 679 1.970 783 610 555 2.000 571 500 3.000 790 491 830 1.070 420 712 829 1.900 473 820

6.540 930 650 1056 439 860 2.785 760 437 950 942 5.300 761 510 920 625 910 545 780 650 700 750 940 600 530 2.050 590 715 859 658 830 690 900 1000 750 895 810 721 1.400 685 438 614 853 753 635 1.150 602 929 413 900 1.450 908 976 906 604 2.100 600 860 436 945 873 604 3.600 1.040 925 408 400 945 940 603 1.630 870 6.100 560 828 893 916 904 745 795

a)¿ Qué tipo de agrupamiento recomendaría Ud. para estos datos ? . Justifique. b) Elabore una tabla de frecuencia , según el criterio de agrupamiento sugerido por Ud. c) Dibuje un histograma , una ojiva y un polígono de frecuencias para la tabla construida por Ud. 8) La siguiente tabla expresa la antigüedad, en años cumplidos, de los empleados de una organización bancaria: Antigüedad (años) Frecuencia 0-1 1200 1-3 1400 3-5 1000 5 -10 700 10 -15 500 15- 25 200 TOTAL 5000 ( Los intervalos se suponen cerrados en el extremo inferior y abiertos en el superior )

Construya el histograma , y la Ojiva . 9) Si al leer un histograma de frecuencias construido en escala logarítmíca , Ud. encuentra que una clase tiene doble altura que otra . ¿ Cual es la relación entre sus frecuencias reales ? . Respuesta : 10 : 1 10) Suponga que en un histograma de frecuencias construido con escala de raíz cuadrada, Ud. encuentra que la altura de la primera clase es una vez y

60

Gráficos Estadísticos Angel F. Arvelo L

media la altura de la segunda clase . ¿ Cual es la razón porcentual entre la frecuencia real de la segunda clase y la primera ? . Respuesta : 44.44 % II. Nivel Intermedio 11)Dada la siguiente Ojiva de frecuencias relativas porcentuales:

Obtenga la tabla de frecuencias relativas , y dibuje el polígono de frecuencias relativas. 12) Demuestre que el área bajo el polígono de frecuencias es igual a la suma de las áreas de los rectángulos del histograma . 13) Complete la siguiente tabla para datos agrupados con intervalos de igual amplitud: Límites Reales ? ? 19.5 - 24.5 ? ? TOTAL

Frecuencia ? ? ? ? ? ?

Frecuencia Acumulada ? ? 122 180 200

Respuesta : Frecuencias : 12 , 39 , 71 , 58 y

Frecuencia Relativa Porcentual ? ? ? ? ? 100.00 %

Frecuencia Relativa Porcentual Acumulada 6.00 % 25.50% ? ? ?

20 .

14) Suponga que en un histograma que considera cuatro clases construido con escala de raíz cuadrada, olvidaron colocar sobre el eje vertical la frecuencia de cada clase , y que Ud. para averiguarlas mide con un escalímetro la altura de los rectángulos que las representan .

61

Gráficos Estadísticos Angel F. Arvelo L

Si al medir las alturas , Ud. encuentra 3.40 , 5.00 , 7.80 y 1.70 centímetros . ¿Cual es la frecuencia relativa porcentual de cada una de las cuatro clases ?. Respuesta : 11.53% , 24.93 % , 60.66 % y 2.88 % respectivamente . 15) Complete la siguiente tabla de frecuencias , para intervalos de igual amplitud: Límites Reales

49.5 - 69.5 ? ? ? ? ? Total Respuesta : x = 50

Frecuencia

x ? 3x ? ? 11 400

Frecuencia Acumulada

Frecuencia Relativa Porcentual

? ? ? 357 ? ?

? ? ? ? ? ? 100.00 %

Frecuencia Relativa Porcentual Acumulada

? 32.50 % 70.00 % ? ? ?

16) Complete la siguiente tabla de frecuencias para intervalos de diferente amplitud, y dibuje el histograma : Límites Reales

Frecuencia

Densidad de Frecuencias

9.95- 12.5 12 ? ? 15 3.00 ? - 20.5 ? 7.00 20.5 - ? 32 8.00 ? - 29.5 ? 2.00 29.5 - ? ? 1.00 Total 100 Respuesta : Frecuencias : 21 , 10 y 10 Límites de clase : 12.5 a 17.5 , 17.5 a 20.5 , 20.5 a 24.5 , 24.5 a 29.5 y 29.5 a 39.5 III. Nivel Avanzado 17) En un histograma de frecuencias construido en escala logarítmica en base 10, y que considera cuatro clases , las alturas de los rectángulos que las representan son de 1.0000 cms , 1.7993 cms , 2.1614 cms y 2.7634 cms . Calcule la frecuencia relativa porcentual de cada una de las cuatro clases . Respuesta : 1.25 % , 7.89 % , 18.17 % y 72.69 % respectivamente 18) Demuestre que si un conjunto de valores está representado por respectivos segmentos en escala logarítmica de base cualquiera, al cambiar la base de los logaritmos, la longitud de estos segmentos queda multiplicada por una constante, y por lo tanto se mantiene la proporción entre ellos .

Gráficos Estadísticos Angel F. Arvelo L

62

19) Se define como densidad de frecuencias relativas para un intervalo a la densidad de frecuencias dividida entre el número total de datos , es decir : di fi ; donde: gi = Densidad de frecuencias relativas del intervalo. gi n n ci Demuestre que el área total bajo el polígono de densidad de frecuencias relativas es siempre igual a 1 , y que el área bajo este polígono para un intervalo cualquiera es siempre igual a la frecuencia relativa del intervalo. Nota del autor : Las curvas de probabilidad continuas son una aproximación al polígono de densidad de frecuencias relativas , y por esta propiedad , a ellas se les exige que el área bajo la curva sea igual a 1 ; y por esta misma razón la probabilidad de un intervalo que es una aproximación teórica a la frecuencia relativa, viene dada por el área bajo la curva en el intervalo .

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.