Story Transcript
4. REPRESENTACIONES GRÁFICAS PARA DATOS CATEGÓRICOS. Cuando se manejan fenómenos categóricos, se pueden agrupar las observaciones en tablas de resumen, para después representarlas en forma gráfica como diagramas de barras, diagramas de pastel o circulares o diagramas de pareto. 4.1 Diagramas de barras. Representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades. Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas. Ejemplo 15.En un colegio se califica con la siguiente escala: E: excelente, S: sobresaliente, A: aceptable, I: insuficiente, D: deficiente, las notas definitivas de Biología del grado séptimo son las siguientes: 5 estudiantes obtuvieron E, 8 obtuvieron S, 15 obtuvieron A, 6 obtuvieron I y 2 obtuvieron D. Construya una tabla de resumen donde muestre la frecuencia Absoluta, la frecuencia Relativa, además construya el grafico de barras correspondiente. Solución. Primero aclaremos los términos frecuencia absoluta, frecuencia relativa. •
•
Frecuencia Absoluta. Se refiere al número de casos que se encuentra en cada categoría, por ejemplo en la categoría sobresaliente S hay 8 estudiantes. La frecuencia absoluta la podemos representar con fi. Frecuencia Relativa. Esta se obtiene de dividir el total de casos de la cada categoría entre el total de casos en el grupo. La frecuencia relativa la podemos representar con hi, y la podemos calcular así: hi =
fi ; donde n es el total de casos. n
Una vez aclarados estos términos proseguiremos a construir la tabla 4 de resumen Tabla 4 de frecuencia absolutas y relativas. Calificación Frecuencia Frecuencia absoluta fi relativa hi E 5 0,139 S 8 0,222 A 15 0,417 I 6 0,167 D 2 0,056 TOTAL 36 1
% 13,9 22,2 41,7 16,7 5,6 100,0
Observe que el primer hi se calcula mediante el siguiente procedimiento h1 = 5/36 ≈ 0,139 al multiplicar por 100 lo podemos expresar en porcentaje y nos da aproximadamente 13,9%. El procedimiento se repite para cada clase o categoría. Para elaborar el grafico de barras en el eje horizontal escribimos las modalidades E, S, A, I, D y sobre el eje vertical las frecuencias absolutas. Cada barra debe tener el mismo grosor y la misma separación entre barras, veamos la grafica 1.
20
4.2 Gráfico de barras con Excel. Siga estos pasos para elaborar la tabla de resumen y el gráfico..
• • • •
• •
Ubíquese en la celda B2, luego B3 hasta la celda B5 y escriba en cada una los respectivos rótulos, observe la tabla 4. Escriba las calificaciones y las frecuencias absolutas en las columnas correspondientes. Ubíquese en la celda B8 y escriba la instrucción =SUMA(C3:C7), también lo puede hacer con las funciones de Excel. Luego vaya a la celda D3, que esta en la columna de las frecuencias relativas y efectúe la siguiente operación =C3/36 que corresponde a la frecuencia relativa h1, esto da un valor aproximado de 0,139. Una vez efectuada la operación arrastre el Mouse desde la celda D3 hasta la D7. Para calcular el porcentaje sitúe el Mouse en la celda E3 y efectúe la siguiente operación =D3*100, después de realizada la operación arrastre el Mouse desde E3 hasta E7.
Grafico 1. Grafico de barras que representa las calificaciones de biología grado séptimo.
Para construir el grafico 1 con ayuda de Excel efectúe los siguientes pasos:
•
Ya teniendo elaborado el cuadro de resumen en Excel, señale las columnas Calificación y Frecuencia absoluta.
• •
Busque el comando de asistente para gráficos y de clic sobre este. Aquí nos muestra una ventana de dialogo, de clic donde dice presione para ver muestra y luego de clic en el botón Siguiente. Ahora estamos en el paso 2 de 4, de clic en el botón siguiente. Cuando ya este en el paso 3 de 4, quite las líneas de división principales dando clic en el cuadro respectivo. Busque la pestaña Rótulos de datos y de clic en el cuadro valor. Luego de clic en la pestaña títulos y de el nombre de Calificación al eje X De clic en el botón finalizar.
• • • • •
4.3 Gráfico Circular. (También llamados de torta). Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa.
21
Ejemplo 16. Una caja contiene bolas de colores distribuidas así: 75 azules, 38 verdes, 54 amarillas y 40 rojas. Con base en esta información construya una tabla de resumen y la grafica circular correspondiente. Solución. Podemos construir la tabla de resumen tabla 5, en esta debe aparecer el nombre de la variable luego la frecuencia absoluta fi, en otra columna la frecuencia relativa hi, y el porcentaje. Tabla 5 de Frecuencias Absolutas y Relativas. Color Azules Verdes Amarillas Rojas
fi 75 38 54 40 207
hi 0,362 0,184 0,261 0,193 1
% 36,2 18,4 26,1 19,3 100
Grados 130,4 66,1 93,9 69,6
Recuerde que para calcular, h1 = 75/207 y así sucesivamente, la columnas grados cuyos datos aparecen en azul son opcionales estos los necesitamos para dibujar la grafica circular, 130,4 se obtiene con la siguiente operación: hi*360, es decir: h1*360 ≈ 130,4 (los cálculos fueron realizados con Excel utilizando más decimales) observe la gráfica 2. Gráfica 2 porcentaje de bolas clasificadas por colores.
Porcentaje de bolas por color
Rojas 19,3%
Amarillas 26,1%
Azules 36,2%
Verdes 18,4%
Para construir el grafico 2 con ayuda de Excel efectúe los siguientes pasos:
•
Señale las columnas Color y fi, frecuencia absoluta.
• •
Busque el comando de asistente para gráficos y de clic sobre este. Aquí nos muestra una ventana de dialogo, busque en el tipo de gráfico: Circular. Aquí puede presionar para ver la muestra o de clic en Siguiente. De otra vez clic en siguiente. Cuando aparezca la pestaña de Títulos. Escriba en el título de grafico: Porcentaje de bolas por color. Luego de clic en rótulos de Datos: aquí señale Nombre de la categoría y Porcentaje. Clic en Finalizar.
• • • •
22
Nota: En los gráficos circulares no se indica el valor de los grados sino del porcentaje. 4.4 Ejercicios. 1º Para el ejemplo 15 construya el gráfico circular, dibújelo a mano y en Excel. 2º Para el ejemplo 16 construya el grafico de barras, dibújelo a mano y en Excel. 3º Una heladería vende cremas de diferentes sabores, la cantidad semanal se muestra en la siguiente tabla 6. Tabla 6 de resumen venta de helados semanales. Sabor Fresa Limón Ron pasas Chocolate Vainilla
Cantidad 85 52 95 100 70
Complete la tabla 6 de resumen y dibuje los gráficos de barras y circular, a mano y en Excel. 4.5 OBTENCIÓN DE MEDIDAS DESCRIPTIVAS DE RESUMEN A PARTIR DE UNA POBLACIÓN. Hasta el momento hemos analizado varios estadísticos que resumen o describen información numérica a través de una muestra. En particular, estos estadísticos se utilizaron para describir las propiedades de tendencia central, variación y forma. Sin embargo si el conjunto de datos al que se tiene acceso no es una muestra sino una colección de medidas numéricas de toda una población, se calculan los parámetros de la población para la media aritmética, la varianza y la desviación estándar de la siguiente manera: N
∑ Xi Media de la Población
µ=
i=1
N
, donde N es el tamaño de la población.
N
Varianza de la Población
σ2 =
∑ (Xi − µ)2 i=1
N N
∑ (Xi − µ) 2 Desviación estándar de la población σ =
i=1
N
23
Coeficiente de variación CV =
σ µ
Uso de la desviación estándar, regla empírica. Esta establece que para la mayoría de los conjuntos de datos, aproximadamente cada dos de tres observaciones (esto es, 68,27%) se encuentran dentro de una distancia de una desviación estándar alrededor de la media, y entre 90 y 95% de observaciones se encuentran dentro de una distancia de 2 desviaciones estándar alrededor de la media, y el 99,73% de las observaciones se encuentran aproximadamente dentro de una distancia de 3 desviaciones estándar alrededor de la media. Hay que tener en cuenta que lo anterior sucede cuando el conjunto de datos esta normalmente distribuidos. Gráfica 3 curva de Gauss para la distribución.
Para el ejercicio 3.8 en el tercer problema del fabricante de pilas para linterna ¿qué proporción de pilas está dentro de ± 1 desviación estándar de la media?
24