Story Transcript
Unidad seis
Matemática
Estadística descriptiva
Presentación
L
as Estadísticas son tan antiguas como las sociedades humanas. Cuenta el historiador Herodoto (siglo 5, A.C.) que él pudo verificar junto a los sacerdotes egipcios, la existencia de datos estadísticos, referentes al pueblo egipcio que se remontaban hasta una antigüedad de 10,000 años. Durante el apogeo del Imperio Romano se elegía dos censores, para un período de cinco años. Las atribuciones de éstos, según Marco Tulio Cicerón (siglo 1, A.C.), eran las siguientes: “Que cuenten el pueblo según la edad, número de hijos, de esclavos y rentas; que velen por la conservación de los templos, los caminos, las aguas, el tesoro, los impuestos; que distribuyan las diferentes partes del pueblo en tribus; que las repartan por caudales, edades y órdenes”. Para poder cumplir con todas las atribuciones asignadas, los censores debían organizar y llevar a cabo una recopilación general de información, llamada censo, a todo lo largo y ancho del Imperio. Como consecuencia de uno de estos censos el nacimiento de Jesucristo ocurrió en Belén; porque José y María habían ido a dicha ciudad para ser censados en tiempos del emperador Augusto César.
MATEMÁTICA • UNIDAD SEIS
71
En el mundo moderno y especialmente en los países llamados desarrollados, las estadísticas demográficas y económicas, juegan un papel fundamental para llevar adelante, de manera exitosa, los planes de desarrollo social. Queda claro que actualmente la información recopilada es enorme y se hace necesaio sintetizarla para poder interpretarla más fácilmente. Este es precisamente el propósito de la disciplina matemática que se conoce con el nombre de Estadística Descriptiva, la cual se encarga de resumir y describir un conjunto de datos estadísticos. ■
72
MATEMÁTICA • PRIMERO DE BACHILLERATO
Objetivos
Al finalizar esta unidad tu deberás ser capaz de: Uno. Explicar el objeto de estudio de la Estadística
Descriptiva y el de la Estadística Inferencial. Dos. Organizar datos en bruto, por medio de un cuadro
de distribución de frecuencias absolutas y relativas. Tres. Graficar adecuadamente información estadística. Cuatro. Analizar e interpretar la información
presentada por medio de gráficos. Cinco. Explicar la utilidad o importancia de las medidas de
tendencia central y de dispersión en el análisis estadístico. Seis. Determinar la media aritmética de un conjunto de datos. Siete. Calcular la varianza y la desviación típica para
datos no agrupados.
MATEMÁTICA • UNIDAD SEIS
73
Contenidos
1. Conceptos básicos 2. Organización y presentación de la información a) Variables cualitativas y cuantitativas (discretas) • Gráfico de barras • Gráfico circular o de sectores • Gráfico lineal • Pictogramas b) Variabes continuas • Tabla de distribución de frecuencias • Histograma 3. Media aritmética a) Propiedades 4. Medidas de dispersión a) Varianza b) Desviación Típica
74
MATEMÁTICA • PRIMERO DE BACHILLERATO
1. Conceptos básicos
Estadística inferencial Es la rama de la Estadística que a partir de una muestra obtiene conclusiones que son válidas para toda la población.
Población En los estudios estadísticos una población está constituida por todas las observaciones posibles en las cuales se está interesado. Por ejemplo si se desea conocer las razones por las que las personas se abstienen de votar, entonces la población estará constituida por todos los salvadoreños adultos aptos para emitir el voto. Cuando un empresario desea instalar una venta de repuestos para automotores y lleva adelante una investigación de mercado, para poder tener una mejor idea acerca de los repuestos que debe adquirir, entonces la población está constituida por todos los vehículos automotores que circulan en el país. Para poder estudiar la gravedad de los niveles de contaminación de nuestros recursos hídricos, la población a considerar está constituida por todos los ríos, lagos y lagunas que existen en nuestro territorio. Es claro que si se está interesado en conocer las razones por las que las personas se abstienen de votar, lo ideal sería pregúntarselo a todos los salvadoreños adultos; pero como eso es practicamente imposible se le pregunta solamente a una parte de la población.
MATEMÁTICA • UNIDAD SEIS
75
Muestra Se llama muestra a una parte de una población. Siendo que las conclusiones estadísticas que se refieren a una población se obtienen a partir de una muestra, es de la mayor importancia conocer las técnicas adecuadas para poder obtener muestras representativas de toda la población, es decir que en la medida de los posible conduzcan a conclusiones válidas, de tal manera que se minimice la posibilidad de error.
Parámetro estadístico Los datos que caracterizan a toda la población se llaman parámetros. Los datos que caracterizan a una muestra se llaman Estadígrafos o Estadísticos. Por ejemplo, el porcentaje a nivel nacional de abstencionismo en unas elecciones es un parámetro, mientras que el porcentaje de abstencionismo entre las personas que viven en tú vecindario es un Estadígrafo. Cuando se hace una recopilación de información ésta puede estar constituida por dos clases de datos. Cualitativos y Cuantitativos.
Datos cualitativos Son los que se refieren a cualidades como color, raza, religión, sexo, etc.
Datos cuantitativos Son los que se refieren a cantidades y que por lo tanto pueden ser, designadas por variables numéricas tales como: estatura, número de hijos por familia, sueldo mensual, etc. Las variables numéricas pueden ser discretas o continuas. Son discretas las que asumen únicamente valores aislados, como por ejemplo el número de hijos por familia. Son continuas las que pueden tomar cualquier valor de un intervalo, por ejemplo la estatura de una persona.
76
MATEMÁTICA • PRIMERO DE BACHILLERATO
2. Organización y presentación de la información
Como la información estadística generalmente consta de un gran número de observaciones y mientras mayor es su número más difícil resulta su lectura e interpretación, se hace necesario presentar los datos en forma resumida por medio de un cuadro o tabla estadística llamada Tabla de Distribución de Frecuencias.
Definición. Se llama frecuencia al número de veces que
aparece repetido un determinado valor de la variable. La frecuencia se acostumbra representarla por la letra f.
Ejemplo 1 Se preguntó a 20 personas por su color favorito y las respuestas que se obtuvieron fueron las siguientes: Azul, negro, azul, negro, café, rosado, rojo, anaranjado, verde, café, blanco, anaranjado, verde, azul, negro, café, negro, rojo, azul y morado. Al presentar esta información por medio de una tabla de distribución de frecuencias, los datos que aparecen con mayor frecuencia se colocan preferiblemente en la parte superior de la tabla; mientras que los datos que aparecen con menor frecuencia ocupan la parte inferior. Esta es una tabla de distribución de frecuencias en que la variable color es cualitativa.
Color preferido
Frecuencia
Azul Negro Café Anaranjado Rojo Verde Blanco Morado Rosado
4 4 3 2 2 2 1 1 1
Total
20
Los datos que se resumen por medio de una tabla de distribución de frecuencias pueden ser presentados haciendo uso de gráficas.
MATEMÁTICA • UNIDAD SEIS
77
a) Variables cualitativas y cuantitativas discretas Uno de los gráficos más sencillos es el llamado Gráfico de Barras, el cual estudiaremos a continuación.
❚ Gráfico de barras
Se utiliza para representar tanto datos cualitativos como cuantitativos; pero referidos a variables discretas.
El gráfico de barras consiste en barras de igual ancho, cuya longitud es proporcional a la frecuencia con que aparecen los datos.
Ejemplo 2 Se preguntó a 25 personas, que laboran en un supermercado capitalino, por la zona geográfica del país de la cual son originarios y las respuestas que se obtuvieron fueron las siguientes: Central, central, oriental, occidental, central, oriental, occidental, occidental, occidental, occidental, central, central, central, central, central, occidental, central, occidental, occidental, central, oriental, occidental, oriental, central, oriental. Presentar esta información por medio de un gráfico de barras.
Solución: La tabla de Distribución de frecuencias correspondiente a estos datos es:
Zona de origen
78
Frecuencia
Central Occidental Oriental
11 9 5
Total
20
MATEMÁTICA • PRIMERO DE BACHILLERATO
11 10
El gráfico de barras correspondiente a esta tabla de distribución de frecuencias queda de la manera siguiente:
9 8 7 6 5 4 3 2 1 0
Central
Occidental
Oriental
Zona geográfica
❚ Gráfico circular o de sectores Este gráfico se conoce también con el nombre de gráfico de pastel y sirve para representar datos cualitativos.
El gráfico circular consiste en un círculo de radio arbitrario que se divide en sectores proporcionales a la frecuencia de los datos.
Para un gráfico circular se debe tener presente que:
El ángulo central que le corresponde a un círculo es de 360 grados.
MATEMÁTICA • UNIDAD SEIS
79
Ejemplo 3: Se preguntó a 40 personas adultas sí votarán en las próximas elecciones presidenciales. Las respuestas obtenidas se muestran en el cuadro.
Respuesta
Nº de pers.
Sí
16
No
24
Total
40
Representar los datos por medio de un gráfico circular. Solución:
A las 40 personas le corresponden los 360 grados de todo el círculo. A una persona le corresponden
360 = 9 grados 40
Además, las 40 personas representan el 100% del total de entrevistados. Una persona representa 100 = 2.5% del total 40
La tabla de Distribución de frecuencias se amplía de la manera siguiente: ¿Votará?
80
Nº de personas
Grados del círculo
Porcentaje
Sí
16
(16 x 9) = 144
(16 x 2.5%) = 40%
No
24
(24 x 9) = 216
(24 x 2.5%) = 60%
Total
40
360
100%
MATEMÁTICA • PRIMERO DE BACHILLERATO
Al medir con un transportador. El gráfico, con su respectivo porcentaje, es el siguiente:
Es recomendable que los sectores se grafiquen de mayor a menor y siguiendo la dirección contraria a las agujas del reloj, empezando por el radio horizontal.
❚ Ejemplo 4
Representar por medio de un gráfico circular los datos del cuadro siguiente: SUPERFICIE DE EL SALVADOR SEGÚN ZONA Zona Occidental Central Oriental Total
Superficie Kms2 4,487 8,824 7,729 21,040
Solución: Al área total de 21,040 Km2 le corresponden los 360 grados de todo el círculo. A 1 Km2 le corresponden
360 grados 21,040
Por lo tanto: A 4,487 Kms2 de la zona occidental le corresponden:
4,487(360) = 77º 21,040
A 8,824 Kms2 de la zona central le corresponden:
8,824(360) = 151º 21,040
A 7,729 Kms2 de la zona oriental le corresponden:
7,729(360) = 132º 21,040
TOTAL:
MATEMÁTICA • UNIDAD SEIS
360º
81
Al asignar los grados, haciendo uso de un transportador, se tiene el gráfico siguiente: Cada sector se ha rotulado con su nombre y se le ha colocado el porcentaje respectivo.
Zona central central Zona 41.94% 41.94%
Zona oriental Zona oriental 37.73% 36.73%
ZonaZona occidental 21.33% occidental 21.33%
El porcentaje territorial correspondiente a cada zona se obtiene de igual forma en que se obtienen los grados respectivos.
A 21,040 le corresponde 100% 100% 21,040
A 1 Km2 le corresponde:
100% = 21.33% 21,040
A 4,487 Kms2 le corresponde:
4,487x
A 8,824 Km2 s le corresponde:
8,824x 100% = 41.94% 21,040
A 7,729 Kms2 le corresponde:
7,729x 100% = 36.73% 21,040
TOTAL = 100%
Las aproximaciones deben hacerce de tal manera que siempre la suma total de los porcentajes dé el 100%. Podemos observar que a la hora de hacer el gráfico no se respeta el orden en que los datos aparecen en la tabla, sino que estos se dibujan siguiendo la dirección contraria a las agujas del reloj y en orden de mayor a menor.
82
MATEMÁTICA • PRIMERO DE BACHILLERATO
Ejercicios Nº 1
1. En el presupuesto general de la nación para el año de 1993 se asignaron las mayores cantidades a las cinco dependencias que se detallan en el cuadro. Presentar la información por medio de un gráfico de barras verticales.
MAYORES ASIGNACIONES EN EL PRESUPUESTO GENERAL DE LA NACIÓN 1993 Dependencia Defensa Educación Obras públicas Policía Salud
Millones asignados 866 1,106 988 256 730
2. La siguiente tabla muestra el número de manzanas que fueron sembradas de algodón, en El Salvador, durante distintos años. Representar los datos por medio de un gráfico de barras verticales.
Año 1981 1983 1985 1987 1989
Superficie sembrada (Miles de manzanas)
101 83 63 24 21
MATEMÁTICA • UNIDAD SEIS
83
3. Se preguntó a 36 jóvenes por su deporte favorito, las respuestas obtenidas se dan en el cuadro. Presentar los datos por medio de un gráfico circular.
Deporte preferido
Nº de personas
Fútbol Baloncesto Ciclismo Total
18 12 6 36
• A las 36 personas les corresponden 360 grados, luego a una persona le corresponde = = grados. • Las 36 personas representan el 100%, una persona representa Llenemos el cuadro ampliado Deporte favorito
Número de personas
Fútbol Baloncesto Ciclismo
18 12 6
Total
36
El gráfico es el siguiente ¡complétalo!
Fútbol %
Ciclismo % Baloncesto %
84
MATEMÁTICA • PRIMERO DE BACHILLERATO
Grados
360
Porcentaje
100%
%
4. El siguiente cuadro dá las exportaciones de café que efectuó El Salvador durante 1988. Presenta los datos por medio de un gráfico circular o de sectores. EXPORTACIONES DE CAFE POR PAIS DE DESTINO. 1988 País E.E.U.U. Alemania Japón Otros TOTAL:
Quintales exportados 532,766 284,904 118,054 88,876 11024,600
Autoevaluación Nº 1
I) Escribe en el espacio correspondiente si se trata de un dato cualitativo o cuantitativo. 1) Clase de ocupación: 2) Votos anulados en las últimas elecciones: II) Escribe en el espacio correspondiente si se trata de una variable discreta o continua 3) Cantidad de matrimonios efectuados el año pasado 4) Tiempo empleado en resolver un examen
MATEMÁTICA • UNIDAD SEIS
85
III) Se preguntó a 30 mujeres adultas por su estado civil y las respuestas obtenidas se presentan a continuación: casada, acompañada, casada, casada, divorciada, soltera, acompañada, casada, viuda, casada, acompañada, casada, divorciada, acompañada, acompañada, casada, casada, casada, divorciada, soltera, soltera, soltera, viuda, divorciada, casada, casada, soltera, casada, soltera y casada. Presenta estos datos por medio de una tabla de Distribución de frecuencias y luego construye el gráfico de barras correspondiente.
IV) Se preguntó a 144 estudiantes por su materia de estudio preferida. Las respuestas obtenidas se dan en el cuadro.
Materia preferida Naturales Sociales Matemática Lenguaje Total
Número de estudiantes 72 36 24 12 144
Construir un gráfico circular, para presentar estos datos.
86
MATEMÁTICA • PRIMERO DE BACHILLERATO
❚ Gráfico lineal El Gráfico Lineal se utiliza para representar cuadros estadísticos en los que la variable corresponde a períodos de tiempo, principalmente años. Por medio de este gráfico se establecen comparaciones entre distintos años, observándose claramente las alzas y bajas. El gráfico lineal se construye de la manera siguiente:
1. Sobre el eje horizontal, el cual es la base de un rectángulo, se marcan los años o meses. 2. El primer año o mes se coloca en el origen de coordenadas. 3. Sobre el eje vertical, el cual es la altura de un rectángulo, se marcan las frecuencias. 4. Se cuadricula el rectángulo. 5. Para cada año y su respectiva frecuencia se grafica un punto. 6. Se unen todos los puntos por medio de una línea continua.
Ejemplo 1: A continuación se dá el Producto Interno Bruto del pueblo salvadoreño desde 1993 hasta 1997. Representaremos los datos por medio de un gráfico lineal. Año
PIB colones
1993 1994 1995 1996 1997
8,000 8,300 8,700 8,700 8,800
Colones
10,000
10.000
9,000 9.000 8,000 8.000 7,000 7.000 6,000 6.000 5,000 5.000 4,000 4.000 3,000 3.000 2,000 2.000 1,000 1.000
El gráfico queda de la manera siguiente: 1993 1993
1994 1994
1995 1995
1996 1996
1997 1997
MATEMÁTICA • UNIDAD SEIS
Años
87
❚ Pictogramas Los pictogramas son representaciones de datos estadísticos por medio de dibujitos que indican claramente la naturaleza de la información. Para representar datos estadísticos por medio de Pictogramas debe poseerse creatividad o ingenio en la técnica del dibujo, puesto que se busca atraer la atención del público en general y que éste pueda captar la información, aunque no posea mayores conocimientos estadísticos. Al construir un Pictograma deberá tenerse presente que todas las figuras que aparezcan deberán ser del mismo tamaño y en el encabezado indicarse claramente a cuántas unidades equivale cada figurita.
Ejemplo 2 : Las exportaciones de frutas que ha efectuado El Salvador desde 1985 hasta 1988 se dan a continuación. Presentar los datos del cuadro por medio de un pictograma.
Año
Millones de colones
1985
11188,300
1986
61000,800
1987
81210,500
1988
41977,200
Solución: Exportación de frutas
88
= ¢ 11000,000.00
1985
1.188 millones
1986
6 millones
1987
8.21 millones
1988
4.977 millones
MATEMÁTICA • PRIMERO DE BACHILLERATO
Como podemos ver claramente, por el ejemplo anterior, los pictogramas son aproximaciones gruesas y no son parte de un análisis estadístico serio, si no que, como dijimos anteriormente, el propósito de un pictograma solamente es el llamar la atención y, transmitir una información rápida al gran público.
Ejercicios Nº 2
1.
La siguiente tabla muestra el número de divorcios que se efectuaron desde 1982 hasta 1986. Presentar la información por medio de un gráfico de líneas. DIVORCIOS REALIZADOS 1982 - 1986
Año 1982 1983 1984 1985 1986
2.
Número de divorcios 1,700 1,700 1,500 1,900 2,000
A continuación aparecen las cantidades de personas que procedentes de Estados Unidos, visitaron El Salvador en calidad de turistas desde 1985 hasta 1989. Presentar los datos por medio de un gráfico de líneas. INGRESO DE TURISTAS, PROCEDENTES DE E.E.U.U. 1985 -1989
Año 1985 1986 1987 1988 1989
Miles de turistas 22.5 25.6 28.3 37.9 32.5
MATEMÁTICA • UNIDAD SEIS
89
3. La siguiente tabla muestra la producción de azúcar blanca desde 1987 hasta 1989. Presentar los datos por medio de un pictograma. PRODUCCION DE AZÚCAR BLANCA. 1987 - 1989
Año 1987 1988 1989
90
MATEMÁTICA • PRIMERO DE BACHILLERATO
Millones de quintales 2.9 2.6 3.5
Autoevaluación nº 2
1. El cuadro proporciona la población del área metropolitana de San Salvador, en períodos de 10 años, desde 1950 hasta 1990. Representa los datos por medio de un gráfico de líneas.
Año
Población (millones)
1950 1960 1970 1980 1990
0.20 0.35 0.57 0.87 1.25
2. El cuadro indica las cantidades de queso que se importaron de los principales países proveedores durante el año de 1988. Presenta los datos por medio de un pictograma.
País Guatemala Dinamarca Nueva Zelandia
Kilogramos queso 50,000 150,000 175,000
MATEMÁTICA • UNIDAD SEIS
91
b) Variables continuas ❚ Tabla de distribución de frecuencias Hemos dicho anteriormente que un cuadro o tabla estadística, que contiene la información resumida, se llama Tabla de Distribución de Frecuencias. Cuando se desea resumir un número grande de datos de variable continua, para presentarlos por medio de una Tabla de Distribución de Frecuencias, se agrupan los diversos valores en un número reducido de clases, llamados intervalos de clase. Para agrupar un conjunto de datos, haciendo uso de intervalos de clase, se sigue el procedimiento siguiente:
1. Primero debe decidirse cuántos intervalos se considerarán. 2. Se encuentran el recorrido, el cual es igual a la mayor de las observaciones menos la menor de las observaciones. 3. Se divide el recorrido entre el número de intervalos de clase que se desean y este resultado es la amplitud o ancho de cada intervalo. 4. Se forman los intervalos, agregando el ancho al límite inferior de cada clase, principiando por el menor de todos los datos. 5. Se determinan, de entre todas las observaciones, aquellas que pertenecen a cada clase o intervalo.
Ejemplo 1 Las siguientes son las estaturas, en centímetros, de 44 aspirantes a ingresar a la Universidad. 167, 156, 154, 159, 162, 156, 160, 166, 162, 165, 162, 158, 169, 159, 162, 173, 156, 165, 158, 165, 174, 155, 157, 164, 185, 158, 168, 163, 173, 178, 162, 173, 159, 158, 170, 159, 175, 167, 163, 155, 161, 162, 160, 167. Resumir los datos anteriores por medio de una tabla de Distribución de Frecuencias que conste de cinco intervalos de clase.
92
MATEMÁTICA • PRIMERO DE BACHILLERATO
Solución: Como la altura máxima es 185 cms. y la mínima 154 cms. se tiene lo siguiente: 2. Recorrido: 185 cms. - 154 cms. = 31 cms. 3. Ancho del intervalo de clase:
Recorrido = 31 cms. = 6.2 Nº de intervalos 5
4. Como el valor más pequeño es 154 cms., éste es el límite inferior del primer intervalo. Al sumarle a este valor, el ancho 6.2 se obtiene 160.2, que es el límite superior del primer intervalo. De acuerdo con esto, el primer intervalo va desde 154 cms. hasta 160.2 cms. Esto lo podemos denotar de la manera siguiente:
Límite inferior
154
160.2
↑
↑
Límite superior
Ahora sumamos a 160.2 el valor del ancho 6.2, obteniendo así el segundo intervalo, que va de 160.2 cms. hasta 166.4 cms. Se tienen, en este momento, los dos intervalos siguentes: 154
160.2
160.2
166.4 INTERVALOS
Al sumar a 166.4 el valor 6.2, del ancho, se tiene el tercer intervalo 166.4 172.6. De manera similar se encuentran los restantes intervalos, para obtener finalmente lo siguiente:
154.0 160.2 166.4 172.6 178.8
160.2 166.4 172.6 178.8 185.0
MATEMÁTICA • UNIDAD SEIS
93
Podemos observar que el límite superior de un intervalo, aparece también como límite inferior del intervalo siguiente y como cada valor debe aparecer solamente en un intervalo, podemos perfectamente utilizar una notación como la siguiente:
INTERVALOS 154 • 160.2 • 166.4 • 172.6 • 178.8 •
160.2 166.4 172.6 178.8 • 185
Con ésta notación queremos indicar que para los primeros cuatro intervalos, el límite superior de cada uno de ellos, no está incluido, pero sí el límite inferior. Mientras que en el último intervalo están incluidos los dos límites, tanto el inferior, que es 178.8, como el superior 185. También podríamos utilizar la notación siguiente: INTERVALOS 154 • 160.2 166.4 172.6 178.8
• • • • •
160.2 166.4 172.6 178.8 185
En este caso queremos indicar que el primer intervalos incluye los dos límites, tanto el inferior como el superior; pero los últimos cuatro intervalos solamente incluyen el límite superior y no así el límite inferior. Estas dos notaciones son opcionales y la persona que elabore la tabla puede perfectamente utilizar cualquier otra notación, siempre y cuando quede claramente establecido, cuáles valores incluye el intervalo respectivo y cuáles no.
94
MATEMÁTICA • PRIMERO DE BACHILLERATO
Ilustración:
Extremo inferior incluido • •
Extremo inferior incluido •
Extremo superior incluido
• Extremo superior incluido
Al construir los intervalos debe tenerse presente que el límite inferior del primer intervalo corresponde al menor de todos los datos y el límite superior del último intervalo corresponde al mayor de todos los datos. Y que estos dos valores, tanto el menor como el mayor deberán ser siempre incluidos. 5. Finalmente para construir la tabla contamos el número de datos que caen en cada intervalo, y este número lo anotamos en la columna correspondiente a las frecuencias, teniéndose así los siguiente:
INTERVALOS 154 • 160.2 • 166.4 • 172.6 • 178.8 • TOTAL
160.2 166.4 172.6 178.8 • 185
FRECUENCIA 17 14 6 6 1 44
Como la información, contenida en la tabla, debe ser clara, lo más conveniente es ponerle título y encabezados que indiquen de manera inequívoca de qué trata el cuadro. Es decir que una mejor manera de expresar el cuadro anterior, es el siguiente:
MATEMÁTICA • UNIDAD SEIS
95
ESTATURAS DE 44 ASPIRANTES A LA UNIVERSIDAD INTERVALOS 154 • 160.2 • 166.4 • 172.6 • 178.8 •
160.2 166.4 172.6 178.8 • 185
TOTAL
FRECUENCIA 17 14 6 6 1 44
La tabla de Distribución de Frecuencias anterior puede ser ampliada con una tercer columna, en donde se indiquen los porcentajes de alumnos que están comprendidos entre las distintas estaturas. Esta columna se encabeza con el nombre de frecuencia relativa.
Definición: Frecuencia relativa es el porcentaje de
observaciones que corresponde a cada intervalo.
La frecuencia relativa, que se designa por fr, se obtiene dividiendo la frecuencia f entre el tamaño n de la muestra y multiplicando luego por 100%.
En otras palabras
fr= nf 100%
Ejemplo 2 : Cincuenta estudiantes se sometieron a un examen de Estadística I, obteniendo las calificaciones siguientes:
5.2, 4.2, 5.7, 8.8, 4.7, 4.2, 6.2, 4.0, 5.3, 6.5, 7.8, 5.5, 5.8, 7.8, 6.3, 6.8, 4.0, 7.0, 6.8, 6.0, 6.5, 9.0, 7.3, 5.3, 4.5, 8.2, 4.3, 4.0, 6.0, 3.0, 5.3, 5.2, 5.0, 2.0, 4.2, 4.5, 2.2, 5.3, 4.5, 4.7, 2.5, 10.0, 4.2, 8.0, 7.3, 7.5, 5.5, 5.5, 6.5, 6.8.
96
MATEMÁTICA • PRIMERO DE BACHILLERATO
Resumir ésta información por medio de una tabla de distribución de frecuencias, que esté formada por cinco intervalos, de tal manera que el límite inferior de cada uno de ellos esté incluido. Agregar a la tabla no solamente las frecuencias, si no que tambien las frecuencias relativas.
Solución: Ancho de cada intervalo=
Recorrido = 10.0 - 2.0 = 1.6 No. de intervalos 5
De acuerdo con este ancho, la información total correspondiente al primer intervalo es la siguiente:
Primer intervalo 3.6
2.0
Frecuencia
Frecuencia relativa
4
4 x 100% = 8% 50
Segundo intervalo 5.2
3.6
14 50
14
x 100%= 28%
De la misma manera se forman los siguientes tres intervalos. La tabla de distribución de frecuencias, queda entonces, así:
CALIFICACIONES DE 50 ESTUDIANTES. ESTADISTICA I CALIFICACIONES
2.0 • 3.6 • 5.2 • 6.8 • 8.4 •
3.6 5.2 6.8 8.4 • 10.0 TOTAL
f NO. DE ALUMNOS
4 14 18 11 3 50
fr PORCENTAJE
8% 28% 36% 22% 6% 100%
MATEMÁTICA • UNIDAD SEIS
97
➠
NOTA:
El total correspondiente a las frecuencias debe ser igual al número de datos, que en este caso son cincuenta; mientras que el total correspondiente a las frecuencias relativas debe ser siempre igual al 100%. Cuando se agrupe un conjunto de datos haciendo uso de intervalos de clase deberá tenerse presente el hecho de que entre menos intervalos de clase tenga la tabla de distribución de frecuencias, más fácil será la “lectura” de la información; porque los datos estarán más concentrados, ésta por supuesto será una ventaja; pero también existirá una desventaja y es la de que entre menos intervalos tenga la tabla, más pérdida de información habrá. Quizás lo deseable sería que el número de intervalos no fuera menor que 5; pero tampoco mayor de 10. En definitiva el número de intervalos lo dictará cada circunstancia en particular.
98
MATEMÁTICA • PRIMERO DE BACHILLERATO
Ejercicios Nº 3
1. Se dan a continuación los pesos en libras, de 80 jóvenes bachilleres: 110, 150, 127, 105, 155, 140, 170, 160, 160, 125, 136, 145, 170, 150, 115, 140, 148, 155, 133, 105, 145, 180, 120, 135, 110, 140, 120, 150, 125, 130, 120, 115, 150, 155, 105, 165, 98, 105, 210, 120, 120, 151, 96, 118, 137, 140, 140, 108, 158, 152, 145, 110, 175, 130, 130, 135, 127, 135, 132, 150, 140, 111, 125, 190, 150, 150, 130, 117, 140, 168, 97, 170, 158, 128, 130, 135, 115, 145, 175, 140. Resumir la información anterior por medio de una tabla de distribución de frecuencias relativas, y que conste de cinco intervalos, en donde el límite inferior de cada intervalo esté incluído. 2. Las estaturas, en cms., de sesenta estudiantes universitarios de segundo año son: 160, 157, 178, 163, 173, 156, 165, 160, 174, 155, 165, 156, 171, 167, 172, 155, 172, 189, 170, 171, 159, 163, 170, 151,172, 168, 152, 171, 170, 160, 174, 175, 165, 165, 170, 160, 178, 179, 165, 179, 170, 167, 170, 160, 154, 157, 154, 170, 178, 170, 160, 162, 155, 165, 152.
160, 160, 179, 185, 181,
Resumir la información anterior por medio de una tabla de distribución de frecuencias, en que aparezcan tanto las frecuencias como las frecuencias relativas. La tabla deberá constar de 6 intervalos y el límite superior de cada intervalo deberá estar incluido.
MATEMÁTICA • UNIDAD SEIS
99
Gráficos para variables continuas Los datos agrupados haciendo uso de intervalos de clase, pueden representarse por medio de varios gráficos. Los principales gráficos que se utilizan par representar las frecuencias o las frecuencias relativas son: Histograma y Polígono de Frecuencias.
❚ Histograma Este gráfico se utiliza para representar tanto las frecuencias como las frecuencias relativas.
El Histograma se construye de la manera siguiente: 1) En el eje horizontal se marcan los intervalos de clase. 2) En el eje vertical se marcan las frecuencias. 3) Se levanta, sobre cada intervalo, un rectángulo cuya base coincida con el ancho del intervalo y cuya altura sea igual a la frecuencia respectiva.
Ejemplo 1: La cantidad de alumbramientos que hubo en el año de 1986 y las edades de las madres, aparecen en el cuadro siguiente. Presentar la información por medio de un histograma. ALUMBRAMIENTOS SEGUN EDAD DE LA MADRE. 1986 Edad de la madre (años) 10 • 15 • 20 • 25 • 30 • 35 • 40 • 45 • 50 •
15 20 25 30 35 40 45 50 • 55
TOTAL
100
MATEMÁTICA • PRIMERO DE BACHILLERATO
Número de alumbramientos 500 28,100 46,300 31,000 18,000 10,900 4,100 1,100 100
140,100
Solución: 5050
Número de alumbramientos (en miles)
Número de alumbramientos (en miles)
45 45 4040
3535
3030
2525
20 20
1515
10 10
5
5 0 5 5
10 10
15 15
20 20
25 25
30 30
35 35
40 40
45 45
50 50
55 55
Edad de las Edad de las madres (años)
madres (años)
Como ya hemos dicho anteriormente, el histograma se utiliza no solamente para representar las frecuencias, sino que también puede utilizarse para representar las frecuencias relativas. Para los datos del ejemplo anterior queremos construir un histograma por medio del cual se presenten las frecuencias relativas o porcentajes. Entonces es necesario calcular primero las frecuencias relativas. Al agregarle la columna correspondiente a las frecuencias relativas, la tabla de distribución de frecuencias queda de la manera siguiente:
MATEMÁTICA • UNIDAD SEIS
101
ALUMBRAMIENTOS SEGUN LA EDAD DE LA MADRE. 1986 Edad de la madre (Años) 10 • 15 • 20 • 25 • 30 • 35 • 40 • 45 • 50 •
15 20 25 30 35 40 45 50 • 55
Nº de alumbramientos 500 28,100 46,300 31,000 18,000 10,900 4,100 1,100 100
TOTAL
140,100
fr Porcentaje 0.36% 20.06% 33.05% 22.13% 12.85% 7.78% 2.92% 0.78% 0.07% 100.00%
Para que la suma total de los porcentajes sea de 100%, se ha hecho lo siguiente: En el intervalo séptimo 2.926% se ha aproximado a 2.92%. En el intervalo octavo
0.785% se ha aproximado a 0.78%.
Esto se hizo así, porque en estos dos intervalos los decimales que se han despreciado son menores que los que tendrían que despreciarse en los restantes intervalos y como ya lo hemos dicho antes, se busca siempre que la suma total de los porcentajes sea del 100%. Si para ello hay que aumentar o despreciar pequeñas aproximaciones decimales, deberá hacerce esto. Ahora que ya tenemos calculadas las frecuencias relativas, podemos graficar el histograma. El histograma correspondiente a las frecuencias relativas es el mismo que el histograma correspondiente a las frecuencias. La única diferencia es que en el eje vertical no se colocan las frecuencias sino que los porcentajes.
102
MATEMÁTICA • PRIMERO DE BACHILLERATO
El histograma queda de la manera siguiente::
Porcentaje
33% 33% 30% 30%
27% 27%
24% 24% 21% 21%
18% 18% 15% 15%
12% 12% 9% 9% 6%
6%
3%
3% 0
0 5 5
10 10
15 15
20 20
25 25
30 30
35 35
40 40
45 45
50 50
55 55
Edad de las madres Edad (años) de las madres (años)
MATEMÁTICA • UNIDAD SEIS
103
Ejercicios Nº 4
1. Presentar por medio de un histograma los datos correspondientes a las estaturas de 60 estudiantes, que aparecieron en los ejercicios Nº 3 y graficar las frecuencias y también las frecuencias relativas. 2. El promedio de vida al nacer o esperanza de vida en años, del pueblo salvadoreño durante distintas épocas se presenta en el siguiente cuadro. Representar los datos por medio de un histograma.
ESPERANZA DE VIDA AL NACER. 1950 - 1975 Época/tiempo 1950 • 1955 • 1960 • 1965 • 1970 •
Esperanza de vida (años) 1955 1960 1965 1970 1975
46.7 49.6 52.9 56.0 59.0
3. Representar por medio de un histograma los datos correspondientes a los pesos de 80 jóvenes que aparecen en los ejercicios Nº 3.
104
MATEMÁTICA • PRIMERO DE BACHILLERATO
Autoevaluación Nº 3
Se dan a continuación las calificaciones que 80 estudiantes obtuvieron en matemática: 6.0, 7.0, 0.5, 5.1, 5.4, 5.5, 2.3, 1.9, 4.6, 3.3, 4.3, 0.8, 0.7, 5.5, 2.8, 3.3, 7.1, 1.5, 6.0, 6.8, 3.1, 3.0, 0.9, 6.6, 1.6, 0.8, 5.6, 2.2, 3.9, 1.1, 5.6, 6.3, 4.6, 6.9, 4.2, 5.6, 6.8, 5.0, 6.0, 6.0, 3.7, 7.9, 6.0, 5.6, 6.2, 10.0, 9.2, 7.0, 8.8, 9.4.
6.0, 2.5, 4.1, 6.3, 5.5, 2.9, 3.4, 7.9, 6.0, 1.5, 4.9, 6.8, 6.5, 4.9, 4.5, 8.4, 4.4, 6.1, 3.6, 6.7, 4.0, 6.0, 7.9, 5.5, 7.0,
2.4, 0.9, 3.3, 8.9, 8.4,
1. Resumir la información anterior por medio de una tabla de distribución de frecuencias y que conste de cinco intervalos. 2. Presentar los datos por medio de un histograma en el cual se indiquen las frecuencias. 3. Presentar los datos por medio de un histograma en el cual se indiquen las frecuencias relativas.
MATEMÁTICA • UNIDAD SEIS
105
3. Media artimética: x Mario, Toño, José y Luis son cuatro amigos. En base a su amistad, deciden lo siguiente: reunirán en un fondo común, todo el dinero que llevan consigo; para luego repartirlo en partes iguales y así ir a una excursión con igual cantidad de dinero. Mario aporta al fondo común 122 colones, Toño 38 colones, José 68 colones y Luis aporta 84 colones. El total que reúnen asciende a 312 colones; por lo tanto al dividirlo entre los cuatro, a cada uno le corresponden 78 colones. José ¢ 68.00
Toño ¢ 38.00
Luis ¢ 84.00
¢ 312.00
Mario
X= 312 = 78 4
¢ 122.00
La cantidad que le toca a cada uno, al repartir el fondo común, es la que se conoce con el nombre de media aritmética.
Definición. La Media Aritmética, de un conjunto de datos, se calcula sumando todos los datos y dividiendo esta suma entre el número de datos.
Si se tienen los n datos siguientes: x1, x2, ..., xn. Entonces la media aritmética de ellos es: X=
106
x1 + x2 + ... + xn n
MATEMÁTICA • PRIMERO DE BACHILLERATO
Para representar la suma de varios valores se acostumbra usar la letra griega ∑, que se llama sigma. n
Así el símbolo ∑ x i, nos dice que debemos sumar los elementos que i=1
se encuentran a la derecha del signo ∑ , los cuales empiezan con x1 (cuando i=1) y terminan con xn (cuando i=n). Al utilizar ésta notación, podemos expresar la media aritmética de la manera siguiente: n
X=
∑ xi x1 + x2 + ... + xn = i=1 n n
Notación:
La media aritmética de una muestra se designa por: X La media aritmética de una población se designa por: µ
Si X es la media de x1, x2 , ..., xn . Esto quiere decir que X representa lo que correspondería a todos y cada uno de los elementos x1, x2, ..., xn, si se hiciera un reparto del total. Observemos que por definición:
X=
x1 + x2 + ... + xn n
Al despejar se tiene: nX = x1 + x2 + x3 + ... + xn X + X + ... + X = x1 +x2 + x3+ ... + xn n veces la media
suma total de los n datos
MATEMÁTICA • UNIDAD SEIS
107
De acuerdo con ésta última igualdad, el total que resulta al sumar los n datos es igual al total que resulta al sumar n veces la media. En otras palabras si cada uno de los valores es sustituido por su media entonces la suma total no se altera. (Recuerda el fondo común de los cuatro amigos).
Ejemplo 1 : Las edades de Juan, Pedro, Luis y Antonio son respectivamente 16, 14, 18, 12 años. Encontrar la edad media de los cuatro.
Solución: Sea
X
=
Edad media
Al aplicar la fórmula para la media, resulta: X= 16 + 14 + 18 + 12 = 15 años 4
Ejemplo 2 : Encontrar la media aritmética de los números siguientes:100, 102, 104, ..., 200, 202.
Solución: Podemos ver que hay 52 números en total, por lo tanto: X= 100 + 102 + 104 + ... + 200 + 202 52 Sumar los cincuenta y dos términos del numerador es un proceso bastante largo, aún haciendo uso de calculadora; sin embargo los cálculos se pueden simplificar si observamos lo siguiente:
100, 102, 104, 106, ..., 150, 152, ..., 196, 198, 200, 202
302
108
MATEMÁTICA • PRIMERO DE BACHILLERATO
La suma de cada una de las veitiséis parejas de números que están unidas por la flecha es siempre igual a 302, es decir que:
26 igualdades
…
…
100 + 202 = 302 102 + 200 = 302 150 + 152 = 302
Esto nos facilita los cálculos. x = 100 + 102 + 104 + ... +200 + 202 = 302 (26) = 151 52 52
Ejercicios Nº 5
1. Encuentre la media aritmética de los números siguientes: 27, 28, 29, ... , 254, 255, 256 2. Un niño tiene en su bolsillo 15 monedas de a cinco centavos, otro tiene 13 monedas de diez centavos. Si un tercer niño tiene 7 monedas de veinticinco centavos; mientras que un cuarto tiene 3 monedas de a colón. ¿Cuál es la cantidad media de dinero que tienen entre los cuatro?
MATEMÁTICA • UNIDAD SEIS
109
Autoevaluación Nº 4
1. Calcule la media de los números siguientes: 1, 5, 9, 13, ... , 77 2. En un supermercado trabajan 30 personas, las cuales tienen un sueldo medio mensual de 2,300 colones. si se paga a cada trabajador 13 sueldos al año ¿A cuánto asciende la cantidad de dinero anual que dicho supermercado paga en total a los 30 empleados?
a) Propiedades de la media Definición: Llamaremos desviaciones a las diferencias (con el
correspondiente signo) entre los valores de la variable y un valor fijo.
Las principales propiedades matemáticas que posee la media aritmética se enuncian a continuación:
Ejemplo 1: Las edades, en años, de cinco jóvenes son 16, 19, 23, 20 y 17. Encontrar la edad media y verificar que la suma de las desviaciones respecto a la media, es cero. Solución: Sea
X
Entonces:
110
=
Edad media
X = 16 + 19 + 23 + 20 + 17 = 19 años 5
MATEMÁTICA • PRIMERO DE BACHILLERATO
La suma de las desviaciones es: n
∑ (xi - X)
= (16 - 19) + (19 - 19) + (23 - 19) + (20 - 19) + (17 - 19)
1=1
= -3 + 0 + 4 + 1 - 2 =0
Propiedad 1
“La suma de las desviaciones de las variables respecto a la media aritmética, es siempre igual a cero”.
Simbólicamente esto mismo se expresa de la manera siguiente: n
∑ (xi - X) = 0 1=1
Ejemplo 2 : Los gastos en golosinas, que efectuó un estudiante, durante cada uno de los cinco días de clases de la semana pasada fueron: ⊄4.00, ⊄4.00, ⊄4.00, ⊄4.00 y ⊄4.00. ¿Cuál fue el gasto medio diario de dicho estudiante para esos cinco días?
Solución: Sea Entonces:
X = Gasto medio X = 4 + 4 + 4 + 4 + 4 = ¢4.00 5
MATEMÁTICA • UNIDAD SEIS
111
Propiedad 2
La media aritmética de un valor constante, es la misma constante.
Prueba: Si cada uno de los valores observados x1, x2, ..., xn es igual a una constante C , entonces:
X=
x1 + x2 + ... + xn ... + C = nC = C =C+C+ n n n
Notación: Qué la media de una constante es igual a la misma constante se puede expresar de la siguiente manera: C=C
Ejemplo 3: Encontrar la media aritmética para 40, 50, 38, 101, 145 y 178. Multiplicar luego cada uno de los datos anteriores por 7 y obtener la media de los nuevos valores resultantes.
Solución: X = 40 + 50 + 38 + 101 + 145 + 178 = 92 6 Al multiplicar cada dato por 7 se tiene: 280, 350, 266, 707, 1,015 y 1,246. La media de estos nuevos datos es: X = 280 + 350 + 266 + 707 + 1,015 + 1,246 = 644 6 Vemos claramente que la segunda media es igual al producto de la primer media por 7, es decir 7(92) = 644.
112
MATEMÁTICA • PRIMERO DE BACHILLERATO
Propiedad 3
La media del producto de una constante por una variable es igual al producto de la constante por la media de la variable.
Notación: CX=CX Prueba:
Si los valores observados son x1, x2, ..., xn . Al multiplicar por la constante C, resulta Cx1, Cx2, ..., Cxn .
Entonces: CX=
Cx1 + Cx2 + ... + Cxn C(x1 + x2 + ... + xn) = n n = C
x1 + x2 + ... + xn n
= CX
De acuerdo con esta propiedad 3, si cada uno de los valores de una muestra, se multiplica por una constante C , entonces la media de la muestra queda multiplicada por C.
Ejemplo 4: En una panadería laboran cinco panaderos cuyo sueldo mensual medio es de ⊄1,600.00. Si el dueño de la panadería aumenta los sueldos de los panaderos en un veinte por ciento, ¿Cuál es el nuevo sueldo mensual medio de los cinco panaderos?
MATEMÁTICA • UNIDAD SEIS
113
Solución: Sea Entonces:
0.20X
X = Sueldo mensual de un panadero cualquiera = Aumento mensual de un panadero cualquiera
De acuerdo con esto, el nuevo sueldo mensual de cada uno de los panaderos es: x + 0.20x = 1.20x Como para obtener el nuevo sueldo se ha multiplicado por 1.20 cada uno de los sueldos originales, entonces el nuevo sueldo medio es: 1.20 (1,600) = ⊄1,920.00
Ejemplo 5: Encontrar la media aritmética para 75, 61, 94, 150 y 45. Sumar luego 20 a cada uno de los datos anteriores y obtener la media de los nuevos valores.
Solución: X = 75 + 61 + 94 + 150 + 45 = 85 5 Al sumar 20 a cada dato resultan los nuevos valores: 95, 81, 114, 170, 65. La media de estos nuevos valores es: X = 95 +81 + 114 + 170 + 65 = 105 5 La segunda media es igual a la primera media más 20. O sea que si a cada uno de los valores de una muestra se le suma una misma constante, entonces la media de la muestra queda aumentada en dicha constante.
114
MATEMÁTICA • PRIMERO DE BACHILLERATO
Propiedad 4
La media de la suma de una variable más una constante es igual a la media de la variable más la constante
Notación: X+C=X+C Prueba: Si los valores observados son: x1, x2, ..., xn Al sumarle la constante C a cada uno de ellos, resulta:
x1 + C, x2 + C, ..., xn + C La media de estos nuevos datos es: X+C=
(x1 + C) + (x2 + C) + ... + (xn + C) n x1 + x2 + ... + xn + C + C + ... + C n
=
x1 + x2 + ... + xn + C + C + ... + C n n
=
x1 + x2 + ... + xn + nC = X + C n n
{
=
X
C
MATEMÁTICA • UNIDAD SEIS
115
Propiedad 5
Si f1 números tienen como media a X1 f2
. . .
fn
”
”
”
”
. . .
.
. . .
. . .
”
”
” ” Xn
. .
”
” X2
. . .
. . .
Entonces la media de todos los números es: X=
f1 X1 + f2 X2 + ... + fn Xn f1 + f2 + ... + fn
Ejemplo 6: En séptimo grado hay 125 estudiantes inscritos y su edad media es de 13 años. En octavo grado hay 100 estudiantes y su edad media es de 14 años; mientras que en noveno grado hay 70 estudiantes con una edad media de 15 años. ¿Cuál es la edad media para los tres años de tercer ciclo? Solución: En este caso: f1 = 125
y
X1 = 13
f2 = 100
y
X2 = 14
f3 = 70
y
X3 = 15
La edad media de todos es: X=
f 1 X 1 + f2 X 2 + f3 X 3 f 1 + f2 + f3
= 125(13) + 100(14) + 70(15) 125 + 100 + 70 = 13.81 años
116
MATEMÁTICA • PRIMERO DE BACHILLERATO
Ejercicios Nº 6
1. La media de los datos: 45, 62, 89, 92 y 112, es: La nueva media que se obtiene cuando a cada uno de los datos anteriores: a) Se le suma 18 es: b) Se le resta 12 es: c) Se le multiplica por 5 es: d) Se le divide entre 4 es: 2. En una fábrica laboran 200 obreros cuyo sueldo mensual medio es ¢ 1,800.oo. Se llega a un acuerdo con el dueño para que el próximo año efectúe dos aumentos de sueldo, uno en el mes de febrero y otro en el mes de julio. Uno de los aumentos deberá ser de 200 colones y el otro consistirá en el 12% del sueldo que el obrero esté devengando a la hora del aumento. Entonces: a) El aumento que conviene a los obreros se efectúe primero es el de: b) El nuevo sueldo medio después de efectuar los dos aumentos en el orden que le conviene a los obreros es: c) Al dueño le conviene efectuar primero el aumento de : d) El nuevo sueldo medio después de efectuar los dos aumentos, en el orden que le conviene al dueño es: e) Si el dueño efectúa los dos aumentos en el orden en que a él le conviene. Entonces mensualmente dejará de pagar la cantidad total de dinero siguiente: 3. Un grupo de clase formado por 30 varones y 20 señoritas tiene, en matemática, una nota media de 6.2. Si la media para solamente las señoritas es de 6.8. Entonces la nota media de los varones solos es de:
MATEMÁTICA • UNIDAD SEIS
117
Autoevaluación Nº 5
1. Haciendo uso de un cordel se miden las cinturas de un grupo de atletas, resultando al final que la cintura media de éstos es de 72.6 cms. Posteriormente, al medir el cordel resulta que es 2cms. más largo de lo que se pensaba ¿Cuál es entonces la verdadera media para la cintura de los atletas? 2. El peso medio de 5 señoritas es de 98 libras; mientras que el peso medio de 12 varones es de 110 libras. ¿Cuál es el peso medio de las 17 personas? 3. En una granja avícola hay 3,200 pollos cuyo peso medio es de 4 libras. El propietario decide darles un nuevo alimento para pollos, cuya garantía es que aumenta el peso de cada pollo en un 10% semanalmente, si la garantía es verdadera, ¿Cuál es el meso medio de los pollos al cabo de 4 semanas? ¿Cuántas libras extras de carne de pollo obtendrá el propietario al cabo de 4 semanas?
118
MATEMÁTICA • PRIMERO DE BACHILLERATO
4. Medidas de dispersión Empecemos con la ilustración siguiente: Para probar la capacidad de los estudiantes, se decide efectuar dos exámenes, uno de Estadística y otro de Matemática. Los alumnos que obtengan las tres mejores calificaciones, en cada una de las materias, recibirán un premio. Diez estudiantes se someten al examen de Estadística y también diez se someten al de matemática. Obteniendo las notas siguientes: Estadística: 2, 3, 6, 7, 8, 8, 8, 9, 9, 10 Matemática: 6, 6, 6, 6, 6, 6, 7, 7, 10, 10 En ambos grupos la nota media es 7. Sin embargo en Estadística, quien obtuvo 7 no recibirá premio; porque hay seis estudiantes mejores que él. No así en matemática, en donde la nota 7 si es merecedora de premio, por existir solamente dos estudiantes con mejor nota que ésta. Podemos ver en la ilustración anterior que la media, por si sola, no ayuda a interpretar cabalmente los datos. Es necesario también tener una medida que permita apreciar cuán dispersos están los datos alrededor de ella.
Definición: Al grado con que los datos numéricos
tienden a extenderse alrededor de un valor medio, se le llama Variación o Dispersión de Datos.
Los Estadígragos de Dispersión se conocen también con el nombre de medidas de Dispersión o de Variabilidad. Y los principales son: Varianza y Desviación Típica.
MATEMÁTICA • UNIDAD SEIS
119
a. Varianza
Definición: Se llama Varianza a la media aritmética de los cuadrados de las desviaciones de los datos respecto a su media.
La varianza de los datos x1, x2, ..., xn que se denota por σ2 es entonces: σ2 =
(X1 - X)2 + (X2 - X)2 + (X3 - X)2 + ... + (Xn - X)2 n n
∑ (Xi - X)2 σ2 =
i =1
n
• La varianza muestral se denota por: s2 ó por σ2n -1 • La varianza poblacional se denota por: σ2 • Una varianza grande indica bastante variación de los datos.
Ejemplo 1: Encontrar la varianza de 16,14, 27, 3 y 20. Solución: Encontramos primero la media: X = 16 + 14 + 27 + 3 + 20 = 16 5 La varianza es: σ2=
(16 -16)2+ (14 - 16)2+ (27 - 16)2 + (3 - 16) 2+ (20 - 16) 2 5
σ2= 0 + 4 + 121 + 169 + 16 = 62 5 120
MATEMÁTICA • PRIMERO DE BACHILLERATO
Como la varianza es grande, en relación con los datos, podemos concluir que existe bastante variabilidad. O lo que es lo mismo, que hay datos que están bastante alejados de la media.
❚ Otra fórmula para calcular la varianza A partir de la definición podemos obtener otra manera para calcular la varianza y que simplifica un poco los cálculos. Por lo que recibe el nombre de Método Corto para el Cálculo de la Varianza. La deducción de la nueva fórmula es la siguiente. Por definición sabemos que: σ2 =
(X1 - X)2 + (X2 - X)2 + (X3 - X)2 + ... + (Xn - X)2 n
Al desarrollar los cuadrados se tiene: 2
σ2 =
2
2
2
2
2
X1 - 2XX1+ ( X ) + X2 - 2XX2 + ( X ) + ... + Xn - 2XXn + ( X ) n
Al agrupar términos: 2
2
2
2
2
2
X1+X2 + ... +Xn - 2XX1 - 2XX2 - ... - 2XXn+( X ) +( X ) +...+( X ) σ2 = n 2
2
2
X1 + X2 + ... + Xn X1+ X2 + ... + Xn n( X ) 2 σ2 = - 2X + n n n X 2 2 2 X1 + X2 + ... + Xn 2 σ2 = -2XX+(X) n σ2 =
σ2 =
2
2
2
2
2
2
X1 + X2 + ... + Xn 2 2 -2(X)+(X) n X1 + X2 + ... + Xn n
-(X)
2
MATEMÁTICA • UNIDAD SEIS
121
Esta última igualdad dice que la varianza es igual a
“La media de los cuadrados menos el cuadrado de la media”.
Ejemplo 2 : Calucular la varianza de 6, 8, 9, 10, 4, 5. Haciendo uso de las dos fórmulas.
Solución : • Primera fórmula: X = 6 + 8 + 9 + 10 + 4 + 5 = 7 6
σ2 =
(6 - 7)2 + (8 - 7)2 + (9 - 7)2 + (10 - 7)2 + (4 - 7)2 + (5 - 7)2 = 4.7 Aprox. 6
• Segunda fórmula: (Método corto) 2 2 2 2 2 2 σ2 = 6 + 8 + 9 + 10 + 4 + 5 - 7 2 6
σ2 = 322 - 49 6 σ2 = 4.7 (aproximadamente)
Como podemos ver, el resultado es el mismo por ambos métodos.
122
MATEMÁTICA • PRIMERO DE BACHILLERATO
Ejercicio Nº 8
Haciendo uso de las dos fórmulas estudiadas, encontrar la varianza de 5, 10, 25, 50 y 100. Solución: X=
=
Según la primer fórmula de la varianza se tiene: S2 = S2 = S2 = Según el método corto: S2 = S2 =
-
S2 =
b) Desviación típica: S
Definición: La Desviación Típica es igual a la raíz
cuadrada (con signo positivo) de la varianza.
La Desviación Típica es la más importante de las medidas de dispersión. Es la que mejor mide cuánto se separan los datos con respecto a su medida. En las calculadoras de bolsillo la desviación típica se designa por s y también por σn. Depende de la marca de la calculadora. La varianza, como medida de variabilidad, tiene el inconveniente de que se expresa en unidades distintas a las de la variable original.
MATEMÁTICA • UNIDAD SEIS
123
Si por ejemplo se está estudiando el peso, en libras, de un grupo de personas. Entonces la varianza dá la variabilidad en libras al cuadrado. La desviación típica en cambio dá la variabilidad en las mismas unidades que la variable original. En este caso daría la variabilidad en libras. De acuerdo con la definición, la desviación típica de los datos: x1, x2, ..., xn se obtiene por medio de la fórmula:
σ=
X21 + X22 + ... + Xn2 n
– ( X )2
Aunque para datos dispersos lo mejor es obtenerla directamente por medio de la calculadora de bolsillo.
Ejemplo 1: Las edades en años de 25 estudiantes de 2º año de la Universidad son: 20, 21, 22, 19, 20, 19, 19, 19, 20, 19, 22, 20, 20, 20, 20, 19, 20, 20, 19, 20, 19, 20, 21, 22, 19. Encontrar la desviación típica de las edades.
Solución: Primera manera (por medio de la fórmula)
X=
σ=
9(19) + 11(20) + 2(21) + 3(22) = 19.96 años 25
9(19)2 + 11(20)2 + 2(21)2 + 3(22)2 25
124
MATEMÁTICA • PRIMERO DE BACHILLERATO
- (19.96)2 = √ 0.9184 = 0.9583
Segunda manera (Haciendo uso de la caltculadora) a) Coloca la calculadora de modo estadístico (SD) b) Introduce cada uno de los datos a memoria ( ∑+) ó ( M+) c) Marca el valor correspondiente a Sn
ó
σx
Paso a paso, si tienes una calculadora Casio o Texas Instrument, hace lo siguiente:
Casio Introduce
Presiona .
MODE
Texas Instrument Aparece en pantalla SD
INV. SAC AC
Presiona
Aparece en pantalla
20
Σ+
1
21
Σ+
2
22
Σ+
3
Introduce
20
M+
20
21
M+
21
.:
.:
.:
.:
.:
.:
20
Σ+
22
20
M+
20
21
Σ+
23
21
M+
21
22
Σ+
24
22
M+
22
19
Σ+
25
19
M+
19
2nd [Sx].
0.9583
INV. [σn]
0.9583
MATEMÁTICA • UNIDAD SEIS
125
Si a la media se le suma una desviación típica y se le resta también una desviación típica, entonces se forma un intervalo. El cual abarca, en algunas ocasiones, el 68% de los datos. ( 68% de los datos ) X - σn
X
X + σn
Para los datos del ejemplo 6 se tiene el intervalo siguiente:
( 19.0017
19.96
) 20.9138
Este intervalo incluye 13 de las 25 edades, es decir el 52% del total. Podemos comprobar con este ejemplo que la afirmación que dice que el intervalo debía contener al 68% de los datos, es una afirmación empírica (es decir no sustentada en ninguna prueba matemática).
Ejercicio Nº 8
Para los números 4, 9, 16, 20, 28, 51 calcular la Desviación Típica. a) Haciendo uso de la fórmula b) Haciendo uso de la calculadora
126
MATEMÁTICA • PRIMERO DE BACHILLERATO
a) Propiedades
Propiedad 1:
La desviación típica nunca es negativa.
Propiedad 2:
La desviación típica de un dato constante es cero. No podía ser de otra manera, ya que en una constante no hay variabilidad.
Propiedad 3:
La desviación típica del producto de una constante por una variable es igual a la constante por la desviación típica de la variable.
En otras palabras: Si la desviación típica de x1, x2, ..., xn, es S Entonces la desviación típica de Cx1 + Cx2 , ..., Cxn es CS
Propiedad 4:
La desviación típica de la suma de una variable y una constante es igual a la desviación típica de la variable.
Es decir que: Si la desiviación típica de x1, x2, ..., xn, es S entonces la desviación típica de x1 + C, x2 + C, ..., xn + C es S
MATEMÁTICA • UNIDAD SEIS
127
Ejemplo 2 Las calificaciones obtenidas por un grupo de estudiantes poseen una desviación típica de 1.5 puntos. ¿Cuál es la nueva desviación típica de las calificaciones si a cada estudiante se le aumenta: a) ¿El diez por ciento de la nota obtenida? b) ¿Un punto?
Solución: Se sabe que S = 1.5 a) Sea X = Nota obtenida por un estudiante Entonces al aumentarle el 10%, la nueva nota es: x + 0.10x = 1.10x Como la nueva nota se obtiene multiplicando por 1.10 la nota original. Entonces por la propiedad 3, la nueva desviación típica es: 1.10S = 1.10 ( 1.5 ) = 1.65 b) De acuerdo con la propiedad 4, en este caso la desviación típica no se modificará después de aumentar un punto a cada uno de los estudiantes y sigue siendo: S = 1.5
128
MATEMÁTICA • PRIMERO DE BACHILLERATO
Ejercicio Nº 9
Calcule la desviación típica de 39, 75, 84, 93, 96 y 116. La desviación típica es: a) Si a cada uno de los 6 datos se le suma 15, entonces la nueva desviación típica es: b) Si a cada uno de los 6 datos se le resta 10, entonces la nueva desviación típica es: c) Si cada uno de los 6 datos se multiplica por 8, entonces la nueva desviación típica es: d) Si cada uno de los datos se divide entre 3, entonces la nueva desviación típica es:
MATEMÁTICA • UNIDAD SEIS
129
Autoevaluación Nº 6
1. Un niño tiene en su bolsillo 7 monedas de a veinticinco centavos, otro tiene 11 monedas de a diez centavos. Si un tercer niño tiene 15 monedas de a cinco centavos y un cuarto tiene 4 monedas de a colón. Encontrar la desviación típica del dinero que tienen los cuatro. 2. Las edades actuales en años, de 3 amigos son: 42, 50, 52. a) Encuentra la desviación típica de las edades b) ¿Cuál era la desviación típica hace 10 años? c) ¿Cuál será la desviación típica dentro de 10 años?
130
MATEMÁTICA • PRIMERO DE BACHILLERATO
Respuestas a los ejercicios
❚ Ejercicios Nº 1
1. Si ordenamos los datos de mayor a menor, entonces el gráfico debió quedarte más o menos de la manera siguiente:
1200 1200 1000 1000 800 800 600 600 400 400 200 4200
Educación Educación
Obras Obras públicas públicas
Defensa Defensa
Salud Salud
Policía Policía
Dependencia Dependencia Estatal Estatal
2. El gráfico es de la forma indicada a continuación: Miles de Miles de Manzanas manzanas
120 120 100 100 80 80 60 60 40 40 20 20
1981 1981
1983 1983
1985 1985
1987 1987
1989 1989
Año
Anno
MATEMÁTICA • UNIDAD SEIS
131
3)
4) Fútbol 50%
E.E.U.U. 52% Ciclismo 16.67%
Baloncesto 33.33%
Alemania 27.8%
Japón 11.5%
❚ Ejercicios Nº 2
1)
Número de divorcios
2,500 2,500
2,000 2,000 1,500 1,500
1,000 1,000
500 500
1982 1982
1983 1983
1984 1984
1985 1986
1986 1987
Años
1987 1987
1988 1988
1989 1989
Años
Número de turistas
2) 45,000 45,000 40,000 40,000 35,000 35,000
30,000 30,000 25,000 25,000 20,000 20,000 15,000 15,000
10,000 10,000
5,000 5,000
1985 1985
132
Otros 8.7%
MATEMÁTICA • PRIMERO DE BACHILLERATO
1986 1986
3) Producción de azúcar blanca
= un millón de quintales
1987
21900,000 qq
1988
21600,000 qq
1989
31500,000 qq
❚ Ejercicios Nº 3
1) Pesos (libras) 96 • 118.8 141.6 164.4 187.2 •
Número de bachilleres
Porcentajes
118.8 •141.6 •164.4 •187.2 •210
17 32 21 8 2
21.25% 40.00% 26.25% 10.00% 2.50%
TOTAL
80
100%
MATEMÁTICA • UNIDAD SEIS
133
2) Estaturas (cms) 151 • 157.33 163.66 169.99 176.32 182.65
Estudiantes Universitarios
157.33 • 163.66 • 169.99 • 176.32 • 182.65 • 189 •
Total
Porcentajes
12 12 9 18 7 2
20.00% 20.00% 15.00% 30.00% 11.67% 3.33%
60
100%
❚ Ejercicios Nº 4
1) a) Número de Número deestudiantes estudiantes
1818
1616
14 14
5,000 12 12
10 10
88
66 4 4
22 00
134
151 151
MATEMÁTICA • PRIMERO DE BACHILLERATO
189 163.66 169.99 169,99 176.32 176,32 182.65 182.65 189 157,33 163.66 157.33
Estatura (cms.) Estatura (cms.)
Número estudiantes Número dedeestudiantes
1) b)
30% 30% 27% 27%
24% 24% 21% 21% 18% 18%
15% 15% 12% 12% 9% 9% 6% 6% 3% 3%
00
189 151 189 163.66 169.99 169,99 176.32 176,32 182.65 182.65 151 157.33 157,33 163.66
Estatura (cms.) Estatura (cms.)
Esperanza vida ESperanzade de vida años en enaños
2) 60 60
50 50 40 40 30 30 20 20 10 10 0
3)
0
1950 1955 1960 1950 1955 1960
1965 1965
1970 1970
1975 1975
Época Época
Número Númerode de bachilleres bachilleres
35 35
30 30 25 25 20 20 15 15 10 10 55
0
0
96 96
118.8 187.2 210 164.4 187.2 210 118.8 141.6 141.6 164.4
peso Peso (libras (libras)
MATEMÁTICA • UNIDAD SEIS
135
❚ Ejercicios Nº 5
1) X = 27 + 28 + 29 + ... + 255 + 256 = 120(283) = 141.5 240
240
2) X = 15(5) + 13(10) + 7(25) + 3(100) = 170 centavos = 1.70 colones 4
❚ Ejercicios Nº 6
1) X = 80,
a) 98,
b) 68
2) a) El de 200 b) 2,240 colones c) El de 12%
c) 400
d) 20
d) 2,216 colones e) 4,800 colones
3) 5.8
❚ Ejercicios Nº 8
17.01959655
❚ Ejercicios Nº 9
S = 23.646 a) La misma
136
b) La misma
MATEMÁTICA • PRIMERO DE BACHILLERATO
c) S = 189.1689
d) S = 7.882
Solución a las autoevaluaciónes
❚ Autoevaluación Nº 1
I) 1) Cualitativo
2) Cuantitativo
3) Discreta
4) Continua
II) Estado Civil
Número de Mujeres
Casada Soltera Acompañada Divorciada Viuda
13 6 5 4 2
Total
30
Número de mujeres
Número de mujeres
14 14 12 12
10 10
88
66
44
Viuda
Viuda
Divorciada Divorciada
Acompañada Acompañada
Soltera Soltera
00
Casada Casada
22
Estado Estado civil civil
MATEMÁTICA • UNIDAD SEIS
137
IV) Naturales 50% Lenguaje 8.33%
Sociales 25%
Matemática 16.67%
❚ Autoevaluación Nº 2
1)
Habitantes
1,400,000 1,400,000 1,200,000 1,200,000 1,000,000 1,000,000 800,000 800,000
600,000 600,000 400,000 400,000 200,000 200,000
1950 1950
1960 1960
1970 1970
1980 1980
1990 1990
2) = 50,000 kgs
Guatemala
Dinamarca
Nueva Zelandia
138
MATEMÁTICA • PRIMERO DE BACHILLERATO
Años
❚ Autoevaluación Nº 3
1) Número de Estudiantes
Calificaciones • 2.4 • 4.3 • 6.2 • 8.1 • 10.0
0.5 2.4 4.3 6.2 8.1
Total
2)
Porcentaje
13 16 27 17 7
16.25% 20.00% 33.75% 21.25% 8.75%
80
100%
Número de estudiantes 28 28 26 26
24 24 22 22 20 20 18 18 16 16 14 14 12 12 10 10 8
8 66
4
4 2
2 0
0
0.5 0.5
2.4 2.4
4.3 4.3
6.2 6.2
8.1 8.1
10.0 10.0
Calificaciones
Calificaciones
MATEMÁTICA • UNIDAD SEIS
139
Porcentaje
3) 33.7% 33.7%
21.25% 21.25% 20% 20% 16.25% 16.25%
8.75% 8.75%
0 0
0.5 0.5
2.4 2.4
4.3 4.3
6.2 6.2
8.1 8.1
❚ Autoevaluación Nº 4
1) media: 39 2) 897,000
❚ Autoevaluación Nº 5
1) 74.6 cms 2) 106.47 libras 3) Peso medio: 5.8564 libras. Libras extra: 5,940.48
❚ Autoevaluación Nº 6
1) 126.44 centavos
140
MATEMÁTICA • PRIMERO DE BACHILLERATO
2) a) 4.32 b) 4.32 c) 4.32
10.0 10.0
Calificaciones Calificaciones