Story Transcript
UNIDAD 5: UTILICEMOS MEDIDAS DE TENDENCIA CENTRAL.
Importancia de las medidas de tendencia central. Cuando recopilamos una serie de datos podemos resumirlos utilizando una tabla de clases y frecuencias. La información así expresada es más fácil de analizar. En una tabla de clases y frecuencias es fácil ver qué intervalo posee mayor número de datos y en cuál hay menos. También podemos captar cuántos datos están por encima o por debajo de un porcentaje dado. Por su parte, las gráficas nos presentan la información de una manera rápida y vistosa. En ellas podemos ver de inmediato qué datos sobresalen. Sin embargo, la información resumida en una tabla de clases y frecuencias puede resumirse aún más, de manera que se pueda realizar un análisis más completo. La información resumida en una tabla puede expresarse en un solo valor. Para esto necesitamos lo que se conoce como medidas de tendencia central. Estas medidas reciben tal nombre porque alrededor de ellas tienden a girar los demás valores de una serie. Las medidas de tendencia central son útiles para tener una mejor descripción de todos los valores que toma una variable determinada. Son medidas de tendencia central: la media aritmética, la mediana y la moda.
2. Media aritmética. La media aritmética es el promedio más conocido.
2.1
Definición y notación.
La media aritmética de una serie estadística, denotada , es el valor que sustituido por cada término produce una suma igual a la de todos los términos. Comprendamos la definición. Se establece que si es la media aritmética de los términos a, b, c, d y e; entonces se tiene que: Si a + b + c + d + e = S, entonces:
++++=S Un ejemplo numérico es el siguiente. Para los datos siguientes 5, 3, 6, 7, 4, 5, 3, 7 la media aritmética es = 5. Esto significa que: Cuando los datos se ordenan de menor a mayor, puede verse la simetría de la distribución. 5 + 3 + 6 + 7 + 4 + 5 + 3 + 7 = 40 Cuando la diferencia entre los números es más o 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 = 40 menos igual, la distribución es bastante simétrica. De lo contrario es asimétrica
2.2 Cálculo de la media aritmética. Cuando se tienen datos no agrupados, la media aritmética se calcula mediante la fórmula
= ∑ Xi
En esta fórmula:
.
n
∑
significa sumatoria
Xi
es cada uno de los datos
n es el número total de datos Pero puede ocurrir que los datos estén agrupados en frecuencias, entonces la fórmula es:
= ∑ fi Xi
Siendo fi la frecuencia con que se repite el dato Xi.
.
n
La anterior ecuación se utiliza para datos muestrales. Algunos libros, para especificar que se trata de datos poblacionales, utilizan μ en vez de , y N en vez de n. Aquí utilizaremos para la media y n para los datos. Cuando sea necesario, especificaremos si son datos poblacionales o muestrales.
Ejemplo.
Para los datos dados, calcular . Luego agruparlos en frecuencias y calcular de nuevo . Datos: 5, 8, 8, 4, 7, 9, 8, 8, 7, 2, 4, 6, 5, 8, 7, 4, 2, 4, 8, 7, 5.
Solución. El número de datos es: n = 21. La sumatoria de los datos es:
∑Xi = 5 + 8 + 8 + 4 + 7 + 9 + 8 + 8 + 7 + 2 + 4 + 6 + 5 + 8 + 7 + 4 + 2 + 4 + 8 + 7 + 5 = 126.
= ∑ Xi
Ordenados los datos de menor a mayor, se tiene: 2, 2, 4, 4, 4, 4, 5, 5, 5, 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 9. La media es 6, y la posición central es uno de los 7. Hay bastante simetría.
= 126/21 = 6.
n
Calculemos agrupando los datos en frecuencias: Datos
2
4
5
6
7
8
9
F
2
4
3
1
4
6
1
Apliquemos la fórmula:
∑ fi Xi
= 2x2 + 4x4 + 3x5 + 6 + 4x7 + 6x8 + 9 = 4 + 16 + 15 + 6 + 28 + 48 + 9 = 126.
= ∑ fi Xi
= 126 = 6.
n
21
para datos agrupados en clases y frecuencias. Cuando los datos están agrupados en clases y frecuencias, se calcula mediante la fórmula:
Se toma el punto medio porque es el valor que mejor representa a los datos de su clase. Para una distribución simétrica, Pm ocupa el centro. En 2, 3, 4, 5, 6: Pm = 4.
= ∑ fi Pmi n
Ejemplo. Para los datos de la tabla, calcular . Tiempos
Pm
Corredores (f)
2.02
17
2.66
7
1.7
2.34
2.34
2.98
2.98
3.62
3.3
3
3.62
4.26
3.94
22
4.26
4.9
4.58
15 Suma = 64
Solución. = ∑ fi Pmi n
= 17x2.02 + 7x2.66 + 3x3.3 + 22x3.94 + 15x4.58 64 = (34.34 + 18.62 + 9.9 + 86.68 + 68.7) / 64 = 218.24 / 64 = 3.41
Con este ejemplo se puede apreciar una utilidad de tener los datos agrupados en clases y frecuencias. También puede apreciarse el valor de Pm, pues es el dato que mejor representa a todos los de su clase.
2.3 Propiedades de la media aritmética.
1. La sumatoria de las restas de cada término respecto de la media es igual a cero. Comprobemos la anterior propiedad con un caso sencillo. Se tiene que para los datos 5, 7, 9, 11 y 13; la media aritmética es 9. La sumatoria de las restas de cada término respecto de la media es la siguiente: (9 – 5) + (9 – 7) + (9 – 9) + (9 – 11) + (9 – 13) = (4) + (2) + (0) + (-2) + (-4) = 4 + 2 + 0 -2 -4 = 4-4 + 2-2 = 0 Se cumple que La sumatoria de las restas de cada término respecto de la media es igual a cero.
2. Media aritmética de una constante. Esta propiedad nos dice que si una serie de datos está formada por la repetición de un mismo dato, la media aritmética es ese dato constante. Para el caso se tiene que la media aritmética de 8, 8, 8, 8, 8, 8... es 8.
3. Media aritmética del producto de una constante por una variable. Ya vimos que para 5, 7, 9, 11 y 13; la media aritmética es 9. Multipliquemos cada número por la constante 5. Obtenemos: 25, 35, 45, 55 y 65. La media aritmética de estos números es 45. Pero 45 es el producto de la constante por la media aritmética original: 5x9 = 45. De lo anterior se concluye que la media aritmética del producto de una constante por una variable es igual al producto de la constante por la media de la variable.
4. Media aritmética de la suma o resta de una constante y una variable. Ya vimos que para 5, 7, 9, 11 y 13; la media aritmética es 9. Sumémosle la constante 5 a cada dato. Obtenemos: 10, 12, 14, 16 y 18. La media de estos datos es 14. Pero 14 es 9 + 5. Lo que es lo mismo: la media aritmética original + la constante. Si en vez de sumar restamos, obtenemos: 0, 2, 4, 6 y 8. Siendo = 4. Pero 4 es 9 – 5. Lo que es lo mismo: la media aritmética original – la constante. De lo anterior se concluye que la media aritmética de la suma o resta de una constante y una variable es la media de la variable más o menos la constante.
5. Media de medias. Cuando se tienen varias medias, la media de esas medias está relacionada con el número de datos de cada una. Se calcula la media de medias con la fórmula
Ejemplo.
= ∑ fi i ∑fi
Para 40 datos = 10; Para 50 datos = 11; Para 60 datos = 12. Calcular la media de las medias.
= ∑ fi i = ∑fi
40x10 + 50x11 + 60x12 = (400 + 550 + 720) / 150 = 11.13
40 + 50 + 60
Actividad 1. Resolver los casos siguientes. 1. Calcular la media aritmética de 2, 5, 7, 3, 8, 2, 9, 7, 6, 4, 5, 6, 9, 2, 7, 3, 4. 7. 9, 4, 3, 5, 2, 5. ____
2. Calcular la media aritmética para las tablas siguientes. a. = _____
Datos
12
13
14
15
16
17
20
22
f
5
4
7
6
4
3
5
6
Datos
12
13
14
15
16
17
20
22
24
25
f
5
4
7
6
4
3
5
6
7
5
.
.
Pm
Tiempos
f
3.3
3.3
4.1
4.1
4.9
25
4.9
5.7
5
5.7
6.5
15
c. = _____
20
Pm
Tiempos
Pmf
10
2.5
b. = _____
f 10
2.5
3.3
3.3
4.1
4.1
4.9
20
4.9
5.7
25
5.7
6.5
15
6.5
7.3
10
15
Pmf d. = _____
7.3
8.1
5
discusión 1
. Resuelvan los casos siguientes.
1. Para los datos siguientes, la media es 9. Calculen el valor de k. 10, 8, 14, 6, k. = _____
K
2. Para los datos 10, 3k, 30, 20 y m; la media es 23. Para los datos 20, k, 10, m y 15, la media es 18. calculen los valores de k y m. K = _____ m = _____ 3. La media para los datos de la tabla es 4. Calculen el valor del dato m. Dato
2
3
4
5
Frec.
5
m
5
16
m = ___
.
4. Para los datos 30, 15, 10, k, 50; se tiene que si a cada valor se le suma 10, la media es 35. calculen el valor de k. 5. Se sabe que la media de 120 datos es 15, la de 85 datos es 12 y la de 100 es 14. Calculen la media de medias. = _______ 6. Un agricultor reparte 500 libras de maíz entre 5 de sus mejores empleados. Las reparte así: 120, 100, 80, 95 y 105. Luego decide agregarle 20 libras a cada uno. Cuál es la media finalmente.
= ____ 7. Se reparten 200 libras de frijol entre 5 personas así: 40, 30, 50, 35, 45. Posteriormente se descubre que la báscula agregaba por error 5 libras más. Cuál es la media de las medidas reales.
= _____ 8. Para un grupo de 40 personas la edad media es de 25 años. Para otro grupo de 50, se desconoce la edad promedio. Sin embargo se sabe que la media de las noventa personas es 20. ¿Cuál es la media del grupo de 50? 9. En una excursión se divide el grupo en 3 conforme con las edades. Para el grupo de 15 personas, el promedio es 16 años. Para el grupo de 20, la edad media es 18 años. Para el tercer grupo la media es 20 años. La media de todas las personas es 18. ¿Cuántas personas forman el tercer grupo?
3. Mediana y moda. 3.2 Mediana. Definición. La mediana de un grupo de datos es el valor que se encuentra en el punto medio después de ordenarlos de menor a mayor.
La mediana es el valor que ocupa la posición (n + 1)/2 Cuando el número de datos es impar, la mediana está en el grupo, y ocupa el centro. Cuando el número de datos es par, la mediana es la media de los dos valores centrales.
Ejemplo. Para cada grupo, calcular la mediana. 1. 8, 10, 6, 12, 10, 11, 13
2. 20, 10, 15, 25, 30, 15, 14, 18
Solución. .
Ordenémoslos de menor a mayor: 6, 8, 10, 10, 11, 12, 13
8, 10, 6, 12, 10, 11, 13
La mediana es la posición (n + 1)/2 = (7 + 1)/2 = 4. La posición 4 es 10.
.
20, 10, 15, 25, 30, 15, 14, 18
Ordenémoslos: 10, 14, 15, 15, 18, 20, 25, 30.
Los valores centrales son 15 y 18. La mediana es: (15 + 18)/2 = 16.5 La mediana siempre estará en el centro; sin importar si los valores están distribuidos simétrica o asimétricamente.
3.2 Moda. Definición. La moda es el dato que aparece más veces en un grupo. De la definición se concluye que habrá grupos de datos con más de una moda. En el grupo 7, 9, 6, 5, 8, 6, 7, 8, 6, 5, 3, 10, 6, 4 la moda es 6. En el grupo 7, 9, 3, 6, 5, 4, 7, 8, 6, 7, 8, 6, 5, 3, 10, 7, 6, 4 tenemos 2 modas: 6 y 7.
25%
25%
Q1
25%
Q2
25%
Q3
Vamos a definir los cuartiles así: son los valores que dividen la serie de datos en 4 partes iguales. Para determinar los cuartiles, los datos deben estar ordenados de menor a mayor. El cuartil uno (Q1) es el valor de la variable que supera a no más del 25% y es superado por no más del 75%. Así mismo, el cuartil dos (Q2) es el valor de la variable que supera a no más del 50% y es superado por no más del 50%. Significa que el cuartil dos es la mediana. Pero una serie de datos, ordenados de menor a mayor, puede dividirse en 10 partes iguales. Así obtenemos los deciles. Evidentemente los deciles son 9. 10%
10%
D1
10%
D2
10%
D3
10%
D4
10%
D5
10%
D6
10%
D7
10%
D8
10%
D9
El decil uno (D1) es el valor de la variable que supera a no más del 10% y es superado por no más del 90%. Es evidente que el decil cinco equivale al cuartil 2.
Pero la serie también puede dividirse en 100 partes iguales. Se obtienen así los percentiles, simbolizados con P.
discusión 2
. Respondan las preguntas siguientes.
1. ¿Cuántos percentiles hay? ______ 2. ¿Cuál es el percentil que equivale a la mediana? _______ 3. ¿A qué percentil equivale el cuartil 3? ______ 4. ¿A qué decil equivale el percentil 50? 5. ¿Consideran que el percentil 70 supera a más del 80% de los datos? ______