Story Transcript
MEDIDAS DE POSICIÓN
También llamadas de centralización o de tendencia central. Sirven para estudiar las características de los valores centrales de la distribución atendiendo a distintos criterios. Veamos su significado con un ejemplo: Supongamos que queremos describir de una forma breve y precisa los resultados obtenidos por un conjunto de alumnos en un cierto examen; diríamos: a) La nota media de la clase es de 6,5. b) La mitad de los alumnos han obtenido una nota inferior a 5. c) La nota que más veces se repite es el 4,5. En la expresión a) se utiliza como medida la media aritmética o simplemente la media. En la b) se emplea como medida la mediana, que es el valor promedio que deja por debajo de ella la mitad de las notas y por encima de ella la otra mitad. Y en la c) se usa el valor de la nota que más veces se ha repetido en ese examen, este valor es la moda. MEDIA ARITMÉTICA Normalmente se suele distinguir entre media aritmética simple y media aritmética ponderada. Media aritmética simple: Es la suma de todos los elementos de la serie dividida por el número de ellos. Se calcula como: k
x=
∑x
i
i =1
n
siendo: x : la media k
∑x i =1
i
: suma de elementos
n : número de elementos (incluyendo a los de igual valor) k : número de elementos con distinto valor. Ejemplos: 1. Hallar la media aritmética de los siguientes valores: 5, 7, 8, 10, 15.
∑x
= 5 + 7 + 8 + 10 + 15 = 45 n=5
x =9 2. 3.
Si las notas de un alumno en las distintas asignaturas de un curso durante una evaluación fueron: 7; 5; 6,5; 3,7; 5, 6,2. Hallar la nota media de la evaluación. (Resp. 5,5666...) La media de 6 elementos se sabe que es 10. Sabiendo que cinco de ellos son: 8, 12, 13, 5 y 9, hallar el elemento que falta. (Resp. 13)
Media aritmética ponderada: Por lo general, en Estadística, los datos se nos presentan agrupados mediante una distribución de frecuencias que hace que no todos los elementos de la serie tengan el mismo peso específico, y eso influye a la hora de calcular la media, por eso se llama media ponderada. Se define como la suma de los productos de cada elemento de la serie por su frecuencia respectiva, dividida por el número de elementos de la serie.
k
x=
∑x
i
⋅ ni
i =1
n
donde ni es la frecuencia o número de veces que se repite un valor. También ni puede ser la ponderación de cada valor xi. Ejemplos: 1.
Durante el mes de octubre de 1981 los salarios recibidos por un obrero fueron: Salario en pesos 200.000 220.000 300.000
Frecuencia en días 5 15 4
Hallar el salario medio durante ese mes.
x= 2. 3.
200.000 x 5 +220.000 x 15 +300.000 x 4 24
Un alumno obtiene en tres exámenes parciales las siguientes notas: 7, 5 y 3; en el examen final consigue un 6. Suponiendo que esta nota final tenga doble valor que las parciales, ¿cuál será su nota media? (Resp. 5,4) Si la renta anual media de los trabajadores del campo es de 1.000.000 de pesos y la renta anual media de los trabajadores de la construcción en esa población es de 1.200.000 pesos, ¿sería la renta anual media para ambos grupos de 1.100.100 pesos? Explica.
Sin embargo, lo normal es Estadística es que los datos vengan agrupados en clases o intervalos, o que nosotros mismos hagamos esa agrupación cuando el número de elementos sea muy extenso, ya que en ese caso el cálculo de la media por los procedimientos vistos para datos sin agrupar sería muy laborioso. Antes de estudiar los métodos más usuales para el cálculo de la media con datos agrupados, vamos a ver algunas propiedades de la media aritmética que nos ayudarán a comprender mejor el contenido de esos métodos. Propiedades de la media aritmética: Las propiedades más importantes son 1. 2. 3.
La suma algebraica de las desviaciones de un conjunto de números respecto de su media aritmética es cero. La suma de los cuadrados de las desviaciones de un conjunto de números con respecto a cualquier otro número es mínima cuando ese otro número es precisamente la media aritmética. Si suponemos, antes de calcularla, que la media de un conjunto de números es cualquier número A, resulta que la verdadera media aritmética es: x =A+
donde A: media supuesta
∑d n
∑d : suma de las desviaciones respecto de A.
n : número de elementos. 4.
Si A1 números tienen una media m1, A2 números una media m2, ...., An números una media mn, entonces la media de todos ellos es: x=
A1 ⋅ m1 + A2 ⋅ m 2 +⋅⋅⋅ + An ⋅ m n A1 + A2 +⋅⋅⋅An
o sea, es la media aritmética ponderada de todas las medias. Ejemplo: En una cierta empresa de 80 empleados, 60 de ellos ganan 500.000 pesos al mes y los 20 restantes ganan 700.000 pesos al mes, cada uno de ellos. Se pide: a) Determinar el sueldo medio b) ¿Sería igual la respuesta si los primeros 60 empleados ganaran un sueldo medio de 500.000 pesos y los otros 20 un sueldo medio de 700.000 pesos? c) Comentar si ese sueldo medio es o no representativo. Cálculo de la media aritmética a partir de datos agrupados en clases. Hay dos métodos principalmente para calcular la media de una distribución con datos agrupados: método directo (o largo) y método abreviado (o corto). Método directo Consiste en aplicar la fórmula ya vista para el cálculo de la media ponderada, con la única salvedad de que se toman como valores representativos de la variable los puntos medios de cada intervalo, que se denotan con xm. O sea: x=
∑x
m
⋅ ni
n
Ejemplo: Hallemos la media aritmética por el método directo de la siguiente serie: 25 33 27 20 14 21 33 29 25 17 31 18 16 29 33 22 23 17 21 26 13 20 27 37 26 19 25 24 25 20 25 29 33 17 22 25 31 27 21 14 24 27 23 15 21 24 18 25 23 24 (Resp: 23,76) Método abreviado Consiste en elegir un intervalo en el que se supone que estará la media (aunque no sea así), y llamamos A al valor de la media supuesta, que coincidirá con el centro del intervalo elegido. Entonces aplicamos la fórmula x =A+
∑d ⋅ n n
i
Siendo d las desviaciones de las marcas de clase con respecto a la media supuesta A, y n i la frecuencia de cada intervalo. Ejemplo: Realizar el mismo anterior para poder comparar mejor los procedimientos. Este método abreviado es más rápido que el método directo, pues las operaciones que hay que realizar son más sencillas. Método clave Se diferencia fundamentalmente del método abreviado en que en lugar de calcular las desviaciones d de cada marca de clase a la media supuesta, simplemente se escriben al lado de cada marca unos números enteros “d”, que expresan el número de clases, más uno, que hay desde la marca considerada a la marca que coincide con la media supuesta. A estos números se les asigna signo menos si están por debajo de la media considerada y signo más si están por encima. La fórmula que se utiliza es la siguiente:
x =A+
∑n
i
⋅d
n
⋅I
donde I es un número igual a la amplitud o longitud de las clases o intervalos. Como ejemplo considerar el mismo de los dos casos anteriores. MEDIANA Una vez dispuestos todos los valores que toma la variable en una serie creciente o decreciente, el valor central de esa serie, si existe, es la mediana. Así pues, la mediana deja el mismo número de valores a su izquierda como a su derecha. Cuando no existe un valor central se puede definir como la media aritmética de los valores medios. Para su cálculo distinguiremos tres casos: a) Mediana de una serie con datos no agrupados. b) Mediana de una serie con datos agrupados por frecuencias y agrupados en intervalos. c) Mediana de una serie con datos agrupados sólo por frecuencias, pero sin agrupar en intervalos. Cálculo de la mediana con datos no agrupados Para calcular la mediana con datos no agrupados se ordenan los elementos en orden creciente o decreciente, y la mediana es el valor que ocupa el lugar
n +1 2
Ejemplos: Determinar la mediana de la serie 5, 6, 9, 11, 15, 19, 23, 26, 27. Luego de la serie 5, 7, 10, 15, 20, 21, 24, 27. En los dos ejemplos anteriores ocurría que la frecuencia de cada elemento era 1. Pero no siempre sucede así. Sea ahora la serie: 3, 4, 4, 4, 6, 8 donde el elemento 4 tiene una frecuencia 3. Consideremos el intervalo que comprende cada elemento desde 0,5 unidades a loa izquierda hasta 0,5 unidades a la derecha. En nuestra serie, los tres elementos 4 se distribuyen entre 3,5 y 4,5. Los representamos en el eje real de la siguiente forma:
Vemos que el valor 4,16 deja a su izquierda tres elementos (3, 4 y 4) y a su derecha otros 3 (4, 6 y 8), luego la mediana es 4,16. De la misma forma determina la mediana de 5, 6, 8, 8, 8, 8, 10, 12, 13. (Resp. 8,125) Cálculo de la mediana con datos agrupados Cuando los datos conviene agruparlos por intervalos, debido al elevado número de ellos, la mediana se calcula de la siguiente forma: 1. 2. 3. 4. 5.
Se calcula n/2. A la vista de las frecuencias acumuladas, se halla el intervalo que contiene a la mediana. Se calcula la frecuencia del intervalo que contiene a la mediana. Se halla uno cualquiera de los límites exactos (el superior o el inferior) del intervalo que contiene a la mediana. Sabiendo que límites exactos de un intervalo a – b, se refiere a los números a-0,5 y b+0,5. Se halla la frecuencia de los valores que quedan “por debajo” del intervalo que contiene a la mediana, o la frecuencia de los valores que quedan “por encima”, y según hayamos decido hacer, calculamos la mediana por alguna de estas dos fórmulas, respectivamente: M =I +
I n ( − fi ) fM 2
M =L −
I n ( −fs ) fM 2
siendo: M: Mediana l: Límite inferior del intervalo de la mediana. L: Límite superior del intervalo de la mediana I: Amplitud del intervalo de la mediana. fM: Frecuencia del intervalo de la mediana. fi: Frecuencia acumulada de los valores inferiores al intervalo de la mediana. fs: Frecuencia acumulada de los valores superiores al intervalo de la mediana. n: Número total de valores. Ejemplo 1: Clases 118 – 126 127 – 135 136 – 144 145 – 153 154 – 162 163 – 171 172 - 180
Frecuencias 3 5 9 12 5 4 2 40
Frecuencias Acumuladas 3 8 17 29 34 38 40
Con los tres primeros intervalos o clases, abarcamos 17 elementos y con las cuatro primeras abarcamos 29, luego está claro que la mediana se encuentra en la cuarta clase, pues n/2 = 20. Entonces l = 144,5 (límite inferior de la clase mediana) I = 9 (amplitud de cada intervalo) fM = 12 (frecuencia de la clase mediana)
fi = 17 (frecuencia acumulada en el intervalo inmediatamente anterior al de la mediana) n = 40 (número total de elementos de la serie) Luego
M =144,5 +
9 ( 20 −17) =146,8 12
Ejercicio: Determinar la mediana de la siguiente serie de valores, agrupando los datos por intervalos y por frecuencia con amplitud 4 y como primera clase la 10 – 14. Ten presente para este caso que los límites se hacen coincidir con los extremos. (Resp. M = 23) Cálculo de la mediana con datos agrupados sólo por frecuencias Se puede decir que es un caso particular del método anterior. El procedimiento es el siguiente: Una vez calculado el número alrededor del cual se encuentra la mediana, se considera este número como centro de un intervalo de amplitud 1; a continuación se aplica la fórmula anterior para el cálculo con datos agrupados en intervalos. Ejemplo: x 1 2 3 4 5 6 7 8 9 10
f 5 7 6 12 20 15 11 6 5 2
fa 5 12 18 30 50 65 76 82 87 89
n = 89/2 = 44,5 Por tanto, la mediana es un valor próximo a 5.
M = 4,5 +
1 ( 44,5 −30) = 5,225 20 MODA
La moda de una serie de números es el valor que se presenta con mayor frecuencia; es decir, el que se repite un mayor número de veces. Es por tanto, el valor común. Por ejemplo, en la serie: 2, 4, 4, 5, 5, 5, 7, 8, la moda es 5. En una distribución puede ocurrir que haya dos o más modas, entonces se habla de distribución bimodal, trimodal, etc. Incluso puede no existir la moda, como en la serie 2, 3, 4, 5, 7, 10. Cálculo de la moda con datos agrupados En el caso de una distribución de frecuencias con datos agrupados, si hiciéramos una gráfica o curva de frecuencias, la moda sería el valor (o valores) de la variable correspondiente al máximo (o máximos) de la curva. La moda se puede calcular aplicando la siguiente fórmula:
M o = l +(
∆1 )⋅I ∆1 + ∆ 2
donde: l: límite inferior de la clase que contiene a la moda. (Clase Modal) ∆1: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase contigua inferior. ∆2: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase contigua superior. I: Amplitud del intervalo de la clase. Ejemplo: Determinemos la moda de la siguiente distribución de frecuencias: Clase 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90
Frecuencia 11 14 21 30 18 15 7 3 119
Mo = 40 +
9 ⋅10 = 4,28 9 +12
Ejercicio: Hallar las tres medidas de tendencia central, media, mediana y moda, de la siguiente tabla:
Clases 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90
ni 11 14 21 30 18 15 7 3
fa
d
f⋅ d
Resp: 44,91; 44,5; 44,28 respectivamente. Consideraciones finales En general, la media aritmética es la medida más utilizada ya que se puede calcular con exactitud y se basa en el total de las observaciones. Se emplea preferentemente en distribuciones simétricas y es el valor que presenta menores fluctuaciones al hacer variar la composición de la muestra. Finalmente, la media aritmética
es especialmente útil cuando se precisa después calcular otros valores estadísticos, como desviaciones, coeficientes de correlación, etc. La mediana es preferida cuando la distribución de los datos es asimétrica, y cuando los valores extremos están tan alejados que distorsionarían el significado de la media. También se calcula la mediana en aquellas distribuciones en las que existen valores sin determinar, por ejemplo, aquellas cuya primera clase es del tipo “menos que x”, y la última clase: “más de y”. En definitiva, lo más importante de esta medida es que no se ve afectada por los valores extremos. Tiene, sin embargo, como inconveniente que se presta menos a operaciones algebraicas que la media aritmética. La moda es una medida que no suele interesar especialmente, a no ser que haya tal concentración de datos en la distribución que un valor destaque claramente sobre todos los demás. Puede servir también para cuando queramos estimar de una forma rápida, y no muy precisa, una medida de tendencia central. La moda, al igual que la mediana, es un valor que no se ve afectado por los valores extremos de la distribución y también es poco susceptible de efectuar con él operaciones algebraicas. Fuente: Estadística; Fernando García y Fernando Garzo, Editorial McGraw-Hill; Madrid