Story Transcript
MEDIDAS DE TENDENCIA CENTRAL Son valores numéricos que localizan e informan sobre los valores medios de una serie o conjunto de datos, se les considera como indicadores debido a que resumen la información como un todo. Las medidas de tendencia central pueden calcularse a partir de datos originales o a partir de datos agrupados en una tabla de distribución de frecuencias, las que consideraremos en este curso son la media aritmética, la mediana y la moda. MEDIA ARITMÉTICA. Es la medida de posición mas utilizada debido a que en forma empírica la hemos utilizado cuando determinamos el promedio aritmético de calificaciones semestrales; también se le conoce con el nombre de valor medio. Nos sirve para determinar el promedio matemático de un conjunto de datos, y posee como características la unicidad, facilidad de cálculo y la influencia negativa que ejercen los valores extremos en su determinación. Se simboliza por la letra griega μ (mu) si tomamos datos poblacionales y con la letra romana X (equis barra) si consideramos una muestra. Por Ejemplo al realizar una investigación respecto a los honorarios diarios que perciben 5 médicos de Tepic, se reportaron como valores $150.00, $150.00, $150.00, $200.00 y $1000.00. Para determinar el promedio sumamos los valores y al resultado lo dividimos entre el numero de observaciones: 150+150+150+200+1000 = 1650/5 = 330 valor no muy representativo del conjunto de datos como un todo ya que el único valor atípico ha tenido el efecto de inflar la media. Para hacer la determinación matemática de la media los cálculos respectivos se pueden realizar para datos originales o sin agrupar y para datos agrupados en una tabla de distribución de frecuencias. Para un conjunto de datos sin agrupar, sea X1, X2, X3,.........Xn, la media aritmética se obtiene sumando los productos de los valores por su frecuencia de aparición y dividiendo el valor obtenido entre el número total de datos que se sumaron, lo cual se puede apreciar en el siguiente modelo matemático:
Si los datos estan ordenados con su frecuencia de aparicion el modelo cambia a:
Donde Xi = Cada uno de los valores que forman el conjunto. n = Numero total de observaciones. fi = Numero de veces que se repite un mismo numero. A este modo de obtención de la media aritmética se le conoce como método largo. Ejemplo. Determine la media de los siguientes números: X1 = 2, X2 = 12, X3 = 9, X4 = 10 y X5 = 7.
x
= 2 + 12 + 9 + 10 + 7 / 5 = 8
Si graficamos estos números y su media tendremos: * * * * * 0 – 1 –2 – 3 – 4 – 5 – 6 – 7 – 8 – 9 – 10 – 11 – 12
x
Podemos observar claramente que la media aritmética es el punto de equilibrio entre los datos. Para un conjunto de datos agrupados en un tabular, la media se calcula partiendo de la suposición que todos los valores que caen dentro de un determinado intervalo de clase se localizan en el punto medio de clase el cual se obtiene calculando el promedio de los límites superior e inferior del intervalo. El modelo matemático es el siguiente:
x=
∑
mi n
fi
Ejemplo: Dados los siguientes datos agrupados en una tabla de distribución de frecuencias calcule su media aritmética. CLASES fi pm o mi 42‐46 2 42 + 46 /2 = 44 47‐51 9 47 + 51/2 = 49 52‐56 31 52 + 56/2 = 54 57‐61 50 57 + 61/2 = 59
52‐66 67‐71 72‐76
51 30 7
52 + 66/2 = 64 67 + 71/2 = 69 72 + 76/2 = 74
El punto medio del primer intervalo equivale a 42 + 46 entre 2 = 44. Los puntos medios de los siguientes intervalos pueden determinarse siguiendo el procedimiento antes descrito, o bien pueden calcularse sumando la amplitud del intervalo de clase al punto medio anterior. Si la amplitud es igual a 5, el punto medio del segundo intervalo seria igual a 44 + 5 = 49 y así sucesivamente los siguientes puntos medios. 44 + 5 = 49 49 + 5 = 59 50 + 5 = 64 51 + 5 = 69 52 + 5 = 74 Para encontrar la media aritmética, de acuerdo con el modelo matemático multiplicamos el punto medio por la frecuencia absoluta correspondiente de cada clase, sumamos estos productos y el resultado se divide entre el numero total de datos (n). CLASES pm o mi fi mi ∙ fi 42 – 46 44 2 88 47 – 51 49 9 441 52 – 56 54 31 1674 57 – 61 59 50 2950 62 – 66 64 51 3264 67 – 71 69 30 2070 72 – 76 74 7 518 TOTALES 180 11,005 11,005
x =
‐‐‐‐‐‐‐‐‐‐‐ = 61.14 180 MEDIANA Dentro de un conjunto de datos la mediana es un punto que tiene como característica el que divide al conjunto en dos partes iguales, se le identifica por el signo X o Me o Md. Tratándose de datos originales no necesitamos ninguna formula para hallar la mediana pero es preciso ordenarlos de menor a mayor o viceversa. Por ejemplo calcule la mediana
de los números 3.0, 27, 3.4, 3.2, 3.3, 3.1 y 12. Primero ordenamos los datos: 3.0, 3.1, 3.2, 3.3, 3.4, 12, 27. Por tanto la mediana será igual a 3.3 debido a que como el número de datos es 7 el valor de la mediana nos lo proporcionara el valor de orden X4. Para conjuntos de datos asimétricos la mediana es una mejor medida de tendencia central que la media. Si el numero de valores en un conjunto es par, los valores que dividen al conjunto en dos partes iguales son dos, por tanto Md será igual al promedio de estos valores centrales, por ejemplo los datos 54, 56, 62, 63, 65, 66, 67, 68, 68 y 70 se hallan ordenados, el valor de la Md estará dado por el promedio de las observaciones X5 y X6 es decir Me = 65 + 66 / 2 = 65.5. Si queremos determinar el valor de la mediana a partir de datos incluidos en una tabla de distribución de frecuencias los pasos a seguir son: 1. Localice la clase que contiene a la mediana por medio de las frecuencias acumuladas relativas, buscando cual de las clases contiene 50% de la información o poco mas. 2. Calcule la mediana con el siguiente modelo matemático:
⎛ n / 2 − fa ⎞ ~ ⎟⎟ i x = Lri + ⎜⎜ fc ⎠ ⎝
Lri = Limite real inferior de la clase que contiene la mediana. n = Numero total de observaciones del conjunto. fa = Frecuencia acumulada de la clase mediana. fc = Numero de observaciones en la clase que contiene la mediana. i = Tamaño del intervalo de clase. Ejemplo: Tabular de salarios mensuales de 100 trabajadores no calificados de la empresa Hotel Garza Canela en la ciudad de San Blas, Nayarit. CLASES fi fai 2400‐2599 7 7 2600‐2799 20 27 2800‐2999 33 60 3000‐3199 25 85 3200‐3399 11 96 3400‐3599 4 100
total
100
~ x
(100/2 – 27 ) 200 = 2799.50 + ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ = 2,938.90 33
MODA O MODO Es una medida de tendencia central que es poco usada porque puede no existir y muy a menudo puede no ser un valor único. La moda se define como el valor que ocurre con mayor frecuencia en un conjunto de datos, si existe un solo valor máximo decimos que es unimodal, si tiene dos o mas valores con la misma frecuencia máxima decimos que el conjunto es bimodal, trimodal, etc. Se representa por las letras Mo o por X (equis pico). Ejemplo: Sean los siguientes valores ordenados de manera ascendente. 56, 62, 62, 65, 65, 65, 65, 68, 70, 72. Como podemos observar en este conjunto de datos el numero 65 se presenta 4 veces, por tanto es el valor que ocurre con mayor frecuencia, por ello la moda será igual a 65. Si deseamos calcular la moda para datos agrupados en una tabla de distribución de frecuencias debemos seguir los siguientes pasos: 1. Localizar la clase que contiene a la moda, a través de la frecuencia absoluta que tenga mayor valor numérico. 2. Una vez localizada la clase modal aplicamos la siguiente ecuación:
xˆ =
⎛ Δ1 ⎜ Lri + ⎜ Δ 1 + Δ ⎝
2
⎞ ⎟⎟ i ⎠
Donde: Lri = Limite real inferior de la clase modal. Δ1 = Diferencia entre la fi de la clase modal y fi de la clase inmediata inferior. Δ2 = Diferencia de la fi de la clase modal y la fi de la clase inmediata superior. i = Tamaño del intervalo de clase.
Ejemplo: Con los datos incluidos en la siguiente distribución de frecuencias calcule la moda. CLASES fi 30.5‐33.5 1 33.5‐36.5 2 36.5‐39.5 6 39.5‐42.5 11 42.5‐45.5 16 45.5‐48.5 9 48.5‐51.5 4 51.5‐54.5 1 1er. PASO Determinemos cual es el intervalo de clase que tenga mayor frecuencia absoluta, claramente podemos observar que para este conjunto la case modal es 42.5 ‐ 45.5 debido y su frecuencia 16. 2º. PASO Para aplicar la formula ubiquemos primeramente los valores conocidos, nuestra incógnita y sustituyamos los valores en la ecuación. DATOS FORMULA Y DESARROLLO Lri = 42.5 Δ1 = 16 – 11 = 5 Λ
x = 42.5 + Δ2 = 16 – 9 = 7
5 (3) = 42.5 + 1.25 = 43.75 5+7
i = 3 Mo = ? RELACION Y USO DE LAS MEDIDAS DE TENDENCIA CENTRAL La media aritmética es la medida de posición más usual, ya que es la que mejor representa el valor medio de la población sin que influya el número de observaciones de la muestra.
La media es el valor de tendencia central recomendado para variables numéricas discretas. La mediana es la medida de tendencia central menos sensible ante un cambio de valor en una observación extrema, por lo que se recomienda utilizarla cuando la curva presenta asimetría o valores indeterminados, también es útil para variables continuas. La moda es la menos usada por su alta sensibilidad, aunque su cálculo sea fácil de obtener. Solo se usa con buenos resultados para variables categóricas nominales. Relación para polígonos de frecuencia unimodales y moderadamente asimétricos:
−
Λ
x =
−
≈
x = 3( x − x )
Relación para polígonos simétricos y unimodales:
−
Λ
≈
x = x = x
CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL CON DATOS NO AGRUPADOS. Ejemplo: Veinticinco empleados de la cadena de Moteles Candida estudiaron un curso de primeros auxilios, al termino del mismo se les practico un Evaluación de lo aprendido contando con 20 puntos en total y los resultados fueron los siguientes: 17, 17, 16, 16, 17, 19, 12, 19, 17, 16, 14, 15, 18, 18, 14, 20, 15, 15, 17, 18, 17, 16, 16, 13, 17. Con la información proporcionada calcule las Medidas de Tendencia Central. Primero ordenamos los datos de manera ascendente y la concentramos en un tabular, donde en l primera columna ubicamos los posibles datos diferentes, seguida de las veces que se repite cada uno de ellos. Enseguida consideramos los modelos matemáticos a utilizar o bien los razonamientos en los que nos basaremos para calcular la media, mediana y moda. Xi fi Xi*fi fai 12 1 12 1 13 1 13 2 14 2 28 4 15 3 45 7
16 17 18 19 20
5 7 3 2 1 Σ 25
80 119 54 38 20 Σ 409
12 19 22 24 25
x=
409 = 16 . 36 ≈ 16 . 4 25
Como la mediana se define como el valor o dato que divide al conjunto en 2 partes exactamente iguales, como n = 25, el dato buscado es X13 pues hay 12 datos antes y 12 después, y su valor lo obtenemos a través de la frecuencia acumulada absoluta, y así X13 = 17. La moda es el valor que mas veces se repite, por lo que analizando el tabular observamos que el valor 17 es el que se repite mas veces ( 7 ), por tanto la moda es 17. CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL CON DATOS AGRUPADOS. Ejemplo: Los datos corresponden a estatura de 150 alumnos elegidos al azar de la Escuela Vocacional No.7 en México D. F. en el ciclo escolar 1999‐2000. Determine las Medidas de Tendencia Central correspondientes. Clases fi mi fai mi*fi 146‐151 8 148.5 8 1,188.0 152‐157 18 154.5 26 2,781.0 158‐163 38 160.5 64 6,099.0 164‐169 30 166.5 94 4,995.0 170‐175 39 172.5 133 6,727.5 176‐181 12 178.5 145 2,142.0 182‐187 4 184.5 149 738.0 188‐193 1 190.5 150 190.5 TOTAL 150 24,861.0
x=
24 ,861 . 0 = 165 . 74 150
⎛ 150 / 2 − 64 ⎞ ~ x = 163 .5 + ⎜ ⎟ 6 = 163 .5 + 2 .2 = 165 .70 30 ⎠ ⎝
xˆ =
⎛ 9 ⎞ ⎟6 = 169 .5 + 1.5 = 171 .00 169,5 + ⎜ ⎝ 9 + 27 ⎠