Story Transcript
UNIDAD Nº2 MEDIDAS DE TENDENCIA CENTRAL 1.- MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN 1.1.- Definición.- Es un estadígrafo en donde el conjunto de la información tiende a concentrarse en el centro de la distribución, es por eso que también se la conoce como medida de localización ya que alrededor de ella giran todos los datos del conjunto. Entre las principales medidas de posición tenemos: la media Aritmética, la Mediana, la Moda, la media Armónica, la media Geométrica, la media Cuadrática, los Cuartiles, los Deciles y los Percentiles. 1.2.- Media Aritmética.- Es el estadígrafo más conocido y también el mas utilizado y al ser el mas estable se localiza en el centro de la distribución de frecuencia. El procedimiento de cálculo se lo efectúa según la distribución de la información, es decir para cuando los datos están agrupados, o están sin agrupar y para cuando los datos están ponderados o sin ponderar. a)Media Aritmética Para Datos no Agrupados (Datos Sencillos).Es la sumatoria de todos los valores de las observaciones divididos entre el número total de cantidades observadas. Ejemplo.- Dadas estudiantes:
las
siguientes
edades
de
un
8,10,12,14,16 años. Encontrar la edad promedio. K
Y =
∑yi i=1
8+10+12+14+16 Y = ──────────────── = 12 Años 5
k Y Yi k
= Promedio de los valores de las observaciones = Valores de las observaciones = Cantidad de observaciones estudiadas
elaborado por: msc. gustavo roger gomez suarez
grupo
de
b)Media Aritmética Para Datos Agrupados (Datos Tabulados).- Es la sumatoria del producto de la marca de clases (Yi) por la frecuencia absoluta(fi) y dividida entre la sumatoria total de los valores de las observaciones (Numero de Observaciones). Ejemplo.- Cuál será el promedio de las notas obtenidas por 15 estudiantes de Estadística I?
┌────────────────┐ │ Yi │ fi│Yi. fi│ ├─────┼───┼──────┤ │ 18.5│ 4 │ 74. │ │ 35.5│ 3 │ 106.5│ │ 52.5│ 2 │ 105. │ │ 69.5│ 3 │ 208.5│ │ 86.5│ 3 │ 259.5│ └─────┼───┼──────┤ │ 15│ 753.5│ └───┴──────┘
K
Y =
∑yi*fi i=1
N K
N = ∑fi i=1
Y = 753.5 = 50.23
Es la nota promedio de los 15 estudiantes.
15 *Existe otra forma más directa para calcular la media aritmética la cual resulta de la sumatoria del producto de las marcas de clases por la frecuencia relativa (simple).
k Y= Σ Yi*hi i=1
Y=(18.5x0.27)+(35.5x0.20)+(52.5x0.13)+(69.5x0.20)+(86.5x0.20) = 50.23
C)Media Aritmética Ponderada.- En los datos no agrupados (sencillos) la ponderación de los valores de cada variable es igual a la unidad (1). En los datos agrupados su ponderación es la frecuencia absoluta. En el caso de los datos ponderados la media aritmética se calcula multiplicando la ponderación de cada valor de la variable, por el valor de cada observación y dividiéndola entre el numero total de ponderaciones. elaborado por: msc. gustavo roger gomez suarez
Ejemplo.- Dadas las notas obtenidas por un estudiante de ESTADÍSTICA en los distintos exámenes del presente semestre: ┌───────────┐ │ k │ │ Σ Yi *Wi│ │Yp=i = 1 │ │ k │ │ Σ Wi│ │ i = 1│ └───────────┘
┌──────────┬─────┬───────┬──────┐ │ EXAMEN │NOTAS│VALORES│ Yi.Wi│ ├──────────┼─────┼───────┼──────┤ │1º Parcial│ 40 │ 15 │ 600 │ │2º Parcial│ 60 │ 15 │ 900 │ │3º Parcial│ 50 │ 15 │ 750 │ │T. Pract. │ 80 │ 10 │ 800 │ │Ex.Pract. │ 70 │ 10 │ 700 │ │Ex.Final │ 30 │ 35 │ 1050 │ Yi = Valores de Obsev. └──────────┼─────┼───────┼──────┤ Wi =Valores de Ponder. │ │ 100% │ 4800 │ │(Yi) │ (Wi) │ │ Y= 4800 = 48 es su Nota promedio 100
Ejemplo Nº2 5 2 3
Alumnos " "
sacaron 60 puntos " 80 " " 40 "
Yi = Notas Wi = Alumnos Y= (60x5)+(80x2)+(40x3) = 58 es su Nota promedio 10 1.2.- Propiedades de la Media Aritmética 1º) La media aritmética de una constante (k) es igual a la misma constante. Y1 Y2 Y3 Y4 Y5
= = = = =
2 2 2 2 2
Y = Σ Yi => 2+2+2+2+2 = 2 k 5 Y = 2 Se cumple
elaborado por: msc. gustavo roger gomez suarez
2º) La media aritmética de una variable más o menos una constante, es igual a la aritmética de la variable más o menos la constante. Y ± K => Σ (Yi ± k) fi N ┌────┬──┬───┬────────┐ │ Yi │fi│ k │(Yi+k)fi│ ├────┼──┼───┼────────┤ │18.5│ 4│ 2 │ 82 │ │35.5│ 3│ 2 │ 112.5 │ │52.5│ 2│ 2 │ 109. │ │69.5│ 3│ 2 │ 214.5 │ │86.5│ 3│ 2 │ 265.5 │ └────┼──┼───┼────────┤ │15│ │ 783.5 │ └──┘ └────────┘
Y+k = 783.5 = 52.23 15 Y = 50.23 k = +2 Y+k = 52.23
Se cumple
3º) La media aritmética de una variable multiplicada o dividida por una constante, es igual a la media aritmética de la variable multiplicada o dividida por la constante. Y */ k => Σ (Yi*/k) fi N ┌──┬─────────┐ │k │ (Yi.K)fi│ Y*K ├──┼─────────┤ │2 │ 148 │ Y = │2 │ 213 │ K = │2 │ 210 │ │2 │ 417 │ │2 │ 519 │ └──┴─────────┘ 1507
= 1507 = 100.46 50.23 x 2 100.46
Se cumple
4º) La suma de las desviaciones ponderadas de los valores de las variables respecto a su media aritmética es igual a (0). Σ(Yi-Y)fi = 0
(Yi-Y)fi ───────────── 18.5 - 50.23 x 35.5 - 50.23 x 52.5 - 50.23 x 69.5 - 50.23 x 86.5 - 50.23 x
4 3 2 3 3
= - 126.90 = - 44.20 = 4.50 = 52.80 = 108.80 ─────────── 0.- Se cumple
elaborado por: msc. gustavo roger gomez suarez
1.2.2 Métodos Abreviados de cálculo.- Cuando el cálculo de la media aritmética se lo efectúa para datos agrupados, se puede realizar de dos maneras sencillas que nos ahorran una perdida innecesaria de tiempo y este cálculo lo realizamos de una forma más rápida, mediante los siguientes métodos: a) Método de las Desviaciones por la Amplitud de Intervalo Consiste en reducir el tamaño de la variable en términos de los desvíos respecto a un origen de trabajo arbitrariamente elegido con preferencia que sea una marca de clases. La base de cálculo está dada por la siguiente formula: Ejemplo.Y= Ot + Σ Z'i fi N Ot = Origen de Trabajo de (Yi) Z'i = Yi - Ot Ot = 52.5 ┌────┬────┬──────────────┬──────┬──────┐ │ Yi │ fi│ Yi-Ot= │ Z'i │Z'i.fi│ ├────┼────┼──────────────┼──────┼──────┤ │18.5│ 4 │ 18.5 - 52.5 =│ -34 │ -136 │ │35.5│ 3 │ 35.5 - 52.5 =│ -17 │ - 51 │ │52.5│ 2 │ 52.5 - 52.5 =│ 0 │ 0 │ │69.5│ 3 │ 69.5 - 52.5 =│ 17 │ 51 │ │86.5│ 3 │ 85.5 - 52.5 =│ 34 │ 102 │ └────┼────┼──────────────┴──────┼──────┤ │ 15 │ │ -34 │ └────┘ └──────┘
Y = 52.5+(-34) 15 Y = 52.5 - 2.27 Y = 50.23
b) Método de Desviación Unitaria.- Consiste en expresar las desviaciones de las unidades de intervalos divididas entre la amplitud de intervalo. Este método es de gran utilidad cuando se tiene una amplitud de intervalos constante. C *( Σ Z"i fi) ───────────── N Yi - Ot Z'i ─────── => ─── C C
Y = Ot + Z"i =
elaborado por: msc. gustavo roger gomez suarez
┌─────────┬────┬──────┐ │ Z'i/c │Z"i │Z"i fi│ ├─────────┼────┼──────┤ │-34/17 = │-2 │ -8 │ │-17/17 = │-1 │ -3 │ │ 0/17 = │ 0 │ 0 │ │ 17/17 = │ 1 │ 3 │ │ 34/17 = │ 2 │ 6 │ └─────────┴────┼──────┤ │ -2 │
Y= 52.5 +
17*(-2) N Y= 52.5 + (-34) 15 Y= 52.5 - 2.27 Y= 50.23
1.3 Mediana.-Es un valor aritmético que divide las observaciones en dos partes iguales, de tal manera que los valores anteriores a la mediana, son iguales a los valores posteriores a esta en número de datos. Procedimiento de cálculo: Al igual que la media aritmética su base de calculo se la realiza en base a la distribución de datos es decir la mediana se calcula para datos sencillos y para datos agrupados. a) Mediana para Datos no Agrupados (sencillos).- Cuando los datos u observaciones no se encuentran procesados en una tabla de distribución de frecuencia, se los ordena en forma ascendente o descendente y se ubica el valor central que se constituye en el valor de la mediana. En el caso de que no exista un solo valor central (valores pares) la mediana se determina tomando los valores existentes en el centro de las observaciones y determinando su media aritmética simple. Ejemplo Nº1 ( Serie Impar.) 2
5
7
10
1)Datos
13
13 5 2 10 7
│ ↓ Me = 7 Ejemplo Nº2 (Serie Par) 2
5
7
10
13
│ │ ↓ Me= 7+10 = 8.5 2
2)Datos 15
13 5 2 10 7 15
elaborado por: msc. gustavo roger gomez suarez
b) Mediana para datos Agrupados(tabulados).- El primer paso antes de utilizar la formula de la mediana, consiste en identificar el intervalo de trabajo de nuestra tabla de distribución de frecuencia, dividiendo entre dos el número total de observaciones, para conocer el valor central de la distribución (J= N/2),luego el valor resultante se lo aproxima un valor de la Frecuencia Absoluta Acumulada Ascendente (Fi )al cual no debe exceder; en el caso que este resultado sobrepase al valor de (Fi ) se debe seleccionar el valor inmediato superior de dicha frecuencia, para que así pueda ingresar al intervalo de trabajo, el valor que está exactamente en el centro de la distribución . La formula de la mediana para datos agrupados esta dada por; ┌── ──┐ │ Cj (N/2 - F j-1) │ Me = Y'j-1 + │──────────────────│ └── fj ──┘ Y'j-1 = Limite inferior del intervalo de trabajo. Cj = Amplitud del intervalo de trabajo N/2 = Es el valor que define el intervalo de trabajo en la Frecuencia absoluta acumulada ascendente (superior) Fj-1 = Frecuencia absoluta acumulada anterior al intervalo de trabajo. Fj = Frecuencia absoluta (simple) del intervalo de trabajo. Ejemplo.- Con los datos del ejercicio anterior central (mediana) de:
hallar el valor
┌──────┬───┬────┬───┐ │Y'i-1 │Y'i│ fi │Fi↑│ ├──────┼───┼────┼───┤ │ 10 │ 27│ 4 │ 4│ J-2 │ 27 │ 44│ 3 │ 7│ J-1 │ 44 │ 61│ 2 │ 9│ = J │ 61 │ 78│ 3 │ 12│ J+1 │ 78 │ 95│ 3 │ 15│ J+2 └──────┴───┼────┼───┘ │ 15 │ └────┘ 1º) Hallar J=
N 2
= 15 = 7.5 2
Al valor Superior de (Fi↑) = 9
elaborado por: msc. gustavo roger gomez suarez
┌───────────────────────────────┐ │ ┌─ ─┐ │ │ │Y'j-1+ Cj (N/2 - Fj-1)│ │ 2º) Reemplazar; Me = │ │ ─────────────────────│ │ │ └─ fj ─┘ │ └───────────────────────────────┘ ┌─ ─┐ │ 17(7.5-7) │ Me = 44 + │───────────│= 48.25 └─ 2 ─┘ Interpretación: El 50% del Curso tienen notas menores a 48.25 1.3.1 Medidas Asociadas a la Mediana.- Las medidas se encuentran asociadas a la mediana son: Los Cuartiles, Deciles, y Percentiles. a) Cuartiles.- Es la medida que divide la información en cuatro partes iguales en la cuál se denomina al 1º Cuartil como el 25% de la información; al 2º Cuartil como el 50%, al 3º Cuartil el 75% y al 4º Cuartil el 100% El método de cálculo es similar al de la mediana con la variación en el coeficiente de (N*k) y en el cociente que es igual a cuatro en vez de dos como en la mediana. N*K Cj( 4 - Fj-1) Qk = Yj-1 + ────────────── fj * Donde: K = Cantidad de Cuartiles en la que va a ser dividida la información. Ejemplo.- Con los datos de la tabla anterior, se pide encontrar las notas del 75% de los estudiantes (el cuartil Nº3) ┌──────┬────┬───┬───┐ │Y'i-1 │Y'i │fi │Fi↑│ ├──────┼────┼───┼───┤ │ 10 │ 27 │ 4 │ 4 │ │ 27 │ 44 │ 3 │ 7 │ │ 44 │ 61 │ 2 │ 9 │J-1 │ 61 │ 78 │ 3 │12 │J │ 78 │ 95 │ 3 │15 │J+1 └──────┴────┼───┼───┘ │15 │ └───┘
elaborado por: msc. gustavo roger gomez suarez
J = NK = 15(3) = 11.25 en el valor Superior Fi=12 4 4 Q3 = 61+ 17(11.25-9) = 73.75 El 75% del Curso han obtenido notas menores a 73.75 b) Deciles.- Es la medida que divide a la información en diez partes iguales; su formula es similar a la de la mediana solo que esta vez la información debe ser dividida entre diez.
Dk = Y'j-1 +
N*k Cj ( 10 - fj-1) ──────────────── fJ
Ejemplo.-Con los datos de la tabla anterior, encontrar el decil Nº8 N*k 15(8) 120 D = ──── => ───── = ───── = 12 10 10 10
en Fi = 12 exactamente
D8 = 61 + 17 (12-9) = 78 3 El 80% del Curso han obtenido notas menores a 78 c) Percentiles.- Es la medida que divide la información en 100 partes iguales y su diferencia con la mediana es en el cociente que será igual a 100. N*K Cj (100 - Fj-1) Pk = Y'j-1 + ─────────────── fj Ejemplo.percentil
Con los Nº41
datos
de
la
tabla
anterior,
Nk 15(41) J=───── =>─────── = 6.15 El valor superior de Fi=7 100 100 P41 = 27 + 17(6.15-4) = 39.18 3 elaborado por: msc. gustavo roger gomez suarez
encontrar
el
1.4 Moda.- Es el valor de la variable al que le corresponde la máxima frecuencia u ocurrencia, es decir la cantidad que se repite mayor número de veces. Cuando la mayor frecuencia de un suceso ocurre una sola vez, se dice que la distribución tiene una sola moda a la cual se le denomina "Unimodal". Cuando la serie tiene dos modas se le denomina serie "Bimodal" y cuando tiene tres o más modas se denomina se le denomina serie "Multimodal". Al igual que la media aritmética y la mediana la moda se puede calcular de acuerdo a la distribución de los datos. a)
Moda para Datos no Agrupados (Sencillos) .- Se trata de identificar los valores que se repiten mayor numero de veces.
Ejemplo: a) b) c) d)
1 1 1 1
2 2 2 2
3 2 3 3
4 3 3 3
5 4 4 4
6 4 5 5
7 4 6 6
5 6 6
6 7 7
7 8 8
9 8
=> => => 9 =>
Moda inexistente Serie Unimodal = 4 Serie Bimodal = 3 y 6 Serie Multimodal=3,6 y 8
b) Moda para Datos Agrupados.- El primer paso consiste en identificar el intervalo de mayor frecuencia es decir el valor mayor de fi, al cuál se lo denomina frecuencia modal (k). Luego se determina el valor de la moda mediante la formula siguiente. Ck.di Mo= Y'K-1 + ─────── d1 +d2
K = Frec. Modal-valor mayor de fi d1= difer. entre la frec. modal y Premodal d2= " " " " Postmodal
Ejemplo.- En base a la tabla de distribución de frecuencia del ejercicio anterior, se pide encontrar la nota de mayor frecuencia. K = 4 (en fi) d1 = 4-0 = 4 d2 = 4-3 = 1
17 .4 Mo = 10 + ─────── 4+1
= 23.6
La nota de mayor frecuencia es 23.6 1.5 Comparaciones y Relaciones entre la Media Aritmética, la Mediana, y la Moda.- Las representaciones gráficas de los mencionados estadígrafos son los que determinan la forma o simetría de la distribución. Los tres casos de relaciones están basados en las curvas resultantes con relación al eje central.
elaborado por: msc. gustavo roger gomez suarez
a) Serie Asimétrica Positiva.-(Sesgada hacia la derecha).- El valor de la moda será menor que el de la mediana y la media aritmética. b) Serie Simétrica.exactamente igual.
El
valor
de
los
tres
estadígrafos
es
c) Serie Asimétrica Negativa.-(Sesgada hacia la izquierda).- El valor de la moda será mayor que el de la mediana y la media aritmética. ↑ │ │ │ │ (+) └──────────> Y > Me > Mo
↑ │ │ │ │ └───────────> Y = Me = Mo
↑ │ │ │ │ (-) └───────────> Y < Me < Mo
La Media Aritmética , la Mediana , y la Moda son las medidas de tendencia central o posición mas utilizadas y por ende susceptibles a ser comparadas. - La media aritmética es la mediada mas conocida por su fácil método de cálculo y por que es mas representativa al tomar en cuenta el total de las observaciones. - La mediana o valor central toma en cuenta los valores extremos y tiene la ventaja que en su estudio se utilizan algunos elementos muy diferentes de lo otros estadigrafos. - La moda es una mediada poco utilizada, ya que su interés se basa solamente en los valores que se presentan más frecuentemente en una distribución. 1.6 Media Geometríca.- Es la raíz "n" del producto de los "n" valores de las variables. Es de gran utilidad para el cálculo de tasas de crecimiento relativamente constantes tal como la tasa de crecimiento poblacional, montos de tasa de capital sujetos a una tasa de interés compuesto etc. a) Media Geometría k
Mg =
para Datos no Agrupados.-(Datos sencillos).
k
π Yi
=
5
y1*y2*y3……..yk
=
2*3*4*5*6 = 3.73
elaborado por: msc. gustavo roger gomez suarez
Otra forma de calcular la Media Geométrica:
Log Mg = log2+log3+log4+log5+log6 = 0.571466 antilog = 3.73 5 b) Media Geometríca N
para Agrupados
N
π Yi
Mg =
fi
=
y1f1*y2f2*y3f3……ykfk
N
18.54*35.53*52.52*69.53 *86.53 = 42.96
Mg =
Otra forma de calcular la Media Geométrica : Log Mg = log18.5*4+log35.5*3+log52.5*2+log69.5*3+log86.5*3 15 = 1.6333 antilog = 42.98 Nota.- La media Geometría está limitada al valor de las variables los cuales deben ser valores positivos ya que si algún valor es (0) la media geometría será (0) y si el valor es negativo, la medida geometríca será imaginaria, lo cual dificulta su interpretación. 1.7 Media Armónica.- Se define como el recíproco de la media geometría de los valores recíprocos de las variables. Es utilizado para obtener un valor representativo en un conjunto de datos expresados en forma de tasa y nos indica la cantidad de unidades del tipo por cada unidad de otra especie. a) Media Armónica para Datos no Agrupados(Datos sencillos) Ejemplo.- Si en 5 grupos de obreros se fabrican 2,3,4,5,y 6 bicicletas respectivamente. Cuál será la productividad diaria de la fabrica? Ma=
∑
K 1/yi
=
5 1/2+1/3+1/4+1/5+1/6
=
5 = 3.45 1.45
b) La Media Armónica para Datos Agrupados Ejemplo.- En base a la tabla de distribución de frecuencias pide hallar la media armónica. Ma=
∑
N fi/yi
=
15 0.22+.08+.04+.04+.04
= 15 = 35.71 0.42
elaborado por: msc. gustavo roger gomez suarez
1.8 Media Cuadrática.- Es la raíz media de las observaciones de los cuadrados de los valores de las variables. Es de gran utilidad para el cálculo de la desviación Standard. a) Media Cuadrática para Datos no Agrupados(Datos sencillos) Ejemplo.-Valores 2,3,4,5,y 6 Mc=
∑
yi2 K
=
∑
y12+y22+y32+…yk2 = K
22+32+42+52+62 = 4.24 5
b) Media Cuadrática para Datos Agrupados Mc=
∑
yi2fi = N
∑
y12f1+y22f2+y32f3+…yk2fk = N
45.599.75= 56.33 15
1.9 Comparación entre las Medias: Aritmética, Geométrica, Armónica, y Cuadrática 1º)La media aritmética y la media Cuadrática se ven inferenciadas por valores superiores. 2º)La media Armónica y la media Geométrica se ven inferenciadas por valores menores. 3º)Si se utilizan los mismos parámetros de comparación se deduce que: MA < MG < Y < MC
MA < MG < Y < MC FIN …
elaborado por: msc. gustavo roger gomez suarez