4. Medidas de tendencia central

4. Medidas de tendencia central ´ obtenida a un solo valor A veces es conveniente reducir la informacion ˜ de valores, las denominadas medidas de te

0 downloads 155 Views 232KB Size

Story Transcript

4.

Medidas de tendencia central

´ obtenida a un solo valor A veces es conveniente reducir la informacion ˜ de valores, las denominadas medidas de teno a un numero pequeno ´ dencia central. Sea X una variable estad´ıstica con valores x1 , x2 , . . . , xk y frecuencias n 1 , n2 , . . . , n k . ´ Media aritmetica (x) x1 n1 + x2 n2 + . . . + xk nk = x= N

Pk

i=1

xi ni

N

=

k X

xi fi

i=1

• La media es muy sensible a los valores extremos de la variable, ´ por lo que no es conveniente usar la media aritmetica como ´ medida central en distribuciones muy asimetricas. ´ • El valor de la media aritmetica puede no pertenecer al conjunto de valores que puede tomar una variable aleatoria discreta. Por ˜ ejemplo, el numero medio de hijos en las familias espanolas es ´ x = 1,2. ´ Media geometrica (xG ) xG =

q N

xn1 1 · xn2 2 . . . xnk k

Esto implica que: k 1 X log xG = ni log xi N 1

Observamos que si ∃ i t.q. xi = 0 ⇒ xG = 0. ´ Media cuadratica (xQ ) p xQ =

x21 n1

+

x22 n2 √

+ ... +

N

10

x2k nk

s =

Pk

x2i ni N

1

´ Media armonica (xA ) N xA = Pk

ni i=1 xi

Esta media no tiene sentido si ∃ i t.q. xi = 0. Prop. xA ≤ xG ≤ x ≤ xQ Mediana (Me).- Es la medida central que, supuestos los valores de la variable ordenados en forma creciente, deja igual numero de ob´ ´ servaciones inferiores que superiores a ella. Veamos como calcularla: • En caso de que la frecuencia de cada valor es 1. - no impar de valores: la mediana es el valor central. Ej. {1, 3, 7, 10, 15}, Me=7. ´ - no par de valores: la mediana es la media aritmetica de las 10+21 dos centrales. Ej. X = {1, 3, 5, 10, 21, 27, 36, 42}, Me= 2 =15.5 • Mediana de una variable discreta.

1. Dividimos el numero de observaciones entre 2, N/2. ´ 2. Comprobamos si N/2 esta´ en la tabla de frecuencias absolutas acumuladas. 11

´ estara´ comprendido entre dos. La mediana es 3. Si no esta, el valor de la variable que corresponde al mayor. ´ la mediana vendra´ dada por: 4. Si esta, Me= xk +x2 k+1 . • Mediana de una variable agrupada. 1. Dividimos el numero de observaciones entre 2, N/2. ´ 2. Comprobamos si N/2 esta´ en la tabla de frecuencias absolutas acumuladas. ´ N/2 estara´ entre Nk y Nk+1 . Para conocer la 3. Si no esta, ´ exacta de la mediana hay que interpolar: posicion x ak+1 − ak = ⇒ Me = ak + x Nk+1 − Nk N/2 − Nk ´ N/2 sera´ la frecuencia absoluta acumulada de un 4. Si esta, cierto intervalo, y la mediana sera´ el extremo superior del mismo.

12

´ frecuencia. Moda (Md).- Es el valor de la variable que tiene mas ´ ´ se No tiene por que ser unica. Si hay dos modas, la distribucion ´ llama bimodal. Si hay tres, trimodal, etc. Cuando la variable viene agrupada en intervalos de clase se habla de intervalo modal, que es el intervalo tal que en su histograma es el intervalo al que le ´ ´ corresponde al rectangulo de mayor area por unidad de base. La ´ puntual viene dada por: situacion Md = a + (b − a)

δ1 δ1 + δ2

Cuartiles.- Son tres valores de la variable que dividen las observaciones en cuatro partes iguales. 1. Primer cuartil (P 1 ): es el valor de la variable que deja la cuarta 4 ´ y las tres parte de las observaciones menores o iguales a el ´ Se calcula de manera analoga ´ cuartas partes superiores a el. a la mediana. 2. Segundo cuartil (P 2 ): es la mediana. 4

´ las tres cuar3. Tercer cuartil (P 3 ): deja inferiores o iguales a el 4 tas partes de las observaciones, y la cuarta parte restante es ´ Se calcula de manera analoga ´ superior a el. a la mediana.

13

´ Deciles.- El decil k−esimo (Dk ) es el valor de la variable que deja k ´ inferiores o iguales a el las 10 partes de las observaciones. Es decir, ´ el 10 × k por 100, donde k = 1, 2, . . . , 9. Se calcula de forma analoga a la mediana. ´ Centiles o percentiles.- El percentil k−esimo (Pk ) es el valor de k ´ las 100 partes de las la variable que deja inferiores o iguales a el observaciones, es decir, el k por 100, donde k = 1, 2, . . . , 99. Su ´ calculo se realiza como el de la mediana, los cuartiles y deciles.

5.

´ o concentracion ´ Medidas de dispersion

´ de la muestra Las medidas de tendencia central reducen la informacion ´ proximo ´ a un solo valor, pero este valor a veces estara´ mas a la realidad y a veces menos. Por ejemplo, consideremos la variable estad´ıstica X que toma los valores 0, 100, 200, cada uno de ellos con frecuencia absoluta ´ ´ 1. La media aritmetica sera: x=

0 + 100 + 200 = 100. 3

Si tomamos ahora otra variable Y que toma los valores 99, 101, cada ´ ´ una de ellas una sola vez. En este caso la media aritmetica sera: y=

99 + 101 = 100. 2

´ Vemos que la media aritmetica de las dos variables es 100. Sin em´ dispersa que la Y , por lo que la bargo, la variable X esta´ mucho mas representatividad de y es mayor que la de x. ´ o concentracion ´ nos van a cuantificar la reLas medidas de dispersion ´ presentatividad de los valores centrales. Notemos que los terminos con´ y dispersion ´ pueden ser utilizados indistintamente, pues alta centracion ´ es equivalente a baja concentracion ´ y baja dispersion ´ equidispersion ´ vale a alta concentracion.

14

´ t´ıpica Varianza y desviacion • Varianza.- Viene dada por Pk 2 2 i=1 (xi − x) ni σ = N La varianza toma siempre valores positivos. En caso de ser ´ σ 2 = 0, todos los xi coinciden con la media aritmetica , es de´ concentradas en un mismo cir, todas las observaciones estan ´ es nula. punto, por lo que la dispersion Como sus unidades son las del cuadrado de la variable, se sue´ le usar su ra´ız cuadrada, como vemos a continuacion. ´ t´ıpica.- Se define como la ra´ız cuadrada positiva • Desviacion de la varianza: s Pk 2 √ i=1 (xi − x) ni σ = σ2 = N

• Propiedades: ´ t´ıpica son sensibles a la varia1. La varianza y la desviacion ´ de cada uno de los valores que toma la variable. Es cion ´ cambia, tambien ´ ellas cambiaran. ´ decir, si una puntuacion ´ es que la varianza es funcion ´ de cada uno de los La razon valores xi de la variable. ´ t´ıpica tiene la propiedad de que en el inter2. La desviacion valo (x − 2σ, x + 2σ) se encuentra, al menos, el 75 % de las observaciones. 3. No es recomendable el uso de ninguno de ellas cuando tampoco lo sea el de la media como medida de tendencia central.

15

´ vienen da´ Estas medidas de dispersion Coeficiente de variacion das por numeros concretos (unidades en las que viene medida la ´ variable), por tanto no son utiles para comparar las dispersiones de ´ dos muestras expresadas en unidades diferentes. Por ejemplo, si medimos la masa de dos poblaciones, pero una de ellas la medimos ´ de felinos) y otra en miligramos en kilogramos (para una poblacion ´ de hormigas) se tiene que habra´ una diferen(para una poblacion ´ puede cia enorme entre las medias de ambas poblaciones. Tambien ocurrir que queramos comparar dos variables distintas, como el peso ´ de elefantes. Para esos casos utilizarey la altura de una poblacion ´ dadas por numeros mos medidas de dispersion abstractos. ´ ´ de Pearson.- Elimina la dimensiona• Coeficiente de variacion ´ existente lidad de las variables, y tiene en cuenta la proporcion ´ t´ıpica. Viene dado por entre medias y desviacion C.V. =

σ x

• Propiedades: ´ se debe calcular para variables con todos los valores 1. Solo positivos. Todo ´ındice de variabilidad debe ser no negativo. ´ trabajamos con variables positivas para tener la seguSolo ridad de que x > 0. 2. Este coeficiente no puede hallarse si x = 0. 3. Este coeficiente a veces aparece multiplicado por 100. 4. No es invariante frente a cambios de origen. Es decir, si a los resultados de una medida le sumamos una cantidad positiva, b > 0, para tener Y = X + b, entonces C.V.Y < C.V.X . 5. Es invariante a cambios de escala. As´ı por ejemplo el coe´ de una variable medida en kilogramos ficiente de variacion es una cantidad adimensional, que no cambiara´ si la medi´ se realiza en miligramos. cion

16

´ Tipificacion.Este proceso consiste en restar la media x y dividir ´ t´ıpica σ a una variable dada X. As´ı se obtiene una por su desviacion nueva variable X −x Z= σ ´ t´ıpica σZ = 1 denominada variable de media z = 0 y desviacion tipificada. La variable tipificada Z carece de unidades, y permite comparar medidas que no son directamente comparables. Por ejemplo, nos po´ grueso que una hormiga demos preguntar si un elefante es mas ´ a su poblacion. ´ determinada, cada uno en relacion ´ sirven para comparar las variabilidaLos coeficientes de variacion des de dos conjuntos de valores (muestras o poblaciones), mientras que si queremos comparar dos individuos de cada uno de estos conjuntos, es necesario usar los valores tipificados.

6.

Medidas de asimetr´ıa y apuntamiento

´ ´ distriEstudiamos ahora como saber si los datos que tenemos estan ´ buidos de forma simetrica son respecto a un valor central, o bien si la ´ ´ de frecuencias no es simetrica. ´ grafica que representa la distribucion En ´ simetrica, ´ caso de tener una distribucion cabe preguntarnos si la distri´ es mas ´ o menos apuntada (larga y estrecha). Este apuntamiento bucion ´ de frecuencias que se lo mediremos comparando con cierta distribucion considera normal. 1. Asimetr´ıa ´ de frecuencias ´ Distribuciones simetricas.Una distribucion ´ es simetrica cuando valores equidistantes de un valor central tienen las mismas frecuencias. Un buen candidato para ese valor central es la mediana, ya que para variables continuas di´ vide al histograma de frecuencias en dos partes de igual area.

17

Get in touch

Social

© Copyright 2013 - 2025 MYDOKUMENT.COM - All rights reserved.