Story Transcript
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable
Cualitativa
ordinal nominal
Cuantitativa
discreta continua
DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa: ni Frecuencia acumulada: Fi Frecuencia acumulada relativa: Ni
Ejercicio 1 xi
Recuento
fi
Fi
ni
Ni
27
I
1
1
0.032
0.032
28
II
2
3
0.065
0.097
29
6
9
0.194
0.290
30
7
16
0.226
0.0516
31
8
24
0.258
0.774
32
III
3
27
0.097
0.871
33
III
3
30
0.097
0.968
34
I
1
31
0.032
1
31
1
DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS = INTERVALOS
Límites de clases : Li y Ls Amplitud de clase: ai Marca de clase: Ci
ci
fi
Fi
ni
Ni
[0, 5)
2.5
1
1
0.025
0.025
[5, 10)
7.5
1
2
0.025
0.050
[10, 15)
12.5
3
5
0.075
0.125
[15, 20)
17.5
3
8
0.075
0.200
[20, 25)
22.5
3
11
0.075
0.2775
[25, 30)
27.5
6
17
0.150
0.425
[30, 35)
32.5
7
24
0.175
0.600
[35, 40)
37.5
10
34
0.250
0.850
[40, 45)
42.5
4
38
0.100
0.950
[45, 50)
47.5
2
40
0.050
1
Ejercicio 2
40
1
PARÁMETRO ESTADÍSTICO
Posición
Centralización:
No centralizados:
Dispersión Rango o Recorrido Desviación Media Varianza Desvío Estándar
Media Mediana Moda Quartiles Deciles Percentiles
Parámetros
de Posición
De Centralización:
Media
Mediana
Moda
MEDIA Propiedades de la media aritmética La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la misma igual a cero.
La media aritmética de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética.
Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda aumentada en dicho número. Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda multiplicada por dicho número. Observaciones sobre la media aritmética La media se puede hallar sólo para variables cuantitativas. La media es independiente de las amplitudes de los intervalos. La media es muy sensible a las puntuaciones extremas. La media no se puede calcular si hay un intervalo con una amplitud indeterminada.
MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
Ejercicio 3 xi
fi
xi fi
[10, 20)
15
1
15
[20, 30)
25
8
200
[30,40)
35
10
350
[40, 50)
45
9
405
[50, 60
55
8
440
[60,70)
65
4
260
[70, 80)
75
2
150
42
1 820
MEDIANA
ME
Cálculo de la Me Ordenamos los datos de menor a mayor. Serie con número impar de medidas la Me es la puntuación central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5 Serie con número par de puntuaciones la Me es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me= 9.5 Cálculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre .
Li-1 es el límite inferior de la clase donde se encuentra la mediana. N/2 es la semisuma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase.
Ejercicio 4: fi
Fi
[60, 63)
5
5
[63, 66)
18
23
[66, 69)
42
65
[69, 72)
27
92
[72, 75)
8
100
100
100/2=50 Clase modal: (66 , 69)
MODA
MO
La moda es el valor que tiene mayor frecuencia absoluta.
Se puede hallar la Mo para variables cualitativas y cuantitativas.
Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5
Si en un grupo hay dos o varias puntuaciones con la misma
M o= 4
frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas. Ej.: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8
Mo = 4
CÁLCULO DE LA MODA PARA DATOS AGRUPADOS
Todos los intervalos tienen la misma amplitud.
Li-1 es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado:
Ejercicio 5:
fi [60, 63)
5
[63, 66)
18
[66, 69)
42
[69, 72)
27
[72, 75)
8 100
Los intervalos tienen amplitudes distintas. En primer lugar tenemos que hallar las alturas. La clase modal es la que tiene mayor altura.
La fórmula de la moda aproximada cuando existen distintas amplitudes es:
Ejercicio 6
fi
hi
[0, 5)
15
3
[5, 7)
20
10
[7, 9)
12
6
[9, 10)
3
3
50
Parámetros
de Dispersión
Rango o Recorrido
Desviación Media
Varianza
Desvío Estándar
DESVIACIÓN MEDIA
Desviación respecto a la media: es la diferencia entre cada valor de la variable estadística y la media aritmética. Di =
Desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
Desviación media para datos agrupados
Ejercicio 7
xi
fi
xi fi
|x - x|
|x - x| fi
[10, 15)
12.5
3
37.5
9.286
27.858
[15, 20)
17.5
5
87.5
4.286
21.43
[20, 25)
22.5
7
157.5
0.714
4.998
[25, 30)
27.5
4
110
5.714
22.856
[30, 35)
32.5
2
65
10.174
21.428
21
457.5
98.57
VARIANZA
Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
Varianza para datos agrupados
Propiedades de la varianza
La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un número la varianza no varía.
Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
Ejercicio 8
xi
fi
xi fi
xi2 fi
[10, 20)
15
1
15
225
[20, 30)
25
8
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
9
405
18 225
[50, 60
55
8
440
24 200
[60,70)
65
4
260
16 900
[70, 80)
75
2
150
11 250
42
1 820
88 050
DESVÍO ESTÁNDAR
σ
Es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
Para datos agrupados:
Propiedades del desvío estándar
Será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un número el desvío estándar no varía.
Si todos los valores de la variable se multiplican por un número el desvío estándar queda multiplicada por dicho número.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivos desvíos puede calcular el desvío estándar total. Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
COEFICIENTE DE VARIACIÓN Y PUNTUACIONES TÍPICAS
Coeficiente de variación es la relación entre la desviación típica de una muestra y su media.
se suele expresar en porcentajes: Permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí. La mayor dispersión corresponderá al valor del coef de variación mayor.
Ejercicio 9 Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?
La primera distribución presenta mayor dispersión.
Puntuaciones típicas: z Puntuaciones diferenciales Resultan de restarles a las puntuaciones directas la media aritmética xi = Xi − X Puntuaciones típicas Son el resultado de dividir las puntuaciones diferenciales entre el desvío estándar. Este proceso se llama tipificación.
Observaciones sobre puntuaciones típicas La media aritmética de las puntuaciones típicas es 0. El desvío estándar de las puntuaciones típicas es 1. Las puntuaciones típicas son adimensionales. Se utilizan para comparar los valores obtenidas en distintas distribuciones.
Ejercicio 10 En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Los desvíos estándar de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de José es de 70 kg y el de Ana es 65 kg. ¿Cuál de ellos puede, dentro del grupo de alumnos de su sexo, considerarse más grueso?
José es más grueso respecto de su grupo.
INFERENCIA ESTADÍSTICA Estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.
MUESTREO PROBABILÍSTICO Consiste en elegir una muestra de una población al azar. Hay varios tipos de muestreo:
Muestreo aleatorio simple
Muestreo aleatorio sistemático
Muestreo aleatorio estratificado
INTERVALOS DE CONFIANZA
Es un intervalo en el que sabemos que está el parámetro con un nivel de confianza determinado.
µ
: nivel de significación. 1- : nivel de confianza. z: coeficiente de confiabilidad. k: valor crítico = z/2
P(z>z/2) = /2 P(-z/2