ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE

0 downloads 95 Views 596KB Size

Recommend Stories


Datos 33. Dato, Constante, Literal, Variable, Tipos de dato, Ordinal, Predefinido, Enumerado, Subrango, Compatibilidad
Datos 33 3. DATOS SIMPLES Conceptos: Dato, Constante, Literal, Variable, Tipos de dato, Ordinal, Predefinido, Enumerado, Subrango, Compatibilidad.

Regresión con variable dependiente cualitativa
Regresión con variable dependiente cualitativa J. M. Rojo Abuín Instituto de Economía y Geografía Madrid, II-2007 José Manuel Rojo 1 Índice I. I

VARIABLE ALEATORIA CONTINUA. DISTRIBUCIÓN NORMAL
VARIABLE ALEATORIA CONTINUA. PRIMERO DE BACHILLERATO. TEORÍA Y EJERCICIOS 18 VARIABLE ALEATORIA CONTINUA. DISTRIBUCIÓN NORMAL. Conocimientos previos

CAPITULO III VARIABLE DEPENDIENTE CUALITATIVA Y LIMITADA
CAPITULO III VARIABLE DEPENDIENTE CUALITATIVA Y LIMITADA 1. MODELOS DE ELECCION DISCRETA Los modelos de elección discreta consideran una variable ind

Story Transcript

ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable

Cualitativa

ordinal nominal

Cuantitativa

discreta continua

DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi  Frecuencia relativa: ni  Frecuencia acumulada: Fi  Frecuencia acumulada relativa: Ni 

Ejercicio 1 xi

Recuento

fi

Fi

ni

Ni

27

I

1

1

0.032

0.032

28

II

2

3

0.065

0.097

29

6

9

0.194

0.290

30

7

16

0.226

0.0516

31

8

24

0.258

0.774

32

III

3

27

0.097

0.871

33

III

3

30

0.097

0.968

34

I

1

31

0.032

1

31

1

DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS = INTERVALOS

Límites de clases : Li y Ls  Amplitud de clase: ai  Marca de clase: Ci 

ci

fi

Fi

ni

Ni

[0, 5)

2.5

1

1

0.025

0.025

[5, 10)

7.5

1

2

0.025

0.050

[10, 15)

12.5

3

5

0.075

0.125

[15, 20)

17.5

3

8

0.075

0.200

[20, 25)

22.5

3

11

0.075

0.2775

[25, 30)

27.5

6

17

0.150

0.425

[30, 35)

32.5

7

24

0.175

0.600

[35, 40)

37.5

10

34

0.250

0.850

[40, 45)

42.5

4

38

0.100

0.950

[45, 50)

47.5

2

40

0.050

1

Ejercicio 2

40

1

PARÁMETRO ESTADÍSTICO 



Posición 

Centralización:



No centralizados:

Dispersión Rango o Recorrido  Desviación Media  Varianza  Desvío Estándar 

Media Mediana Moda Quartiles Deciles Percentiles

 Parámetros 

de Posición

De Centralización: 

Media



Mediana



Moda

MEDIA Propiedades de la media aritmética  La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la misma igual a cero. 

La media aritmética de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética.

Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda aumentada en dicho número.  Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda multiplicada por dicho número. Observaciones sobre la media aritmética  La media se puede hallar sólo para variables cuantitativas.  La media es independiente de las amplitudes de los intervalos.  La media es muy sensible a las puntuaciones extremas.  La media no se puede calcular si hay un intervalo con una amplitud indeterminada. 

MEDIA ARITMÉTICA PARA DATOS AGRUPADOS

Ejercicio 3 xi

fi

xi — fi

[10, 20)

15

1

15

[20, 30)

25

8

200

[30,40)

35

10

350

[40, 50)

45

9

405

[50, 60

55

8

440

[60,70)

65

4

260

[70, 80)

75

2

150

42

1 820

MEDIANA

ME

Cálculo de la Me  Ordenamos los datos de menor a mayor.  Serie con número impar de medidas la Me es la puntuación central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5  Serie con número par de puntuaciones la Me es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me= 9.5 Cálculo de la mediana para datos agrupados  La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.  Es decir tenemos que buscar el intervalo en el que se encuentre .

Li-1 es el límite inferior de la clase donde se encuentra la mediana. N/2 es la semisuma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase.

Ejercicio 4: fi

Fi

[60, 63)

5

5

[63, 66)

18

23

[66, 69)

42

65

[69, 72)

27

92

[72, 75)

8

100

100

100/2=50 Clase modal: (66 , 69)

MODA

MO



La moda es el valor que tiene mayor frecuencia absoluta.



Se puede hallar la Mo para variables cualitativas y cuantitativas.



Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5



Si en un grupo hay dos o varias puntuaciones con la misma

M o= 4

frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas. Ej.: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9



Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8

Mo = 4

CÁLCULO DE LA MODA PARA DATOS AGRUPADOS 

Todos los intervalos tienen la misma amplitud.



Li-1 es el límite inferior de la clase modal.



fi es la frecuencia absoluta de la clase modal.



fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.



fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.



ai es la amplitud de la clase.



También se utiliza otra fórmula de la moda que da un valor aproximado:

Ejercicio 5:

fi [60, 63)

5

[63, 66)

18

[66, 69)

42

[69, 72)

27

[72, 75)

8 100

Los intervalos tienen amplitudes distintas.  En primer lugar tenemos que hallar las alturas.  La clase modal es la que tiene mayor altura. 



La fórmula de la moda aproximada cuando existen distintas amplitudes es:

Ejercicio 6

fi

hi

[0, 5)

15

3

[5, 7)

20

10

[7, 9)

12

6

[9, 10)

3

3

50

 Parámetros

de Dispersión



Rango o Recorrido



Desviación Media



Varianza



Desvío Estándar

DESVIACIÓN MEDIA 

Desviación respecto a la media: es la diferencia entre cada valor de la variable estadística y la media aritmética. Di =

Desviación media  es la media aritmética de los valores absolutos de las desviaciones respecto a la media. 



Desviación media para datos agrupados

Ejercicio 7

xi

fi

xi — fi

|x - x|

|x - x| — fi

[10, 15)

12.5

3

37.5

9.286

27.858

[15, 20)

17.5

5

87.5

4.286

21.43

[20, 25)

22.5

7

157.5

0.714

4.998

[25, 30)

27.5

4

110

5.714

22.856

[30, 35)

32.5

2

65

10.174

21.428

21

457.5

98.57

VARIANZA 

Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.



Varianza para datos agrupados



Propiedades de la varianza



La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.



Si a todos los valores de la variable se les suma un número la varianza no varía.



Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.



Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Ejercicio 8

xi

fi

xi — fi

xi2 — fi

[10, 20)

15

1

15

225

[20, 30)

25

8

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

9

405

18 225

[50, 60

55

8

440

24 200

[60,70)

65

4

260

16 900

[70, 80)

75

2

150

11 250

42

1 820

88 050

DESVÍO ESTÁNDAR

σ

Es la raíz cuadrada de la varianza.  Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. 



Para datos agrupados:

Propiedades del desvío estándar 

Será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.



Si a todos los valores de la variable se les suma un número el desvío estándar no varía.



Si todos los valores de la variable se multiplican por un número el desvío estándar queda multiplicada por dicho número.



Si tenemos varias distribuciones con la misma media y conocemos sus respectivos desvíos puede calcular el desvío estándar total. Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

COEFICIENTE DE VARIACIÓN Y PUNTUACIONES TÍPICAS 

Coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

se suele expresar en porcentajes:  Permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas.  Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.  La mayor dispersión corresponderá al valor del coef de variación mayor. 

Ejercicio 9 Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?

La primera distribución presenta mayor dispersión.

Puntuaciones típicas: z Puntuaciones diferenciales  Resultan de restarles a las puntuaciones directas la media aritmética xi = Xi − X Puntuaciones típicas  Son el resultado de dividir las puntuaciones diferenciales entre el desvío estándar. Este proceso se llama tipificación.

Observaciones sobre puntuaciones típicas  La media aritmética de las puntuaciones típicas es 0.  El desvío estándar de las puntuaciones típicas es 1.  Las puntuaciones típicas son adimensionales.  Se utilizan para comparar los valores obtenidas en distintas distribuciones. 

Ejercicio 10 En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Los desvíos estándar de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de José es de 70 kg y el de Ana es 65 kg. ¿Cuál de ellos puede, dentro del grupo de alumnos de su sexo, considerarse más grueso?

José es más grueso respecto de su grupo.

INFERENCIA ESTADÍSTICA Estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

MUESTREO PROBABILÍSTICO Consiste en elegir una muestra de una población al azar. Hay varios tipos de muestreo: 

Muestreo aleatorio simple



Muestreo aleatorio sistemático



Muestreo aleatorio estratificado

INTERVALOS DE CONFIANZA 

Es un intervalo en el que sabemos que está el parámetro con un nivel de confianza determinado.

µ

 : nivel de significación. 1- : nivel de confianza. z: coeficiente de confiabilidad. k: valor crítico = z/2

P(z>z/2) = /2 P(-z/2

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.