Unidad 2 Distribuciones Univariadas: Tablas y Gráficos

Estadística Laboral - RRLL Unidad 2 Distribuciones Univariadas: Tablas y Gráficos Estadística Laboral - RRLL Conceptos a tener en cuenta  VARIABL

Author: Francisco Paz Vargas

0 downloads 84 Views 6MB Size

Report

DOWNLOAD PDF

Recommend Stories

UNIDAD 2. writer USANDO TABLAS. CURSO: LibreOffice

Unidad IV: Distribuciones muestrales

UNIDAD V DISTRIBUCIONES DE PROBABILIDAD

Tema 2: Distribuciones bidimensionales

Anexo 2. Figuras y tablas

2.- Tablas de frecuencias

CAPÍTULO 9 DISTRIBUCIONES DE PROBABILIDAD DISCRETAS Y CONTINUAS 1.- DISTRIBUCIONES DISCRETAS 2.- DISTRIBUCIONES CONTINUAS

DISTRIBUCIONES DE PROBABILIDAD DISCRETAS Y CONTINUAS CAPÍTULO 9 DISTRIBUCIONES DE PROBABILIDAD DISCRETAS Y CONTINUAS 1.- DISTRIBUCIONES DISCRETAS 2.

1.4 Métodos de ordenamiento y presentación de datos. Tablas de distribuciones de frecuencias y representaciones gráficas

ESTADÍSTICA I PROGRAMA ANALÍTICO 2013 Tema 1: Estadística Descriptiva 1.1 Población y muestra. Parámetros y estadísticas. 1.2 Ideas básicas de muestre

Tema 2: Tablas de Contingencia

Tema 2: Tablas de Contingencia Introducci´ on Una tabla de contingencia es una de las formas m´as comunes de resumir datos categ´oricos. En general, e

UNIDAD 4. MODIFICAR TABLAS DE DATOS

Story Transcript

Estadística Laboral - RRLL

Unidad 2 Distribuciones Univariadas: Tablas y Gráficos

Estadística Laboral - RRLL

Conceptos a tener en cuenta  VARIABLE: propiedad, atributo o característica de una unidad de análisis, susceptible de adoptar diferentes valores o categorías  Los valores o categorías que adopta una variable constituyen un SISTEMA DE CATEGORIAS. MUTUAMENTE EXCLUYENTES y el sistema debe ser EXHAUSTIVO para la población en estudio  MATRIZ DE DATOS: contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan a esas unidades  DATO: valor que toma una variable en una unidad de análisis

Matriz de Datos Ingresos del Número de miembros que hogar

trabajan

Hogar 1

$2000

2

Hogar 2

$70000

4

Hogar 3

$ 4500

0

….

Uso de Tablas y Gráficos  Los usamos para facilitar la lectura de la matriz de datos, para eso, la reducimos.  En la clase de hoy, trabajaremos con UNA sola VARIABLE.  Más adelante aprenderemos a trabajar con dos variables al mismo tiempo.  Existen métodos de análisis multivariados (múltiples variables) pero no los veremos en el curso

Distribuciones Univariadas  Elegimos la VARIABLE a estudiar.  Realizamos la distribución de frecuencias, que en nuestro caso será una DISTRIBUCION UNIVARIADA DE FRECUENCIAS  La presentamos en una TABLA  Podemos establecer además un recorrido o rango de la variable

Precisiones conceptuales  DISTRIBUCION DE FRECUENCIAS:

es una forma de organizar y resumir un conjunto de datos agrupados en categorías, en las cuales se muestra el número de observaciones que contiene cada categoría

 DISTRIBUCION FRECUENCIAS:

UNIVARIADA sirve

para

información de una sola variable

resumir

DE la

Precisiones conceptuales  TABLA es una presentación ordenada de los distintos valores de una variable en base a los datos originales. Una forma de presentar la distribución univariada de frecuencias  RECORRIDO o RANGO de la variable es la distancia entre el valor más alto y el más bajo

Datos  Cuando el tamaño de la población o muestra y el recorrido de la variable son pequeños, no hay que hacer nada especial, simplemente anotarlas de manera ordenada en filas o columnas.  Cuando el tamaño de la población y/o muestra es grande, usamos tablas

Tablas tipo II: Tablas de distribución de frecuencias simples

 Cuando el tamaño de la población y/o muestra es grande y el recorrido de la variable es pequeño, hay valores de la variable que se repiten

Tablas tipo II: Tablas de distribución de frecuencias simples Número de integrantes del hogar 2

1

2

2

1

2

4

2

1

1

2

3

2

1

1

1

3

4

2

2

2

2

1

2

1

1

1

3

2

2

3

2

3

1

2

4

2

1

4

1

1

3

4

3

2

2

2

1

3

3

Guía de Clase Pág.4

Tablas tipo II: Tablas de distribución de frecuencias simples Distribución de frecuencias simples de integrantes del hogar

Integrantes del hogar

Número de hogares

1 2 3 4 Total

16 20 9 5 50

Tablas tipo II: Tablas de distribución de frecuencias simples  FRECUENCIA SIMPLE ABSOLUTA veces que se repite el mismo valor (categoría) de la variable.  Variables como SEXO o ESTADO CIVIL que normalmente toman pocos valores lo usual es resumirlas en tablas de frecuencias simples

Tablas tipo II: Tablas de distribución de frecuencias simples Integrantes del hogar

Categorías

o valores de la variable

1 2 3 4 Total

Número de hogares 16 20 9 5 50

Retomando este ejemplo, identifique Frecuencia/s Simple/s Absoluta/s

Frecuencias Simples Absolutas para cada valor de la variable Ayuda: veces que se repite el mismo valor (categoría) de la variable

Tablas tipo III: tablas de frecuencias con datos agrupados en clases

Cuando el tamaño de la población y/o muestra y el recorrido de la variable son grandes, será necesario agrupar en intervalos los valores de la variable.

Tablas tipo III: tablas de frecuencias con datos agrupados en clases  Ejemplo en Guía de Clases. Pág. 5 Tomamos un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes datos:

450

115

250

300

17

0

5

18

200

675

50

37

78

159

230

500

120

100

18

125

31

42

56

110

25

268

60

15

20

985

Tablas tipo III: tablas de frecuencias con datos agrupados en clases

¿Cuál es el recorrido de la variable?  la variable tiene un recorrido muy grande  recorrido: 985-0= 985

Tablas tipo III: tablas de frecuencias con datos agrupados en clases  si queremos hacer una tabla con estos datos tendremos que tomar clases que agrupen los valores.  A estas clases le debemos definir un «recorrido». Para decidir el recorrido de las clases, necesitaremos decidir ….

 ¿cuántas clases queremos?.  se suele trabajar con no más de 10 o 12 clases

Tablas tipo III: tablas de frecuencias con datos agrupados en clases    

Modalidades de construcción de Clases limites superior e inferior “reales” de la distribución de datos 0 – 99; el segundo 100 a 199; el tercero 200 a 299, y así sucesivamente.. toman los denominados límites “teóricos” 0 a 100; el segundo de 100 a 200, el tercero, de 200 a 300 y, así sucesivamente si bien la primer clase se define como (0 a 100) no incluye el 100; esta cifra esta incluida en la segunda clase Veremos ejemplos…

Tablas tipo III: tablas de frecuencias con datos agrupados en clases  ¿cuántas clases queremos?.

 Tomaremos 10 clases.  Veremos cómo construimos la tabla definiendo qué límites superior e inferior tomamos

Li= límite inferior Ls: Límite Superior

Tablas tipo III: tablas de frecuencias con datos agrupados en clases  Ejemplo de tabla construida en base a límites reales:

 Dividimos el recorrido entre 10 (985/10)= 98,5. Por mayor comodidad tomamos 99 Primer clase:  Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada  Límite superior de la primer clase (L s =99)

Tablas tipo III: tablas de frecuencias con datos agrupados en clases Clases 0

Exhaustivo y mutuamente excluyente

Frecuencia simple absoluta (fi)

- 99

15

100 - 199

6

200 - 299

4

300 - 399

1

400 - 499

1

500 - 599

1

600 - 699

1

700 - 799

0

800 - 899

0

900 - 999

1

fi= frecuencias absolutas simples

Veces que se repite el mismo valor (categoría) de la variable

Tablas tipo III: tablas de frecuencias con datos agrupados en clases Ejemplo de tabla construida en base a límites teóricos: Primer clase:  Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada  Límite superior de la primer clase (L s =100).

Tablas tipo III: tablas de frecuencias con datos agrupados en clases LIMITES TEÓRICOS

 Se toman sumando al límite superior y restando al límite inferior “0,5” unidades. ( Li – 0,5) (Ls + 0,5). Esto significa que el primer intervalo tiene un recorrido de -0,5 a 99,5; el segundo de 99,5 a 199,5.  Es decir, el límite inferior es 0.5 unidades menor que el límite inferior, y el límite superior es 0.5 unidades mayor que el límite superior indicado.  Pero NO se toman decimales, sino cifras redondeadas

Tablas tipo III: tablas de frecuencias con datos agrupados en clases Primer clase:  Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada  Límite superior de la primer clase (L s =100).

Tablas tipo III: tablas de frecuencias con datos agrupados en clases Hasta 99 Incluye 100

¿Si un alumno tiene 100 pesos, en qué clase lo voy a incluir?

[ Li-1 , Li )

fi

[ 0 – 100 )

15

[ 100 - 200)

6

[ 200 - 300)

4

[ 300 – 400)

1

[ 400 - 500)

1

[ 500 - 600)

1

[ 600 - 700)

1

[ 700 - 800)

0

[ 800 - 900)

0

[ 900 - 1000)

1

Tablas tipo III: tablas de frecuencias con datos agrupados en clases

AMPLITUD DE CLASE Diferencia entre dos límites sucesivos inferiores teóricos de las clases 100-0= 100 200-100= 100

Tablas tipo III: tablas de frecuencias con datos agrupados en clases Agrupar la información en intervalos permite «resumir» la información contenida en una matriz de datos pero también implica una «pérdida de información» . Tomar pocas clases implica que la "pérdida de información" sea mayor. Para solucionar este problema es decir, que no dispongamos de los valores originales para reconstruir la verdadera distribución de los datos – se suele asumir el supuesto que todos los valores de la clase «tienden» a coincidir con

el «valor medio» de la misma, también llamada

MARCA DE CLASE (Xc)

Es un valor medio que se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos.

MARCA DE CLASE (Xc)  Se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos.

Tablas tipo III: tablas de frecuencias con datos agrupados en clases CLASES [ Li-1 , Li )

MARCA DE CLASE Xc

FRECUENCIA ABSOLUTA fi

AMPLITUD Ai

[ 0 – 100 )

50

15

100

[ 100 - 200)

150

6

100

[ 200 - 300)

250

4

100

[ 300 – 400)

350

1

100

[ 400 - 500)

450

1

100

[ 500 - 600)

550

1

100

[ 600 - 700)

650

1

100

[ 700 - 800)

750

0

100

[ 800 - 900)

850

0

100

[ 900 - 1000)

950

1

100

30

Tipos de frecuencia

 Absolutas – Relativas relativas porcentuales  simples / acumuladas

Tipos de frecuencia  Se llama frecuencia absoluta (simple) (fi) de un valor de la variable al número de veces que se presenta dicho valor. La representaremos por fi. En el ejemplo anterior el valor «tener en el bolsillo entre 900 y 1000 pesos» obtuvo en la medición una frecuencia absoluta de 1. La suma de todas las frecuencias absolutas es igual al total de la población.

Frecuencia absoluta (fi) CLASES [ Li-1 , Li )

MARCA DE CLASE Xc

FRECUENCIA ABSOLUTA fi

AMPLITUD Ai

[ 0 – 100 )

50

15

100

[ 100 - 200)

150

6

100

[ 200 - 300)

250

4

100

[ 300 – 400)

350

1

100

[ 400 - 500)

450

1

100

[ 500 - 600)

550

1

100

[ 600 - 700)

650

1

100

[ 700 - 800)

750

0

100

[ 800 - 900)

850

0

100

[ 900 - 1000) 950

1

100

30

Frecuencia relativa simple (fr)  Se llama frecuencia relativa (simple) (fr) de un valor a la frecuencia absoluta dividida por el número total de individuos que conforman la población o muestra (N). Es por tanto, una proporción. La representaremos por fr . En el ejemplo anterior la frecuencia relativa de esta clase o intervalo [ 900 - 1000) es 1/30 = 0,033. La suma de todas las frecuencias relativas es igual a la unidad (1).

Frecuencia relativa simple [ Li-1 , Li )

[ 0 – 100 )

fi

fr

15

0,50

[ 100 - 200)

6

0,20

[ 200 - 300)

4

0,13

[ 300 – 400)

1

0,03

[ 400 - 500)

1

0,03

[ 500 - 600)

1

0,03

[ 600 - 700)

1

0,03

[ 700 - 800)

0

0,00

dividido el número total de individuos que conforman la población o muestra= 30

[ 800 - 900)

0

0,00

1/30= 0,033

[ 900 - 1000)

1

0,03

30

1,00

N

Valor de la frecuencia absoluta= 1

Frecuencia absoluta acumulada  Se llama frecuencia absoluta acumulada (Fi) al número de veces que se presenta un valor y todos los anteriores a él.  En el caso del ejemplo anterior el intervalo [ 0 – 100 ) acumula 15 casos; el intervalo [ 100 - 200) acumula 21 casos (6 que corresponden a este intervalo + 15 casos que se le agregan por corresponder al intervalo anterior.

 Las frecuencias absolutas acumuladas llegan a acumular N en el último valor o clase considerada.

Frecuencia absoluta acumulada [ Li-1 , Li )

fi

fr

Fi

15

0,5 0

15

15 + 6

[ 100 - 200)

6

0,2 0

21

= 21

[ 200 - 300)

4

0,1 3

25

[ 0 – 100 )

21 + 4 = 25

[ 300 – 400)

1

0,0 3

26

[ 400 - 500)

1

0,0 3

27

[ 500 - 600)

1

0,0 3

28

[ 600 - 700)

1

0,0 3

29

Frecuencia relativa acumulada (Fr)  Se llama frecuencia relativa acumulada (Fr) a la frecuencia absoluta acumulada

dividida por el número total de observaciones. La representaremos por FR Las frecuencias relativas acumuladas llegan a acumular 1 en el último valor o clase considerada

Frecuencia relativa acumulada (Fr) [ Li-1 , Li ) [ 0 – 100 )

fi

Fr

Fi

Fr

15

0,50

15

0,5

15/30= 0,5

[ 100 - 200)

6

0,20

21

0,70

21/30= 0,7

[ 200 - 300)

4

0,13

25

0,83

25/30= 0,83

[ 300 – 400)

1

0,03

26

0,87

[ 400 - 500)

1

0,03

27

0,90

[ 500 - 600)

1

0,03

28

0,93

[ 600 - 700)

1

0,03

29

0,97

[ 700 - 800)

0

0,00

29

0,97

[ 800 - 900)

0

0,00

29

0,97

[ 900 - 1000)

1

0,03

30

30

1,00

1,00

30/30=1 N

Frecuencia porcentual (%)  Se llama frecuencia porcentual (%) al tanto por ciento de las veces que se ha obtenido un determinado resultado. Se obtiene

multiplicando por 100 la frecuencia relativa y se representa por n%.  Se puede calcular la frecuencia porcentual tanto para frecuencias simples como para frecuencias acumuladas. (% acumulado)

Frecuencia porcentual (%) [ Li-1 , Li ) [ 0 – 100 )

fi

fr

%

Fi

Fr

15

0,50

50

15

0,5

[ 100 200)

6

0,20

20

21

0,70

[ 200 300)

4

[ 300 – 400)

1

[ 400 500)

1

0,03

3

27

0,90

[ 500 600)

1

0,03

3

28

0,93

[ 600 700)

1

0,03

3

29

0,97

[ 700 800)

0

0,00

0

29

0,97

0,5 x 100= 50 fr

0,13

13

25

%

0,83 0,20 x 100= 20

0,03

3

26

0,87

0,13 x 100= 13

Frecuencia porcentual (%) acumulados

[ Li-1 , Li )

fi

[ 0 – 100 )

15

0,50

50

15

0,5

50

[ 100 - 200)

6

0,20

20

21

0,70

70

[ 200 - 300)

4

0,13

13

25

0,83

83

[ 300 – 400)

1

0,03

3

26

0,87

87

[ 400 - 500)

1

0,03

3

27

0,90

90

[ 500 - 600)

1

0,03

3

28

0,93

93

[ 600 - 700)

1

0,03

3

29

0,97

97

[ 700 - 800)

0

0,00

0

29

0,97

97

[ 800 - 900)

0

0,00

0

29

0,97

97

[ 900 - 1000)

1

0,03

3

30

1,00

100

30

fr

% Fi

1,00 100

Fr

% acumulado

Fr 0,5 x 100= 50 0,70 x 100= 70

Una tabla de distribución de frecuencias es una forma de presentar los datos sobre una característica de la población en estudio; por tanto debe contener la información necesaria para que el lector pueda analizarla.

Esto implica que debe tener explícitamente: Título, en el cual se describe qué variable se está presentando, qué tipo de tabla es (frecuencia simple, acumulada, porcentual, etc.) y cuál es la población que se está caracterizando (Por ejemplo: “Trabajadores ocupados de Montevideo, año 2007”; “Personal administrativo de la empresa XXX, año 2006”) Fuente de donde proviene la información: cuál es el origen de la matriz de datos que se está resumiendo. (Por ejemplo: “Encuesta Continua de Hogares, INE”; “Encuesta a la empresa XXX, realizada por el autor del informe”) Las columnas deben estar encabezadas por el tipo de frecuencia que contienen.

Ejemplo I Variable Escolaridad con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos

Xi

fi

0 = bachillerato,

50

1 = licenciatura sin título;

160

2 = licenciatura con 100 título 3 = postgrado

90

400

Ejemplo I  Considere el ejemplo de la variable Escolaridad con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos  0 = bachillerato,  1 = licenciatura sin título  2 = licenciatura con título  3 = postgrado

Ejemplo II Xi

fi

0 = viudo,

10

1 = casado

150

2 =soltero

250

3 = divorciado

90

Variable Estado Civil con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos 0 = viudo 1 = casado 2 = soltero

500

3 = divorciado

Ejemplo I y II Trabajo en grupos:  ¿Cuál es la información relevante?  ¿por qué?  ¿Corresponde acumular? ¿Por qué?

Ejemplo I - Solución Xi

fi

fr

f%

Fi

Fr

F%

0 = bachillerato,

50

0,13

13

50

0,13

13

1 = licenciatura sin título;

160

0,4

40

210

0,53

53

2 = licenciatura con título

100

0,25

25

310

0,78

78

3 = postgrado

90

0,22

22

400

1,00

100

400

1

100

Ejemplo II - Solución Xi

fi

fr

f%

0 = viudo,

10

0,02

2

1 = casado

150

0,3

30

2 =soltero

250

0,5

50

3 = divorciado

90

0,18

18

500

1

100

Ejemplo III Salario por hora

Número de obreros

(variable)

(frecuencias)

de 4 a 8 pesos

3

de 8 a 12 pesos

12

de 12 a 16 pesos

40

de 16 a 32 pesos

47

de 32 a 36 pesos

32

de 36 a 40 pesos

13

de 40 a 44 pesos

9

de 44 a 48 pesos

4

Total

160

Calcule las distribuciones de frecuencias que corresponda. ¿Podemos calcular la marca de clase?: -¿Qué información nos aporta? - ¿Por qué la podemos calcular? - Calcule la marca de clase si corresponde

Ejemplo III - Solución Salario por hora fi

fr

[0 a 20 pesos )

10

0,05

5

10

0,05

5

10

[20 a 40 pesos )

20

0, 10

10

30

0,15

15

30

[40 a 60 pesos )

40

0,20

20

70

0,35

35

50

[60 a 80 pesos )

50

0,25

25

120

0,60

60

70

[80 a 100 pesos )

35

0,18

18

155

0,78

78

90

[100 a 120 pesos )

30

0,15

15

185

0,93

93

110

[120 a 140 pesos )

10

0,05

5

195

0,98

98

130

140 a 160 pesos )

5

0,02

2

200

1

100

150

200

1

100

(variable)

Total

f%

Fi

Fr

F%

Xc

Ejemplo I En esta variable la información que es relevante es la que se refiere a: 1. Los valores distintos que se presentan en la matriz de datos originales (columna 1) 2. El orden de estos valores 3. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos originales . 4. Los distintos valores acumulados a medida que crece el valor de la variable. En esta variable tiene sentido la idea de «acumular» pues los valores guardan un «orden» que da un criterio de acumulación.  Así, el resumen eficiente para este tipo de variables es una tabla de frecuencias simple que brinde información tanto a partir de las frecuencias absolutas, relativas y porcentuales, simples como acumuladas. Seleccionamos una tabla de frecuencias simple

porque la población es grande (200) y su recorrido pequeño (no es necesario agrupar los valores en clases)

Ejemplo II   

En esta variable la información que es relevante es la que se refiere a: 1. Los valores distintos que se presentan en la matriz de datos originales (columna 1) 2. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos originales .

No interesa:  

el orden en que se presentan los datos y, por tanto, tampoco los distintos valores acumulados a medida que crece el valor de la variable Así, el resumen eficiente para este tipo de variables es una tabla de frecuencias que brinde información a partir de las frecuencias absolutas, relativas y porcentuales simples. No calculamos frecuencias acumuladas porque no tiene sentido juntar valores ya que entre ellos no existe un criterio de orden o jerarquía que permita agruparlos.

Ejercicios del Módulo II EJERCICIO Nº 1 Propone representaciones tabulares (lo más completas posibles) y gráficas (puede ser de más de un tipo) para los siguientes casos: 

Distribución de frecuencias de la variable Departamento de residencia de una población compuesta por 10 personas, en Uruguay, 2007.



Distribución de frecuencias de la Edad de las personas desempleadas en la ciudad de Montevideo en 2007. Toma en cuenta que la situación de empleo se le pregunta sólo a las personas de 14 años y más.



Esa misma población se ha desagregado según el sexo. ¿Qué representación gráfica propondrías para visualizar la estructura por edad y sexo de los desempleados?



Distribución del Número de accidentes laborales en el último año que han tenido 50 empresas del ramo de la construcción en el país. Se conoce para cada empresa el número de accidentes.

Ejercicios del Módulo II EJERCICIO Nº 2 Reconstruye las Tablas de distribuciones de frecuencias simples absolutas, relativas y porcentuales y, cuando sea pertinente también las acumuladas correspondientes a partir de la información proporcionada por las siguientes gráficas, provenientes de un estudio a una población compuesta por 200 personas: Estado civil de la población en estudio (%) 5

10

25 Soltera/o En pareja Divorciada/o Viuda/o

60

Fuente: Datos ficticios

Ejercicios del Módulo II EJERCICIO Nº 2 Reconstruye las Tablas de distribuciones de frecuencias simples absolutas, relativas y porcentuales y, cuando sea pertinente también las acumuladas correspondientes a partir de la información proporcionada por las siguientes gráficas, provenientes de un estudio a una población compuesta por 200 personas: Nivel educativo de la población en estudio (Frecuencias simples absolutas) 120 100 100 Sin instrucción

70

80

Primaria

60

Secundaria

40 20

20

Terciaria

10

0 Fuente: Datos ficticios

Distribuciones Univariadas  Resumen Variables de Tipo II: Estadísticas que constan de muchas observaciones, pero la variable toma pocos valores distintos.

Variables de Tipo III: Estadísticas que constan de muchas observaciones y la variable toma muchos valores distintos. Salario por hora

Personas Activas

Número de Familias

(variable)

Número de obreros

(variable)

(frecuencias) 1

16

2

20

(frecuencias)

de 4 a 8 pesos

3

de 8 a 12 pesos

12

de 12 a 16 pesos

40

de 16 a 32 pesos

47

de 32 a 36 pesos

32

3

9

4

5

de 36 a 40 pesos

13

Total

50

de 40 a 44 pesos

9

de 44 a 48 pesos

4

Total

160

Distribuciones Univariadas Usamos:

Tablas tipo II: Tablas de distribución de frecuencias simples. Cuando el tamaño de la población y/o muestra es grande y el recorrido de la variable es pequeño, hay valores de la variable que se repiten Tablas tipo III: tablas de frecuencias con datos agrupados en clases Cuando el tamaño de la población y/o muestra y el recorrido de la variable son grandes, será necesario agrupar en intervalos los valores de la variable.

Distribuciones Univariadas  RECORRIDO o RANGO de la variable es la distancia entre el valor más alto y el más bajo  Las clases tienen una LIMITE INFERIOR, un LIMITE SUPERIOR, y una AMPLITUD

 AMPLITUD DE CLASE: Diferencia entre dos límites sucesivos inferiores teóricos de las clases  MARCA DE CLASE (Xc). Es un valor medio que se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos.

Distribuciones Univariadas Nomenclatura Li- – Ls

Intervalo de clase (con límite inferior de clase y límite superior de clase. Se trata de límites teóricos y no reales.

Ai

Amplitud del intervalo: diferencia entre Li y Ls TEORICOS

Xc

Marca de clase: Punto medio del intervalo de clase. Es el punto más representativo de los valores incluidos en el intervalo. Se obtiene promediando los dos límites teóricos del intervalo (Li +Ls)/2

Repaso Niveles de medición de las variables  Nominales  Ordinales (crit.jerarquización, ordenación)  De Intervalo (orden,distancia)  De razón (orden, distancia, proporción)

GRÁFICOS

Una forma de presentación…  Los gráficos son considerados el método de presentación de la información más simple para el lector porque puede captar el panorama general o la tendencia de los datos de una sola mirada

Ventajas  Es mucho más fácil de comprender que una tabla o un texto.  La sencillez de líneas, una atractiva manera de presentación, hacen de los gráficos una de las herramientas más poderosas para transmitir ideas en forma rápida y simple al lector.

Desventaja

Su desventaja más notoria es la pérdida de precisión y exactitud, si se lo compara con una tabla.

Distribución de la variable tipo de ocupación

Tipo de Ocupación

%

Asalariado privado

57

Asalariado público

16

Miembro de cooperativa de producción

1

Patrón

5

Cuenta propia sin local o inversión

7

Cuenta propia con local o inversión

12

Miembro del hogar no remunerado

3

Asalariado privado

100

Asalariado público

Total

Miembro de cooperativa de producción Patrón Cuenta propia sin local o inversión Cuenta propia con local o inversión Miembro del hogar no remunerado

TIPOS DE GRÁFICOS

Gráficos para variables cualitativas

•

Diagramas de barras:

Representamos en el eje de ordenadas las categorías y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Para comparar usar frecuencias relativas!

Diagramas de barras (ej. Estado Civil)

Diagramas de barras (ej. Estado Civil)

Compara dos poblaciones

Diagramas de sectores (o de torta)

41% 46%

59%

Hasta 35 años

Más de 35 años

Masculino

54%

Femenino

Se divide un círculo en tantas porciones como categorías existan, de modo que a cada categoría le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa

Pictogramas Expresan con dibujos alusivos al tema de estudio las frecuencias de las categorías de la variable. Estos gráficos se hacen representando a diferentes escalas un mismo dibujo. Las áreas son proporcionales a las frecuencias. Se usa en medios de comunicación por su facilidad

Gráficos para variables cuantitativas Distinción entre Variables Discretas y variables Continuas •Una variable discreta es la variable tal que entre 2 cualesquiera valores observables (potencialmente), hay por lo menos un valor no observable (potencialmente). •Una variable continua tiene la propiedad de que entre 2 cualesquiera valores observables (potencialmente), hay otro valor observable (potencialmente).

Distinción entre Variables Discretas y variables Continuas - Una variable discreta es sencillamente una variable para la que se dan de modo inherente separaciones entre valores observables sucesivos. Dicho con más rigor, se define una variable discreta como la variable tal que entre 2 cualesquiera valores observables (potencialmente), hay por lo menos un valor no observable (potencialmente). Por ejemplo, un recuento del número de familias que habitan en una vivienda es una variable discreta. Mientras que cuentas de 3 y 4 son potencialmente observables, no lo es una de 3,5. - Una variable continua tiene la propiedad de que entre 2 cualesquiera valores observables (potencialmente), hay otro valor observable (potencialmente). Una variable continua toma valores a lo largo de un continuo, esto es, en todo un intervalo de valores. Longitudes y pesos son ejemplos de variables continuas. La estatura de una persona, pude ser 1,70 mts. ó 1,75 mts., pero en potencia al menos podría tomar cualquier valor intermedio como 1,73 mts. por ejemplo. - Un atributo esencial de una variable continua es que, a diferencia de lo que ocurre con una variable discreta, nunca se la puede medir exactamente. Con una variable continua debe haber inevitablemente un error de meda. - Un importante principio sobre variables continuas es que siempre se registran en forma discreta, quedando la magnitud de la distancia entre valores registrables adyacentes determinada por la precisión de la medición.

Variables discretas: Cuando representamos una variable discreta, usamos el diagrama de barras si pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama acumulado (o integral) tiene, por la naturaleza de la variable, forma de escalera.

Variables discretas:

xi

fi

fr

Fi

Fr

0

1

1/8

1

1/8

1

3

3/8

4

4/8

2

3

3/8

7

7/8

3

1

1/8

8

8/8

n=8

1

Variables continuas: •

Histograma: Se construye a partir de la tabla estadística, representando sobre cada intervalo un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.

Variables continuas:

•Polígono de Frecuencias Se

construye

Polígono de Frecuencias e Histograma Li-1 - Li

Xc

fi

Fi

0 -- 2

1

2

2

2 -- 4

3

1

3

4 -- 6

5

4

7

6 -- 8

7

3

10

8 - 10

9

2

12

………. .

12

Polígono de Frecuencias Acumulado Se obtiene como la poligonal definida en abscisas a partir de los extremos de los intervalos en los que se ha organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas

Supuesto Xc – frecuenci a cero

Nota:

El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura,

Tipo especial de Histograma: Pirámide de población

Resumen Tabla: Principales diagramas según el tipo de variable

Tipo de variable Variable Cualitativa

Diagrama Barras, sectores, pictogramas

Variable Cuantitativa Variable Discreta

Diferencial (barras) Acumulativo (en escalera)

Variable Continua

Diferencial (histograma, polígono de frecuencias, pirámides de población) Acumulativo (Ojiva o polígono de frecuencias acumuladas)