Story Transcript
Estadística Laboral - RRLL
Unidad 2 Distribuciones Univariadas: Tablas y Gráficos
Estadística Laboral - RRLL
Conceptos a tener en cuenta VARIABLE: propiedad, atributo o característica de una unidad de análisis, susceptible de adoptar diferentes valores o categorías Los valores o categorías que adopta una variable constituyen un SISTEMA DE CATEGORIAS. MUTUAMENTE EXCLUYENTES y el sistema debe ser EXHAUSTIVO para la población en estudio MATRIZ DE DATOS: contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan a esas unidades DATO: valor que toma una variable en una unidad de análisis
Matriz de Datos Ingresos del Número de miembros que hogar
trabajan
Hogar 1
$2000
2
Hogar 2
$70000
4
Hogar 3
$ 4500
0
….
Uso de Tablas y Gráficos Los usamos para facilitar la lectura de la matriz de datos, para eso, la reducimos. En la clase de hoy, trabajaremos con UNA sola VARIABLE. Más adelante aprenderemos a trabajar con dos variables al mismo tiempo. Existen métodos de análisis multivariados (múltiples variables) pero no los veremos en el curso
Distribuciones Univariadas Elegimos la VARIABLE a estudiar. Realizamos la distribución de frecuencias, que en nuestro caso será una DISTRIBUCION UNIVARIADA DE FRECUENCIAS La presentamos en una TABLA Podemos establecer además un recorrido o rango de la variable
Precisiones conceptuales DISTRIBUCION DE FRECUENCIAS:
es una forma de organizar y resumir un conjunto de datos agrupados en categorías, en las cuales se muestra el número de observaciones que contiene cada categoría
DISTRIBUCION FRECUENCIAS:
UNIVARIADA sirve
para
información de una sola variable
resumir
DE la
Precisiones conceptuales TABLA es una presentación ordenada de los distintos valores de una variable en base a los datos originales. Una forma de presentar la distribución univariada de frecuencias RECORRIDO o RANGO de la variable es la distancia entre el valor más alto y el más bajo
Datos Cuando el tamaño de la población o muestra y el recorrido de la variable son pequeños, no hay que hacer nada especial, simplemente anotarlas de manera ordenada en filas o columnas. Cuando el tamaño de la población y/o muestra es grande, usamos tablas
Tablas tipo II: Tablas de distribución de frecuencias simples
Cuando el tamaño de la población y/o muestra es grande y el recorrido de la variable es pequeño, hay valores de la variable que se repiten
Tablas tipo II: Tablas de distribución de frecuencias simples Número de integrantes del hogar 2
1
2
2
1
2
4
2
1
1
2
3
2
1
1
1
3
4
2
2
2
2
1
2
1
1
1
3
2
2
3
2
3
1
2
4
2
1
4
1
1
3
4
3
2
2
2
1
3
3
Guía de Clase Pág.4
Tablas tipo II: Tablas de distribución de frecuencias simples Distribución de frecuencias simples de integrantes del hogar
Integrantes del hogar
Número de hogares
1 2 3 4 Total
16 20 9 5 50
Tablas tipo II: Tablas de distribución de frecuencias simples FRECUENCIA SIMPLE ABSOLUTA veces que se repite el mismo valor (categoría) de la variable. Variables como SEXO o ESTADO CIVIL que normalmente toman pocos valores lo usual es resumirlas en tablas de frecuencias simples
Tablas tipo II: Tablas de distribución de frecuencias simples Integrantes del hogar
Categorías
o valores de la variable
1 2 3 4 Total
Número de hogares 16 20 9 5 50
Retomando este ejemplo, identifique Frecuencia/s Simple/s Absoluta/s
Frecuencias Simples Absolutas para cada valor de la variable Ayuda: veces que se repite el mismo valor (categoría) de la variable
Tablas tipo III: tablas de frecuencias con datos agrupados en clases
Cuando el tamaño de la población y/o muestra y el recorrido de la variable son grandes, será necesario agrupar en intervalos los valores de la variable.
Tablas tipo III: tablas de frecuencias con datos agrupados en clases Ejemplo en Guía de Clases. Pág. 5 Tomamos un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes datos:
450
115
250
300
17
0
5
18
200
675
50
37
78
159
230
500
120
100
18
125
31
42
56
110
25
268
60
15
20
985
Tablas tipo III: tablas de frecuencias con datos agrupados en clases
¿Cuál es el recorrido de la variable? la variable tiene un recorrido muy grande recorrido: 985-0= 985
Tablas tipo III: tablas de frecuencias con datos agrupados en clases si queremos hacer una tabla con estos datos tendremos que tomar clases que agrupen los valores. A estas clases le debemos definir un «recorrido». Para decidir el recorrido de las clases, necesitaremos decidir ….
¿cuántas clases queremos?. se suele trabajar con no más de 10 o 12 clases
Tablas tipo III: tablas de frecuencias con datos agrupados en clases
Modalidades de construcción de Clases limites superior e inferior “reales” de la distribución de datos 0 – 99; el segundo 100 a 199; el tercero 200 a 299, y así sucesivamente.. toman los denominados límites “teóricos” 0 a 100; el segundo de 100 a 200, el tercero, de 200 a 300 y, así sucesivamente si bien la primer clase se define como (0 a 100) no incluye el 100; esta cifra esta incluida en la segunda clase Veremos ejemplos…
Tablas tipo III: tablas de frecuencias con datos agrupados en clases ¿cuántas clases queremos?.
Tomaremos 10 clases. Veremos cómo construimos la tabla definiendo qué límites superior e inferior tomamos
Li= límite inferior Ls: Límite Superior
Tablas tipo III: tablas de frecuencias con datos agrupados en clases Ejemplo de tabla construida en base a límites reales:
Dividimos el recorrido entre 10 (985/10)= 98,5. Por mayor comodidad tomamos 99 Primer clase: Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada Límite superior de la primer clase (L s =99)
Tablas tipo III: tablas de frecuencias con datos agrupados en clases Clases 0
Exhaustivo y mutuamente excluyente
Frecuencia simple absoluta (fi)
- 99
15
100 - 199
6
200 - 299
4
300 - 399
1
400 - 499
1
500 - 599
1
600 - 699
1
700 - 799
0
800 - 899
0
900 - 999
1
fi= frecuencias absolutas simples
Veces que se repite el mismo valor (categoría) de la variable
Tablas tipo III: tablas de frecuencias con datos agrupados en clases Ejemplo de tabla construida en base a límites teóricos: Primer clase: Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada Límite superior de la primer clase (L s =100).
Tablas tipo III: tablas de frecuencias con datos agrupados en clases LIMITES TEÓRICOS
Se toman sumando al límite superior y restando al límite inferior “0,5” unidades. ( Li – 0,5) (Ls + 0,5). Esto significa que el primer intervalo tiene un recorrido de -0,5 a 99,5; el segundo de 99,5 a 199,5. Es decir, el límite inferior es 0.5 unidades menor que el límite inferior, y el límite superior es 0.5 unidades mayor que el límite superior indicado. Pero NO se toman decimales, sino cifras redondeadas
Tablas tipo III: tablas de frecuencias con datos agrupados en clases Primer clase: Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada Límite superior de la primer clase (L s =100).
Tablas tipo III: tablas de frecuencias con datos agrupados en clases Hasta 99 Incluye 100
¿Si un alumno tiene 100 pesos, en qué clase lo voy a incluir?
[ Li-1 , Li )
fi
[ 0 – 100 )
15
[ 100 - 200)
6
[ 200 - 300)
4
[ 300 – 400)
1
[ 400 - 500)
1
[ 500 - 600)
1
[ 600 - 700)
1
[ 700 - 800)
0
[ 800 - 900)
0
[ 900 - 1000)
1
Tablas tipo III: tablas de frecuencias con datos agrupados en clases
AMPLITUD DE CLASE Diferencia entre dos límites sucesivos inferiores teóricos de las clases 100-0= 100 200-100= 100
Tablas tipo III: tablas de frecuencias con datos agrupados en clases Agrupar la información en intervalos permite «resumir» la información contenida en una matriz de datos pero también implica una «pérdida de información» . Tomar pocas clases implica que la "pérdida de información" sea mayor. Para solucionar este problema es decir, que no dispongamos de los valores originales para reconstruir la verdadera distribución de los datos – se suele asumir el supuesto que todos los valores de la clase «tienden» a coincidir con
el «valor medio» de la misma, también llamada
MARCA DE CLASE (Xc)
Es un valor medio que se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos.
MARCA DE CLASE (Xc) Se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos.
Tablas tipo III: tablas de frecuencias con datos agrupados en clases CLASES [ Li-1 , Li )
MARCA DE CLASE Xc
FRECUENCIA ABSOLUTA fi
AMPLITUD Ai
[ 0 – 100 )
50
15
100
[ 100 - 200)
150
6
100
[ 200 - 300)
250
4
100
[ 300 – 400)
350
1
100
[ 400 - 500)
450
1
100
[ 500 - 600)
550
1
100
[ 600 - 700)
650
1
100
[ 700 - 800)
750
0
100
[ 800 - 900)
850
0
100
[ 900 - 1000)
950
1
100
30
Tipos de frecuencia
Absolutas – Relativas relativas porcentuales simples / acumuladas
Tipos de frecuencia Se llama frecuencia absoluta (simple) (fi) de un valor de la variable al número de veces que se presenta dicho valor. La representaremos por fi. En el ejemplo anterior el valor «tener en el bolsillo entre 900 y 1000 pesos» obtuvo en la medición una frecuencia absoluta de 1. La suma de todas las frecuencias absolutas es igual al total de la población.
Frecuencia absoluta (fi) CLASES [ Li-1 , Li )
MARCA DE CLASE Xc
FRECUENCIA ABSOLUTA fi
AMPLITUD Ai
[ 0 – 100 )
50
15
100
[ 100 - 200)
150
6
100
[ 200 - 300)
250
4
100
[ 300 – 400)
350
1
100
[ 400 - 500)
450
1
100
[ 500 - 600)
550
1
100
[ 600 - 700)
650
1
100
[ 700 - 800)
750
0
100
[ 800 - 900)
850
0
100
[ 900 - 1000) 950
1
100
30
Frecuencia relativa simple (fr) Se llama frecuencia relativa (simple) (fr) de un valor a la frecuencia absoluta dividida por el número total de individuos que conforman la población o muestra (N). Es por tanto, una proporción. La representaremos por fr . En el ejemplo anterior la frecuencia relativa de esta clase o intervalo [ 900 - 1000) es 1/30 = 0,033. La suma de todas las frecuencias relativas es igual a la unidad (1).
Frecuencia relativa simple [ Li-1 , Li )
[ 0 – 100 )
fi
fr
15
0,50
[ 100 - 200)
6
0,20
[ 200 - 300)
4
0,13
[ 300 – 400)
1
0,03
[ 400 - 500)
1
0,03
[ 500 - 600)
1
0,03
[ 600 - 700)
1
0,03
[ 700 - 800)
0
0,00
dividido el número total de individuos que conforman la población o muestra= 30
[ 800 - 900)
0
0,00
1/30= 0,033
[ 900 - 1000)
1
0,03
30
1,00
N
Valor de la frecuencia absoluta= 1
Frecuencia absoluta acumulada Se llama frecuencia absoluta acumulada (Fi) al número de veces que se presenta un valor y todos los anteriores a él. En el caso del ejemplo anterior el intervalo [ 0 – 100 ) acumula 15 casos; el intervalo [ 100 - 200) acumula 21 casos (6 que corresponden a este intervalo + 15 casos que se le agregan por corresponder al intervalo anterior.
Las frecuencias absolutas acumuladas llegan a acumular N en el último valor o clase considerada.
Frecuencia absoluta acumulada [ Li-1 , Li )
fi
fr
Fi
15
0,5 0
15
15 + 6
[ 100 - 200)
6
0,2 0
21
= 21
[ 200 - 300)
4
0,1 3
25
[ 0 – 100 )
21 + 4 = 25
[ 300 – 400)
1
0,0 3
26
[ 400 - 500)
1
0,0 3
27
[ 500 - 600)
1
0,0 3
28
[ 600 - 700)
1
0,0 3
29
Frecuencia relativa acumulada (Fr) Se llama frecuencia relativa acumulada (Fr) a la frecuencia absoluta acumulada
dividida por el número total de observaciones. La representaremos por FR Las frecuencias relativas acumuladas llegan a acumular 1 en el último valor o clase considerada
Frecuencia relativa acumulada (Fr) [ Li-1 , Li ) [ 0 – 100 )
fi
Fr
Fi
Fr
15
0,50
15
0,5
15/30= 0,5
[ 100 - 200)
6
0,20
21
0,70
21/30= 0,7
[ 200 - 300)
4
0,13
25
0,83
25/30= 0,83
[ 300 – 400)
1
0,03
26
0,87
[ 400 - 500)
1
0,03
27
0,90
[ 500 - 600)
1
0,03
28
0,93
[ 600 - 700)
1
0,03
29
0,97
[ 700 - 800)
0
0,00
29
0,97
[ 800 - 900)
0
0,00
29
0,97
[ 900 - 1000)
1
0,03
30
30
1,00
1,00
30/30=1 N
Frecuencia porcentual (%) Se llama frecuencia porcentual (%) al tanto por ciento de las veces que se ha obtenido un determinado resultado. Se obtiene
multiplicando por 100 la frecuencia relativa y se representa por n%. Se puede calcular la frecuencia porcentual tanto para frecuencias simples como para frecuencias acumuladas. (% acumulado)
Frecuencia porcentual (%) [ Li-1 , Li ) [ 0 – 100 )
fi
fr
%
Fi
Fr
15
0,50
50
15
0,5
[ 100 200)
6
0,20
20
21
0,70
[ 200 300)
4
[ 300 – 400)
1
[ 400 500)
1
0,03
3
27
0,90
[ 500 600)
1
0,03
3
28
0,93
[ 600 700)
1
0,03
3
29
0,97
[ 700 800)
0
0,00
0
29
0,97
0,5 x 100= 50 fr
0,13
13
25
%
0,83 0,20 x 100= 20
0,03
3
26
0,87
0,13 x 100= 13
Frecuencia porcentual (%) acumulados
[ Li-1 , Li )
fi
[ 0 – 100 )
15
0,50
50
15
0,5
50
[ 100 - 200)
6
0,20
20
21
0,70
70
[ 200 - 300)
4
0,13
13
25
0,83
83
[ 300 – 400)
1
0,03
3
26
0,87
87
[ 400 - 500)
1
0,03
3
27
0,90
90
[ 500 - 600)
1
0,03
3
28
0,93
93
[ 600 - 700)
1
0,03
3
29
0,97
97
[ 700 - 800)
0
0,00
0
29
0,97
97
[ 800 - 900)
0
0,00
0
29
0,97
97
[ 900 - 1000)
1
0,03
3
30
1,00
100
30
fr
% Fi
1,00 100
Fr
% acumulado
Fr 0,5 x 100= 50 0,70 x 100= 70
Una tabla de distribución de frecuencias es una forma de presentar los datos sobre una característica de la población en estudio; por tanto debe contener la información necesaria para que el lector pueda analizarla.
Esto implica que debe tener explícitamente: Título, en el cual se describe qué variable se está presentando, qué tipo de tabla es (frecuencia simple, acumulada, porcentual, etc.) y cuál es la población que se está caracterizando (Por ejemplo: “Trabajadores ocupados de Montevideo, año 2007”; “Personal administrativo de la empresa XXX, año 2006”) Fuente de donde proviene la información: cuál es el origen de la matriz de datos que se está resumiendo. (Por ejemplo: “Encuesta Continua de Hogares, INE”; “Encuesta a la empresa XXX, realizada por el autor del informe”) Las columnas deben estar encabezadas por el tipo de frecuencia que contienen.
Ejemplo I Variable Escolaridad con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos
Xi
fi
0 = bachillerato,
50
1 = licenciatura sin título;
160
2 = licenciatura con 100 título 3 = postgrado
90
400
Ejemplo I Considere el ejemplo de la variable Escolaridad con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos 0 = bachillerato, 1 = licenciatura sin título 2 = licenciatura con título 3 = postgrado
Ejemplo II Xi
fi
0 = viudo,
10
1 = casado
150
2 =soltero
250
3 = divorciado
90
Variable Estado Civil con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos 0 = viudo 1 = casado 2 = soltero
500
3 = divorciado
Ejemplo I y II Trabajo en grupos: ¿Cuál es la información relevante? ¿por qué? ¿Corresponde acumular? ¿Por qué?
Ejemplo I - Solución Xi
fi
fr
f%
Fi
Fr
F%
0 = bachillerato,
50
0,13
13
50
0,13
13
1 = licenciatura sin título;
160
0,4
40
210
0,53
53
2 = licenciatura con título
100
0,25
25
310
0,78
78
3 = postgrado
90
0,22
22
400
1,00
100
400
1
100
Ejemplo II - Solución Xi
fi
fr
f%
0 = viudo,
10
0,02
2
1 = casado
150
0,3
30
2 =soltero
250
0,5
50
3 = divorciado
90
0,18
18
500
1
100
Ejemplo III Salario por hora
Número de obreros
(variable)
(frecuencias)
de 4 a 8 pesos
3
de 8 a 12 pesos
12
de 12 a 16 pesos
40
de 16 a 32 pesos
47
de 32 a 36 pesos
32
de 36 a 40 pesos
13
de 40 a 44 pesos
9
de 44 a 48 pesos
4
Total
160
Calcule las distribuciones de frecuencias que corresponda. ¿Podemos calcular la marca de clase?: -¿Qué información nos aporta? - ¿Por qué la podemos calcular? - Calcule la marca de clase si corresponde
Ejemplo III - Solución Salario por hora fi
fr
[0 a 20 pesos )
10
0,05
5
10
0,05
5
10
[20 a 40 pesos )
20
0, 10
10
30
0,15
15
30
[40 a 60 pesos )
40
0,20
20
70
0,35
35
50
[60 a 80 pesos )
50
0,25
25
120
0,60
60
70
[80 a 100 pesos )
35
0,18
18
155
0,78
78
90
[100 a 120 pesos )
30
0,15
15
185
0,93
93
110
[120 a 140 pesos )
10
0,05
5
195
0,98
98
130
140 a 160 pesos )
5
0,02
2
200
1
100
150
200
1
100
(variable)
Total
f%
Fi
Fr
F%
Xc
Ejemplo I En esta variable la información que es relevante es la que se refiere a: 1. Los valores distintos que se presentan en la matriz de datos originales (columna 1) 2. El orden de estos valores 3. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos originales . 4. Los distintos valores acumulados a medida que crece el valor de la variable. En esta variable tiene sentido la idea de «acumular» pues los valores guardan un «orden» que da un criterio de acumulación. Así, el resumen eficiente para este tipo de variables es una tabla de frecuencias simple que brinde información tanto a partir de las frecuencias absolutas, relativas y porcentuales, simples como acumuladas. Seleccionamos una tabla de frecuencias simple
porque la población es grande (200) y su recorrido pequeño (no es necesario agrupar los valores en clases)
Ejemplo II
En esta variable la información que es relevante es la que se refiere a: 1. Los valores distintos que se presentan en la matriz de datos originales (columna 1) 2. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos originales .
No interesa:
el orden en que se presentan los datos y, por tanto, tampoco los distintos valores acumulados a medida que crece el valor de la variable Así, el resumen eficiente para este tipo de variables es una tabla de frecuencias que brinde información a partir de las frecuencias absolutas, relativas y porcentuales simples. No calculamos frecuencias acumuladas porque no tiene sentido juntar valores ya que entre ellos no existe un criterio de orden o jerarquía que permita agruparlos.
Ejercicios del Módulo II EJERCICIO Nº 1 Propone representaciones tabulares (lo más completas posibles) y gráficas (puede ser de más de un tipo) para los siguientes casos:
Distribución de frecuencias de la variable Departamento de residencia de una población compuesta por 10 personas, en Uruguay, 2007.
Distribución de frecuencias de la Edad de las personas desempleadas en la ciudad de Montevideo en 2007. Toma en cuenta que la situación de empleo se le pregunta sólo a las personas de 14 años y más.
Esa misma población se ha desagregado según el sexo. ¿Qué representación gráfica propondrías para visualizar la estructura por edad y sexo de los desempleados?
Distribución del Número de accidentes laborales en el último año que han tenido 50 empresas del ramo de la construcción en el país. Se conoce para cada empresa el número de accidentes.
Ejercicios del Módulo II EJERCICIO Nº 2 Reconstruye las Tablas de distribuciones de frecuencias simples absolutas, relativas y porcentuales y, cuando sea pertinente también las acumuladas correspondientes a partir de la información proporcionada por las siguientes gráficas, provenientes de un estudio a una población compuesta por 200 personas: Estado civil de la población en estudio (%) 5
10
25 Soltera/o En pareja Divorciada/o Viuda/o
60
Fuente: Datos ficticios
Ejercicios del Módulo II EJERCICIO Nº 2 Reconstruye las Tablas de distribuciones de frecuencias simples absolutas, relativas y porcentuales y, cuando sea pertinente también las acumuladas correspondientes a partir de la información proporcionada por las siguientes gráficas, provenientes de un estudio a una población compuesta por 200 personas: Nivel educativo de la población en estudio (Frecuencias simples absolutas) 120 100 100 Sin instrucción
70
80
Primaria
60
Secundaria
40 20
20
Terciaria
10
0 Fuente: Datos ficticios
Distribuciones Univariadas Resumen Variables de Tipo II: Estadísticas que constan de muchas observaciones, pero la variable toma pocos valores distintos.
Variables de Tipo III: Estadísticas que constan de muchas observaciones y la variable toma muchos valores distintos. Salario por hora
Personas Activas
Número de Familias
(variable)
Número de obreros
(variable)
(frecuencias) 1
16
2
20
(frecuencias)
de 4 a 8 pesos
3
de 8 a 12 pesos
12
de 12 a 16 pesos
40
de 16 a 32 pesos
47
de 32 a 36 pesos
32
3
9
4
5
de 36 a 40 pesos
13
Total
50
de 40 a 44 pesos
9
de 44 a 48 pesos
4
Total
160
Distribuciones Univariadas Usamos:
Tablas tipo II: Tablas de distribución de frecuencias simples. Cuando el tamaño de la población y/o muestra es grande y el recorrido de la variable es pequeño, hay valores de la variable que se repiten Tablas tipo III: tablas de frecuencias con datos agrupados en clases Cuando el tamaño de la población y/o muestra y el recorrido de la variable son grandes, será necesario agrupar en intervalos los valores de la variable.
Distribuciones Univariadas RECORRIDO o RANGO de la variable es la distancia entre el valor más alto y el más bajo Las clases tienen una LIMITE INFERIOR, un LIMITE SUPERIOR, y una AMPLITUD
AMPLITUD DE CLASE: Diferencia entre dos límites sucesivos inferiores teóricos de las clases MARCA DE CLASE (Xc). Es un valor medio que se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos.
Distribuciones Univariadas Nomenclatura Li- – Ls
Intervalo de clase (con límite inferior de clase y límite superior de clase. Se trata de límites teóricos y no reales.
Ai
Amplitud del intervalo: diferencia entre Li y Ls TEORICOS
Xc
Marca de clase: Punto medio del intervalo de clase. Es el punto más representativo de los valores incluidos en el intervalo. Se obtiene promediando los dos límites teóricos del intervalo (Li +Ls)/2
Repaso Niveles de medición de las variables Nominales Ordinales (crit.jerarquización, ordenación) De Intervalo (orden,distancia) De razón (orden, distancia, proporción)
GRÁFICOS
Una forma de presentación… Los gráficos son considerados el método de presentación de la información más simple para el lector porque puede captar el panorama general o la tendencia de los datos de una sola mirada
Ventajas Es mucho más fácil de comprender que una tabla o un texto. La sencillez de líneas, una atractiva manera de presentación, hacen de los gráficos una de las herramientas más poderosas para transmitir ideas en forma rápida y simple al lector.
Desventaja
Su desventaja más notoria es la pérdida de precisión y exactitud, si se lo compara con una tabla.
Distribución de la variable tipo de ocupación
Tipo de Ocupación
%
Asalariado privado
57
Asalariado público
16
Miembro de cooperativa de producción
1
Patrón
5
Cuenta propia sin local o inversión
7
Cuenta propia con local o inversión
12
Miembro del hogar no remunerado
3
Asalariado privado
100
Asalariado público
Total
Miembro de cooperativa de producción Patrón Cuenta propia sin local o inversión Cuenta propia con local o inversión Miembro del hogar no remunerado
TIPOS DE GRÁFICOS
Gráficos para variables cualitativas
•
Diagramas de barras:
Representamos en el eje de ordenadas las categorías y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Para comparar usar frecuencias relativas!
Diagramas de barras (ej. Estado Civil)
Diagramas de barras (ej. Estado Civil)
Compara dos poblaciones
Diagramas de sectores (o de torta)
41% 46%
59%
Hasta 35 años
Más de 35 años
Masculino
54%
Femenino
Se divide un círculo en tantas porciones como categorías existan, de modo que a cada categoría le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa
Pictogramas Expresan con dibujos alusivos al tema de estudio las frecuencias de las categorías de la variable. Estos gráficos se hacen representando a diferentes escalas un mismo dibujo. Las áreas son proporcionales a las frecuencias. Se usa en medios de comunicación por su facilidad
Gráficos para variables cuantitativas Distinción entre Variables Discretas y variables Continuas •Una variable discreta es la variable tal que entre 2 cualesquiera valores observables (potencialmente), hay por lo menos un valor no observable (potencialmente). •Una variable continua tiene la propiedad de que entre 2 cualesquiera valores observables (potencialmente), hay otro valor observable (potencialmente).
Distinción entre Variables Discretas y variables Continuas - Una variable discreta es sencillamente una variable para la que se dan de modo inherente separaciones entre valores observables sucesivos. Dicho con más rigor, se define una variable discreta como la variable tal que entre 2 cualesquiera valores observables (potencialmente), hay por lo menos un valor no observable (potencialmente). Por ejemplo, un recuento del número de familias que habitan en una vivienda es una variable discreta. Mientras que cuentas de 3 y 4 son potencialmente observables, no lo es una de 3,5. - Una variable continua tiene la propiedad de que entre 2 cualesquiera valores observables (potencialmente), hay otro valor observable (potencialmente). Una variable continua toma valores a lo largo de un continuo, esto es, en todo un intervalo de valores. Longitudes y pesos son ejemplos de variables continuas. La estatura de una persona, pude ser 1,70 mts. ó 1,75 mts., pero en potencia al menos podría tomar cualquier valor intermedio como 1,73 mts. por ejemplo. - Un atributo esencial de una variable continua es que, a diferencia de lo que ocurre con una variable discreta, nunca se la puede medir exactamente. Con una variable continua debe haber inevitablemente un error de meda. - Un importante principio sobre variables continuas es que siempre se registran en forma discreta, quedando la magnitud de la distancia entre valores registrables adyacentes determinada por la precisión de la medición.
Variables discretas: Cuando representamos una variable discreta, usamos el diagrama de barras si pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama acumulado (o integral) tiene, por la naturaleza de la variable, forma de escalera.
Variables discretas:
xi
fi
fr
Fi
Fr
0
1
1/8
1
1/8
1
3
3/8
4
4/8
2
3
3/8
7
7/8
3
1
1/8
8
8/8
n=8
1
Variables continuas: •
Histograma: Se construye a partir de la tabla estadística, representando sobre cada intervalo un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.
Variables continuas:
•Polígono de Frecuencias Se
construye
Polígono de Frecuencias e Histograma Li-1 - Li
Xc
fi
Fi
0 -- 2
1
2
2
2 -- 4
3
1
3
4 -- 6
5
4
7
6 -- 8
7
3
10
8 - 10
9
2
12
………. .
12
Polígono de Frecuencias Acumulado Se obtiene como la poligonal definida en abscisas a partir de los extremos de los intervalos en los que se ha organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas
Supuesto Xc – frecuenci a cero
Nota:
El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura,
Tipo especial de Histograma: Pirámide de población
Resumen Tabla: Principales diagramas según el tipo de variable
Tipo de variable Variable Cualitativa
Diagrama Barras, sectores, pictogramas
Variable Cuantitativa Variable Discreta
Diferencial (barras) Acumulativo (en escalera)
Variable Continua
Diferencial (histograma, polígono de frecuencias, pirámides de población) Acumulativo (Ojiva o polígono de frecuencias acumuladas)