Story Transcript
ENCUESTA DE PROTECCIÓN Y SEGURIDAD SOCIAL II -ENAPROSS IISubsecretaría de Programación Técnica y Estudios Laborales
ENCUESTA DE PROTECCIÓN Y SEGURIDAD SOCIAL II
METODOLOGÍA DEL DISEÑO DE MUESTRA
CONTENIDO 1.
INTRODUCCIÓN .................................................................................................... 2
2.
POBLACIÓN Y DOMINIOS .................................................................................... 2
2.1 Población objetivo ................................................................................................ 2 2.2 Dominio .................................................................................................................. 3 3.
DISEÑO DE LA MUESTRA .................................................................................... 3
4.
LOCALIDADES: UNIDADES DE MUESTREO DE PRIMERA ETAPA (UPE) ....... 4
5.
RADIOS: UNIDADES DE MUESTREO DE SEGUNDA ETAPA (USE) .................. 6
6.
VIVIENDAS: UNIDADES DE MUESTREO DE TERCERA ETAPA (UTE) ............. 7
7.
TAMAÑO DE LA MUESTRA .................................................................................. 7
8.
ADJUDICACIÓN DE RADIOS POR LOCALIDAD ................................................. 8
9.
ESTIMADORES .................................................................................................... 11
10. ERRORES DE MUESTREO ................................................................................. 11 BIBLIOGRAFÍA ............................................................................................................. 12
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
1. INTRODUCCIÓN La Encuesta de Protección y Seguridad Social II (ENAPROSS II) es un estudio orientado a la evaluación de la situación socioeconómica y de protección social de los hogares localizados en el territorio de la República Argentina y de los individuos que residen en él. El estudio se basa en una muestra probabilística de viviendas de localidades urbanas que, de acuerdo al Censo Nacional de Población, Hogares y Viviendas 2010 (en adelante, Censo 2010) realizado por el Instituto Nacional de Estadística y Censos (INDEC), poseían en ese momento, 5000 o más habitantes, de las jurisdicciones de la Ciudad Autónoma de Buenos Aires (CABA), 24 partidos del Gran Buenos Aires, provincia del Chaco, provincia de Catamarca, provincia de Corrientes, provincia de Jujuy y la provincia de Río Negro. La fecha de referencia es el año 2015 porque corresponde al período de la ejecución del operativo de campo. El tamaño de la muestra planeado para los principales dominios fue de 2000 casos para CABA y 24 partidos del Gran Buenos Aires, y 1200 casos para las restantes provincias, lo que resulta un total de 10.000 viviendas. Por su magnitud, junto con la ENAPROSS I, se la ubica entre las más grandes encuestas llevadas a cabo en nuestro país. La principal utilidad de la ENAPROSS II es la de suministrar la información necesaria para la formulación de eficientes políticas de Protección y Seguridad Social a nivel del país, regiones y provincias.
2. POBLACIÓN Y DOMINIOS 2.1 Población objetivo
La población objetivo está compuesta por los hogares y personas que durante el año 2015 habitaban en viviendas particulares ubicadas en localidades del país y que, de acuerdo con el Censo 2010, tenían 5000 o más habitantes. Algunas definiciones generales relacionadas con el presente proyecto son: Hogar particular: es el constituido por toda persona o personas que comparten una misma vivienda en un régimen de tipo familiar y consumen alimentos con cargo al mismo presupuesto, independientemente de que sean parientes o no. Cada persona integrante de un hogar particular es un miembro del hogar. Vivienda: es el recinto fijo o móvil que ha sido construido o adaptado para alojar personas. |2
2
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
También se consideran viviendas aquellos locales no destinados originalmente para alojar personas, pero que son utilizados para ese fin. Una vivienda puede contener uno o más hogares. Se excluyó de la población en estudio a las personas que viven en hogares colectivos como asilos, guarderías, orfanatos, instituciones religiosas, hospitales, instituciones militares, etc., y hogares en viviendas móviles. En cambio, sí se incluyeron los hogares particulares constituidos en hoteles, pensiones e inquilinatos.
2.2 Dominio
Es un concepto de carácter técnico, definido en el año 1950 por la Organización de las Naciones Unidas en relación con la teoría del muestreo. Se lo define como “cualquier subdivisión de la población acerca de la cual se puede dar información numérica con una precisión posible de ser estimada”. Dominios básicos: La Ciudad Autónoma de Buenos Aires y cada una de las provincias encuestadas: Catamarca, Corrientes, Chaco, Jujuy y Río Negro. Los 24 partidos del Gran Buenos Aires. Formación de dominios por agregación: adicionando los dominios básicos enunciados anteriormente, se pueden construir nuevos dominios de información. En particular, es de interés la región Gran Buenos Aires (GBA) conformada por CABA y los 24 partidos del Gran Buenos Aires.
3. DISEÑO DE LA MUESTRA El diseño de la muestra fue probabilístico, dado que a cada unidad de la población se le asoció una probabilidad distinta de cero de ser seleccionada para integrar la muestra. Las probabilidades fueron asignadas a las unidades de cada uno de los marcos de muestreo definidos. El Censo 2010 fue el marco general disponible a nivel de provincia. No suministraba datos sobre la localización de cada uno de los hogares, ni de las viviendas de cada localidad, pero sí la información correspondiente a la cantidad de hogares y de población que contenía cada radio censal definido en el año 2010. Se consideró que el diseño probabilístico más eficiente era un Muestreo estratificado de conglomerados a tres etapas. En la primera etapa de la investigación, en cada dominio, se eligió una muestra de localidades que en el Censo tenían como mínimo 5000 habitantes; en una segunda etapa, dentro de cada localidad elegida, se seleccionó una submuestra de radios censales; en cada uno de estos, se listaron todas |3
3
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
las viviendas ubicadas dentro de sus límites; en la tercera y última etapa, se seleccionó la submuestra de viviendas y se entrevistaron a todos los habitantes de las viviendas así elegidas. Finalmente, se seleccionaron los radios y en cada uno de ellos se procedió a realizar el listado y conteo de las viviendas para disponer de un marco actualizado de Unidades de Tercera Etapa. Si bien esto se realizó entre los años 2010 y 2011, se actualizaron algunos radios que fueron listados nuevamente durante 2015. En resumen, en el presente diseño, se definieron localidades como unidades de muestreo de primera etapa (UPE), radios censales como de segunda etapa (USE), y las viviendas como las de tercera o última etapa (UTE).
4. LOCALIDADES: UNIDADES DE MUESTREO DE PRIMERA ETAPA (UPE) Las UPE se seleccionaron en todas las provincias argentinas, usando una estrategia mixta de inclusión forzosa y selección en forma aleatoria.
UPE de inclusión en forma forzosa: fueron todas las capitales de provincia más las ciudades
que, al momento del Censo 2010, tenían al menos 140.000 habitantes. Este conjunto de grandes ciudades no participó en la selección aleatoria sino que entró en la muestra con probabilidad igual a la unidad. UPE seleccionadas en forma aleatoria: quedó constituido por el conjunto formado por las localidades de 5000 y más habitantes, según el Censo 2010, excluidas las que integraron la muestra por inclusión forzosa. Las unidades fueron seleccionadas con probabilidad proporcional al tamaño, utilizando como medida del tamaño la cantidad de habitantes que cada localidad tenía en ese Censo. Para lograr una mejor dispersión geográfica de las localidades sobre la superficie de la provincia, se preparó un marco especial a partir de ubicar las localidades de cada provincia, arbitrariamente en dos o tres zonas, al solo efecto de selección de la muestra. En total, fueron elegidas 22 localidades/ aglomerados, de los cuales 7 fueron de inclusión forzosa y 15 de selección aleatoria. En el siguiente cuadro, se presentan las localidades/ aglomerados que conformaron la muestra, con la indicación de si fueron de inclusión forzosa o seleccionadas aleatoriamente.
|4
4
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
Cuadro 1 |
Jurisdicción Ciudad Autónoma de Buenos Aires (CABA)
Prov. de Buenos Aires
Prov. de Catamarca
Prov. de Corrientes
Aglomerado/ Localidad
Departamento/ Partido
Forma de selección
-
IF
24 partidos del Gran Buenos Aires
Almirante Brown; Avellaneda; Berazategui; Esteban Echeverría; Ezeiza; Florencio Varela; General San Martín; Hurlingham; Ituzaingó; José C. Paz; La Matanza; Lanús; Lomas de Zamora; Malvinas Argentinas; Merlo; Moreno; Morón; Quilmes; San Fernando; San Isidro; San Miguel; Tigre; Tres de Febrero y Vicente López
IF
Gran San Fernando del Valle de Catamarca
Capital
I.F.
Tinogasta
Tinogasta
S.A.
Santa María
Santa María
S.A.
Gran Corrientes
Capital
I.F.
Mercedes
Mercedes
S.A.
Gobernador Ing. Valentín Virasoro
Santo Tomé
S.A.
Bella Vista
Bella Vista
S.A.
Gran Resistencia
San Fernando
I.F.
General José de San Martín
Libertador General San Martín
S.A.
CABA
Prov. del Chaco
Prov. de Jujuy
Presidencia Roque Saenz Comandante Fernández Peña
S.A.
San Bernardo
O'Higgins
S.A.
Gran San Salvador de Jujuy
Dr. Manuel Belgrano Palpalá
I.F.
San Pedro
San Pedro
S.A.
La Quiaca
Yavi
S.A.
San Carlos de Bariloche
Bariloche
I.F.
General Roca
General Roca
S.A.
Cipolletti
General Roca
S.A.
Viedma
Adolfo Alsina
I.F.
Villa Regina
General Roca
S.A.
Río Colorado
Pichi Mahuida
S.A.
Prov. de Río Negro
Referencias: I.F.: Localidad/ aglomerado incluida forzosamente para participar en la muestra S.A.: Localidad seleccionada aleatoriamente para participar en la muestra
|5
5
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
5. RADIOS: UNIDADES DE MUESTREO DE SEGUNDA ETAPA (USE) Las USE fueron los radios censales definidos por el INDEC para el Censo 2010. En general, los radios censales en ese momento contenían 300 viviendas, en promedio. Dentro de cada localidad, se seleccionaron las USE con probabilidad proporcional al tamaño, medido este por la cantidad de hogares. El número de USE a seleccionar dentro de cada localidad dependió de: a) la cantidad de población; b) el efecto diseño; y c) indicadores del nivel de pobreza. Con respecto al efecto diseño, la teoría estadística indica que es necesario tener un adecuado balance entre la cantidad de encuestas a realizar en cada radio y el número de radios seleccionados, dado que al aumentar la cantidad de encuestas por radio, el efecto diseño disminuye la eficiencia de los estimadores. La población de mayor interés para esta investigación es la de menores recursos, ya que hacia ellos van dirigidas las políticas de protección social. Por este motivo, el diseño ha contemplado una mayor cantidad de unidades de segunda etapa de selección en zonas de bajos recursos. Las ciudades con representación diferenciada en la muestra son: CABA y 24 partidos del Gran Buenos Aires. Para el caso de CABA, se solicitó a la Dirección General de Estadística y Censos (DGEyC) de la Ciudad Autónoma de Buenos Aires que realizara el diseño de muestra y el relevamiento, pues disponía de marcos de muestreo más actualizados; en el caso de los 24 Partidos del Gran Buenos Aires, se seleccionaron nuevos radios censales (200 radios) y se entrevistaron 10 viviendas en cada uno de ellos. En las otras ciudades, si bien no se aumentó el tamaño de la muestra en los radios con hogares de mayor privación, se utilizó el IPMH para el ordenamiento de los radios lo que aseguraba, al utilizar el método de selección sistemático, que hubiera una mejor representación de la población en relación con esa variable. Si bien este ordenamiento no es estrictamente una estratificación, las estimaciones tienden a tener menores variancias. Se determinó la cantidad de unidades de segunda etapa para cada estrato por afijación óptima, logrando así el objetivo de tener mayor proporcionalidad de radios en el estrato de más alta proporción de hogares con alguna privación. El método de afijación óptima se refiere a la meta de asignar razones de muestreo a los estratos, de manera que se obtenga la mínima variancia para la media y el total para un costo fijo. Cuando el costo es el mismo entre estratos, se lo conoce como la asignación de Neyman (Leslie Kish, 1979) (Scheaffer et al., 1987). La determinación de tamaños de muestra no proporcionales a la estructura poblacional implica construir los factores de expansión de modo tal que permitan, en el momento de la expansión, reproducir la estructura poblacional del área en estudio. |6
6
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
Como ya se mencionó, la información sobre la cantidad de viviendas por radio proviene del Censo 2010, pero no se disponía de un marco de viviendas, por lo cual se recorrieron las manzanas que componían cada radio elegido y se listaron todas las viviendas particulares existentes en ese momento, obteniendo así marcos de viviendas actualizados a la fecha del listado. Las tareas de listado en los radios seleccionados fueron supervisadas a efectos de validar su cantidad y calidad, ya que sufrieron un cambio significativo entre la información del Censo 2010 y el listado realizado.
6. VIVIENDAS: UNIDADES DE MUESTREO DE TERCERA ETAPA (UTE) Las UTE fueron las viviendas. Los listados realizados en cada uno de los radios constituyeron los marcos para selección de viviendas que, como ya se expresó, estuvieron disponibles en una base de datos, lo que posibilitó el desarrollo de una aplicación informática para la selección sistemática y que, además, elabora automáticamente la Hoja de Ruta del Encuestador. Las viviendas fueron elegidas con probabilidad igual dentro de cada radio integrante de la muestra. La no respuesta: uno de los inconvenientes de las encuestas dirigidas a hogares es que la tasa de no respuesta puede ser altamente significativa y, además, variable según localidad y barrio. En general, hay una correlación positiva entre la tasa de no respuesta y el nivel socioeconómico de los hogares. Para poder lograr una muestra efectiva acorde a lo esperado en el diseño y evitar tener que seleccionar a posteriori nuevas viviendas para completarla, sin afectar las probabilidades, se extrajo una muestra mayor de viviendas en cada radio elegido.
7. TAMAÑO DE LA MUESTRA El objetivo de obtener estimaciones que tengan una determinada precisión y nivel de confianza similar para cada uno de los dominios hizo necesario establecer una cantidad mínima de UTE a ser seleccionada en cada uno de ellos. Además, con fines prácticos para el trabajo de campo, se adoptaron cantidades iguales de viviendas en los radios de cada dominio. En el Cuadro N° 2, se presentan los tamaños de muestra por dominio, indicando, además, la cantidad de viviendas a seleccionar en cada USE.
|7
7
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
Cuadro N° 2 | Tamaño de la muestra en cantidad de USE y de UTE por dominio
Jurisdicción
Dominio
Entre- vistas (UTE)
Radios
Entrevistas
(USE)
por radio
Ciudad Autónoma de Buenos Aires (CABA)
CABA
2.000
430
10
Prov. de Buenos Aires
24 partidos del Gran Buenos Aires
2.000
200
10
Prov. de Catamarca
Prov. de Catamarca
1.200
75
16
Prov. de Corrientes
Prov. de Corrientes
1.200
75
16
Prov. del Chaco
Prov. del Chaco
1.200
75
16
Prov. de Jujuy
Prov. de Jujuy
1.200
75
16
Prov. de Río Negro
Prov. de Río Negro
1.200
75
16
10.000
1.005
-
Total general
-
Se observa que, para los dominios CABA y 24 Partidos del Gran Buenos Aires, corresponde un tamaño de 2.000 viviendas, mientras que para los restantes dominios el mismo es de 1.200 viviendas. En el caso de CABA, el diseño contempla 3 marcos diferenciados, “Viviendas particulares
generales”, “Inquilinatos, Hoteles familiares, Pensiones, Casas (inmuebles) usurpadas/ tomadas” (IHPCT) y “Villa”. En el primer marco, se utiliza una estratificación en 5 estratos, de acuerdo con la metodología que habitualmente utiliza la DGEyC para el diseño de sus muestras. Se selecciona una muestra de radios dentro del marco de viviendas particulares y se las asigna proporcionalmente a los estratos. En el caso de los 24 partidos del Gran Buenos Aires, se procedió a estratificar los radios en 5 estratos con la información del Censo 2010. Para ello, se utilizó la información de porcentaje de hogares con NBI. Si superaba el 50%, se los consideró en un estrato y para construir los restantes 4 estratos, se tomó el porcentaje de jefes de hogar con primario incompleto, haciendo el corte entre el 15%, 50% y 65%.
8. ADJUDICACIÓN DE RADIOS POR LOCALIDAD Los 1005 radios y las 10.000 viviendas debieron ser adjudicados en cada una de las 22 localidades/ aglomerados elegidos. |8
8
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
El método de adjudicación fue proporcional a la cantidad de habitantes que tenía la localidad con respecto al dominio según los datos del Censo Nacional de Población, Hogares y Viviendas de 2001, con la restricción, por problemas operativos, de elegir un mínimo de 3 radios en cada localidad. La regla de adjudicación de los radios de cada dominio entre las localidades fue:
cdl
Pobdl cd Pobdl l
Si cdl< 3 se hace cdl = 3 Ajustando los restantes valores
Donde: cd: Cantidad de radios en la muestra del dominio “d” cdl: Cantidad de radios a adjudicar en la localidad l-ésima del dominio “d” Pobdl: Cantidad de habitantes de la localidad l-ésima del dominio “d” en el Censo 2001.
En el cuadro siguiente, se presenta la cantidad de radios que le correspondió a cada localidad/ aglomerado integrante de la muestra y la cantidad total de viviendas que debían ser seleccionadas.
|9
9
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
Cuadro N°3 | Cantidad
Forma de selección
de radios
Entrevistas esperadas
Ciudad Autónoma de CABA Buenos Aires (CABA)
I,F.
120
2.000
Prov. de Buenos Aires
24 partidos del Gran Buenos Aires
I.F.
200
2.000
Gran San Fernando del Valle de Catamarca
I.F.
65
1040
Tinogasta
A.L.
5
80
Santa María TOTAL
A.L. -
5 75
80 1200
Gran Corrientes
I.F.
59
944
Mercedes
A.L.
6
96
Gobernador Ing. Valentín Virasoro
A.L.
5
80
Bella Vista
A.L.
5
80
-
75
1200
Gran Resistencia
I.F.
55
880
Presidencia Roque Sáenz Peña
A.L.
12
192
General José de San Martín
A.L.
5
80
San Bernardo
A.L.
3
48
-
75
1200
Gran San Salvador de Jujuy
I.F.
60
960
San Pedro
AL
12
192
La Quiaca
AL
Jurisdicción
Prov. de Catamarca
Prov. de Corrientes
Aglomerado/ Localidad
TOTAL
Prov. del Chaco
TOTAL
Prov. de Jujuy
TOTAL
Prov. de Río Negro
3
48
75
1200
San Carlos de Bariloche
I.F.
20
320
General Roca
A.L.
17
272
Cipolletti
A.L.
16
256
Viedma
I.F.
12
192
Villa Regina
A.L.
7
112
Río Colorado
A.L.
3
48
-
75
1200
TOTAL
Referencias: I.F.: Localidad/aglomerado incluido forzosamente para participar en la muestra A.L.: Localidad seleccionada aleatoriamente para participar en la muestra
| 10
1
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
9. ESTIMADORES Los estimadores se definen como las expresiones matemáticas construidas a partir de los datos de la muestra y que tienen como objetivo estimar los valores poblacionales o parámetros del estudio. La estructura de estas fórmulas depende de la forma en que fueron seleccionadas las diferentes unidades de muestreo. En la presente investigación, el diseño de muestra es complejo: en cada dominio, la selección fue en tres etapas, donde las UPE se seleccionaron con probabilidad variable, las USE se estratificaron y seleccionaron también con probabilidades variables, y las UTE con probabilidades iguales. Los dominios de información requieren el suministro de estimaciones por separado. Se trabajó con dos tipos de estimadores:
Insesgados de expansión simple: para estimar parámetros totales y promedios de una variable cuantitativa o dicotómica como así también los errores debidos al muestreo. Se utilizan en forma directa o se incorporan a los estimadores por razón.
Sesgado de razón: en muestras suficientemente grandes como la presente, el sesgo es despreciable y la ventaja es que suele ser más preciso. Permite estimar el parámetro razón de dos variables, totales y promedios de una variable cuantitativa o dicotómica y los estimadores del error de muestreo.
10. ERRORES DE MUESTREO La base de datos de la ENAPROSS en formato SPSS permite estimar el error típico, el coeficiente de variación y el efecto diseño para cada estadístico, utilizando el módulo de muestras complejas. Para ello es necesario construir el archivo csplan de SPSS o la sintaxis en Stata para indicar el diseño muestral utilizado. Los estratos deben ser indicados por las variables identificadas en la base como “Dominio” y “estrato” y los conglomerados por “PuntoMuestra”. Se recomienda tener en cuenta la siguiente sugerencia para evaluar la confianza de las estimaciones: Estadísticos cuyos coeficientes de variación sean inferiores o iguales al 10% se consideran muy aceptables, los que superan el 10% y hasta un 20%, se los considera razonables, cuando superan el 20%, se debe tomar con precaución el dato estimado.
| 11
1
Encuesta de Protección y Seguridad Social II (ENAPROSS II)
BIBLIOGRAFÍA
KISH, Leslie (1979). Muestreo de encuestas, Trillas. México. SCHEAFFER, R.L.; MENDENHALL, W, y OTT, L. (2006). Elementos de muestreo. Sexta edición. Thomson Editores. Paraninfo. España.
| 12
1