Story Transcript
301
DISEÑOS MUESTRALES UTILIZADOS EN ALGUNAS DE LAS ENCUESTAS DE HOGARES REALIZADAS EN LA ÚLTIMA DÉCADA EN CUBA
OFICINA NACIONAL DE ESTADÍSTICA (ONE)1
1
Documento elaborado por Mildred Iglesias Linares.
302
Diseños muestrales utilizados en algunas...
ÍNDICE Página
1.
Disponibilidad de un Marco Muestral para el Levantamiento de las Encuestas de Hogares ........................................................................................................... 303
2.
Diseños Muestrales Realizados por la Oficina Nacional de Estadística en los Últimos Años para el Levantamiento de las Encuestas de Hogares........................... 305 2.1 Diseño muestral general o muestra maestra................................................................. 306 2.2 Diseño muestral de la encuesta sobre indicadores de prevención de infección por el VIH/SIDA ..................................................................................... 306 2.3 Diseño muestral de la encuesta de hogares del año 2001 ............................................ 308 2.4 Diseño muestral de la encuesta sobre el uso del tiempo .............................................. 310 2.5 Diseño muestral de la encuesta estudio de mercados .................................................. 314 2.6 Diseño muestral de la encuesta nacional de factores de riesgo para la salud y enfermedades no transmisibles............................................................ 317
Diseños muestrales utilizados en algunas...
1.
303
Disponibilidad de un Marco Muestral Maestro para el Levantamiento de las Encuestas de Hogares
Desde que se instituyó, a inicios de la década de los 70, la Oficina Nacional de Estadística (ONE) como órgano independiente de la Junta Central de Planificación, comenzaron a realizarse de forma oficial encuestas por muestreo en el país. Al principio eran solo Encuestas Eventuales para luego, a partir de 1977, comenzar a realizar algunas, como la de Presupuesto Familiar, de forma permanente. Con el levantamiento del Censo de Población y Viviendas de 1981 y tomando en cuenta los precedentes que apuntaban a la necesidad de disponer de un listado de unidades, a partir del cual se pudieran seleccionar las muestras de hogares requeridas para las encuestas a nivel nacional, se dio inicio, en el año1982, a la organización de lo que luego se denominó Marco Muestral Maestro. Dicho marco quedó estructurado según la División Político Administrativa (DPA) del país en 14 provincias y 169 municipios por debajo de los cuales se encontraban conglomerados de 180 viviendas en promedio que constituían los Distritos Censales y conformaban las Unidades de Primera Etapa de selección. A posteriori, una vez organizado el Marco Muestral Maestro, se elaboró el Diseño Muestral General (DMG) también identificado como Muestra Maestra (MM) que, organizado en tres bloques, los dos primeros destinados para la selección de las muestras, mediante un Muestreo por Listas, de las encuestas de carácter continuo y el tercero para el desarrollo de encuestas eventuales, sirvió de base en general al Sistema de Encuestas de Hogares. En el año 1990, para garantizar, ante las dificultades económicas, materiales y energéticas del país, la continuidad del DMG y con ello la selección de las muestras de las encuestas a la población, se decidió transformar el Muestreo por Listas que se venía aplicando en un Muestreo por Áreas. La implementación del marco de áreas resultó ser mucho mas conveniente y ventajosa para llevar a cabo la selección de viviendas ya que permite asociar las viviendas con un área geográfica determinada, ya sea una manzana, segmento o sección, debidamente definida por límites físicos. Esto garantiza una mayor estabilidad en la identificación de las áreas de muestreo que la que ofrece el muestreo por listas, al tiempo que refleja de manera automática el crecimiento natural de la población. A lo anterior expuesto pudiera añadirse la obtención de una simplificación notable en el proceso de selección, porque se concentra la muestra en bloques compactos de viviendas próximas denominados secciones. Además, luego de realizar una primera selección se puede establecer un orden de rotación de las secciones que integran el territorio quedando seleccionadas las viviendas de manera automática. Ya implementado el Muestreo por Áreas y en ausencia de recursos para levantar el Censo de la ronda de los 90´ se hizo necesario actualizar la distritación del país. Fue entonces que, en el año 1995, dentro del DMG, se definió una nueva división territorial por debajo del municipio denominada Área Geográfica Muestral (AGEM), que sustituyó a los Distritos Censales que se venían utilizando hasta ese momento. En ese entonces, sólo fue posible realizar la división de los planos municipales en AGEM y confeccionar los expedientes cartográficos de las AGEM seleccionadas para participar en la Encuesta Nacional de Migraciones Internas de Cuba. Posteriormente en el período de Septiembre 1998 - Junio 1999, al disponerse de los recursos necesarios se confeccionaron los expedientes cartográficos de todas las AGEM del país. Estos expedientes, confeccionados a partir de la actualización en el terreno del Marco Muestral Maestro, contienen los mapas o planos con la subdivisión en manzanas y secciones de las AGEM urbanas, así como en segmentos y secciones en el caso de las rurales, los derroteros y los listados de las viviendas contenidas en cada AGEM. De este modo la Oficina Nacional de Estadísticas dispone de un Marco Muestral estructurado según la DPA vigente en 14 provincias y 169 municipios. Los municipios a su vez se encuentran particionados en AGEM urbanas y/o rurales, conglomerados que tienen en promedio 180 viviendas. Por su parte las
304
Diseños muestrales utilizados en algunas...
AGEM dentro de la parte urbana se encuentran divididas en Manzanas de 30 viviendas como mínimo y las correspondientes a la parte rural en Segmentos de 90 viviendas como promedio. Finalmente, tanto las manzanas como los segmentos se dividen en secciones que tienen en promedio 5 viviendas. Considerándose como estratos geográficos las provincias y los municipios en que está dividido el territorio según la División Político Administrativa entonces las Unidades Maestrales que conforman el marco quedan resumidas en: Tabla 1. Unidades Muestrales que conforman en Marco Unidades Muestrales Unidad de Primera Etapa Unidad de Segunda Etapa Unidad de Tercera Etapa
Urbano AGEM Manzana Sección
Viviendas Promedio 180 30 como mínimo 5
Rural AGEM Segmento Sección
Viviendas Promedio 180 90 5
Destaca el hecho que dentro de cada estrato se realizó una estratificación implícita de las AGEM que comprende dos criterios de clasificación, que se aplican para proporcionarles un ordenamiento antes del proceso de selección de la muestra. Primer criterio: Asentamiento Poblacional. Se ordenaron las AGEM según los códigos de los asentamientos poblacionales a que pertenecen, que comienzan por la ciudad cabecera municipal con el código 001. Segundo Criterio: se utilizó la doble clasificación por zona urbana y rural y las características de la distribución de las viviendas que radican en cada AGEM, de los cuales resultaron 8 niveles de clasificación: Urbano Rural - Llano
Rural - Montaña
Llano Montaña Concentrado Mixto Disperso Concentrado Mixto Disperso
Con respecto a la identificación de límites de las unidades de selección en la parte urbana se recomendó que las fronteras de las manzanas fueran las calles y en la periferia de las ciudades, los ríos, las líneas de ferrocarril, etc. Estos deberían quedar reflejados en los mapas y derroteros junto a las señalizaciones, los letreros, los semáforos pudiendo servir de puntos de referencia para la ubicación más fácil en el terreno. En la parte rural, los límites pueden ser caminos, carreteras, canales de riego o de drenaje, vías de ferrocarril, ríos, lagos, presas, arboledas, sembrados u otros accidentes físicos reconocibles y relativamente estables en el tiempo. La numeración de las AGEM se realizó dentro de los Municipios/Parte. En la parte urbana, las manzanas se numeraron dentro de las AGEM y la numeración de las secciones se realizó dentro de cada manzana. De forma similar se realizó en la parte rural, numerándose los Segmentos dentro de las AGEM y las secciones dentro de los Segmentos. Desde el punto de vista de su contenido, la estructuración del Marco Muestral, contempla desde la formación del listado de unidades a muestrear, hasta las medidas de tamaño de las diferentes subdivisiones o unidades de muestreo que lo conforman. Es decir ofrece la información necesaria para
Diseños muestrales utilizados en algunas...
305
permitir una clasificación, selección, e identificación de las unidades muestrales que conlleve a mejorar los procesos de selección, estratificación o estimación a partir de una muestra. 2.
Diseños Muestrales Rrealizados por la Oficina Nacional de Estadísticas en los Últimos Años para el Levantamiento de las Encuestas de Hogares
En la mayoría de las investigaciones NO es factible obtener información de todas las unidades de la población, o lo que es lo mismos, realizar un censo, por la gran cantidad de recursos materiales y humanos que se requiere o por lo complejo de los estudios. En estos casos, las observaciones se limitan a un subconjunto de las unidades de la población que es lo que se denomina Muestra. Las muestras pueden ser de dos tipos, probabilísticas y no probabilísticas. Ahora bien, si se quiere que la investigación tenga rigor técnico y permita dar respuesta a los requerimientos de la investigación estas no se deben escoger arbitrariamente. Es requisito indispensable para seleccionar una muestra: -
conocer cuales son los objetivos de la investigación así como el alcance territorial y temático.
-
Definir claramente quien conforma a la población objeto de estudio, cual es la unidad de visita y de enumeración, el método de enumeración y el periodo de enumeración.
-
Definir el marco muestral que servirá de base para la selección de las unidades a muestrear, las unidades a muestrear y el método de muestreo que se aplicará.
-
Identificar quienes conformarán los estratos y los dominios de estudio y como se realizará la afijación o distribución de la muestra por estratos.
-
Precisar según los objetivos del estudio y la disponibilidad de recursos, la confiabilidad y el nivel de error admisible para los resultados
-
Determinar el tamaño de muestra necesario para lograr cumplimentar los objetivos propuestos así como los procedimientos de estimación que se emplearán para realizar inferencias a la población.
-
Determinar, en caso de tratarse de una encuesta continua, la periodicidad en la realización de la investigación así como el esquema de rotación que garantice la comparabilidad de los resultados en cada etapa.
Lo anteriormente expuesto pudiera resumirse en plantear que para realizar una investigación por muestreo se requiere definir a priori un Diseño Muestral. En los últimos años, en la Oficina Nacional de Estadística se han realizado diseños maestrales para distintas encuestas de hogares. Pudiera citarse en primer lugar el Diseño Muestral General o Muestra Maestra, que no es mas que el diseño de una muestra compleja de gran alcance en el espacio y el tiempo, que sirve de base para garantizar tanto las encuestas periódicas con el estudio de sus indicadores y de la dinámica de los mismos, como, dada su flexibilidad, la aplicación de encuestas eventuales sobre submuestras seleccionadas con ese fin. A continuación se describirá brevemente en primer lugar, el Diseño Muestral de la Muestra Maestra para a posteriori pasar a describir, de forma concisa también, los diseños maestrales que se han empleado en algunas de las encuestas realizadas en los últimos años: la Encuesta Nacional de Ocupación, la Encuesta de Ingresos y Gastos, la Encuesta sobre Indicadores de Prevención de Infección por el VIH/SIDA, la Encuesta sobre Salud y Bienestar del Adulto Mayor (SABE), la Encuesta sobre el Mercado Negro, la Encuesta Nacional de Migraciones Internas, la Encuesta sobre Uso del Tiempo, la Encuesta sobre Factores de Riesgo para la Salud y Enfermedades No Transmisibles, la Encuesta sobre Hábitos Culturales, la Encuesta sobre Comportamientos y Creencias Sexuales y Reproductivas de los Hombres Cubanos, la Encuesta de Evaluación de la Cobertura y la Calidad del Contenido Censal entre otras.
306
Diseños muestrales utilizados en algunas...
2.1 Diseño muestral general o muestra maestra El Marco Maestro de Muestreo de la ONE, dispone de toda la información necesaria para cubrir los requerimientos de una MM previendo en su organización las labores de actualización periódica que incluyen el pateo de terreno y el reajuste de los expedientes cartográficos de las Unidades Muestrales que comprende. La Muestra Maestra, como se expuso anteriormente, no es mas que el diseño de una muestra compleja de gran alcance en el espacio y el tiempo, que sirve de base para garantizar tanto las encuestas periódicas con el estudio de sus indicadores y la dinámica de los mismos, así como también, dada su flexibilidad, la aplicación de encuestas eventuales sobre submuestras seleccionadas con ese fin. Apoyados en el Marco Muestral Maestro de Cuba se realizó el Diseño Muestral General que dio origen mediante la aplicación de un método de Muestreo Probabilístico por Conglomerados Trietápico con estratificación de las Unidades Muestrales de Primera etapa, a la Muestra Maestra. A partir de este diseño, como se mencionó previamente, se obtuvo la Muestra Maestra que comprende un total de 4000 AGEM. Dichas AGEM, conforman las Unidades de Primera Etapa en el diseño y se seleccionaron con Probabilidad Proporcional al Tamaño dado este por el número de viviendas particulares con residentes permanentes que existen en el área geográfica en cuestión. Las Unidades de Segunda Etapa dentro de la parte urbana están constituidas por las Manzanas o Unidades de manzana (de 30 viviendas o más) y en la parte rural por los Segmentos (con 90 viviendas como promedio). Tanto las manzanas urbanas como los segmentos rurales se seleccionaron dentro de las AGEM con Probabilidad Proporcional al Tamaño, dado este por el número de viviendas particulares con residentes permanentes que las conforman. Finalmente las Unidades de Tercera Etapa o sea las Secciones, se seleccionaron de forma sistemática con Probabilidades Iguales. Este diseño dio lugar a una muestra autoponderada a nivel de Municipio/Parte, es decir, a una muestra dentro de la cual las unidades elementales tienen la misma probabilidad de aparecer en la muestra, dentro de cada Municipio/Parte. Para generar las estimaciones se definieron estimadores de razón utilizando como variable auxiliar las Estimaciones de la Población emitidas de manera oficial por el Departamento de Demografía de la Oficina Nacional de Estadísticas debido a que no disponía de estadísticas confiables sobre la cantidad de viviendas del país. La Distribución de la muestra por provincias/parte y municipios/parte se realizó a partir de una Afijación de Compromiso entre una Afijación Proporcional al Tamaño, dado este por el total de población, una Afijación Uniforme y el cálculo del tamaño de muestra necesario para los requerimientos de las encuestas periódicas del país, que son, la Encuesta Nacional de Ocupación y la Encuesta de Situación Económica de los Hogares. 2.2 Diseño muestral de la encuesta sobre indicadores de prevención de infección por el VIH/SIDA La investigación se realizó en dos momentos. Una primera encuesta en 1995 que formaba parte de un proyecto regional de la OPS y una segunda que se levantó del 22 de Junio al 20 de Julio del 2001, de la cual se describirá brevemente el diseño muestral. Esta última encuesta del 2001 se realizó con el propósito de evaluar los avances en cuanto al conocimiento de la población sobre los métodos para prevenir las Infecciones de Transmisión Sexual y el VIH/SIDA, así como el impacto de los programas de difusión en la reducción de las conductas de riesgo.
Diseños muestrales utilizados en algunas...
307
Para desarrollar este estudio, se diseñó y aplicó un cuestionario a la población objetivo, comprendida por las personas de 15 a 49 años de edad residentes permanentes en viviendas particulares, en el cual se abordaron las temáticas necesarias para cumplimentar los propósitos del mismo. Teniendo en cuenta que la disponibilidad de recursos era limitada y se deseaba obtener resultados a nivel de Cuba y provincias lo cual era muy costoso, se consideró seleccionar por provincias al municipio cabecera e incluir además a todos los de la capital Ciudad de La Habana, por ser estos los lugares donde más se reportan las incidencias del SIDA. A partir de ello se decidió agrupar las provincias en cuatro regiones: Ciudad Habana, Región Occidental, Región Central y Región Oriental y diseñar la muestra de forma tal que fuera representativa de Cuba, Ciudad de La Habana y las tres restantes regiones. En el desarrollo de la encuesta la unidad de visita fue la vivienda seleccionada y la unidad de enumeración la persona seleccionada de 15 a 49 años residente permanentemente en la misma, a quien se le llenó el cuestionario mediante una entrevista directa. La muestra para desarrollar la encuesta se insertó dentro de la Muestra Maestra actualizada de que dispone la ONE y el método de muestreo empleado respondió a un muestreo probabilístico del tipo correspondiente a un Muestreo por Conglomerados Cuatrietápico Estratificado donde los estratos geográficos lo constituyeron la parte urbana de los municipios cabeceras provinciales seleccionados para participar en la investigación. Las unidades muestrales y sus probabilidades de selección por municipio se registran en la Tabla 2. Tabla 2. Unidades Muestrales y Probabilidades de Selección por Municipio Etapa de Selección Primera
Unidad Muestral AGEM
Segunda
Manzana
Tercera Cuarta
Sección Persona
Probabilidad de Selección Proporcional al Tamaño PPT (Cantidad de viviendas particulares con residentes permanentes) Proporcional al Tamaño PPT (Cantidad de viviendas particulares con residentes permanentes) Probabilidades Iguales PI Probabilidades Iguales PI
La distribución de la muestra por estrato se realizó con Afijación Proporcional al Tamaño, dada la medida de tamaño por el total de población de 15 a 49 años residentes en la parte urbana de los municipios seleccionados según cifras oficiales del Departamento de Demografía de la ONE. Para determinar el tamaño de muestra necesario para cumplimentar los propósitos de la encuesta se consideraron tanto los resultados obtenidos en la encuesta realizada en 1995 como los devenidos del ensayo efectuado en el municipio de Centro Habana de la capital de país en febrero del 2001, así como también el comportamiento de las caídas de muestra que se obtuvo en los municipios que intervienen en la investigación en la última Encuesta Nacional de Ocupación perteneciente al Sistema de Encuesta de Hogares implantado en el país se llegó al siguiente consenso: 1. Determinar tamaños de muestra similares para la Región Occidental, Región Central y Región Oriental e incrementar el de Ciudad de la Habana. 2. Esperar un mínimo de 300 personas por municipio con el objetivo de obtener los indicadores fundamentales. 3. Incrementar el mínimo de personas requeridos para obtener los indicadores, con los por cientos de caídas de muestra previstos para cada municipio según su comportamiento en las encuestas previas analizadas. Los tamaños de muestra teóricos y su distribución por regiones se muestran en la siguiente tabla.
308
Diseños muestrales utilizados en algunas... Tabla 3. Distribución de la Muestra Estratos Región Occidental Ciudad Habana Región Central Región Oriental CUBA
AGEM 143 160 144 142 589
Viviendas Teóricas 5720 6400 5760 5680 23560
Estos tamaños de muestra se lograron seleccionando con probabilidades iguales 8 secciones de 5 viviendas como promedio por AGEM y entrevistando, en cada vivienda perteneciente a esas secciones y que tuviera persona elegible, a una sola persona, seleccionada por el entrevistador con probabilidades iguales utilizando una tabla de Kish, en el momento de llegar a la vivienda. a)
Procedimiento de estimación
Teniendo como premisa fundamental No obtener diferencias con las estimaciones oficiales por sexo y grupos de edades (15–19, 20-29, 30-39, 40-49) se determinó realizar el procedimiento de estimación por post estratificación de estos dos indicadores. El estimador utilizado fue el de Razón Separada, empleándose como variable auxiliar el Total de personas correspondiente a cada estrato de ponderación. Por su parte el cálculo de los errores maestrales y el coeficiente de variación (CV) de los estimadores de los indicadores fundamentales de la encuesta se realizó utilizando el paquete de programas PC CARP Se señaló además que dado que los errores calculados se refieren a las estimaciones de los indicadores básicos de la encuesta, en las tablas donde aparecieran estimaciones de varios indicadores cruzados, estos estarían afectados por niveles de error superiores en magnitud; es decir; que tendrían menor precisión. 2.3 Diseño muestral de la encuesta de hogares del año 2001 En el año 2000 se unificaron la Encuesta Nacional de Ocupación y la de Ingresos y Gastos que se venían desarrollando de forma independiente hasta la fecha, en una sola encuesta dividida por módulos que se denominó Encuesta de Hogares. Consecuente con ello, La Encuesta de Hogares del año 2001 es una encuesta por módulos compuesta por un módulo fijo, un módulo de ocupación, un módulo de ingresos y un módulo de gastos. El módulo fijo, el de ocupación y el de ingresos son similares a los aplicados en la Encuesta de Hogares del año 2000. A continuación se explicará brevemente el diseño muestral creado para la implementación de esta encuesta durante el periodo de marzo, abril y mayo del 2001. La Encuesta de Hogares del año 2001 es una encuesta nacional que tiene por población objeto de estudio a las personas que residen permanentemente en viviendas particulares. Se realiza a una muestra de viviendas particulares representativas de todo el país tanto de la parte urbana como de la rural excluyendo la Base Naval de Guantánamo. Fue diseñada para continuar los estudios sobre la ocupación y la situación económica de los hogares permitiendo poder caracterizar a los mismos de acuerdo a un conjunto de variables socioeconómicas. La muestra para desarrollar la encuesta se seleccionó del Diseño Muestral General o Muestra Maestra del Sistema de Encuesta de Hogares que tuvo como Marco Muestral Maestro el elaborado por la ONE para la realización de encuestas de hogares en 1995 y que fue actualizado en 1999.
Diseños muestrales utilizados en algunas...
a)
309
Método de muestreo
El método de muestreo que se utilizó corresponde con un muestreo por conglomerados trietápico, con estratificación de las unidades primarias. Las provincias y dentro de ellas los municipios constituyeron los estratos. Las Unidades Muestrales de Primera Etapa fueron las AGEM (Areas Geográficas Muestrales), que tienen 180 viviendas en promedio. Como Unidades de segunda etapa, en el caso de la parte urbana se seleccionaron manzanas o unidades de manzanas, y para la parte rural segmentos. Las Unidades de tercera y última etapa fueron las secciones, con 5 viviendas como promedio. Dentro de cada estrato se hizo un ordenamiento de las unidades primarias de muestreo por asentamientos, previamente clasificados en grandes, medianos y pequeños según su población, garantizando así una estratificación implícita de las unidades de muestreo antes de aplicar el procedimiento de selección. b)
Procedimientos de selección
Las unidades de muestreo se seleccionaron a través de procedimientos probabilísticos: las unidades de primera y segunda etapa, las AGEM, las manzanas urbanas y los segmentos rurales, se seleccionaron con probabilidades proporcionales al tamaño, siendo la medida de tamaño considerada en todos los casos el total de viviendas particulares con residentes permanentes, y las secciones se seleccionaron con probabilidades iguales. c)
Rotación de la muestra
Como se planteó en los inicios, en el año 2001 al igual que en el 2000 se realizó una sola vez en el año, en el periodo (marzo abril y mayo) el levantamiento de la Encuesta de Hogares que vino a unificar las encuestas continuas (Encuesta Nacional de Ocupación y Encuesta sobre la Situación Económica de los Hogares). En ambos momentos, los indicadores de Ingresos se ubicaron en el módulo de ingresos y los de Ocupación en el de ocupación y se aplicaron por igual a la muestra completa de 40000 hogares. El módulo de gastos, por su parte, se le aplicó a una submuestra de 8000 hogares de la parte urbana. La muestra para el año 2001 se aplicó con un solapamiento del 50% de la muestra del año 2000 para el módulo fijo, el de ingresos y el de ocupación permitiendo así que los indicadores fundamentales pudieran ser comparables con una buena precisión. O sea, se levantaron nuevamente 40000 viviendas correspondientes a las mismas 4000 AGEM, solo que 20000 de ellas ya habían participado en el año anterior y las 20000 restantes entraron nuevas ese año para repetirse entonces en el 2002. Con relación a la submuestra de 800 AGEM a la que se le aplicó el módulo de gastos, se mantuvo también la rotación del 50% de la muestra de 8000 hogares que participaron en el estudio, lográndose también buena precisión en la comparabilidad. d)
Período de levantamiento
El levantamiento de la encuesta se realizó en los meses de Marzo, Abril y Mayo. La submuestra de 800 AGEM, a la que se le aplicó el módulo de GASTOS (además de los módulos Fijo, de Ocupación y de Ingresos), se levantó en el mes de Mayo con una duración de cuatro semanas. e)
Tamaño de la muestra
El tamaño de la muestra se determinó de manera tal que permitiera obtener resultados de los indicadores más importantes al nivel de provincias y nación, con una caída de muestra esperada promedio de un 10% y con un nivel de error inferior al 5%. Todo esto permitiría hacer a posteriori un análisis de indicadores con cierto grado de desagregación. El tamaño teórico para Cuba fue de 40000 viviendas.
310
Diseños muestrales utilizados en algunas...
La distribución de la muestra por estratos (provincias, municipios, partes) se realizó con una Afijación de Compromiso. En el caso de la submuestra de 8000 viviendas, dentro de cada provincia los hogares fueron distribuidos aleatoriamente por semanas, de forma tal que tuviese cada semana un tamaño similar en número de viviendas. f)
Estimación.
Los estratos de ponderación fueron los municipios parte urbana y rural dentro de cada provincia, la muestra se diseñó de forma tal que se obtuvo una muestra autoponderada a ese nivel. Para las estimaciones se aplicaron estimadores de razón que utilizaron como variable auxiliar el Total de Población que ofrecen los cálculos demográficos de la ONE. Para las variables de Ocupación e Ingresos se aplicó además una post-estratificación por sexo y grupos de edad (15-29, 30-54, 55 y más para las mujeres, y 15-29, 30-59, 60 y más para los Hombres) Se calcularon los errores muestrales de algunos de los principales indicadores utilizando el sistema PCCARP. Estos errores relativos ó coeficientes de variación permitieron calcular los intervalos de confianza de las estimaciones obtenidas. Estos intervalos se calcularon siguiendo la fórmula:
(
(
)
(
I . C. (Yest ) = Yest − t * Yest * C.V . (Yest ) ; Yest + t * Yest * C.V . (Yest )
))
(1)
donde t es el percentil de la distribución normal, que a un nivel del 95% de confiabilidad toma el valor de 1.96. Se debe recordar que las estimaciones no están referidas a valores puntuales, sino a valores
que se mueven dentro de un intervalo de confianza como el descrito anteriormente, lo que significa que la muestra se diseñó de forma tal que si se tomaran 100 muestras de igual tamaño y diseño, en 95 de ellas el verdadero valor del indicador quedaría dentro de ese intervalo. La interpretación del Error Relativo o Coeficiente de Variación (C.V.) de las estimaciones se realizó de la siguiente forma: ! C.V. menor del 5%, la estimación del indicador es muy Buena. ! C.V. entre el 5% y el 10%, la estimación del indicador es Buena. ! C.V. entre el 10% y el 15%, la estimación del indicador es Aceptable. ! C.V. entre el 15% y el 20%, la estimación hay que utilizarla con precaución. ! C.V. mayor del 20%, la estimación del indicador NO es buena y sólo se tomará como cifra indicativa para el análisis del indicador obtenido en momentos distintos. 2.4 Diseño muestral de la encuesta sobre el uso del tiempo La Encuesta sobre el Uso del Tiempo se realizó a principios del año 2002 bajo el financiamiento de la UNIFEM y PDHL con el propósito de evaluar cómo utilizan su tiempo las personas de 15 años y más, por sexos y grupos de edades. La población objeto de estudio estuvo constituida por aquellas personas de 15 años y más residentes de manera permanente en viviendas particulares de la parte urbana y rural de los municipios Pinar del Río, San Juan y Martínez, Habana Vieja, Bayamo y Guisa. a)
Marco muestral
La Encuesta se montó sobre el Diseño Muestral General, también conocido como Muestra Maestra, del Sistema de Encuestas de Hogares de la Oficina Nacional de Estadísticas. El mismo está organizado de
Diseños muestrales utilizados en algunas...
311
acuerdo a la División Político Administrativa del país en 14 provincias y 169 municipios y además contiene la estructura requerida para el trabajo de terreno, donde cada municipio quedó dividido en las llamadas Áreas Geográficas Muestrales (AGEM). Este Marco Muestral Maestro fue objeto de una exhaustiva actualización a partir de 1998 con motivo de los trabajos de organización del Censo de Población y Viviendas de septiembre del 2002. La Muestra fue seleccionada especialmente para esta investigación y se utilizó un grupo de entrevistadores, supervisores y oficinistas especialmente entrenados para el desarrollo de este tipo de encuesta. b)
Tipo de muestreo
El tipo de muestreo utilizado en el presente estudio es un Muestreo por Conglomerados Trietápico con estratificación de las unidades primarias. Los estratos estuvieron constituidos por los municipios, parte urbana y parte rural. c)
Unidades de muestreo y probabilidades de selección
Las unidades muestrales de primera etapa fueron las AGEM que se seleccionaron con probabilidad proporcional al tamaño dado este por la cantidad de viviendas que las conforman, como unidades de segunda etapa se seleccionaron Manzanas en la parte urbana y segmentos en la parte rural, ambos también con probabilidades proporcionales al tamaño. Finalmente las Secciones constituyeron las unidades de tercera etapa y fueron seleccionadas con probabilidades iguales. Dentro de cada sección se entrevistó un promedio de 5 viviendas y dentro de cada vivienda se tomó información de todas las personas residentes permanentes. d)
Afijación de la muestra
La distribución de la muestra por estratos se realizó por el método de afijación uniforme. Desde el punto de vista geográfico la muestra se distribuyó de acuerdo al diseño muestral y además también fue repartida en el tiempo. Se establecieron 14 días de trabajo y la muestra fue repartida en 7 grupos conformados por parejas de días. La metódica de distribución de los días comprendidos en el período de captación estableció siete parejas de días. En cada pareja de días trabajaron dos AGEM distintas para lograr similares tamaños de muestra en cada día de la encuesta. Esta encuesta tuvo en su desarrollo, diversos aspectos novedosos: !
En el proceso de toma de información, se utilizaron dos métodos: de una parte la entrevista cara a cara para recoger información relacionada con el hogar, condiciones de la vivienda, composición del núcleo familiar, e información socioeconómica de las personas, y por otro lado la autoenumeración que se empleó para registrar el uso del tiempo en dos diarios asignados a cada persona, los que debían ser llenados en los días determinados para cada hogar y no en otros días de la semana.
!
Se clasificaron los días en dos tipos: día típico y día no típico. En cada diario la persona debía marcar si el día en cuestión era para la misma un día típico o no típico. A los efectos del procesamiento de la encuesta, existieron tres alternativas de clasificación de las parejas de días:
!
-
Dos días típicos
-
Un día típico y otro no típico
-
Dos días no típicos
Se previó que no todas las personas tuvieran la posibilidad de llenar los dos diarios, por lo que en la encuesta aparecen individuos con solo un diario lleno.
312
Diseños muestrales utilizados en algunas...
!
De manera general las personas residentes en las viviendas involucradas en la encuesta, llenaron los cuestionarios en los dos días que se les señaló con anterioridad. En la primera semana las parejas de días tenían dos días intermedios y en la segunda semana solo uno. En los casos en que en la primera visita no se logró acceder a la vivienda, o no se logró la entrevista individual con las personas objeto de investigación, fue necesario repetir la visita en los días intermedios a fin de poder lograr las entrevistas individuales, dejar los diarios de cada persona y tener al menos lleno, el diario correspondiente al segundo día.
!
Los diarios terminados, debían ser recogidos por los entrevistadores en las viviendas de cada AGEM al día siguiente de haberse llenado.
e)
Tamaño de la muestra
Para la captación de la información se seleccionaron un total de 28 AGEM por municipio, 14 en el área urbana y 14 en el área rural, a fin de conformar una muestra que satisficiera los requerimientos de la encuesta, la cual debía ofrecer resultados a nivel municipal, por sexos y por parte urbana y rural. En cada municipio/parte se le asignaron 2 AGEM a cada grupo (GR1, GR2, etc.) y por cada AGEM se asignaron 4 secciones, para un promedio de 20 viviendas por AGEM. Con el objetivo de obtener una buena calidad en la información captada y además un por ciento de caída de muestra lo más pequeño posible, se garantizó que cada entrevistador de la encuesta conociera de antemano las AGEM, secciones y viviendas que le correspondían y los días en que las mismas debían participar en la encuesta. f)
Estimadores de la encuesta
Como ya se hizo referencia anteriormente la estrategia de Muestreo desarrollada corresponde con un Muestreo por Conglomerados Trietápico Estratificado. Las unidades muestrales y sus probabilidades de selección permiten obtener la probabilidad final de selección del diseño muestral de cada elemento de la población que se calcula como: a V i V ij 4 1 = F V V i S ij
1 1 = S ij Vij n
(2)
(3)
donde a: Número de AGEM en la muestra Vi: Total de viviendas en la AGEM i-ésima Vij :Total de viviendas en la manzana o segmento j-ésima/o de la AGEM i-ésima V : Total de viviendas en la Población Sij: Número de secciones en la manzana o segmento j-ésima/o de la AGEM i-ésima n: Promedio de viviendas por sección. El inverso del producto de las probabilidades de selección es el factor de expansión, que para el diseño elaborado (Muestra Autoponderada) resulta constante dentro de cada estrato.
Diseños muestrales utilizados en algunas...
g)
313
Estimadores
!
Variables de Personas: Se utilizaron estimadores de razón, considerando para ello como variable auxiliar la población emitida por las estadísticas oficiales de la ONE. Además de una postestratificación por sexo y grupos de edad: 15-19, 20-24, 25-29,30-34, 35-39, 40-44, 45-49, 50-54, 55-59, y 60 años o más, lo que dio lugar a 20 categorías.
!
Variables de Núcleos: Se utilizaron estimadores de razón, empleando como variable auxiliar el total de viviendas de cada estrato que se obtiene a partir de la igualdad de las proporciones siguientes
P/p = V/v h)
(4)
Estimadores de tiempo y participación en las actividadesPromedio de Minutos diarios para la actividad z (promediado sobre toda la población): Es el tiempo promedio empleado por el total de la población (tanto participantes como no participantes) en una actividad z específica y se calcula como: n
TZ =
di
∑ wi ∑ tijz i
j
(5)
n
∑w d i
i
i
donde: t i j z es el número de minutos reportados por el respondiente i, el día j, en la actividad z. di
es el número de días-diario reportados por el respondiente i (nota: este número debe ser igual a 2, aunque podría ser igual a 1 en algunos casos)
wI
es el peso asociado al respondiente i.
n
es el número de respondientes elegibles en la muestra.
Promedio de Minutos diarios para la actividad z (promediado sobre la población que participa en la actividad ): Significa, en un día cuando ciertas personas realizan la actividad z, cuántos minutos estas personas emplean en la actividad z, como promedio, y se calcula como: d iz
nz
∑w ∑t i
TP Z =
i
ijz
j
(6)
nz
∑w d i
z i
i
donde: t i j z es el número de minutos reportados por el respondiente i, el día j, en la actividad z. d zi es el número de días-diario en los que el respondiente i reportó que empleó un tiempo distinto de cero en la actividad z. w i es el peso asociado al respondiente i. n z es el número de respondientes elegibles en la muestra que reportaron emplear algún tiempo en la actividad z.
314
i)
Diseños muestrales utilizados en algunas...
Precisión en los resultados
Para el cálculo de las estimaciones de los errores muestrales, coeficientes de variación y efectos de diseño se utilizó el Método del “Ultimate Cluster” a través del sistema PC- CARP. En los cuadros de salida se incluyeron los coeficientes de variación. Estos errores relativos o coeficientes de variación permiten calcular los intervalos de confianza de las estimaciones obtenidas. Estos intervalos se calculan siguiendo la fórmula:
(
(
)
(
I . C. (Yest ) = Yest − t * Yest * C.V . (Yest ) ; Yest + t * Yest * C.V . (Yest )
))
(7)
donde t es el percentil de la distribución normal, que a un nivel del 95% de confiabilidad toma el valor de 1.96. Se debe recordar que las estimaciones no están referidas a valores puntuales, sino a valores que se mueven dentro de un intervalo de confianza como el descrito anteriormente, lo que significa que la muestra se diseñó de forma tal que si se tomaran 100 muestras de igual tamaño y diseño, en 95 de ellas el verdadero valor del indicador quedaría dentro de ese intervalo. 2.5 Diseño muestral de la encuesta estudio de mercados La presente encuesta se levantó en enero del 2001 con el propósito de captar las opiniones y percepciones de la población acerca de los diferentes mercados que se desarrollan en el país. Especialmente sobre el mercado negro. El período de levantamiento fue de 10 días, considerando días hábiles y no hábiles. a)
Alcance geográfico y población objeto de estudio
La investigación tuvo un carácter territorial y se realizó en Ciudad de La Habana, capital del país y en la parte urbana del municipio Santiago de Cuba. Ambas zonas fueron seleccionadas, por la incidencia de delitos e infracciones vinculadas al mercado negro que en ellas se detectan. Dentro de esas áreas, el estudio se centró en la población de 15 años o más residente en viviendas particulares, que se encontraba ocupada, fuera estudiante, jubilada o pensionada, o que se dedicara a los quehaceres del hogar. Resultaba de interés además, poder disponer de resultados concernientes a la población de 15 años o más según sexo, así como desglosada según tres grupos de edades: de 15 a 30 años, de 31 a 59 años y de 60 años o más. b)
Marco muestral
Se tomo como marco muestral, la Muestra Maestra del Sistema de Encuestas de hogares. c)
Método de muestreo y selección de la muestra
Tratándose de un sondeo de opinión sobre mercados se empleó un muestreo por cuotas, aplicado sobre un muestreo por conglomerados cuatrietápicos para el caso de Ciudad de La Habana, con estratificación de las unidades primarias, y sobre un muestreo por conglomerados trietápico en el caso del municipio Santiago de Cuba. Solo se explicará, para abreviar, el caso de Ciudad de la Habana. !
Para Ciudad de La Habana
Las unidades muestrales de primera etapa (UPE) fueron los municipios, los cuales se seleccionaron de manera no probabilística atendiendo a determinados criterios. Las unidades de segunda etapa (USE) la formaron las AGEM que tienen en promedio 180 viviendas y se seleccionaron dentro de cada municipio
Diseños muestrales utilizados en algunas...
315
con probabilidades proporcional al tamaño, dado este por el total de viviendas que las conforman. Las unidades de tercera etapa (UTE) fueron las manzanas. Se seleccionó dentro de las AGEM aquella manzana que más viviendas poseía, (dato que se obtuvo del muestreo por áreas), con el propósito de hacer más factible el cumplimiento de las cuotas. Las manzanas escogidas, se fueron barriendo vivienda por vivienda hasta saturar la cuota establecida para la AGEM a que pertenecía. El recorrido de las manzanas se hizo comenzando por el punto noroeste y continuando siempre hacia la derecha. Por último, las personas formaron las unidades de cuarta etapa (UCE). Dentro de la manzana seleccionada se entrevistaron aquellas personas que respondían a las características de la cuota que le fue establecida a cada enumerador. Solo se entrevistó una persona por vivienda, y dejó de recorrerse la manzana en el momento en que se completó la norma establecida. De no poder completarse la norma en la manzana, se debió escoger la que le siguiera en cantidad de viviendas y en ella continuar muestreando. Esquema del Recorrido de las Manzanas
manzana
Teniendo en cuenta la limitación de recursos del proyecto, se consideró oportuno realizar una selección de municipios con determinado nivel de compromiso. Los diferentes criterios a considerar para conformar la muestra de municipios se acogieron a juicios de valor de los especialistas y se ofrecen a continuación. Un primer requisito consistía en considerar dentro de la muestra municipios periféricos y centrales. Un segundo requisito fue incluir municipios con diferentes niveles de ingresos medios. Además, aunque no se asumió directamente como criterio para realizar la estratificación, se presto atención a que quedaran implícitos dentro de la selección, aquellos municipios con mayor movimiento de mercado según criterio de expertos, así como también los más poblados. A partir de estos criterios se seleccionaron en la capital del país ocho municipios para incluir en la muestra. Posterior a la selección de los municipios y las AGEM, se distribuyó la muestra dentro de ellos según estratos de actividad: ocupados, estudiantes, jubilados o pensionados y quehaceres del hogar, así como también sexo y grupos de edades. d)
Afijación de la muestra
La distribución de la muestra por municipios y dentro de cada estrato socioeconómico: ocupados, estudiantes, pensionados y quehaceres del hogar, fue uniforme dentro de la provincia. Sin embargo, la distribución por sexo y grupos de edades se realizó de acuerdo con la estructura poblacional de estas variables, garantizando reproducir las proporciones que tienen dentro de la población de 15 años o más de cada provincia. e)
Tamaño de la muestra
Luego de valorar tres variantes de tamaños de muestra, dada la disponibilidad de recursos del proyecto, así como las características del estudio en cuestión, se consideró oportuno admitir resultados con un margen de error de hasta un 10 por ciento a un grado de confiabilidad del 95 por ciento.
316
Diseños muestrales utilizados en algunas...
Para garantizar representatividad de cada uno de los cuatro estratos de actividad dentro de la provincia a ese nivel de precisión, fue necesario para Ciudad de La Habana, seleccionar teóricamente 104 personas por estrato, o sea 104 estudiantes, 104 ocupados, 104 dedicados a los quehaceres del hogar y 104 jubilados o pensionados. De esta forma se entrevistaron 416 personas. A su vez, estas personas fueron distribuidas por sexo y grupos de edad dentro de cada situación de actividad a que estuvieran vinculadas, logrando así submuestras representativas de las proporciones en que esas variables se encuentran dentro de la población mayor de 14 años de la provincia. f)
Distribución de la muestra para Ciudad Habana.
La Tabla 4 ofrece un desglose de la muestra para Ciudad de la Habana por municipios, estratos socioeconómicos, sexo y grupos de edad. Estos tamaños de muestra permiten realizar tabulados de proporciones y frecuencias por cada tipo de actividad, por sexo o por grupos de edad. Es necesario no perder de vista que el tamaño de muestra no permite obtener cruces de estos indicadores. Tabla 4. Distribución de la Muestra para Ciudad Habana Municipio T Pers. T AGEM Ocupados Hombres 15-30 31-59 60 o más Mujeres 15-30 31-59 60 o más Estudiantes Hombres 15-30 31-59 60 o más Mujeres 15-30 31-59 60 o más Q. Hogar Hombres Mujeres 15-30 31-59 60 o más J/Pensionad Hombres 15-30 31-59 60 o más Mujeres 15-30 31-59 60 o más
San Miguel 52 3 13 8 1 7 5 5 13 8 8 5 5 13 13 13 13 8 8 5 2 3
C. Habana 52 3 13 8 1 7 5 5 13 8 8 5 5 13 13 13 13 8 8 5 2 3
La Lisa 52 3 13 8 1 7 5 5 13 8 8 5 5 13 13 13 13 8 8 5 2 3
Playa
10 de Oct.
52 3 13 8 1 7 5 5 13 8 8 5 5 13 13 13 13 8 8 5 3 2
52 3 13 9 1 8 4 1 3 13 8 8 5 5 13 13 13 13 8 8 5 2 3
H. Este 52 3 13 8 1 7 5 1 4 13 8 8 5 5 13 13 13 13 8 8 5 3 2
Plaza 52 3 13 8 1 7 5 1 4 13 8 8 5 5 13 13 13 13 8 8 5 2 3
Habana Vieja 52 3 13 8 1 7 5 5 13 8 8 5 5 13 13 13 13 8 8 5 2 3
Total 416 24 104 65 8 57 39 3 36 104 64 64 40 40 104 104 104 104 64 64 40 18 22
Diseños muestrales utilizados en algunas...
317
Posteriormente estos tamaños de muestra fueron distribuidos por municipios y AGEM seleccionadas, quedando con ello establecidas las cuotas que debía completar cada entrevistador. Realizándose 52 entrevistas por municipio durante el transcurso de 10 días, si se repartieran uniformemente entre los días que dura el levantamiento quedarían entre 5 y 6 entrevistas diarias por municipio. Para realizar esto se necesitó asignar un enumerador por municipio que debía entrevistar entre 5 y 6 personas diarias hasta completar su cuota. Sugerencia a los enumeradores Aunque el personal designado como enumerador tenía la instrucción de continuar muestreando hasta tanto completara la cuota establecida, a fines de aligerar el trabajo de campo se le sugirió: Comenzar el levantamiento intentando localizar a las mujeres pensionadas de 31 a 59 años que hayan caído en su muestra, por ser estos los casos menos frecuentes de encontrar. Posteriormente tratar de captar a los ocupados y estudiantes, ya que aunque no es difícil identificar viviendas donde ellos radiquen, si costara trabajo contactarlos, pues las entrevistas casi siempre coinciden con horarios en que estas personas se encuentran fuera de su domicilio. En la práctica, sería recomendable intentar avanzar los primeros días, para en los días finales del levantamiento disponer de mayor cobertura de tiempo para localizar a las personas que les falten. Las cuotas establecidas no deben bajo ningún concepto dejar de captarse, siempre recordando que aunque en una vivienda aparezcan dos personas con características a muestrear, solo entrevistarán una. Nunca más de una persona por vivienda. g)
Estimaciones
La estructura por sexo y edad se respeto en el diseño muestral, y por tanto no se requiere utilizar factor de corrección para trabajar con ella. Sin embargo, para realizar las estimaciones correspondientes a los estratos socioeconómicos ocupados, estudiantes, jubilados o pensionados, y quehaceres del hogar con la idea de comparar resultados entre ellos, entonces sí será necesario emplear un factor de corrección para cada uno, garantizando así, que respondan a la estructura que ellos representan dentro del universo muestral. Los factores a emplear aparecen en la siguiente tabla. Tabla 5. Factores de Corrección según actividad. Ciudad de la Habana Pob. /Actividad
Población
Ocupados Estudiantes Q. del Hogar Jub o Pensionados Total
974.557 118.213 266.972 305.248 1.664.990
Estructura en la Población 59 7 16 18 100
Muestra proporcional a la estructura en la población. 245 29 67 75 416
Factor de Corrección 2.36 0.28 0.63 0.72
2.6 Diseño muestral de la encuesta nacional de factores de riesgo para la salud y enfermedades no trasmisibles Durante los dos últimos meses del año 2000 se realizó en el país la II Encuesta Nacional de Factores de Riesgo para la Salud y Enfermedades No Trasmisibles. La misma constituye un proyecto conjunto del Instituto Nacional de Higiene, Epidemiología y Microbiología (INHEM) y la Oficina Nacional de Estadísticas, representada por el Centro de Estudios de Población y Desarrollo (CEDPE) y la Dirección de Estadísticas Sociales. Debido a las limitaciones económicas que confronta el país, su levantamiento se realizó sólo en el área urbana del territorio nacional.
318
Diseños muestrales utilizados en algunas...
La Encuesta tuvo como objetivo fundamental, realizar a partir de una muestra probabilística, un estudio acerca de las características epidemiológicas de los principales factores que afectan la salud de las personas y el conocimiento de las mismas sobre esta temática. Su levantamiento se realizó en el transcurso de los meses de noviembre y diciembre del año 2000. a)
Alcance geográfico y población objeto de estudio
El alcance territorial de la investigación comprende todo el territorio nacional, excluyendo el territorio de la Base Naval de Guantánamo. La población a estudiar estará conformada por aquellas personas de 15 años y más que residen de forma permanente en las viviendas particulares de la parte urbana del país. b)
Marco muestral
Se tomó como Marco Muestral, la Muestra Maestra del Sistema de Encuestas de Hogares de la Oficina Nacional de Estadísticas, que fue actualizada en el transcurso del año 1999. c)
Método de muestreo
El método de muestreo se corresponde con un muestreo por conglomerados trietápico con estratificación de las unidades primarias. A fin de poder obtener resultados a nivel provincial se consideraron como estratos las catorce provincias, conjuntamente con el Municipio Especial Isla de la Juventud, de acuerdo con la División Político Administrativa vigente. Las unidades muestrales de primera etapa fueron las AGEM, las cuales tienen 180 viviendas como promedio. Como unidades de segunda etapa se seleccionaron las manzanas o uniones de manzanas que tienen 30 viviendas como mínimo. Las unidades de tercera y última etapa fueron las secciones, con 5 viviendas como promedio. d)
Tamaño de la muestra
El tamaño de la muestra fue determinado de manera tal que permita obtener resultados de los principales indicadores de la encuesta, tanto a nivel nacional como para las catorce provincias del país con un nivel de error inferior al 5 % y una confiabilidad del 95 %, además se tuvo en cuenta un cierto nivel de caída de muestra esperado. En el cálculo del tamaño teórico de personas a incluir en la encuesta se tuvo en cuenta los siete grupos de edades para los que se quería ofrecer información, así como también la desagregación de la población por sexos y además ciertos porcentajes de prevalencia en la población de los principales indicadores objeto de análisis tales como el tabaquismo, ingestión de bebidas alcohólicas, hipertensión arterial, asma, diabetes mellitus, entre otros. El tamaño teórico de la muestra asciende a 914 AGEM y se seleccionaron dos secciones por AGEM lo que equivale a incorporar a la muestra 9140 viviendas en todo el país. La distribución de la muestra por provincias, se realizó de manera proporcional al tamaño tomando como magnitud de referencia, el total de población de 15 años y más. Además de los estudios antes descritos, otro de los requerimientos de la encuesta era realizar un conjunto de análisis más especializados a partir de la toma de muestras de sangre a la población, realización de pruebas de esfuerzo, electrocardiogramas, y encuesta dietética, etc. Teniendo en cuenta que este procedimiento resulta extremadamente costoso, debido a que implica la utilización de equipos, reactivos y otros materiales, se determinó conformar una submuestra que incluyó aproximadamente la sexta parte de las AGEM seleccionadas para participar en la encuesta, esto fue equivalente a un total de 1490 viviendas.
Diseños muestrales utilizados en algunas...
e)
319
Procedimiento de selección
Con el fin de garantizar la autoponderación de la muestra, o sea, que todos los individuos tengan igual probabilidad final de selección en cada estrato, las unidades de primer etapa, es decir las AGEM fueron objeto de una selección sistemática con probabilidad proporcional al tamaño, al igual que las manzanas tomando como medida de tamaño la cantidad de viviendas con residentes permanentes con que contaban las mismas. Las secciones se seleccionaron con probabilidades iguales. En cada AGEM se seleccionó una manzana y de cada manzana fueron seleccionadas dos secciones con 5 viviendas como promedio. f)
Estimación
Como estratos de ponderación se considerarán las provincias del país, realizando posteriormente una post estratificación por sexo y edad. Las estimaciones de la encuesta se realizaron utilizando estimadores de razón los cuales emplearon como variable auxiliar los totales de personas de 15 años y más correspondientes a cada estrato de ponderación, información que se tomo de los datos estimados por el Departamento de Estadísticas Demográficas del CEPDE con cierre de diciembre del 2000. Como medida de evaluar la calidad de los datos de la encuesta se calcularon los errores de muestreo, efecto de diseño y los intervalos de confianza de los indicadores básicos obtenidos.