Story Transcript
1
Un registro estadístico de empresas (REE), la principal fuente para la selección de marcos de muestreo, es un sistema en el cual se generan unidades estadísticas a partir de las unidades administrativas. Cuando se lo refiere a las demandas de la población objetivo, surge una serie de imperfecciones. Para el diseñador de la encuesta es importante tener conciencia de estas imperfecciones y tomar medidas de compensación siempre que sea posible. La situación ideal sería que existiera un marco de muestreo perfecto, el cual sería un conjunto actualizado de todos los elementos de la población objetivo. Sin embargo, resulta complejo y difícil formar y mantener actualizado un marco muestral. De hecho, las características y la composición de la población están cambiando constantemente con el tiempo, mientras que las fuentes de información para estos cambios tienden a ser imperfectas. En primer lugar, para la mayoría de las encuestas sólo una parte de todos los elementos registrados en el REE será pertinente. En segundo lugar, hay que tener en cuenta que el REE inevitablemente contiene una serie de errores, omisiones y retrasos. Teniendo en cuenta que las estadísticas de las empresas deben observar y describir la actividad productiva total de un país, el producto del REE ideal puede definirse como "un archivo actualizado de todas las unidades estadísticas que están activas en el territorio del país y generan valor agregado", así como sus correspondientes atributos estadísticos y administrativos. Otras características atañen a acontecimientos de carácter económico y demográfico, como la creación, extinción, fusión, escisión, eliminación, etc. Por otra parte, es común registrar los vínculos jerárquicos entre las unidades, como las relaciones con el padre o madre, de hermana o de hija, así como los vínculos longitudinales entre las unidades. Estos últimos permiten rastrear las unidades a través del tiempo, incluso cuando cambian su estructura. Dado que las actualizaciones en el REE a menudo se rezagan con respecto a los acontecimientos reales, es útil señalar los cambios mediante sellos de tiempo dobles que hagan
2
Después de definir la población objetivo y la población marco, el siguiente paso es la elección del diseño de la muestra y del procedimiento de estimación. La teoría del muestreo proporciona una variedad de métodos mediante los cual se pueden extraer las muestras y se pueden producir estimaciones. La primera pregunta es si se debe tomar una muestra o llevar a cabo un censo. Si una se considera que una muestra es suficiente, se tiene que decidir el tamaño de la muestra. Antes de tomar las muestras es importante centrarse en los datos que se van a publicar. Los cuadros que figuran en la publicación final incluyen estimaciones de los parámetros de la población objetivo. Algunos ejemplos de parámetros son los totales de población, los promedios y proporciones de la población, las razones entre dos totales y las diferencias entre dos totales. En la mayoría de las encuestas, las estimaciones no se hacen solamente para el total de la población, sino también para una serie de subpoblaciones en las que está dividida la población. En la etapa de diseño de una encuesta se deben buscar métodos para producir estimaciones lo más aproximadas posible a los valores de los parámetros. En las encuestas de negocios se presenta a menudo el caso de que las grandes empresas tienen valores relativamente altos de los atributos de interés. Si en el diseño de la encuesta no se tiene en cuenta este hecho, es posible que los resultados de la encuesta sean inexactos. El esquema de selección de la muestra describe la selección mecánica de una muestra de acuerdo con el diseño elegido. Si el marco poblacional no cubre a la totalidad de la población objetivo, en otras palabras, si hay imperfecciones del marco como se mencionó anteriormente, el esquema de selección de la muestra opera en el marco poblacional, lo que implica que se debe tener cuidado por lo que respecta a la definición de los parámetros de población a estimar. Cuál es el diseño que mejor se adapta a una encuesta particular depende de la información auxiliar presente en el marco. Cuanta más información esté disponible antes de efectuar el muestreo, más a la medida de los objetivos de la encuesta estará
3
El diseño de la encuesta se concentra primero en los meros efectos del muestreo, ignorando cualquier imperfección del marco o cualquier otro tipo de errores que puedan ocurrir, tales como los errores derivados de la no-respuesta. El diseño de la muestra es un conjunto de especificaciones que definen a la población objetivo, las unidades de muestreo y las probabilidades vinculadas a las posibles muestras. Cuando el tamaño de una empresa está inscrito en el registro de empresas, esta información puede ser utilizada para medir las variables que se relacionan con el tamaño. Estas variables son los costos laborales y el volumen de negocios. Se puede utilizar la información sobre el tamaño eligiendo probabilidades proporcionales al tamaño; las empresas grandes tienen una alta probabilidad de ser seleccionadas. El estimador es la función matemática por medio de la cual se calcula la estimación de un parámetro en particular. La combinación de un diseño y un estimador recibe el nombre de estrategia de muestreo. El concepto de sesgo requiere que se piense en términos de todos los posibles resultados de una encuesta por muestreo. El sesgo no está conectado con una estimación particular sino que se relaciona con todas las estimaciones de un determinado parámetro que podrían ser producidas por la encuesta de muestreo. La idea de sesgo gira alrededor de expectativa. Se puede considerar la expectativa del estimador como el promedio de todas las estimaciones generadas "a la larga" a través de repetidos muestreos y de la subsiguiente observación de las características de interés. Cuando el diseño coincide escasamente con el estimador, la combinación del diseño del muestreo con el estimador generará probablemente malas estimaciones, alejadas de los valores de los parámetros en cuestión. El sesgo es la diferencia entre la expectativa y el valor del parámetro poblacional. El sesgo podría ocurrir, por ejemplo, cuando la población de
4
Una vez que se ha decidido cuál será la combinación entre el diseño de la muestra y el estimador, se puede determinar el tamaño de la muestra Dos aspectos desempeñan un papel: el costo y la precisión. Generalmente la precisión aumentará si el tamaño de la muestra aumenta. Sin embargo, cuanto más grande sea la muestra, más costosa será la encuesta y requerirá de más tiempo. Con frecuencia el tamaño de la muestra es decidido por el presupuesto total. En las encuestas de negocios se utiliza con mucha frecuencia el método de muestreo estratificado. Antes del muestreo, la población se divide en subpoblaciones no superpuestas, denominadas estratos. Los estratos pueden tratarse como poblaciones separadas, para las cuales se pueden elegir estrategias adecuadas. La selección de las muestras de cada uno de los estratos es realizada de forma independiente. Para mejorar la precisión de la estimación del volumen total de operaciones de las empresas es posible estratificar la población en clases de tamaño, a menudo en términos del número de empleados de la empresa: por ejemplo, 9 empleados o menos, de 10 a 99 y 100 ó más. La muestra se asigna en relación a estos estratos y para cada estrato se define un diseño de la muestra antes de que llevar a cabo la encuesta. El primer paso para el muestreo estratificado concierne a la elección de las características mediante las cuales se formarán los estratos. Esta elección depende de la finalidad para la cual se aplique el muestreo estratificado. Si el motivo de la estratificación es la búsqueda de una mayor precisión, es beneficioso formar estratos que sean grupos más o menos homogéneos en el sentido de las variables objetivo. En las encuestas de negocios, la clase de tamaño generalmente funciona bien como variable de estratificación, porque a menudo el tamaño está en fuerte correlación con la mayoría de las variables de interés. Otra cuestión es la forma en que se asigna el tamaño total de la muestra a cada uno de los estratos. En las encuestas de negocios la asignación suele ser escogida en desproporción con las clases de tamaño. Sin embargo, es probable que la mejor asignación para una variable objetivo no sea óptima para otra. La
5
Utilizando métodos sólidos es posible reducir las fuentes de error de las encuestas. Esto se refiere tanto a los errores de muestreo (los errores que se derivan de tomar una muestra en lugar de utilizar información procedente de la totalidad de la población) como a los errores de no muestreo (por ejemplo, los relativos a las imperfecciones del marco, a objetivos imprecisos, a un mal diseño de las preguntas y a la no-respuesta). Las medidas que describen la variabilidad son la varianza y el error cuadrático medio del estimador. Se puede considerar a la varianza como el promedio "a la larga" de todas las diferencias cuadráticas entre las estimaciones y la expectativa del estimador. Del mismo modo, el error cuadrático medio es igual al promedio de las diferencias cuadráticas entre las previsiones y el parámetro. La varianza expresa qué tanto se acercan las estimaciones a la expectativa del estimador, mientras que el error cuadrático medio mide la proximidad en torno al parámetro. El término exactitud se refiere generalmente a la varianza, y el término precisión, al error cuadrático medio. Se dice que un estimador es exacto si la varianza es pequeña, y preciso si el error cuadrático medio es pequeño. En la mayoría de las encuestas no se pueden extraer todas las muestras posibles para calcular la varianza, pero en muchas circunstancias el valor puede estimarse con base en una sola muestra. En el caso de estimadores libres (o casi libres) de sesgo, la exactitud suele expresarse en términos del coeficiente de variación, el cual se define como la raíz cuadrada de la varianza estimada, dividida entre la estimación del parámetro.
6
Decidir sobre el mejor método de recopilación de datos posible para una encuesta es otra actividad importante del diseño de la encuesta. Existen varios métodos para recabar datos de las encuestas. Los métodos de recopilación de datos comúnmente utilizados pueden dividirse en tres tipos básicos: la entrevista personal, la autoenumeración y la entrevista telefónica. Estos tres tipos "manuales" tienen sus correspondientes métodos electrónicos: la entrevista asistida por computadora (CAPI), la auto-entrevista asistida por computadora (CASI), que incluye formularios por internet y por correo electrónico, y las entrevistas telefónicas asistidas por computadora (CATI). Otro método de recopilación de datos es la utilización de fuentes de datos existentes, tales como los archivos administrativos. El éxito de la encuesta dependerá en gran medida de la idoneidad del método de recopilación de datos elegido. Sin embargo, para las encuestas empresariales la enumeración es a menudo la única opción realista, ya sea con base en un cuestionario impreso sobre papel, o bien o en la modalidad CASI, cada vez más frecuente en la actualidad. Otro aspecto es que las encuestas de empresas suelen ser repetitivas. Hay varias maneras de organizar encuestas repetitivas de empresas y de hogares. Una es la encuesta transversal reiterada (una nueva muestra para cada ocasión). Otra posibilidad es una encuesta panel (la misma muestra para todas las ocasiones). Existen varias posibilidades intermedias entre estos dos extremos, por ejemplo las encuestas panel reiteradas (una serie de encuestas panel, que pueden solaparse o no), o las encuestas panel rotatorias (paneles reiterados que se solapan). Qué tipo de diseño es el más adecuado depende de los objetivos de la encuesta. 7
Las encuestas empresariales generalmente utilizan métodos de auto-enumeración. Los tres métodos de auto-enumeración más comunes son la encuesta postal, el envío y la respuesta a vuelta de correo y la entrega y recogida, y el formulario electrónico o CASI (auto-entrevista asistida por computadora). En las encuestas por correo postal, los cuestionarios son enviados por correo a los informantes con un sobre con el porte pagado para que los informantes puedan enviar de regreso el formulario completado. Esta técnica tiene varias ventajas. Los informantes pueden completar el cuestionario a su propio tiempo. Además, el informante puede verificar los registros. Se pueden incluir instrucciones y explicaciones más detalladas. Se pueden cubrir áreas geográficas más amplias con un costo mucho menor que el de las entrevistas personales. Por último, las encuestas postales brindan acceso a los informantes "difíciles de contactar" (por ejemplo, aquellos que como dirección proporcionan sólo un número de apartado postal o que pasan mucho tiempo lejos de su hogar). La principal desventaja de las encuestas postales es que a menudo tienen una menor tasa de respuesta. Por otra parte, que pueden causar que los datos tarden en quedar disponibles. Además hay un límite en cuanto a la complejidad del cuestionario en comparación con los entrevistadores capacitados en el uso del cuestionario. El método postal no es apropiado para los posibles informantes con una capacidad limitada para leer o escribir en un idioma determinado, a menos que los cuestionarios se proporcionen en el idioma adecuado. El envío y la respuesta a vuelta de correo y la entrega y recogida son dos métodos de encuesta de auto-enumeración estrechamente relacionados entre sí que brindan mayores tasas de respuesta que las encuestas postales. En ambos casos, el cuestionario es entregado a los informantes por un entrevistador, quien les explica los objetivos de la encuesta y la manera de llenar el cuestionario. El informante conserva el cuestionario para llenarlo y enviarlo de regreso o para que el entrevistador pase a recogerlo en una fecha posterior. El costo del uso de entrevistadores hace que esta técnica implique un gasto mayor que las encuestas postales, pero generalmente es menor que el de las entrevistas personales. Un formulario electrónico es una versión electrónica del cuestionario. El uso de la devolución electrónica también produce una respuesta más rápida que otros métodos de auto-enumeración. Las desventajas son: incremento en los costos del desarrollo de los formularios y del mantenimiento de los sistemas relacionados y la seguridad. Además, esta técnica requiere que los informantes cuenten con software compatible y que se disponga de personal que proporcione soporte técnico telefónico sobre el uso del formulario. A veces también se utiliza, en lugar de un formulario impreso en papel, un formulario de encuesta electrónico en disco o CD que es enviado por correo o entregado personalmente al informante.
8
La recopilación de datos de las empresas puede parecer una actividad trivial, pero su importancia práctica es enorme. Una vez que se conozcan las unidades que se incluirán en la muestra, se podrá dar inicio a los preparativos para el envío del cuestionario, así como a la creación de un fichero que contenga registros de los elementos del cuestionario para cada una de las unidades a las que se aplicará la encuesta. Se realizarán operaciones de seguimiento con el fin de aumentar la respuesta y mejorar la calidad de los datos. La mayoría de las operaciones pueden ser soportadas por las modernas herramientas de automatización. Una vez enviado el cuestionario, la principal preocupación del encuestador es estimular y ayudar a los informantes. Aquí la unidad de información pasa a ocupar el lugar central. Los datos del cuestionario se refieren a la unidad de observación, pero la unidad de información es el contacto de la ONE. Es muy importante indicar claramente en el cuestionario acerca de qué parte de la organización debe proporcionar datos el informante. En esta etapa del proceso estadístico, las herramientas de automatización pueden ser de gran utilidad. A partir del cuestionario sobre papel y un archivo de los informantes, las herramientas de automatización se aplican a las siguientes operaciones: las direcciones y los datos de identificación pueden ser impresos en el cuestionario directamente o en una etiqueta autoadherible, que se adherirá al cuestionario. Los códigos de identificación pueden imprimirse como códigos de barras y ser escaneados de nuevo a partir de los formularios recogidos. La mayoría de los programas de base de datos tienen excelentes funciones para la impresión de formularios. La lista de unidades incluidas en la muestra y los elementos del cuestionario proporcionan los ingredientes para la creación de un archivo de microdatos, en el que se registrarán los datos a obtener mediante la encuesta. Hemos señalado antes que el marco de muestreo sufrirá inevitablemente las consecuencias de una serie de deficiencias. Algunas de éstas se pueden corregir fácilmente. Entre las más importantes se encuentran la eliminación de duplicaciones evidentes y la actualización de cambios de dirección reportados recientemente En general merece la pena dedicar tiempo y esfuerzos a realizar verificaciones y actualizaciones de último momento antes del envío. Éstas evitan irritaciones a los informantes, contribuyen a reducir la carga para los informantes, así como la no-respuesta, y ahorran tiempo en las etapas posteriores del proceso de recolección. Se debe prevenir a los informantes en caso de que se realicen nuevas encuestas o se modifiquen sustancialmente los cuestionarios. Esto les da la oportunidad de adaptar sus sistemas de información. Si es posible, este aviso previo debe ir acompañado de una recomendación de la organización comercial u otras instituciones que representen a los informantes. Además, la ONE puede promover la encuesta proporcionando información a los medios de comunicación. Los informantes deben ser invitados a ponerse en contacto con la ONE en caso de cualquier problema. Los problemas, que generalmente se exponen por teléfono, se relacionan con la identificación de la unidad, peticiones de aplazamiento o dispensa y solicitudes de servicio móvil de asistencia.
9
Básicamente existen cinco modos de captura de datos: Uno es el intercambio electrónico de datos (IED). Este instrumento permite al informante realizar parte de la edición. El escaneo es otra alternativa de tecnología de punta. Las partes pertinentes de los formularios en papel recuperados son traducidas electrónicamente en información como mapas de bits; Los sistemas actuales de reconocimiento óptico de caracteres (OCR), una tecnología un tanto menos avanzada, permiten controles de edición sencillos, como la validación de valores y rangos de valores. El método se adapta especialmente a las grandes recolecciones de datos. Evidentemente, la legibilidad es un factor fundamental. Los números son más fáciles de leer que el texto sin formato. Los paquetes modernos de OCR utilizan un diccionario al reconocer palabras, pero cada combinación de cifras da como resultado un número válido. El material escrito a mano es mucho más difícil de reconocer que los datos escritos a máquina o en computadora. Con el OCR, la principal precaución es que requiere un diseño y estándares de impresión del cuestionario muy precisos a fin de garantizar que las respuestas puedan ser leídas correctamente por los sensores; Un tercer método es la llamada captura de datos verificados, que significa que un programa de computadora le da al capturista retroalimentación instantánea sobre datos que ingresa en el formulario. Por último, la captura de datos no verificados significa que los datos se transcriben a alta velocidad y sin la retroalimentación de la computadora. Este método puede aún ser válido cuando la calidad de los datos entrantes es alta. La captura de datos no verificados puede ser contratada externamente. En general, la captura de datos requiere un hardware y un software específicos. En estos sistemas se pueden aplicar algunos controles de valores válidos y controles de rango, de tal manera que se puedan detectar los errores sencillos de mecanografía. Los controles sólo pueden ser blandos, ya que lo único que el capturista puede hacer es comparar los datos capturados con los datos del formulario. En las computadoras PC se pueden utilizar programas de bases de datos y programas específicos para la captura de datos tanto verificados como no verificados. Un programa de hoja de
10
El punto de partida para la fase del procesamiento son los datos recibidos de los informantes. Por muchas razones, el acto de procesar la información implica algo más que el simple agregar los elementos de los cuestionarios. Una de las razones es que algunos de los informantes cometen errores al llenar el cuestionario. Lo mismo vale para los capturistas cuando ingresan los datos. En segundo lugar, tanto a nivel micro como en el nivel agregado, inevitablemente habrá incongruencias con elementos relacionados obtenidos a partir de otras encuestas. En tercer lugar, algunos de los informantes sólo completan parcialmente el cuestionario. Además, no todos los elementos del cuestionario son una representación perfecta de los conceptos de producción previstos. A esto se añade que sólo una parte de los elementos del marco población han sido objeto de encuestas. Asimismo, es necesario hacer frente a la norespuesta. Por otra parte, el marco de muestreo del que se tomó la muestra no es una representación perfecta de la población de la encuesta. El procesamiento comprende una serie de operaciones que posteriormente se ocupan de todas estas deficiencias. Se aplican los siguientes pasos: Después de la captura de los datos se detectan los errores e inconsistencias y se corrigen durante la edición. Más adelante, se resuelven mediante la imputación los casos de norespuesta a ciertas preguntas y las lagunas entre los conceptos del cuestionario y los conceptos de salida. Luego, el conjunto resultante de microdatos limpios y completos sirve como base para ponderar y reponderar. Durante esta etapa también se busca corregir los errores de marco. Después se confrontan los datos agregados con los datos de otras fuentes y se integran. Por último, en su caso, se llevan a cabo recopilaciones estadísticas y análisis, que dan como resultado las tabulaciones finales. Cabe señalar que la distinción entre los diversos pasos no es siempre tan clara como se presenta aquí. Esto se aplica especialmente a los límites entre la edición y la imputación y entre la imputación y la (re)ponderación. 11
La edición es el examen de los datos con el fin de detectar errores. Al igual que cualquier informante de una encuesta, un informante de estadísticas de negocios es propenso a cometer errores al llenar un cuestionario estadístico. Sólo una parte de estos errores puede ser detectada; muchos errores que no se detectan ni pueden ser detectados. Por lo tanto, incluso una edición de datos exhaustiva nunca producirá un archivo de datos libre de errores. Lo más importante es detectar y corregir los errores graves. La edición de datos se realiza durante o después de la captura de datos. Los controles de enrutamiento prueban si todas las preguntas que deberían haberse contestado realmente han sido contestadas. Los controles de validación de los datos comprueban si las respuestas son permisibles. En las encuestas de negocios el rango de valores válidos a menudo tiene que ser muy amplio, debido a las dimensiones cambiantes de las empresas. En ese caso se pueden utilizar controles relacionales. Muchos controles revisten la forma de una razón entre dos variables, que debe encontrarse dentro de límites específicos. Otro tipo de verificación relacional es el control aritmético, que por ejemplo especifica que la suma de las variables debe ser igual a un total. Algunas reglas de edición son estocásticas, en el sentido de que no son más que una advertencia de que algo podría estar mal (errores blandos). No todas las estrategias de edición aplicadas son eficientes. La edición automatizada es cada vez más importante. En el proceso de edición automatizada se pueden diferenciar tres etapas: la primera es la detección de errores o inconsistencias; después, en caso de que haya una inconsistencia, determinar en qué campo hay error, y finalmente corregirlo o realizar una imputación. La edición selectiva se reduce a la detección de valores aberrantes. Esto se denomina macro-edición. La edición durante la captura de datos (o edición de entrada) tiene la ventaja de la puntualidad, porque puede comenzar tan pronto como ingrese el primer formulario; pero la edición de entrada no debe ser demasiado extensa porque es costosa. Para reducir los costos se debe ser selectivo, por ejemplo
12
La coherencia de los datos estadísticos es importante y puede ser mejorada mediante la integración. Como se discutió anteriormente, los intereses de los usuarios en general no se limitan a los datos resultantes de una encuesta en particular. Lograr la coherencia es un proceso complejo. El concepto de integración está estrechamente vinculado a las prácticas de las cuentas nacionales. La integración mejorará en todo caso la coherencia entre los resultados de diferentes encuestas. Una primera cuestión es sintonizar los conceptos con respecto a las variables, a las unidades estadísticas y a las clasificaciones de las diversas estadísticas básicas. En el caso de una encuesta laboral y una encuesta de producción con sus definiciones divergentes del costo laboral y de la industria, básicamente hay dos soluciones posibles en teoría. Una es ajustar los nombres de los conceptos, para destacar que ambas encuestas observan cosas diferentes. Una segunda solución es ajustar la definición de los conceptos de una encuesta a los de la otra. Sin embargo, esto no siempre es posible. Por ejemplo, las estadísticas básicas y los cuadros de oferta y uso de las cuentas nacionales deben utilizar la misma definición del costo laboral. Pero el problema es que las estadísticas básicas no pueden incluir la mano de obra en negro, porque no es observable en las recopilaciones ordinarias. Una tercera solución es eliminar las duplicaciones. Luego de sanear las diferencias conceptuales entre la encuesta laboral y la encuesta de producción, al parecer una de las encuestas podría omitir la pregunta sobre los costos laborales y obtener los datos de la otra. Esta es una solución rigurosa, y en la práctica suele ser difícil de aplicar. Suponiendo que nunca vaya a ser posible omitir todas las duplicaciones y discrepancias, otra solución es que la ONE adopte una "política de un solo número". Un almacén de datos mantenido de forma centralizada es una herramienta poderosa en este sentido.
13
Existe una variedad casi infinita de análisis, dependiendo de la naturaleza y objetivos de la encuesta. Por lo tanto, sólo mencionaremos unos pocos ejemplos de particular importancia para los usuarios: el ajuste estacional de las series de tiempo y el control de divulgación de los datos estadísticos tabulares. En cuanto a ajuste estacional, muchas series de tiempo económicas muestran fluctuaciones cíclicas. Esto es más evidente en el caso de series publicadas con un período inferior a un año, por ejemplo los precios de las acciones y el desempleo. Pero también las series con un período de un año pueden mostrar ciclos; por ejemplo, los inventarios a menudo tienen un ciclo de unos cuantos años. Si el período de la serie es de menos de un año, entonces las fluctuaciones dentro de un ciclo de un año se denominan fluctuaciones estacionales. Las principales causas de esas fluctuaciones estacionales son los efectos calendáricos (por ejemplo, el número de días laborables al mes), los efectos institucionales (por ejemplo, debido a que los jóvenes usualmente salen de clases en el mes de junio, los meses de junio, julio y agosto muestran a menudo un mayor nivel de desempleo que mayo y septiembre), y el clima (por ejemplo, debido a las inclemencias del invierno hay durante los meses de invierno un aumento en la tasa de desempleo de los trabajadores de la construcción). Si una serie muestra fluctuaciones estacionales, uno puede querer calcular una nueva serie que de alguna manera esté corregida tomando en cuenta estas fluctuaciones estacionales. Uno de los principales motivos por los que podríamos estar interesados en esas series ajustadas a la estación es su pertinencia para las políticas públicas: si, por ejemplo, el desempleo aumenta notablemente en un mes determinado, los responsables de formular políticas necesitan saber si este aumento es más o menos permanente o se debe a un factor estacional. Los datos ajustados estacionalmente son también un requisito previo para evaluar el estado del ciclo económico. Existen diversas técnicas de ajuste estacional. Por lo que se refiere a la supresión de las celdas sensibles de las tablas, normalmente las tablas no contienen información de los informantes individuales, sino información agregada referida a varios informantes. Sin embargo, podrían producirse situaciones en las que es posible deducir información correspondiente a un informante individual a partir del total global, por ejemplo cuando la aportación de uno de los informantes domina este total. En tal caso debe aplicarse el control de la divulgación de datos estadísticos (o CDDE) . Hay tres técnicas: la modificación
14
Con el fin de hacer que las estadísticas sean consumibles por los usuarios, es necesario desarrollar y mantener sistemas de difusión. La difusión es uno de los tres procesos básicos de las ONEs y conlleva muchas actividades. Las estadísticas son esencialmente información, un producto intangible: un servicio. Por ello, si bien la difusión de las estadísticas también incluye el proporcionar productos, tiene que ver principalmente con proporcionar servicios. El conjunto de datos resultantes de la etapa de procesamiento y análisis puede ser considerado como un almacén de datos, que contiene los agregados más bajos que puedan ser publicados. Estos agregados elementales son los bloques de construcción para las tabulaciones en todo tipo de publicaciones. Las acciones a emprender en la etapa final ya no están dirigidas a agregar nueva información ni a mejorar la fiabilidad. Parte de estas acciones, es decir, las medidas de control de la divulgación, llegan incluso a tener el efecto contrario, en el sentido de que suprimen información. La esencia de la etapa final consiste en estructurar, presentar y distribuir los datos producidos de manera tal que se llegue a un número máximo de usuarios con la información que mejor satisfaga sus necesidades. La idea de una estrategia corporativa de publicación y difusión, encaminada a proporcionar la máxima satisfacción a los usuarios supone que los usuarios no pueden ser definidos necesariamente de acuerdo a los ámbitos cubiertos por las encuestas individuales. En segundo lugar, existe una amplia gama de grupos de usuarios y en consecuencia una amplia variedad de áreas de interés parcialmente coincidentes entre sí. Esto significa que las publicaciones deben contener datos derivados de diferentes encuestas. También requiere que haya una gran variedad de "publicaciones", parcialmente coincidentes en el contenido de la información. La moderna tecnología de la información permite a la ONE cumplir con esta variedad de necesidades de los usuarios mediante una respuesta flexible. No importa cuán importante pueda ser la difusión en papel y en formato electrónico, en la práctica la mayoría de las compras de información comienzan con una carta o una llamada telefónica de los posibles usuarios. Normalmente las ONEs reciben un gran número de preguntas por teléfono y por fax. Lo mismo puede decirse de las solicitudes de información relativas a los datos de diferentes fuentes de encuestas. Con el fin de evitar que los clientes sean enviados de un escritorio a otro, y con el fin de suministrar información coherente, es conveniente concentrar un servicio de información de primera línea en un mostrador central de
15
La importancia de los registros administrativos para su uso en la elaboración de las estadísticas está aumentando rápidamente debido a la presión de tres desarrollos de carácter general, es decir, la necesidad de reducir la carga de respuesta y las reducciones presupuestarias impuestas por los gobiernos nacionales, por un lado, y un aumento de la demanda, por el otro. El papel de esos registros en el diseño de las encuestas empresariales se pueden resumir diciendo que, dada una necesidad particular del usuario, la recolección de datos directamente de las empresas sólo está justificada después de que una amplia investigación ha llevado a la conclusión de que ninguno de los registros disponibles puede satisfacer la necesidad. En el contexto de las estadísticas empresariales un registro administrativo puede definirse como una recolección sistemática de datos que puede estar relacionada con las empresas individuales de tal manera que su actualización sea posible. Según el objetivo al que sirven, los registros administrativos pueden ser subdivididos en registros básicos y registros especializados. Los registros básicos se mantienen como fuente para la administración pública en general, o bien, para servir a varias administraciones diferentes. Estos registros suelen mantenerse al tanto de la población empresarial y sus dinámicas. Una condición importante es que este tipo de registros conserve atributos de identificación también usados por otras administraciones. Además deben contener algunos datos básicos de interés común para varias administraciones. Los registros especializados sirven sólo a un propósito o grupo de propósitos limitado y explícitamente definido. Estos registros son mantenidos por la autoridad que es también el usuario. A menudo los registros proporcionan parte de los datos de entrada, tales como nombre, dirección, forma jurídica, código de actividad y tamaño de las unidades jurídicas y locales. Ejemplos de
16
La disyuntiva de recabar los datos directamente de las empresas o confiar en los registros administrativos es una cuestión de equilibrio entre las ventajas y desventajas relativas. Las principales ventajas de los registros administrativos son: evitan la carga de respuesta; menor costo, en especial cuando se incluye la carga de reporte en el costo para la sociedad; no-respuesta insignificante o inexistente; inexistencia de errores de muestreo; los datos pueden ser más exactos debido a los intensos controles de los datos por las autoridades administrativas. Las principales desventajas de los registros administrativos son: la discrepancia entre conceptos administrativos y conceptos estadísticos, la mala integración con otros datos del sistema estadístico, los riesgos con respecto a la estabilidad, las autoridades pueden cambiar las prácticas administrativas o la base jurídica para el registro sin tomar suficientemente en cuenta las necesidades en materia de estadística. En algunos casos los datos comunicados pueden ser menos precisos. Por ejemplo, cuando se utilizan los datos fiscales, el informante tiene un interés directo en los datos que proporciona; esto puede causar un sesgo sistemático. Además, los datos administrativos pueden demorarse de manera inaceptable en quedar disponibles. Por último, puede haber limitaciones legales en relación con el acceso y la confidencialidad. Hay tres tipos de uso de los registros administrativos. El procesamiento directo de los datos se justifica cuando los conceptos registrados encajan razonablemente bien con el sistema de estadística y además los datos suministrados son de calidad suficiente. Las actividades estrictamente supervisadas como la banca y los seguros se aplica a menudo al procesamiento directo. El cotejo con fuentes administrativas o estadísticas es otra forma de utilización. Esto puede enfocarse en complementar los atributos de un registro con atributos de otro registro o en verificar la validez de los datos. Otra forma de utilización es realizar el seguimiento de los cambios en la reserva de unidades o en sus atributos mediante la comparación de los registros en dos puntos en el tiempo.
17