Story Transcript
jisyJSTA
35
MAYO
SECRETARIA
DIRECCION
DE
INDUSTRIA
GENERAL
DE
Y
COMERCIO
ESTADI ST ICA
MEXICO-1973
RE VIST A
DE
ESTADISTICA
PUBLICACION MENSUAL DE LA DIRECCION GENERAL DE ESTADISTICA SECRETARIA DE INDUSTRIA Y COMERCIO
VOLUMEN XXXVI
NUM. 5 •
VENTA
DE
EJEMPLARES:
OFICINA DE PUBLIGACIONES Av. Cuauhtemoc y Dr. Liceaga (Biblioteca) Tel. 5-78-81-50
LA LEY FEDERAL DE ESTADISTICA EN SU ARTICULO 8? DICE: Las empresas indusfriales, comerciales y agricolas, asl como las dedicadas a una actividad consistente en la production o venta de mercantias y serv'tcios de cualquiera
DGE. Revista de estadística. 1973
close, estdn obligadas a inscribirse, dentro del mes de enero de cada afio, en los registros estadisticos de la Secretaria de Industria y Comercio, suministrando por escrito informes sobre su nombre o razon social, denomination del esiablecimiento, domicilio y clase de actividad economica a que se dediquen, y a poner en conocimiento de la propia Secretaria el cambio en cualquiera de estos datos que se realice en el curso del ano. Esfe informe debera ser presentado dentro de los tremta dias siguientes a la fecha en que el cambio se efectue.
SECRETARIA
DE
INDUSTRIA
DIRECCION
GENERAL
DE
Y
COMERCIO
ESTADISTICA
REVISTA
DE
ESTADISTICA
MAYO
,\J©0S
MEXICO 19 7 3
ESTADOS
UNIDOS
MEXICANOS
PRESIDENCIA DE LA REPUBLICA PRESIDENTE CONSTITUCIONAL Lie. Luis Echeverria Alvarez
SECRETARIA DE INDUSTRIA Y COMERCIO
SECRETARIO Lie. Carlos Torres Manzo SUBSECRETARIO DE INDUSTRIA Lie. Jose Campillo Sainz
SUBSECRETARIO DE COMERCIO Lie. Eliseo Mendoza Berrueto
SUBSECRETARIO DE PESCA Inc. Hector Medina Neri OFICIAL MAYOR Lie. Carlos Fabre del Rivero
CONSEJO CONSULT1VO DE ESTADISTICA Ing. Emilio Alani's Patino Ing. Rodolfo Flores Talavera Lie. Javier Bonilla Garcia
DGE. Revista de estadística. 1973
DIRECCION GENERAL DE ESTADISTICA DIRECTOR Lie. Ruben Gleason Galicia SUBDIRECTORES Lie. Jose Manuel Gil Padilla
Lie. Thelma de la Mora de Gontes
Inc. Gregorio Solis Serrano
Lie. Roberto Labastida Almendaro
ENCUESTA NACIONAL DE HOGARES
Diseno de la muestra (Continua) 13.
ESTIMADORES 13.1
Totales y promedios
Se quiere calcular una variedad de estimaciones, como totales, promedios, relaciones, indices, etc. Como se recuerda el pais fue dividido en 132 estratos de donde se seleccionaron dos unidades primarias NAR por estrato y por otro lado se tienen 144 unidades primarias AR. Sea: Mh
= numero de unidades primarias NAR en el estrato h y se seleccionan mh - 2. h = 1,2,... .,132. Si h 132 representan unidades AR.
Ahl
= numero de areas geograficas en la unidad P del estrato h y se seleccionan ahl<
RhiJ
= numero de manzanas o dreas equivalentes en el area j y se seleccionan rhy.
Hbijk = numero de hogares en la manzana K y se seleccionan hhlj# Yhijki = caracteristica del hogar uno en la manzana K del drea j en la unidad P i del estrato h.
Yh = — E AhI — E Rbij — E Hhijt -r^— E YhUk i=l 9-hi j = 1 k=l ^hijk 1=1 Yhijk Yhii Yhi 621
DGE. Revista de estadística. 1973
Una estimaci6n del promedio en un estrato es igual a:
En total en un estrato es igual a: Yh = Mh Yh Con la identificacion de los estratos y unidades primarias AR que componen una entidad se calcula el promedio y el total por entidad federativa. Como el estimador es autoponderado, es decir, se selecciono en tal forma que 1 Ph Phi Phij Phijk *~
las estimaciones estan afectadas por el inverso de esta probabilidad. El estimador del total en un estrato es igual a: Yi, = 250 E E E E yMjki i=lj=ik=l1=1 sin embargo, ciertas unidades requieren de ajustes por la no-entrevista y porque las diferencias en el proceso de selecci6n fueron grandes, debido al conteo y el censo.
13.2
Estimador de raz6n
Un m^todo sesgado que utilizamos, es el estimador de razon, en donde con informaci6n independiente, como son proyecciones censales, referidas al punto medio de febrero, mayo agosto y noviembre, se ajustan los resultados muestrales. El sesgo es despreciable cuando la muestra es grande. Los resultados de ambos procedimientos se comparan con el objeto de encontrar diferencias en el m£todo de selecci6n de unidades, asf como las estimaciones de poblaci6n obtenidas con el primer m£todo. El estimador de raz6n es de la forma:
Rh
=
yh xh
donde yh es la estimaci6n ponderada de una caracteristica. xh es el total ponde-
DGE. Revista de estadística. 1973
rado de esa caracteristica en un estrato.
Yh = Rh Xh donde Xh es la estimacion independiente. Por ejemplo, la estimaci6n del total de personas entre 20 y 29 anos de edad que buscan trabajo. 622
" Num. de personas del estrato entre " 250
20-29 anos que buscan trabajo
250
Num. total de personas entre
Num. de personas entre X
20-29 anos (Censo) en el estrato.
20-29 anos en el estrato. En una estimation de razon la variable xt es un estimador correlacionado con la variable bajo estudio, inclusive se puede estimar el cambio a trav£s del tiempo, en donde se consida la misma variable en dos trimestres. 13.3
Varianzas. Metodo de grupos aleatorios y de Keyfitz
La estimaci6n de la varianza, se lleva a cabo por separado para las unidades primarias AR y NAR. Los calculos de varianza serdn diferentes de acuerdo a la presentacidn de la informacidn, esto es, por entidad federativa, regi6n o total del pais. El calculo de la varianza tiene por objeto conocer la precisi6n con que se hacen las estimaciones. La expresi6n de la varianza debe ser lo mis simple posible, con el objeto de que su c&lculo tenga valor pr&ctico. El metodo que se propone es de "grupos aleatorios", que refleja por sf solo todas las diferencias metodologicas del diseno de la muestra, esto es, que se consideran los locales especiales de alojamiento, la nueva construction, estratification, la formaci6n de conglomerados, etc. Posteriormente se calcularin las expresiones de los componentes de estas varianzas, con el objeto de descubrir qu£ parte de los errores de muestreo provienen entre y dentro de las unidades primarias, y cuando se cuente con la information suficiente sobre costos se puede mejorar el diseno de la muestra. 13.3.1
Unidades primarias NAR
En el muestreo estratificado cada uno de los estratos se compensa en los grupos aleatorios. La estratificacion es particularmente importante cuando se incluyen submuestras grandes en cada unidad primaria, la contribuci6n "entre unidades primarias" es de considerable magnitud. Suponiendo que las dos unidades primarias se seleccionaron en forma independiente, el metodo de Keyfitz establece que: /
L
\
L
Vnab ( E (Y,,1 + Yh2) ) = 5T (Yhi - Yh2)2 \ h=l / h=1 donde Yhi es el total de una caracterfstica en el estrato h.
= (250)2 £ (Yhi - Ks)S
utilizando los totales muestrales. 623
DGE. Revista de estadística. 1973
Como el estimador es autoponderado:
La varianza del estimador de raz6n es igual a:
T7 ^2 / Vnar (R) = 2^ R I h=i \
Xhi — Xh2
V'
(Xhi — ^2
yti f ' 2~i (yhi
yh2
Y j r— I =2^ d yh2/ / h-i
£1 estimador del total de una caracteristica es igual a la siguiente expresi6n: A A Y = ^ Rk XK k donde K es un grupo de sexo y edad:
Vnar (Y) = X] (^2 XR dhK V h=1 \ K J Como los resultados de una encuesta para diferentes grupos de edad y sexo no son independientes, existen covarianzas, pero en este m£todo van implfcitas. 13.3.2
Unidades primarias AR
Utilizamos el m£todo de "grupos aleatorios", debido al reducido costo de c&lculo, a la facilidad de la implementaci6n con la utilizaci6n de la computadora. Se agrupan aleatoriamente los conglomerados ultimos en "t" grupos de "K" elementos cada uno. Estos conglomerados se tratan como una sola unidad. Cuando se quiere calcular la varianza de una caracteristica en la entidad se sigue este procedimiento. El estimador del total tiene la forma siguiente:
sl
=
K(t-D £(y':-y')2
Se demuestra que
E (s|) = S|
y'i = 250 £ yij i— I donde yy es el valor muestral de la observaci6n i-^sima en la muestra.
DGE. Revista de estadística. 1973
— 1 v-* y = — 2_, yi t j-i Una formula aproximada para estimar totales es:
v(Y) =
624
1 ... t (t — 1) y
2
Etyi-yf i-i
El estimador de raz6n se obtiene de la forma usual. V (R) = (V; + Vp - 2Vjy) R2 La estimaci6n de la covarianza se obtiene de:
£ (yl — y) (xi — x') y— — _Lii Iy t(t— l)x'x'
13.4
Estimaci6n de LOS componentes de la varianza
La varianza total est£ compuesta de dos elementos: la varianza W "entre" y "dentro" de unidades primarias. La varianza "entre" que denotamos por S2 se obtiene por diferencia. (Y) = S2 (Y) - S2 (Y) Unidades primarias NAR. Una estimaci6n de la varianza "dentro" denotada por
para las unidades
primarias NAR en donde se hizo una seleccion de dos unidades por estrato se obtiene de la siguiente expresi6n.
Si (Y) = £ — — -4r t Rj, h-i mi! mh Ph i=i
(Rhi
-kl) Rhi
s
*' hi
2 Rhi hi « O ~ 1 *M,i
Si (•?) =
£ £ r hi2 Siki (Ybi) h-li-l
es el numero de conglomerados ultimos, o segmentos.
Sihi (%i) =
77- S tfbii - %i)' rhi (rhi— 1) i-i
Yhij = 250 yhii
yhij
es el total muestral
~ _250_ ^ *hi — / -> yhij r hi j-1 625
DGE. Revista de estadística. 1973
hl
4
13,5
Lista de renglones para LOS cuales se efectuaran LOS CALCULOS
Los renglones para los cuales se aconseja calcular estas varianzas son: 1.
Poblacidn total de 12 anos de edad y mas.
2.
Total de hombres de 12 anos de edad y mas.
3.
Total de mujeres de 12 anos de edad y mas.
4.
Total de hombres de 12 anos y mas en areas urbanas.
5.
Total de jefes de familia.
6.
Poblacion total en la fuerza de trabajo.
7.
Total de hombres en la fuerza de trabajo.
8.
Total de mujeres en la fuerza de trabajo.
9.
Poblacion de 12-19 anos de edad en la fuerza de trabajo.
10.
Total de desempleados.
11.
Total de empleados en actividades agropecuarias.
12.
Total de hombres empleados en actividades agropecuarias.
13.
Total de empleados en actividades economicas no agropecuarias.
14.
Total de hombres empleados.
15.
Poblacion total empleada en la manufactura.
16.
Trabajadores asalariados empleados.
17.
Poblacidn empleada que esta trabajando en establecimientos de servicios.
18.
Personal asalariado que esta trabajando por tiempo completo en actividades no agropecuarias.
19.
Poblacidn de empleados que estan trabajando por tiempo parcial en actividades no agropecuarias.
15.
20.
Poblacidn total de empleados que estan trabajando por tiempo parcial.
21.
Total de trabajadores por cuenta propia.
22.
Total de familiares que trabajan sin remuneracitfn.
23.
Otros.
CORRECCION DE ALGUNOS ERRORES Y SESGOS DEBIDOS AL DISEttO DE LA MUESTRA En esta parte se hace hincapi£ en algunos problemas que se presentaron debi-
do al diseno de la muestra y la forma en que se resolvieron, de ninguna manera, se pretende resolver todos los problemas que surgen en una encuesta tan compleja como la que se esta realizando. En toda encuesta que se efectua se introducen errores y sesgos en diferentes
DGE. Revista de estadística. 1973
magnitudes, debido al simple proceso de obtencidn de la informaci6n. Esto senala la importancia que tiene en una encuesta no s61o el buen diseno de la misma, sino el trabajo de campo que requiere: elaboraci6n de cuestionarios funcionales, entrevistadores eficientes; trabajo de c6mputo electr6nico adecuado; buen control en la oficina, etcetera. Es iniitil hacer una fuerte inversion en la preparaci6n del personal para la encuesta; en elaborar la documentacidn nece626
saria; en tener un equipo responsable, si los resultados no concuerdan con la realidad. Los errores que se introducen en una muestra se originan principalmente por la variabilidad de la caracteristica en la poblacion y por las inferencias que se realicen; esto se conoce como error de muestreo. El error total en una encuesta surge de la diferencia entre los resultados y los valores reales de los parametros, y esta diferencia se debe no solo a los errores de muestreo, sino tambien a aquellos errores ajenos al proceso que en realidad constituyen los sesgos. El error cuadrdtico medio se define de la siguiente manera: ECM = V (Xt) + B2 dande B = sesgo Si Xt se estima con una muestra aleatoria simple
Xt = — E Xit 11
1
-
donde i = 1, ...,N t = 1, . . ., M
En una poblacion, xlt es el valor censal de la caracteristica i-£sima y el subIndice "t", indica una de las M posibles repeticiones independientes del Censo en condiciones favorables.
X, = vSXi, i\ i = 1
E (X.) = X . .
Xi = — £ Xi. 11 i = l
E (Xit) = X,.
entonces V (xt) = E(Xt —Xi-fi.+ Xi —I. .)2 = E(X, — Xi.)2 + E (Xi. — X . . )2 + 2E(X, — Xi.) (Xi. —f . . ) Por lo tanto: ECM = Var (de respuesta simple) + Cov (dentro de la encuesta) + Var (de muestreo) + Cov (entre repeticiones de la encuesta) + (sesgo).2 Debe existir en una encuesta, un equilibrio, considerando los costos, entre los errores de muestreo y los sesgos. Con los recursos con que se cuente se debe nezca constante. Cuando una estimaci6n se ve afectada solamente por la variabilidad, se dice que es precisa, pero cuando se corrigen los errores ajenos, se le llama tambien insesgada. (Continuara) 627
DGE. Revista de estadística. 1973
tratar de disminuir los sesgos, aunque la variabilidad se incremente o perma-
Republica Mexicai;a 14. E&AUEMA RESUMEK I 8 Regiones
Q—
Entidad Federativa T
1 3 Areas metropolitanas Mexico,Guadalajara,Monterrey
Estratificaci6n
1 Municipios AR Municipios NAR Forraaci