Story Transcript
Discapacidad y relación con la actividad en los hogares españoles: efectos directos e inducidos Centro de Estudios Demográficos
6 ANÁLISIS MULTIVARIABLE
6.1 Metodología Tras todo el trabajo descriptivo realizado hasta ahora, que rebela la gran diversidad de casuísticas en las que puede analizarse la relación entre la ocupación laboral y la convivencia o el cuidado a personas dependientes, nuestro trabajo aplica modelos multivariables para poder integrar tales interrelaciones de forma controlada. Lo que hace esta herramienta es precisamente estimar la relación o asociación entre dos variables teniendo en cuenta que puede haber otros factores que modifiquen esa relación. En particular, para averiguar el efecto de tales factores en la probabilidad de trabajar hemos utilizado como herramienta la regresión logística. Su uso requiere de la variable dependiente ciertas características que se cumplen en nuestro caso: es posible tratar la ocupación como una variable dependiente de tipo dicotómico (el sujeto trabaja o no trabaja), lo que equivale a una variable binaria del tipo 0/1, en la que las dos categorías son mutuamente excluyentes. En tales condiciones, pueden explorarse modelos sucesivos, según las variables que se sospecha condicionan la ocupación, y comprobar con qué intensidad lo hacen, y si los simples resultados descriptivos ocultaban interferencias, redundancias o relaciones espurias. En definitiva, los modelos de regresión permitirán estimar la probabilidad de que un individuo trabaje en función de diversas características propias o del hogar. En este apartado sólo se sondean las variables más claramente asociadas a la variable dependiente "ocupación" (Y). El primer análisis que realizamos es simplemente bivariable; se testa la relación existente entre la variable dependiente (Y) y una sola variable independiente (Xi). Eso permite valorar la conveniencia de su posterior inclusión en modelos multivariables, utilizando su nivel de significación estadística como criterio73. Los modelos serán descritos y explicados igualmente más adelante.
73
Según Jovell (1995) no existe un consenso respecto al nivel de significación requerido. Hay autores que proponen valores de significación específicos (0,20; 0,25 o 0,40), mientras otros defienden que todas las variables deben ser consideradas para su inclusión en el análisis multivariable. También se pueden fijar de antemano los niveles de significación estadística que delimitan tanto la entrada al modelo como la posterior permanencia en el mismo de las variables independientes. Aquí sólo consideramos aquellas variables independientes que tienen un nivel de significación α = 0,20 en la entrada para cada categoría.
201
Discapacidad y relación con la actividad en los hogares españoles: efectos directos e inducidos Centro de Estudios Demográficos
El proceso por el que se decide qué variables integran un modelo no puede ser aleatorio, y tampoco conviene empezar incluyendo todas las variables posibles. La mejor manera es ir añadiéndolas una por una74, siempre teniendo en cuenta una posible causalidad75 y la significación de la mejora en la medida de bondad de ajuste del modelo (véase el Anexo). Se ha seguido aquí un proceso de stepwise, es decir, de inclusión gradual de variables adicionales y observación de los efectos que ello produce en el conjunto del modelo; es posible que haya una relación bivariable significativa, pero que una vez la variable testada se incluya en el modelo multivariable su efecto sobre la variable dependiente se anule, porque otra variable con que esté relacionado lo absorba76. Así se puede averiguar mejor el efecto directo (independiente) de cada variable explicativa en el empleo y además ver si hay variables que confunden o modifican dicha relación, mediante la comparación con los resultados de los análisis bivariables y de cada paso de la regresión multivariable. En el apartado anterior hemos visto que en general la relación entre un variable independiente y la probabilidad de trabajar ha sido diferente para hombres y mujeres. Por eso hemos tenido que hacer los análisis separados para hombres y mujeres. Eso significa que, aparte de la diferencia entre hombres y mujeres en el ámbito de trabajo, hay interacciones entre los determinantes de trabajar y género. En otras palabras, la influencia de educación, por ejemplo, no es lo mismo para un hombre que para una mujer y las diferencias de género son distintas para cada nivel de estudio. En el caso de edad, sólo había interacciones en varias ocasiones, y por esta razón se han hecho estimaciones de los coeficientes de esas variables independientes para cada categoría de edad77. La interpretación de los resultados se hace a partir de modelos multivariables. En regresión logística se calculan primero las ods78 (en vez de probabilidades). Una ods es la razón entre la probabilidad de que se produzca un
74
En general, se lleva a cabo la modelización estadística mediante tres tipos de estrategias 1) la inclusión secuencial de variables hacia delante (forward), 2) método de eliminación progresiva o exclusión secuencial de variables hacia atrás (backward), o 3) método de inclusión por pasos o paso de paso de variables (stepwise).
75
Por ejemplo, la relación entre empleo y la renta para un adulto se explica parcialmente por el nivel de educación que haya tenido antes de empezar su primer empleo. Por eso sería mejor añadir educación en el modelo antes que la renta. De igual modo, empezamos con las variables más básicas del sujeto, las demográficas, seguido por las socioeconómicas y de la salud y solo después testamos los factores del hogar y las variables respecto a las características de los demás miembros de hogar.
76
El motivo es la llamada "multicolinealidad" entre variables (véase el Anexo).
77
Además, por falta de casos en algunas combinaciones de una categoría de variable y edad no pudimos testar una posible interacción (estado civil, tipología hogar, discapacidad cónyuge, discapacidad hijos, trabaja padre, trabaja madre, horas por semana que cuida, años que cuida, si recibe compensación económica). Utilizamos el criterio