Story Transcript
Regresión con heterocedasticidad y autocorrelación Tema 6
Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Regresión con heterocedasticidad • La heterocedasticidad significa que var(i) cte • Es la norma, no la excepción, en especial con datos transversales • Hay diversas circunstancias que justifican su aparición: – En modelos de aprendizaje, los agentes reducen sus errores en el tiempo – Hay variables explicativas que justifican una mayor variabilidad de los agentes – Mejora en la recogida de datos reduce los errores – Existencia de atípicos severos – Mala especificación (omisión de variables, forma funcional, datos incorrectos …)
• La heterocedasticidad afecta a la eficiencia, pero los estimadores MCO siguen siendo insesgados y consistentes
Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Consecuencias de la heterocedasticidad • El estimador MCO es βˆ MCO β ( X'X)1 X'ε • Puesto que, E (βˆ ) E[ β (X'X)1 X'ε] β E[( X'X) 1 X'ε] β (por la exogeneidad)
Se mantiene la insesgadez • La varianza será, E[(βˆ β)(βˆ β) '] ( X'X) 1 X ' εε ' X( X'X) 1 E[( X'X) 1 X ' Σ ' X( X'X) 1 ]
Pero ahora ’ 2I y por tanto la expresión anterior no será igual a 2(X’X)-1 • El estimador MCO ya no es eficiente
Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Estimación eficiente con heterocedasticidad • Supongamos que conociésemos la forma de la heterocedasticidad var( i X i ) h( X i )
• Entonces el modelo transformado, Yi X 1i 1 0 1 ... k h( X i ) h( X i ) h( X i )
X ki i h( X i ) h( X i )
tiene errores homocedásticos: i 1 1 var var( i ) h( X i ) 1 h( X ) h( X i ) h ( X ) i i
• Por tanto podemos estimar por MCO el modelo transformado. Este procedimiento se denomina MCP y es una caso particular de MCG Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Estimación eficiente con heterocedasticidad • Por ejemplo si en Yi = 0+ 1Xi+ i ,var(i) = Xi ,en el modelo, Yi Xi i 1 0 1 Xi Xi Xi Xi
• Tendremos, i var X i
• Análogamente
2
X i 1 cte.
Yi X 1 0 1 i i Xi Xi Xi Xi i var X i
Econometría y predicción
1 X i
2
1 X i cte X i
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Estimación eficiente con heterocedasticidad • Cuando no se conoce la forma de la heterocedasticidad hay que estimarla para poder aplicar el método anterior: MCPF • Una forma bastante flexible de modelizar la heteroscedasticidad es, var ( i | X) 2 exp 0 1 X 1i ... k X ki 2 h( X )
•
Si ui es una v.a. independiente de X y con media unitaria, tenemos, i2 2 exp 0 1 X1i ... k X ki ui pues E ( i2 ) 2 exp 0 1 X 1i ... k X ki ln( i2 ) 0 0 1 X1i ... k X ki ei
• que podemos estimar para obtener hˆ( X )y aplicar el método Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Estimación eficiente con heterocedasticidad • También podemos usar estimadores robustos (§4.3.1.2) 1 ˆi ]2 ( n 2) [( X X ) 1 1 i ˆ ( ˆ1 ) var n n 1 ( X X )2 2 1i
• A la hora de decidirse por MCP o el estimador robusto, debemos tener en cuenta que, – Si conocemos la forma de la heterocedasticidad, MCP es más eficiente que el estimador robusto – Pero MCG exige exogeneidad estricta – En general el estimador robusto es mejor si hemos de emplear MCPF y es fácil de obtener al venir incorporado en todos los programas
• Considerando pros y contras junto con el hecho de que no se suele conocer la forma de la heterocedasticidad, no es extraño que hoy lo habitual sea emplear estimadores robustos Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Contrastes de heterocedasticidad Contraste de Breusch Pagan • Para contrastar si la varianza del error se relaciona con las variables explicativas, estimamos el modelo ˆi2 0 1 X1i ... k X ki ei • A continuación contrastamos H0: 1 = k = 0. El estadístico de contraste nR2 se distribuye como una 2(k) Contraste de White • Más potente y más empleado, es similar al anterior incluyendo como regresores potencias y productos cruzados de las X • El estadístico de contraste y su distribución son idénticos, nR2 se distribuye como una 2(k) Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Ejemplo contraste heteroscedasticidad Test de Breusch-Pagan Dependent Variable: VOTEA Method: Least Squares Date: 01/14/16 Time: 17:26 Sample: 1 173 Included observations: 173
Dependent Variable: U2 Method: Least Squares Date: 01/14/16 Time: 17:25 Sample: 1 173 Included observations: 173
Variable
Coefficient
Std. Error
t-Statistic
Prob.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C PRTYSTRA DEMOCA LEXPENDA LEXPENDB
37.66141 0.251918 3.792943 5.779294 -6.237836
4.736036 0.071293 1.406520 0.391820 0.397460
7.952097 3.533575 2.696687 14.74988 -15.69427
0.0000 0.0005 0.0077 0.0000 0.0000
C PRTYSTRA DEMOCA LEXPENDA LEXPENDB
113.9635 -0.299264 15.61921 -10.30573 -0.051404
50.81503 0.764929 15.09117 4.204008 4.264520
2.242712 -0.391231 1.034990 -2.451405 -0.012054
0.0262 0.6961 0.3022 0.0153 0.9904
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.801163 0.796429 7.573085 9635.072 -593.1954 169.2288 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
50.50289 16.78476 6.915554 7.006690 6.952527 1.524816
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.052563 0.030005 81.25499 1109199. -1003.723 2.330112 0.058058
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
2(4)= nR2 = 173·0.05256 = 9.093; (vc (5%) = 9,49) Econometría y predicción Matilla, M., Pérez, P. y Sanz, B. McGraw Hill
55.69406 82.50214 11.66154 11.75267 11.69851 1.912911
Ejemplo contraste heteroscedasticidad Test de White Test Equation:
Dependent Variable: VOTEA Method: Least Squares Date: 01/14/16 Time: 17:26 Sample: 1 173 Included observations: 173 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C PRTYSTRA DEMOCA LEXPENDA LEXPENDB
37.66141 0.251918 3.792943 5.779294 -6.237836
4.736036 0.071293 1.406520 0.391820 0.397460
7.952097 3.533575 2.696687 14.74988 -15.69427
0.0000 0.0005 0.0077 0.0000 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.801163 0.796429 7.573085 9635.072 -593.1954 169.2288 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
50.50289 16.78476 6.915554 7.006690 6.952527 1.524816
Dependent variable U2
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C PRTYSTRA^2 PRTYSTRA*DEMOCA PRTYSTRA*LEXPEND... PRTYSTRA*LEXPEND... PRTYSTRA DEMOCA^2 DEMOCA*LEXPENDA DEMOCA*LEXPENDB LEXPENDA^2 LEXPENDA*LEXPEND... LEXPENDA LEXPENDB^2 LEXPENDB
55.74236 -0.054980 1.029412 -0.458714 -0.104149 6.761675 65.80657 -31.23212 8.778460 6.656256 5.071447 -51.87069 -4.480707 4.518940
284.6372 0.060446 2.156386 0.555609 0.581220 6.942492 130.9924 11.47446 12.56600 1.971641 4.881279 39.47324 2.427131 49.35734
0.195837 -0.909564 0.477378 -0.825605 -0.179189 0.973955 0.502369 -2.721881 0.698588 3.375997 1.038959 -1.314072 -1.846092 0.091556
0.8450 0.3644 0.6337 0.4103 0.8580 0.3316 0.6161 0.0072 0.4858 0.0009 0.3004 0.1907 0.0667 0.9272
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.179778 0.112715 77.71354 960263.7 -991.2510 2.680758 0.001973
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
2(13)= nR2 = 173·0.1798 = 31,10; (vc (5%) = 22,4) Econometría y predicción Matilla, M., Pérez, P. y Sanz, B. McGraw Hill
55.69406 82.50214 11.62140 11.87658 11.72492 1.996983
Problemas de heteroscedasticidad Estimador robusto Dependent Variable: VOTEA Method: Least Squares Date: 01/14/16 Time: 18:00 Sample: 1 173 Included observations: 173 HAC standard errors & covariance (Bartlett kernel, Newey-West fixed bandwidth = 5.0000)
Dependent Variable: VOTEA Method: Least Squares Date: 01/14/16 Time: 17:26 Sample: 1 173 Included observations: 173 Variable
Coefficient
Std. Error
t-Statistic
Prob.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C PRTYSTRA DEMOCA LEXPENDA LEXPENDB
37.66141 0.251918 3.792943 5.779294 -6.237836
4.736036 0.071293 1.406520 0.391820 0.397460
7.952097 3.533575 2.696687 14.74988 -15.69427
0.0000 0.0005 0.0077 0.0000 0.0000
C PRTYSTRA DEMOCA LEXPENDA LEXPENDB
37.66141 0.251918 3.792943 5.779294 -6.237836
4.989690 0.077275 1.511932 0.619492 0.421132
7.547847 3.260001 2.508674 9.329079 -14.81208
0.0000 0.0013 0.0131 0.0000 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.801163 0.796429 7.573085 9635.072 -593.1954 169.2288 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
50.50289 16.78476 6.915554 7.006690 6.952527 1.524816
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) Prob(Wald F-statistic)
Econometría y predicción Matilla, M., Pérez, P. y Sanz, B. McGraw Hill
0.801163 0.796429 7.573085 9635.072 -593.1954 169.2288 0.000000 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat Wald F-statistic
50.50289 16.78476 6.915554 7.006690 6.952527 1.524816 148.7644
Regresión con autocorrelación • Hay autocorrelación serial si corr(ts) 0 para t s • Esta circunstancia afecta a la eficiencia de los estimadores MCO • La autocorrelación es mucho más frecuente en series temporales (en series transversales se conoce como autocorrelación espacial) • Entre los motivos por los que puede surgir el problema cabe señalar: – – – –
Omisión de variables que por naturaleza están autocorrelacionadas Inercia propia de las series temporales Utilización de variables retardadas Manipulación de los datos
Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Regresión con autocorrelación • Hay autocorrelación serial si corr(ts)0 • Esta circunstancia afecta a la eficiencia de los estimadores MCO • Si las perturbaciones están correlacionadas, Σ ' E ( ' X)
• es una matriz en la que todos los elementos fuera de la diagonal principal no son nulos • En estas condiciones, var(βˆ X) ( X'X)1 X ' Σ ' X( X'X) 1
• Expresión diferente de la habitual. El estimador MCO ya no es eficiente Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Regresión con autocorrelación • En un modelo de regresión simple con autocorrelación, la varianza del estimador de la pendiente puede descomponerse en, 1 var[( X t X ) t ] var ˆ1 fT 2 2 T ( ) x
• Entre corchetes la varianza del estimador MCO sin autocorrelación, mientras que fT=1+2T1(T1)1+…+2T1(TT+1)T1 . Sin autocorrelación fT=1, pero con ella la expresión típica de la varianza del estimador deja de ser válida • Como en el caso de la heterocedasticidad, si se conoce la forma de la autocorrelación podemos aplicar una transformación que conduce a un modelo con residuos no autocorrelacionados (MCG)
Econometría y predicción
Matilla, M., Pérez, P. y Sanz, B.
McGraw Hill
Regresión con autocorrelación • Así, supongamos que en el modelo Yt=0+1Xt+ t el patrón de la autocorrelación de t es un AR(1), t = t +ut, con