Story Transcript
Capítulo VI: Modelos ARIMA - Estimación y validación
Aplicaciones Informáticas
3. APLICACIONES INFORMÁTICAS: ARIMA - ESTIMACIÓN Y VALIDACIÓN
Fichero: cii6p1.wf1 Series:
Y
Periodo muestral: 1 - 350 3.1. Introducción El objetivo en esta práctica es estimar y validar el modelo ARIMA que mejor representa la serie temporal Y, dada una previa identificación del mismo. 3.1.1. Representación gráfica de la serie QUICK/GRAPH... Y (Line Graph) 16
12
8
4
0
-4 50
100
150
200
250
300
350
Y
Como podemos ver en el gráfico, la serie corta frecuentemente a su nivel medio y además su variabilidad parece bastante constante, lo cual son indicaciones de que la serie es estacionaria, y por tanto, tiene sentido plantear un modelo ARMA(p,q) para la misma. La determinación de los valores de p y q se hará analizando las funciones de autocorrelación total y parcial estimadas. 3.1.2. FACE y FACPE QUICK/Series Statistics/Correlogram...
Series name: Y Correlogram of: Level Lag Specification: 10
Correlogram of Y ============================================================== Sample: 1 350 Included observations: 350 ============================================================== Autocorrelation Partial Correlation AC PAC Q-Stat Prob ============================================================== .|****** | .|****** | 1 0.830 0.830 243.15 0.000 .|**** | ***|. | 2 0.557-0.423 353.01 0.000 .|*** | .|** | 3 0.360 0.210 399.11 0.000 .|** | *|. | 4 0.238-0.082 419.29 0.000 .|* | .|. | 5 0.152 0.000 427.50 0.000 .|* | *|. | 6 0.066-0.098 429.06 0.000 .|. | *|. | 7-0.030-0.079 429.38 0.000 1
Capítulo VI: Modelos ARIMA - Estimación y validación
Aplicaciones Informáticas
*|. | .|. | 8-0.098 0.029 432.81 0.000 *|. | .|* | 9-0.100 0.075 436.45 0.000 *|. | *|. | 10-0.078-0.061 438.68 0.000 ============================================================== El aspecto de las FACE y FACPE corresponde al de una serie estacionaria. En este caso, al observarse un decaimiento no truncado en ambos correlogramas se ha planteado, como modelo de partida en la fase de identificación, un modelo ARMA(1,1). 1 3.2. Estimación Una vez identificados los modelos que son posibles candidatos a representar el comportamiento dinámico de la serie se procede a su estimación. La estimación de modelos ARMA para una serie temporal mediante Eviews es sencilla puesto que se reduce a especificar los términos AR y MA correspondientes. Por ejemplo, para estimar un modelo ARMA(2,3) con constante para la serie Y haríamos lo siguiente: QUICK/Estimate Equation... Y C AR(1) AR(2) MA(1) MA(2) MA(3) Observaciones: • • •
Eviews estima el modelo ARMA por mínimos cuadrados. El problema de no linealidad inducido por la parte MA se resuelve recurriendo a un algoritmo de optimización numérica (Eviews asigna un valor preliminar a los coeficientes por sí mismo). Para la estimación Eviews adopta un enfoque condicional en el tratamiento de los valores iniciales del proceso, que son: Y0 = (Y1,Y2,...,Yp)’ y ε0 = (0,0,...,0)’. Consecuentemente, en la estimación de un modelo ARMA(p,q) se pierden las p primeras observaciones. Convención de signos. Eviews estima el modelo en su forma usual, es decir: Yt = a1 Yt − 1 + a2 Yt −2 + K + a p Yt − p + b1ε t − 1 + b 2 ε t − 2 + K + b q ε t − q + ε t y, por tanto, los coeficientes estimados son:
•
AR (1) → a$ 1 AR (2 ) → $a2
MA (1) → b$ 1 MA ( 2 ) → b$
M
M
AR ( p ) → $a p
MA ( q ) → b$ q
2
Tratamiento del término constante. Cuando en el modelo se incluye una constante, su estimación en Eviews corresponde a la estimación del parámetro µ = E[ Yt ] en a( L )( Yt − µ ) = b ( L) ε t . Sin embargo, habitualmente especificamos el modelo como a( L ) Yt = δ + b ( L) ε t , de modo que δ = (1 − α1 −...−α p )µ . En Eviews el valor estimado de la constante C es µ.
El modelo ARMA(1,1) estimado (con término constante) es: QUICK/Estimate Equation... Y C AR(1) MA(1) ============================================================ LS // Dependent Variable is Y Sample(adjusted): 2 350 Included observations: 349 after adjusting endpoints Convergence achieved after 8 iterations ============================================================ 1
Ver aplicación práctica del capítulo V para referencias concretas sobre la identificación de un modelo ARMA(p,q).
2
Capítulo VI: Modelos ARIMA - Estimación y validación
Aplicaciones Informáticas
Variable CoefficienStd. Errort-Statistic Prob. ============================================================ C 6.738410 0.331443 20.33054 0.0000 AR(1) 0.697487 0.040042 17.41901 0.0000 MA(1) 0.703628 0.040261 17.47656 0.0000 ============================================================ R-squared 0.797118 Mean dependent var 6.702822 Adjusted R-squared 0.795945 S.D. dependent var 2.434500 S.E. of regression 1.099724 Akaike info criter 0.198677 Sum squared resid 418.4497 Schwarz criterion 0.231815 Log likelihood -526.8786 F-statistic 679.7109 Durbin-Watson stat 1.924820 Prob(F-statistic) 0.000000 ============================================================ Inverted AR Roots .70 Inverted MA Roots -.70 ============================================================ Por tanto, el modelo estimado es: Yt = 2.038 + 0.697 Yt −1 + 0.703ε$ t −1 + ε$ t (0.04004)
(0.04026)
3.3. Validación En esta fase vamos a estudiar la validez de los modelos estimados para describir el comportamiento de la serie Y. Para ello se lleva a cabo un análisis de los residuos, de los coeficientes y de la bondad del ajuste. 3.3.1. Análisis de los residuos El objetivo aquí es comprobar si los residuos de los modelos estimados son compatibles con un ruido blanco tal y como implica una correcta especificación de estos modelos. 3.3.1.1. Contrastes de autocorrelación Si los residuos son compatibles con un r.b. entonces no deberían presentar dependencia serial (autocorrelación). Para contrastar la ausencia de autocorrelación en los residuos nos fijamos en los coeficientes de la FACE (denotamos como rk el coeficiente de autocorrelación estimado de orden k). Llevaremos a cabo contrastes individuales y conjuntos. i) Contrastes individuales: Para cada coeficiente rk contrastamos: H0:
ρk = 0
H A : ρk ≠ 0 La regla a seguir es: 1.25 , k = 1,2 ,3 rk > T RH 0 si r > 1.60 , k > 3 k T Nota: Las bandas de confianza que ofrece el programa Eviews no son correctas, ya que las calcula para 196 . Por eso no debemos fijarnos en ellas, sino hacer los cálculos manualmente. 3
T.
Capítulo VI: Modelos ARIMA - Estimación y validación
Aplicaciones Informáticas
En nuestro caso, los valores críticos para hacer los contrastes individuales son: 1.25 T 1.60 T
= =
1.25 350 1.60 350
= 0.0668 ,
k = 1,2 ,3
= 0.0855 ,
k >3
ii) Contrastes globales (Ljung-Box): H 0 : ρ1 =K = ρ m = 0 donde m < (1/3)T H A : No H 0 m
El estadístico para este contraste es: Q * = T(T + 2 ) ∑ (T − K ) −1 rk2 → χ 2m − p −q . H 0
k =1
Eviews calcula automáticamente el estadístico Ljung-Box. Para ello, en la ventana con el output de la estimación, seleccionamos: VIEW/Residual Tests/Correlogram - Q-statistics Para nuestro modelo ARMA(1,1) tenemos: Correlogram of Residuals ============================================================== Sample: 2 350 Included observations: 349 χ2m−1−1 Q-statistic probabilities adjusted for 2 ARMA term(s) ============================================================== Autocorrelation Partial Correlation AC PAC Q-Stat Prob ============================================================== .|. | .|. | 1 0.037 0.037 0.4922 .|. | .|. | 2-0.008-0.010 0.5164 *|. | *|. | 3-0.069-0.068 2.1882 0.139 .|. | .|. | 4 0.030 0.035 2.4982 0.287 .|. | .|. | 5 0.007 0.003 2.5149 0.473 .|. | .|. | 6 0.059 0.055 3.7577 0.440 .|. | .|. | 7-0.047-0.047 4.5369 0.475 *|. | *|. | 8-0.155-0.153 13.220 0.040 .|. | .|. | 9-0.034-0.016 13.630 0.058 .|. | .|. | 10 0.004-0.006 13.636 0.092 .|. | .|. | 11-0.029-0.048 13.934 0.125 .|. | .|. | 12 0.035 0.043 14.375 0.157 .|. | .|. | 13-0.012-0.009 14.431 0.210 .|. | .|. | 14-0.007 0.005 14.448 0.273 *|. | *|. | 15-0.062-0.068 15.874 0.256 ============================================================== Como se puede comprobar, comp arando el valor absoluto de las autocorrelaciones estimadas con los valores críticos calculados anteriormente, los contrastes individuales son favorables a la hipótesis nula de no autocorrelación. Respecto al contraste conjunto de Ljung-Box, también acepta la nula de correlaciones iguales a cero para distintos valores de m. En concreto, para m=15, el valor de probabilidad que nos da Eviews es 0.256 < 0.05, y por tanto, favorable a la nula. Vemos pues, que ambos contrastes favorecen al modelo ARMA(1,1), ya que en todos se acepta la nula de que el residuo es un ruido blanco. 3.3.1.2. Análisis gráfico 4
Capítulo VI: Modelos ARIMA - Estimación y validación
Aplicaciones Informáticas
En el gráfico de los residuos vamos a intentar detectar síntomas de no compatibilidad con un ruido blanco: varianza no constante, valores extremos, etc. La forma de proceder es generar las series de residuos tras la estimación de cada modelo y ver su gráfico. Para eso, en la ventana del output de la estimación hacemos: VIEW/Actual, Fitted, Residuals/Graph. 15 10 4
5
2
0
0
-5
-2 -4 50
100
150
200
Residual
Actual
250
300
350
Fitted
Como podemos comprobar en este gráfico, el ajuste del modelo estimado es muy bueno, y la representación gráfica de los residuos se corresponde a la de un ruido blanco. 3.3.2. Análisis de los coeficientes 3.3.2.1. Estacionariedad Para determinar si el modelo es estacionario, examinamos el valor de las raíces del polinomio de retardos AR estimado:
a$ p ( L) = (1 − λ$ 1 L)...(1 − λ$ p L) 1 Eviews calcula directamente el valor de: λ$ i = $ (inverted AR roots). Si alguno de estos valores es mayor que Li uno en módulo, el proceso no es estacionario y posiblemente sea necesario diferenciar la serie. En nuestro caso las raíces de la parte AR son menores que uno en módulo: Inverted AR Roots
.70
y, en consecuencia, el valor de los coeficientes estimados garantiza la estacionariedad. 3.3.2.2. Invertibilidad En este apartado se estudia si el modelo es invertible considerando las raíces del polinomio de retardos MA estimado:
b$ p (L) = (1 − λ$ 1 L)... (1 − λ$ p L) 1 Eviews también calcula directamente λ$ i = $ (inverted MA roots). Si alguno de estos valores es mayor que uno Li en módulo, el modelo no es invertible, lo cual es un síntoma de sobrediferenciación de la serie. En nuestro caso las raíces de la parte MA son menores que uno en módulo: 5
Capítulo VI: Modelos ARIMA - Estimación y validación
Inverted MA Roots
Aplicaciones Informáticas
-.70
y, en consecuencia, el valor de los coeficientes estimados garantiza la invertibilidad.. 3.3.2.3. Sobreparametrización Lo primero que hay que hacer es comprobar que todos los coeficientes estimados son significativos y si alguno de ellos no lo es suprimirlo del modelo. Dado que las estimaciones de los coeficientes son asintóticamente normales (ya que el proceso es estacionario), podemos seguir utilizando contrastes de tipo t, aunque serán válidos sólo en muestra grande. Por tanto, no se puede usar el valor de probabilidad que da Eviews, sino el que se obtiene de la distribución Normal. De acuerdo con esto, y para contrastes bilaterales al 5%, el punto crítico que deberemos usar es 1.96. En nuestro modelo ARMA(1,1) todos los coeficientes (incluida la constante) son significativos, así que los mantenemos todos. Por último, completamos el análisis de coeficientes comprobando si hemos omitido algún coeficiente que resulte ser significativo, es decir, si el modelo puede ser mejorado mediante la introducción de coeficientes adicionales. El procedimiento a seguir si hemos estimado un modelo ARMA(p,q) es, en general: i) Estimar un modelo ARMA(p+1,q) ii) Estudiar la significatividad de a$ p +1 iii) Si a$ p +1 es significativo, llevar a cabo la fase de validación para el modelo ARMA(p+1,q) Y a continuación: i’) Estimar un modelo ARMA(p,q+1) ii’) Estudiar la significatividad de b$ q +1 iii’) Si b$ q +1 es significativo, llevar a cabo la fase de validación para el modelo ARMA(p,q+1) Vamos, por tanto, a estimar los modelos ARMA(2,1) y ARMA(1,2) •
Modelo ARMA(2,1):
QUICK/Estimate Equation... Y C AR(1) AR(2) MA(1) ============================================================ LS // Dependent Variable is Y Sample(adjusted): 3 350 Included observations: 348 after adjusting endpoints Convergence achieved after 5 iterations ============================================================ Variable Coefficien Std. Error t-Statistic Prob. ============================================================ C 6.729736 0.312476 21.53682 0.0000 AR(1) 0.788749 0.077702 10.15096 0.0000 AR(2) -0.099565 0.074058 -1.344427 0.1797 MA(1) 0.650979 0.060590 10.74407 0.0000 ============================================================ R-squared 0.797285 Mean dependent var 6.714875 Adjusted R-squared 0.795517 S.D. dependent var 2.427556 S.E. of regression 1.097735 Akaike info criter 0.197926 Sum squared resid 414.5278 Schwarz criterion 0.242204 Log likelihood -524.2297 F-statistic 450.9883 Durbin-Watson stat 1.992590 Prob(F-statistic) 0.000000 6
Capítulo VI: Modelos ARIMA - Estimación y validación
Aplicaciones Informáticas
============================================================ Inverted AR Roots .6 .16 Inverted MA Roots -.65 ============================================================ Como vemos, el coeficiente AR(2) no es significativo, ya que
−1344427 . < 196 . . Por lo tanto, no faltan
parámetros AR. •
Modelo ARMA(1,2):
QUICK/Estimate Equation... Y C AR(1) MA(1) MA(2) ============================================================ LS // Dependent Variable is Y Date: 04/24/98 Time: 15:00 Sample(adjusted): 2 350 Included observations: 349 after adjusting endpoints Convergence achieved after 8 iterations ============================================================ Variable CoefficienStd. Errort-Statistic Prob. ============================================================ C 6.723083 0.310684 21.63965 0.0000 AR(1) 0.633329 0.059099 10.71643 0.0000 MA(1) 0.814153 0.073667 11.05177 0.0000 MA(2) 0.125147 0.071561 1.748806 0.0812 ============================================================ R-squared 0.798622 Mean dependent var 6.702822 Adjusted R-squared 0.796871 S.D. dependent var 2.434500 S.E. of regression 1.097224 Akaike info criter 0.196963 Sum squared resid 415.3460 Schwarz criterion 0.241147 Log likelihood -525.5795 F-statistic 456.0666 Durbin-Watson stat 2.006052 Prob(F-statistic) 0.000000 ============================================================ Inverted AR Roots .63 Inverted MA Roots -.2 -.61 ============================================================ Como vemos, el coeficiente MA(2) no es significativo, ya que 1748806 . < 1.96 . Por lo tanto, tampoco faltan parámetros MA. 3.3.3. Análisis de la calidad del ajuste La calidad del ajuste se puede medir por el coeficiente de determinación. En nuestro caso, éste vale: R-squared
0.797118
lo cual indica un buen ajuste. 3.3.4. Análisis de estabilidad paramétrica Como última etapa de la fase de validación, se estudia si los coeficientes del modelo seleccionado son estables en toda la muestra. Si los parámetros no son estables, entonces la capacidad del modelo para predecir estará notablemente limitada. La forma más tradicional de proceder para ver si hay o no cambio estructural es utilizar un test de Chow. Pero, para su aplicación, es necesario especificar el punto de la muestra en que se puede haber producido un cambio en el valor de los coeficientes. 7
Capítulo VI: Modelos ARIMA - Estimación y validación
Aplicaciones Informáticas
Observando el gráfico de nuestra serie, vemos que no existe evidencia alguna de que se haya producido algún cambio estructural en el periodo muestral considerado. Cuando no se detecta nada visualmente, se aconseja llevar a cabo el contraste reservando para ello aproximadamente el 10% último de la muestra. En nuestro caso, esto implica contrastar un posible cambio estructural en la observación 315 (= 350 × 0.9). Para contrastar la hipótesis nula de estabilidad paramétrica empleamos un contraste tipo F de la forma: F=
[SCE
R
]
− ( SCE1 + SCE 2 ) K
( SCE1 + SCE 2 ) ( N − 2K )
~ FK, N-2K
bajo H0.
donde: SCER :
Suma de residuos al cuadrado del modelo restringido (con idénticos parámetros en toda la muestra). Suma de residuos al cuadrado del modelo no restringido (con parámetros diferentes en las dos submuestras). Nº de restricciones linealmente independientes sobre los coeficientes (coincide con el nº de coeficientes en el modelo restringido). Nº de observaciones empleadas (N) menos nº de coeficientes en el modelo no restringido (2K).
SCE1 + SCE2 : K: N - 2K :
Eviews realiza este contraste directamente. Desde la ventana con el output de la estimación se hace: VIEW/Stability test/Chow Breakpoint Test... 315. ============================================================ Chow Breakpoint Test: 315 ============================================================ F-statistic 1.212787 Probability 0.304975 Log likelihood ratio 3.682509 Probability 0.297851 ============================================================ Vemos, por tanto, que se acepta la hipótesis nula de no existencia de cambio estructural, ya que 0.3049 > 0.05. En caso de aceptar la existencia de un cambio estructural habría que cambiar la especificación del modelo incluyendo variable ficticias. Finalmente, el modelo estimado con el que nos quedamos es:
Yt = 2.038 + 0.697 Yt −1 + 0.703ε$ t −1 + ε$ t (0.04004)
(0.04026)
3.4. Aplicación propuesta Fichero: cii6p2.wf1 Series:
Y
Periodo muestral: 1 - 350 Determine un modelo ARIMA adecuado para representar a la serie Y y proceda a su posterior estimación y validación. 8