Pronósticos Automáticos

STATGRAPHICS – Rev. 9/14/2006 Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futu

Author: Natividad Salinas Duarte

36 downloads 120 Views 150KB Size

Report

DOWNLOAD PDF

Recommend Stories

No stories

Story Transcript

STATGRAPHICS – Rev. 9/14/2006

Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de datos numéricos secuenciales tomados en intervalos igualmente espaciados, generalmente sobre un periodo de tiempo o espacio. Desemejante al procedimiento de pronósticos se espera que el usuario seleccione el modelo del pronóstico a utilizar, este procedimiento contiene muchos modelos y selecciona al mejor modelo posible según criterios especificados. El criterio disponible para la sección del modelo incluye el Criterio de Información Ataide (AIC), el Criterio Hannan-Quinn (HQC), y el Criterio SchwarzBayesian (SBC). Este criterio selecciona con el cuadrado medio del error más pequeño, sujeto a una penalización para el número de parámetros desconocidos que se necesitan estimar. Puesto que la salida de este procedimiento es similar al procedimiento Pronósticos, este documento destacará solamente los aspectos únicos del procedimiento de Pronósticos Automáticos. Para una discusión detallada de todas las tablas, consulte la documentación de Pronósticos.

Ejemplo StatFolio: autocast.sgp Datos del Ejemplo: El archivo golden gate.sf6 contiene volúmenes mensuales de trafico en Golden Gate Bridge en San Francisco para un periodo de n = 168 meses desde Enero, 1968 hasta Diciembre, 1981. La tabla de abajo muestra una lista parcial de los datos de este archivo: Month (Mes) 1/68 2/68 3/68 4/68 5/68 6/68 7/68 8/68 9/68 10/68 11/68 12/68 1/69 …

Traffic (Trafico) 73.637 77.136 81.481 84.127 84.562 91.959 94.174 96.087 88.952 83.479 80.814 77.466 75.225 …

© 2006 por StatPoint, Inc.

Pronósticos Automáticos - 1

STATGRAPHICS – Rev. 9/14/2006 Los datos fueron obtenidos de una publicación del Golden Gate Bridge.

Entrada de Datos La caja de dialogo para la entrada de datos solicita el nombre de la columna que contienen los datos de la serie de tiempo:

•

Datos: Contiene la columna numérica con n observaciones numéricas igualmente espaciadas.

•

Intervalo de Muestreo: Define el intervalo entre observaciones sucesivas. Por ejemplo, los datos del Golden Gate Bridge fueron recolectados una vez cada mes, empezando en Enero, 1968.

•

Estacionalidad: La longitud de la estacionalidad es s, si la hay. Los datos son estaciónales si existen un patrón que se repite en un periodo fijo. Por ejemplo, los datos mensuales como el trafico sobre Golden Gate Bridge tienen una estacionalidad de s = 12. Los datos de horas que se repiten cada día tienen una estacionalidad de s = 24. Si no se ingresa nada, se asume que los datos tienen estacionalidad (s=1).

© 2006 por StatPoint, Inc.

Pronósticos Automáticos - 2

STATGRAPHICS – Rev. 9/14/2006 •

Ajustar los Días: Una variable numérica con n observaciones es utilizada para normalizar las observaciones originales, por ejemplo el número de días trabajados en un mes. Las observaciones en la columna Datos pueden ser divididos por estos valores antes de dibujar un grafico o calcular un análisis. Debe haber suficientes entradas en esta columna para cubrir tanto los datos observados como el número de periodos en los cuales se solicitan los pronósticos.

•

Selección: La selección de un conjunto en los datos.

•

Numero de Pronósticos: Número de periodos que continúan al final de los datos para los cuales se desean los pronósticos.

•

Retención para Validación: Número de periodos m al final de la serie con propósitos de retención para la validación. Los datos en estos periodos no pueden utilizarse para estimar el modelo de pronósticos. Sin embargo, se calculan estadísticas que describen que tan bueno es el modelo estimado para poder pronosticar estas observaciones.

En el ejemplo actual, los datos de trafico son mensuales empezando en Enero, 1968, y se tiene una estacionalidad de s = 12. Un m = 24 observaciones al final de la serie de tiempo con propósitos de retención para la validación, mientras los pronósticos pueden generarse de los siguientes 36 meses.

Opciones del Análisis El modelo estimado por el procedimiento Pronósticos Automáticos es controlado por la caja de dialogo de Opciones del Análisis:

© 2006 por StatPoint, Inc.

Pronósticos Automáticos - 3

STATGRAPHICS – Rev. 9/14/2006

•

Modelos Incluidos: Especifica el modelo que se debe estimar sobre los datos. Estos son los modelos de los cuales el “mejor” será seleccionado. La descripción de cada modelo puede encontrarse en la documentación de “Pronósticos”. Para varios modelos, opciones adicionales son proporcionadas: Modelo Walk Aleatorio – Valida si se incluye constante para considerar un modelo que contenga una constante así como una sin constante. Modelo de Medias Móviles – Seleccione el orden de valores máximo a considerar. Los modelos se estimarán a partir de 2 valores o más a través del número que se indique. ARIMA con términos AR – Específica el orden máximo p de los términos autoregresivos en el modelo. ARIMA con términos MA – Específica el orden máximo q de los términos de medias móviles en el modelo. Se puede elegir solo considerar modelos de la forma q = p – 1. ARIMA con Diferenciación – Específica el orden máximo de diferenciación d. Seleccione Incluir constante para considerar que el modelo incluya un termino constante cuando la diferenciación se desarrolla.

© 2006 por StatPoint, Inc.

Pronósticos Automáticos - 4

STATGRAPHICS – Rev. 9/14/2006

•

Criterio de Información: El criterio utilizado para seleccionar el mejor modelo.

•

Transformación: Antes de ajustar un modelo, los datos pueden transformarse usando algunas de las operaciones indicadas.

El procedimiento estima cada uno de los modelos seleccionados y selecciona el modelo que encuentra el valor más pequeño sobre la selección del criterio. Son tres criterios a elegir de: Criterio de Información Akaike El Criterio de Información Akaike (AIC) es calculado por AIC = 2 ln(RMSE ) +

2c n

(1)

donde RMSE es la raíz del cuadrado medio del error durante el periodo de estimación, c es el número de coeficientes estimados en el modelo estimado, y n es el tamaño de muestral utilizado para estimar el modelo. Nótese que AIC es una función de la varianza de los residuos del modelo, penalizado por el número de parámetros estimados. En general, el modelo que será seleccionado minimiza el cuadrado medio del error sin usar también muchos coeficientes (relativo a la cantidad de datos disponibles). Criterio de Hannan-Quinn El Criterio Hannan Quinn (HQC) es calculado por 2 p ln(ln(n) ) HQC = 2 ln(RMSE ) + n

(2)

Este criterio utiliza diferentes penalizaciones para el número de parámetros estimados. Criterio de Información Schwarz-Bayesian El Criterio de Información Schwarz-Bayesian (SBIC) es calculado por SBIC = 2 ln(RMSE ) +

p ln(n ) n

(3)

Una vez más, la penalización para el número de parámetros estimados es diferente que para los otros criterios.

© 2006 por StatPoint, Inc.

Pronósticos Automáticos - 5

STATGRAPHICS – Rev. 9/14/2006

Resumen del Análisis La salida de Resumen del Análisis calcula un pronóstico estándar para cualquier modelo que tenga el valor más pequeño del criterio especificado. Pronósticos Automáticos - Traffic Datos/Variable: Traffic (Golden Gate Bridge Traffic Volume) Número de observaciones = 168 Indice Inicial = 1/68 Intervalo de Muestra = 1.0 mes(es) Longitud de la estacionalidad = 12 Resumen de Pronósticos Diferenciación no estacional de orden: 1 Diferenciación estacional de orden: 1 Modelo de pronóstico seleccionado: ARIMA(0,1,2)x(2,1,2)12 Número de pronósticos generados: 36 Número de periodos retenidos para validación: 24

Estadístico RMSE MAE MAPE ME MPE

Periodo de Estimación 2.0522 1.35877 1.49719 -0.0402442 -0.0732127

Periodo de Validación 1.55727 1.16503 1.18882 0.0221547 0.00847592

Resumen de Modelo ARIMA Parámetro Estimado Error Estd. t Valor-P MA(1) 0.242799 0.0877347 2.76742 0.006367 MA(2) 0.238687 0.0869116 2.74632 0.006770 SAR(1) -1.04978 0.13349 -7.86407 0.000000 SAR(2) -0.0556194 0.119539 -0.465283 0.642408 SMA(1) -0.243651 0.0819685 -2.97249 0.003446 SMA(2) 0.899649 0.0464212 19.3801 0.000000 Pronóstico Histórico: sí Varianza estimada de ruido blanco = 4.37813 con 149 grados de libertad Desviación estándar estimada de ruido blanco = 2.0924 Número de iteraciones: 17

Al buscar en los modelos, el procedimiento intenta todos los modelos activados sobre la caja de dialogo de Opciones del Análisis. Nota: excepto para el Suavizamiento Exponencial Winter y los modelos ARIMA, los datos estaciónales primero serán ajustados estacionalmente antes de aplicar pronósticos.

© 2006 por StatPoint, Inc.

Pronósticos Automáticos - 6

STATGRAPHICS – Rev. 9/14/2006 Una vez que se generan los pronósticos, la estacionalidad se desarrolla de nuevo para crear los pronósticos finales. Para los datos Golden Gate Bridge, se selecciona el procedimiento con un modelo ARIMA (0,1,2)x(2,1,2)12. Note que todos los coeficientes del modelo son estadísticamente significativos. Como podemos apreciar en el grafico sobre la estimación y los pronósticos, los resultados son satisfactorios: Time Sequence Plot for Traffic ARIMA(0,1,2)x(2,1,2)12 123 actual forecast 95.0% limits

Traffic

113 103 93 83 73 1/68

1/72

1/76

1/80

1/84

1/88

Comparación de Modelos El panel de Comparación de Modelos despliega información sobre los modelos que mejor se ajustan por cada tipo solicitado. La sección inferior resume los datos y listas de los modelos estimados: Comparación de Modelos Variable de datos: Traffic Número de observaciones = 168 Indice Inicial = 1/68 Intervalo de Muestra = 1.0 mes(es) Longitud de la estacionalidad = 12 Número de periodos retenidos para validación: 24 Modelos (A) Caminata aleatoria (B) Media constante = 93.153 (C) Tendencia lineal = 66.5074 + 0.0923593 t (D) Tendencia cuadrática = 41.5321 + 0.269169 t + -0.000306429 t^2 (E) Tendencia exponencial = exp(4.24508 + 0.000997307 t) (F) tendencia curtva-S = exp(4.8175 + -80.4029 /t) (H) Suavización exponencial simple con alfa = 0.7835 (I) Suavización exp. De Brown con alfa = 0.3388 Ajuste matemático: Box-Cox con potencia = 0.0 y adendo = 0.0 (J) Suavización exp. De Holt con alfa = 0.7613 y beta = 0.0143 (K) Suavización exp. cuadrática de Brown con alfa = 0.1791 (L) Suavización exp. de Winter con alfa = 0.5165, beta = 0.02, gama = 0.5 (M) ARIMA(0,1,2)x(2,1,2)12 (N) ARIMA(2,0,2)x(1,1,2)12 con constante (O) ARIMA(1,1,1)x(2,1,2)12 con constante (P) ARIMA(1,1,2)x(1,1,2)12 (Q) ARIMA(1,0,0)x(0,1,1)12 con constante

© 2006 por StatPoint, Inc.

Pronósticos Automáticos - 7

STATGRAPHICS – Rev. 9/14/2006 Los cinco modelos ARIMA en la lista poseen el mejor ajuste, entre docenas que fueron estimadas. La siguiente sección resume el desarrollo de cada modelo durante la estimación del periodo: Periodo de Estimación Modelo (A) (B) (C) (D) (E) (F) (G) (H) (I) (J) (K) (L) (M) (N) (O) (P) (Q)

RMSE 2.15723 5.0849 3.24619 3.22054 3.25935 3.19448 2.48865 2.91786 2.65308 2.96059 2.56768 3.04 2.0522 2.03378 2.04984 2.06766 2.11182

MAE 1.32165 3.86344 2.41982 2.34518 2.44179 2.34628 1.6626 2.07536 1.7498 1.93325 1.71834 1.96053 1.35877 1.25306 1.33781 1.28876 1.35568

MAPE 1.458 4.251 2.66084 2.57551 2.68339 2.5743 1.82416 2.27504 1.92949 2.13122 1.89248 2.16142 1.49719 1.38098 1.47744 1.42164 1.49186

ME -0.00150458 0.00537199 0.00022691 0.000060774 0.0548011 0.0524653 0.255358 0.882328 0.141644 -0.316974 -0.0438619 -0.361903 -0.0402442 0.0884528 0.0450175 -0.0258518 0.135221

MPE -0.0242249 -0.292675 -0.120425 -0.116781 -0.0613545 -0.0587977 0.232329 0.869531 0.126127 -0.389177 -0.0727782 -0.481662 -0.0732127 0.0582524 0.0131063 -0.0589859 0.102928

AIC 1.68591 3.41922 2.53552 2.53354 2.54361 2.5034 1.81704 2.29448 2.10422 2.32355 2.03878 2.22372 1.52116 1.53091 1.53275 1.53617 1.53677

La ultima columna hacia la derecha muestral los valores del criterio seleccionado para cada uno de los modelos. En la muestra de los datos, el modelo ARIMA (2,0,1)x(2,1,1)12 (Modelo M) es el mejor, aunque otros modelo ARIMA diferentes son muy cercanos. La salida también demuestra que tan bien estuvo cada modelo durante el periodo de validación de los pronósticos con las observaciones que fueron retenidas para la estimación del proceso: Periodo de Validación Modelo (A) (B) (C) (D) (E) (F) (G) (H) (I) (J) (K) (L) (M) (N) (O) (P) (Q)

RMSE 2.72132 35.7947 6.17679 2.49534 7.17915 2.80136 2.18546 2.56813 2.46638 4.15101 2.90303 4.15181 2.4251 2.09206 2.62911 2.0961 2.26482

MAE 1.42365 5.74478 2.06352 1.38226 2.2584 1.41307 1.30179 1.36359 1.39127 1.66548 1.44906 1.73076 1.16503 1.18016 1.13357 1.18316 1.25482

MAPE 1.46028 5.79108 2.09452 1.41552 2.29013 1.4416 1.32752 1.40201 1.4176 1.70837 1.4631 1.76437 1.18882 1.22359 1.15323 1.22549 1.29717

© 2006 por StatPoint, Inc.

ME 0.00416832 5.74478 -2.01854 -0.368482 -2.25692 -0.748106 0.136708 0.542393 0.374832 1.02078 0.424273 0.987824 0.0221547 -0.3114 0.301173 -0.0621341 -0.260738

MPE -0.00391219 5.79108 -2.04853 -0.386012 -2.28857 -0.767949 0.130939 0.537291 0.376192 1.01629 0.437374 0.953436 0.00847592 -0.330986 0.292195 -0.0776316 -0.278414

Pronósticos Automáticos - 8

STATGRAPHICS – Rev. 9/14/2006 El modelo ARIMA seleccionado posee un buen desarrollo, especialmente sobre MAPE con aproximadamente 1.2%, aunque podría cambiarse por otros modelos ARIMA con respecto a RMSE.

© 2006 por StatPoint, Inc.

Pronósticos Automáticos - 9

Recommend Stories

Story Transcript

Get in touch

Social