PRACTICAS SOBRE LA MODELIZACIÓN DE SERIES TEMPORALES
CON LA METODOLOGÍA DE BOX-JENKINGS
FICO. GR 21
Ministerio de Economía: obtención de series temporales de variables
económicas largas
Producto Interior Bruto Portugal
Serie: Producto Interior Bruto de Portugal
Fuente: Ministerio de Economía y Hacienda
Periodicidad: Anual
Metodología Box-Jenkins
La construcción de modelos consta de tres pasos:
1.- Identificación inicial
2.- Estimación
3.- Validación
Identificación
•
La clase general de modelos de la metodología Box-Jenkings es la familia de
modelos ARIMA con elementos determinísticos (constante, tendencia
determinística, estacionalidad determinística, efecto semana santa, efecto
días laborables, atípicos, etc)
•
En la especificación de estos modelos entran distintos tipos de parámetros
que capturan distintos rasgos de los datos
•
El primer paso es determinar si el modelo se debe formular con los datos
originales o con series transformadas. En todo caso, deben recoger:
 Evolutividad en varianza
 Evolutividad de la tendencia
 Evolutividad estacional
•
El modelo incorporará:
 Diferencias regulares
 Diferencia estacional
 Constante
 Factores determinísticos
COMO LA SERIE ES ANUAL NO TIENE ESTACIONALIDAD, POR
TANTO SE PRESCINDE DE LA EVOLUTIVIDAD ESTACIONAL
Identificación (gráficos)
•
En general, se trabaja con la transformación logarítmica de la serie original:
 Homogeneización de la varianza. Estacionariedad en varianza.
 Relación con las tasas de crecimiento
Por tanto, procederemos a trabajar con las series en logaritmos
•
La serie de logaritmos presenta una evolución alcista, con crecimiento
sistemático, a lo largo de la muestra, por tanto, no tiene media constante y la
serie no presenta un comportamiento estacionario. Para obtener estacionariedad
y eliminar la tendencia, habrá que proceder a tomar diferencias.
•
La primera diferencia de la serie de logaritmos presenta un comportamiento
estacionario en torno a un valor medio, ligeramente superior a 0.02 (no tiene
porque ser cero).
•
Parece, por tanto, que con una primera diferencia ya se ha conseguido la
estacionariedad y no habría que seguir diferenciando. Veremos también si el
correlograma y el test de Dickey-Fuller son indicativos de que esta
transformación es ya estacionaria.
•
Se observan tres valores atípicos: 1982,1991 y 2009
 En la serie original se reflejan como saltos en el nivel de la tendencia
 En la serie diferenciada se muestran como un valor atípico puntual, lo que
es consecuencia del proceso de diferenciación
Identificación (gráficos)
Producto Interior Bruto Portugal
(1-l)Lgdp
LGDP
0.08
0.06
0.04
0.02
0
-0.02
-0.04
14.20
14.00
13.80
13.60
13.40
13.20
13.00
12.80
12.60
12.40
12.20
2010
2008
2006
2004
2002
2000
1998
1996
1994
1992
1990
1988
1986
1984
1982
1980
2010
2008
2006
2004
2002
2000
1978
1998
1970
1972
1974
1976
1978
1980
1982
1984
1986
1988
1990
1992
1994
1976
1970
1972
1974
1976
1978
1980
1982
1984
1986
1988
1990
1992
1994
1996
1998
2000
2002
2004
2006
2008
2010
1970
1974
0
-0.02
-0.04
-0.06
-0.08
1996
0.08
0.06
0.04
0.02
1972
(1-l)2 Lgdp
Identificación (correlogramas)
•
El correlograma de la serie original (en log) presenta un perfil en el que las
correlaciones muestrales disminuyen muy ligeramente a medida que aumenta
la distancia temporal entre las variables, no existe punto de corte. Es por
tanto, un correlograma característico de series no estacionarias.
 Véase la diferencia con la FAC de un proceso no estacionario, que por
definición no está definida, al no existir una media constante y, por tanto,
la varianza, las covarianzas y las correlaciones no están definidas.
•
El correlograma de la primera diferencia presenta un punto de corte para el
primer retardo. El resto de correlaciones muestrales no son significativamente
distintas de cero. Por tanto, presenta un perfil coherente con una serie
estacionaria.
Identificación (correlogramas)
LGDP
(1-L) LGDP
(1-L)2 LGDP
Identificación (test de Dickey-Fuller)
•
Serie original: El valor del estadístico “t” es mayor que los valores críticos en
tablas para los distintos niveles de error. En concreto, toma el valor -1.56.
 Por tanto, se acepta la hipótesis de que existe una raíz unitaria y es
necesario diferenciar la serie para obtener la transformación estacionaria
que elimine dicha raíz unitaria.
•
Primera diferencia: En este caso el valor del estadístico “t” es menor que los
correspondientes valores críticos.
 Por tanto, se rechaza la hipótesis de que existe una raíz unitaria. Lo cual
es indicativo de que la correspondiente serie es estacionaria.
En definitiva, tanto gráficamente, como a partir del análisis del
correlograma y del test de Dickey-Fuller, se concluye que la primera
diferencia de la serie en logaritmos es estacionaria en media.
•Esta será la serie a partir de la cual se estimará el modelo
Se van a estimar AR de orden 1,2,3,4 y será a partir de los
criterios de información que se decidirá que modelo se elige
Se concluirá con el análisis de los residuos para validar el
modelo
Identificación (test de Dickey y Fuller)
LGDP
(1-L) LGDP
Estimación
Las siguientes transparencias recogen los resultados de estimar sucesivamente
modelos autorregresivos de distinto orden.
Se ha incluido una constante en el modelo, porque en la etapa de identificación se
observó que la serie estacionaria oscilaba alrededor de un valor medio distinto de
cero.
•Si al estimar no fuera significativa se eliminaría del modelo (el contraste se
realiza mediante el estadístico “t”)
Con los resultados obtenidos, se presenta un cuadro comparativo con los criterios
de información de Akaike y Schwarz. Se incluye además el valor que toma la
función de máxima verosimilitud a modo de información complementaria.
Estimación del modelo
Modelo AR(4)
Modelo AR(3)
Estimación del modelo
Modelo AR(2)
Modelo AR(1)
Validación
En el cuadro adjunto se presentan los valores de los criterios de información y el
valor de la función de máxima verosimilitud en el máximo.
Se observa que a medida que se ha ido reduciendo el número de retardos del
modelo autorregresivo, han ido disminuyendo los valores de los criterios de
información y aumentando el valor de la función en el máximo.
Por tanto, se concluye que el modelo que mejor se ajusta a la serie estacionaria
será un AR(1) con constante.
Cabe señalar que en el resto de modelos estimados los coeficientes no eran
significativos.
En definitiva el modelo de la serie es:
(1-0.34L)(1-L) Log DGPt = 0.03+ at
Obsérvese que el valor del autorregresivo coindice con la correlación muestral de
orden 1.
Diagnóstico
Modelo
Criterio de
Akaike
Criterio de
Schwarz
Máximo función
versosimilitud
AR(4)
-4.79
-4.57
91.23
AR(3)
-4.88
-4.71
94.27
AR(2)
-4.88
-4.75
95.76
AR(1)
-4.91
-4.88
97.70
Validación
El gráfico adjunto recoge los valores que proporciona el modelo comparado con
los datos reales. También se incluye la serie de residuos.
La serie de residuos presenta un comportamiento estacionario y aleatorio.
Cabe destacar la presencia de determinados valores atípicos que se
producen en los años 1982, 1991 y 2009, coincidiendo con etapas de crisis
económica en el entorno europeo.
Una vez llegados a este punto, habría que incluir variables dummy para recoger el
impacto de dichos valores atípicos.
Diagnóstico
Validación
El gráfico adjunto el correlograma de los residuos del modelo AR(1)
Como se puede observar las correlaciones para los distintos retardos no son
significativamente distintas de cero.
Además el valor del estadístico Q para los distintos retardos es menor que el
valor en tablas.
Por ejemplo, para el retardo 10, el valor del estadístico Q es 3.7, mientras
que el valor en tablas (chi-cuadrado con 10 grados de libertad, al 95% de
confianza) es igual a 18.3
Por tanto, se concluye que los residuos del modelo presentan estructura de ruido
blanco, lo que nos permite validar el modelo.
Diagnóstico
Correlograma de los residuos
Descargar

Práctica_4