Story Transcript
Material Docente de
Econometría Curso 2011-2012. Primera parte
Esquemas de teoría
Cuarto curso de Economía Cuarto curso de Administración y Dirección de Empresas Cuarto curso de Derecho y A.D.E
Profesores: Jesús Cavero Álvarez Helena Corrales Herrero Yolanda González González Carmen Lorenzo Lago Mercedes Prieto Alaiz Pilar Zarzosa Espina
Material Docente de Econometría Primera parte Curso 2011-2012 Introducción............................................................................................... 1 Tema 1.- El modelo de regresión lineal clásico I ..................................... 5 Tema 2.- El modelo de regresión lineal clásico II ................................... 17 Tema 3.- Predicción .................................................................................. 21 Tema 4.- Variables ficticias ...................................................................... 25 Tema 5.- Errores de especificación ........................................................... 31 Tema 6.- Multicolinealidad ..................................................................... 41 Anexo ........................................................................................................ 47
Econometría
Curso 2011-2012
INTRODUCCIÓN Concepto de Econometría En sentido literal “Econometría” significa “medición de la economía”. A lo largo del tiempo se han formulado diversas definiciones del concepto de Econometría. La primera, formulada por Frisch a finales de los años 20, definía la Econometría como la ciencia que combina la Tª Económica, las Matemáticas y la Estadística, con el objeto de medir los fenómenos económicos. Entre las más recientes podríamos quedarnos con la de Maddala que define la Econometría como “la aplicación de métodos estadísticos y matemáticos al análisis de los datos económicos, con el propósito de dar un contenido empírico a las teorías económicas y verificarlas o refutarlas”. Podemos considerar que los objetivos de la Econometría son: • Explicar el comportamiento de una o de varias variables económicas en función de otras. • Predecir el comportamiento de las variables económicas. • Contrastar hipótesis de interés económico. Modelos Económicos y Modelos Econométricos Un modelo económico es la expresión matemática simplificada de una determinada teoría económica. Ejemplos: - Si queremos especificar que la cantidad demandada de un bien depende del precio de dicho bien, podremos formular una función matemática, lineal o no, entre la cantidad demandada y el precio. Así, si la relación es lineal la función de demanda será : Dt = α + βPt. - El consumo según la teoría keynesiana es función de la renta por lo que la función de consumo podría expresarse: Ct = α + βRt. Estos modelos son deterministas. Un modelo econométrico es un modelo económico con las especificaciones necesarias para su tratamiento empírico. Así, en el ejemplo de la función de demanda el modelo econométrico sería Dt = α + βPt + εt y en la de consumo Ct = α + βRt+ εt, donde εt es una variable aleatoria. Con su introducción el fenómeno económico se concibe como un fenómeno aleatorio. Esta variable que llamaremos perturbación aleatoria dota al modelo de un mayor realismo ya que con ella aceptamos la incertidumbre existente en cualquier comportamiento social. Otros motivos adicionales para incorporar la perturbación aleatoria son: 1) Es imposible especificar todos los factores causales que intervienen en el fenómeno. En el ejemplo del consumo: número de hijos, lugar de residencia, nivel cultural, etc. 2) En ocasiones, aunque conozcamos todos los factores causales, algunos no serán cuantificables o serán de cuantificación difícil. En el ejemplo del consumo, los gustos constituyen un factor que influye en el consumo, pero es de difícil cuantificación. 3) Para recoger los posibles errores de observación que podríamos cometer.
1
Econometría
Curso 2011-2012
Elementos constitutivos de un modelo econométrico La forma general de presentar un modelo econométrico será: Yt =β0 +β1X1t +β2X2t +β3X3t +…..+βkXkt +εt Los elementos constitutivos de un modelo econométrico son por tanto: parámetros y variables. Parámetros: son las constantes del modelo que nos permiten cuantificar las relaciones entre las variables y que trataremos de estimar mediante métodos estadísticos. Son los coeficientes del modelo y recogen la estructura del modelo. Variables: pueden ser de dos tipos: variables observables y variables no observables. •
Variables observables: (Yt, X1t, X2t, X3t,…..Xkt). Pueden ser endógenas o predeterminadas * Variables endógenas: son aquellas cuyo comportamiento se pretende explicar con el modelo. (Yt). En el ejemplo del consumo sería Ct. En los modelos uniecuacionales hay una sola variable endógena, que figura como variable dependiente o “regresando”. En los modelos multiecuacionales hay tantas variables endógenas como ecuaciones. * Variables predeterminadas: son las variables explicativas del modelo. (X1t, X2t, X3t,…..Xkt). En el ejemplo del consumo sería Rt. En los modelos uniecuacionales figuran como variables independientes y se suelen llamar regresores. Pueden ser variables exógenas puras o variables endógenas retardadas. o
Variables exógenas puras: son las que se determinan fuera del modelo. En el ejemplo Rt.
o
Variables endógenas retardadas: son variables endógenas pero que aparecen en periodos de tiempo anteriores al del modelo. En el ejemplo Ct-1. C t = β 0 + β 1 Rt + β 2 C t −1 + ε t { { V. exógena pura
•
V. endógena retardada
Variables no observables: son variables para las cuales no podemos obtener observaciones. Son variables aleatorias con propiedades probabilísticas bien definidas, que se denominan “perturbaciones aleatorias” y recogen aquéllo que no es posible especificar explícitamente dentro de las variables explicativas del modelo.
Etapas en la elaboración de un modelo econométrico 1) Especificación del modelo: se trata de expresar la relación propuesta por la Teoría Económica en un lenguaje matemático, determinando las variables a introducir y la función que las relaciona, así como las distintas hipótesis sobre todas las variables del modelo. 2) Elección y tratamiento de los datos Estas dos etapas van muy unidas pues especificamos el modelo y elegimos los datos pero también la disposición de los datos nos permite especificar mejor el modelo. 2
Econometría
Curso 2011-2012
3) Estimación: consiste en obtener estimadores de los parámetros a partir de los datos disponibles. 4) Evaluación y Contrastación: En esta fase se realizan diferentes contrastes con el fin de conocer si tanto las hipótesis estadísticas, como las económicas son coherentes con los datos disponibles. 5) Predicción: en esta fase se obtienen valores futuros de la variable dependiente, en base a valores conocidos de las variables explicativas. Clasificación de los modelos econométricos Según los diferentes criterios que se pueden utilizar, existen múltiples clasificaciones de modelos econométricos. Entre ellas las siguientes: 1er criterio: según el número de ecuaciones • Modelos uniecuacionales. Ejemplo: Ct = α + βRt+ εt • Modelos multiecuacionales. Ejemplo: si al modelo uniecuacional de consumo añadimos otra ecuación como por ejemplo Rt = Ct + It donde It Ct = α + βRt+ εt
sería la inversión, tendremos un modelo multiecuacional: Rt = Ct + It 2º criterio: atendiendo a la forma funcional • Modelos lineales. Ejemplo: Ct = α + βRt+ εt • Modelos no lineales. Ejemplo: la función de producción de Cobb-Douglas Pt =
ALβt K tβ e ε 1
2
t
3er criterio: atendiendo al periodo de tiempo al que estén referidas las variables • Modelos estáticos: están especificados para un momento de tiempo determinado. Ejemplo: Ct = α + βRt+ εt • Modelos dinámicos: en ellos aparece alguna variable retardada. Ejemplo: Ct = β0 + β1Rt + β2Ct-1 + εt Clasificación de los datos Para que el modelo econométrico sea operativo necesitamos conocer los valores numéricos de sus parámetros y para ello hemos de disponer de un conjunto de datos sobre las variables. Los datos pueden ser de tres tipos: datos temporales, datos de corte transversal y datos de panel. • Datos temporales o series temporales: son observaciones de una variable, para una unidad económica a lo largo del tiempo. Ejemplos: datos de la Contabilidad Nacional, indicadores de coyuntura mensuales o trimestrales, ventas de una empresa a lo largo del tiempo, etc. • Datos atemporales o de corte transversal: son observaciones de una variable, para distintas unidades económicas en un momento de tiempo dado. Ejemplo: Encuesta de Presupuestos Familiares (INE) en el período 90-91, en la que se ha entrevistado a más de 20.000 familias. • Datos de panel: son observaciones de una variable para distintas unidades económicas a lo largo del tiempo, es decir, es la combinación de datos temporales y de corte transversal. 3
Econometría
Curso 2011-2012
4
Econometría
Curso 2011-2012
TEMA 1.-EL MODELO DE REGRESIÓN LINEAL CLÁSICO I 1.1.- Especificación del modelo •
Forma escalar : Yi = β o + β 1 X 1i + ..... + β k X ki + ε i
para i =1….N
Yi = X i' β + ε i •
Forma matricial: Y = Xβ + ε
Y1 Y2 Donde:Y= . , . Y N
1 X 11 1 X 12 X= . . . . 1 X 1N
. . . . .
. X k1 . X k2 . . , . . . X kN
ε1 ε2 ε = . . ε N
Hipótesis Clásicas: •
Linealidad en los parámetros
•
ε → N (0, σ 2 I )
•
X no aleatoria
•
rg(X) = k+1 < N
Y → N (Xβ , σ 2 I ) por tanto
o
ε o Y son variables iid
1.2.- Estimación Mínimo Cuadrática Ordinaria Objetivo: Obtener estimadores de los parámetros β
y σ2
Método: Mínimos Cuadrados Ordinarios
•
Función Objetivo a minimizar: ∑ ei2 = e ' e = (Y − Xβˆ ) ' (Y − Xβˆ )
e' e = Y ' Y − Y ' Xβˆ − βˆ ' X ' Y + βˆ ' X ' Xβˆ = Y ' Y − 2Y ' Xβˆ + βˆ ' X ' Xβˆ •
Condiciones de mínimo: 1ª Condición :
2ª Condición :
•
∂e' e =0 ∂βˆ
∂ 2 e' e ∂βˆ ∂βˆ '
sea definida positiva
Obtención del estimador MCO:
∂e' e = −2 X ' Y + 2 X ' Xβˆ = 0 ˆ ∂β
⇒ X ' Xβˆ = X ' Y Sistema de ecuaciones normales
⇒ βˆ = ( X ' X )−1 X ' Y 5
Econometría
∂ 2 e' e
Curso 2011-2012
= 2 X ' X matriz definida positiva
∂βˆ ∂βˆ '
βˆ MCO = ( X ' X )−1 X ' Y
Por tanto: ⇒
1.3.- Propiedades del estimador de β •
Finitas
-
Lineal en Y y en ε : por ser X no aleatoria
-
Insesgado: E βˆ = β por ser X no aleatoria y E (ε ) = 0
()
()
−1 E βˆ = β + ( X ' X ) X ' E (ε )
-
Òptimo: de mínima varianza dentro de la familia de estimadores lineales e insesgados. Cuya matriz de varianzas covarianzas es:
(
)(
( ))
(
)(
)
' ' ∑ βˆβˆ = E βˆ − E ( βˆ ) βˆ − E βˆ = E βˆ − β βˆ − β = = E(X ' X ) X 'ε ε ' X (X ' X ) =σ 2 (X ' X ) −1
−1
−1
Teorema de Gauss Markov demuestra que: 2 ∑ β~β~ = ∑ βˆβˆ + σ D' D
donde
D' = C '−( X ' X ) X ′ −1
siendo C’ una matriz cualquiera no aleatoria y D' D una matriz semidefinida positiva. - Eficiente: de mínima varianza entre los insesgados. Alcanza la cota de Cramer Rao.
(
−1 - Distribución finita: βˆ MCO → N β , σ 2 ( X ' X )
•
)
Asintóticas
-
Consistente : Si se cumple P= Σ XX = lim N →∞
-
βˆ MCO → β
c. p.
p lim N →∞
βˆ = p lim
ya que: p lim N →∞
o bien
X'X N
; P ≠ 0 y finita, entonces:
p lim N →∞ βˆ = β −1
N →∞
X 'ε X'X β + p lim N →∞ =β p lim N →∞ N N
X 'ε =0 N
- Asintóticamente normal :
(
)
−1 X ' X a 2 ˆ N β −β → N 0,σ lim N →∞ N
- Asintóticamente eficiente : La varianza asintótica alcanza la cota de Cramer-Rao.
6
Econometría
Curso 2011-2012
1.4.- Estimador de σ 2 y sus propiedades Denotamos por S2 el estimador de la varianza de las perturbaciones σ2 •
Definimos
•
Propiedades: -
S2 =
Insesgado: E(S2) = σ2
p lim N →∞ S 2 = σ 2
Consistente: •
e' e N − K −1
Propiedades del estimador de S ˆ ˆ = S 2 (X ' X ) ββ
∑ββ
ˆˆ
−1 −1 E S ˆ ˆ = E S 2 ( X ' X ) = ∑ βˆβˆ ββ
- Insesgado :
1.5.- Características de los residuos mínimo cuadráticos •
Poblacionales: e=Mε
Ya que: e = Y − Yˆ = Y − Xβˆ = MY = Mε Yˆ = Xβˆ
−1 M = I − X ( X ' X ) X ' matriz no aleatoria, simétrica e idempotente
•
-
E(e)=0
-
2 2 ∑ee' = Eee' = E (Mεε ' M ') = σ M ≠ σ I
-
E ( X ' e) = 0
-
e → N 0 ,σ 2 M
(
si
N→∞
)
Muestrales: -
X 'e = 0
(
⇒
)
X ′ Y − Yˆ = X ' Y − X ' Yˆ
⇒
Y = Yˆ si XNx(k+1)
N
⇒
e=0
∑e = 0 i =1 i
si XNx(k+1)
∑ X ji ei = 0 ∀ j = 1....k ⇒ cov(e, Xj)=0 ⇒ rex j = 0 - Yˆ ' e = 0 ⇒
cov( Yˆ , e) = 0 ⇒ reYˆ = 0
7
M→I
Econometría
Curso 2011-2012
1.6.- Descomposición de la varianza
(
∑ Yi − Y
)
2
= ∑ Yi 2 − N Y
(
2
)(
)
2 ∑ Yi = Y ' Y = Yˆ + e ' Yˆ + e = Yˆ ' Yˆ + e' e
Restando a ambos lados : N Y
(
∑ Yi − Y
)
2
(
2
)
2
(
= ∑ Yˆi − Yˆ + ∑ ei − e
)
2
si Y = Yˆ
SCT=SCE+SCR Coeficientes de determinación R2 y de determinación ajustado
R2 = 1− 2
R = 1−
SCR SCE = SCT SCT
0 ≤ R 2 ≤1
SCR / N − k − 1 SCT / N − 1
1.7.- Estimadores máximo verosímiles de los parámetros El método de máxima verosimilitud consiste en hallar los estimadores que maximizan la función de verosimilitud. La función de verosimilitud de la muestra es, simplemente, la función de densidad conjunta de la muestra haciéndola depender de los parámetros desconocidos.
(
Puesto que Y es una variable normal N-dimensional : Y → N Xβ , σ 2 I
su función de densidad y, por lo tanto, la función de verosimilitud es:
−
−
N
f (Y ) = 2πσ 2 2
e
1
2σ 2
(Y − Xβ )`(Y − Xβ )
dado que max L(β , σ 2 ) es lo mismo que max ln L(β , σ 2 )
ln L β , σ 2 = − N ln (2π ) − N ln σ 2 − 1 (Y − Xβ )' (Y − Xβ ) 2 2 2σ 2 ln L β , σ 2 = − N ln (2π ) − N ln σ 2 − 1 Y 'Y − 2Y ' Xβ + β ' X ' Xβ 2 2 2σ 2
Condiciones de máximo: 1ª condición: Se igualan a cero las primeras derivadas •
∂ ln L 1 =− ∂β 2σˆ 2
(− 2 X 'Y + 2 X ' Xβˆ ) = 0 MV
MV
por tanto βˆ
MV
= ( X ' X )− 1 X ' Y = βˆ
MCO
8
⇒ X ' Y = X ' Xβˆ MV
)
Econometría
•
∂ ln L ∂σ
2
Curso 2011-2012
=−
N 2σˆ
2
+
2(Y − Xβˆ
MV
MV
) ' (Y − Xβˆ
2 (σˆ 2
2 MV
)
MV
2
)
=0
2 ⇒ σˆ MV = e' e
N
2ª condición: Se cumple que el hessiano evaluado en el máximo es una matriz definida negativa.
Propiedades de los estimadores Bajo condiciones de regularidad se demuestra que los EMV tienen las siguientes propiedades: •
Asintóticamente insesgados
•
Consistentes
•
Asintóticamente eficientes
•
Asintóticamente normal
•
Invarianza
1.8.- Criterios de bondad del ajuste basados en la función de verosimilitud 1)
Análisis de la función de verosimilitud evaluada en los EMV de los parámetros
ln L β , σ 2 = − N ln (2π ) − N ln σˆ 2 − 1 MV 2 2 2σˆ 2
(Y − Xβˆ )(' Y − Xβˆ ) MV
MV
MV
∑ ei2 − N ln L β , σ 2 = − N ln (2π ) − N ln 2 2 N 2 No está acotado y está influido por el número de variables explicativas que introduzcamos en el modelo. 2)
Criterio de Akaike AIC y Criterio de información bayesiano de Schwartz SBIC AIC =
−2 2(k + 1) ln L + N N
SBIC =
−2 (k + 1) ln N ln L + N N
Cuanto menor sean estos estadísticos mejor será la estimación del modelo.
9
Econometría
Curso 2011-2012
1.9.- Diferencias entre la regresión simple y la regresión múltiple 1) Los coeficientes son diferentes Yi = β o + β 1 X 1i + ..... + β k X ki + ε i • * * * • Yi = β 0 + β 1 X 1i + ε i En el primer modelo, β1 mide en cuánto varía la variable endógena cuando varía X1 en una unidad, manteniendo constante el resto de las variables. En el segundo modelo, β1* mide en cuánto varía la variable endógena cuando varía X1 en una unidad 2) Los coeficientes estimados por MCO son diferentes La información que proporciona un regresor, por ejemplo X1, sobre la variable endógena puede ser parecida a la que tienen el resto de las variables. De hecho, la información de X1 puede ser genuina de la propia variable o compartida con el resto de las variables explicativas. Cuando estimamos por mínimos cuadrados ordinarios un modelo de regresión simple el estimador asociado a X1 solamente recoge el efecto de la información propia de X1, ya que no están incluidos otros regresores. La importancia de la regresión múltiple es que el estimador por mínimos cuadrados ordinarios asociado a X1 es capaz de medir el efecto de X1 una vez descontada la información que comparte con el resto de los regresores. 3) Las varianzas estimadas de los coeficientes son diferentes Existen dos casos especiales en los que el coeficiente estimado por MCO asociado a X1 será el mismo en la regresión simple que en la regresión conjunta. 1) Cuando no exista información compartida (regresores ortogonales) 2) Cuando los coeficientes asociados al resto de los regresores sean cero.
10
Econometría
Curso 2011-2012
Apéndice 1.- Gráfico de algunas hipótesis del modelo
11
Econometría
Curso 2011-2012
Apéndice 2.- Modelo de regresión sin término constante Yi = β1X1i +β2X2i +β3X3i +…..+βkXki +εi
con i=1,2,3,....N
Matricialmente se podría expresar: Y = X*β* + ε donde X* es la matriz de orden Nxk 1 X X 21 L X k 1 11 1 X 12 X 22 L X k 2 X= M M M M M 1 X 1N X 2 N L X kN 424444 3 1444 X* * βˆ MCO = ( X *' X * ) −1 X *' Y tiene buenas propiedades y no hay ningún problema por lo que
respecta a las propiedades de los estimadores, pero se dejan de cumplir algunas características que se daban en el modelo con término constante.
S ˆ ˆ = S2( X *' X * )-1 donde S 2 = ββ
N 2 ∑ X 1i N i =1 X X * 2i 1i βˆ MCO =∑ i =1 M N ∑ X ki X 1i i =1
e' e N −k
N
∑ X 1i X 2i i =1
N
∑ X 22i i =1
M
N
∑ X ki X 2i i =1
L ∑ X 1i X ki i =1 N L ∑ X 2i X ki i =1 M M N 2 X L ∑ ki i =1 N
−1
N ∑ X 1i Yi ˆ* iN=1 β 1 X Y βˆ * 2 2i i = ∑ i =1 M M N βˆ * ∑ X ki Yi k i =1
Particularidades de estos modelos: 1) Los estimadores obtenidos con datos centrados no coinciden con los obtenidos con datos sin centrar ya que si trabajamos con datos centrados en un modelo sin término constante obtenemos los mismos estimadores que si trabajásemos con datos centrados en el modelo con término constante. Lo más correcto en estos modelos es trabajar con datos sin centrar. 2) Ya no se cumple que Yˆ = Y pues al no disponer X* de una columna de unos no se cumple que
N
N
i =1
i =1
∑ Yˆi = ∑ Yi
y por lo tanto Yˆ ≠ Y
3) Aunque se sigue cumpliendo que los regresores son ortogonales a los residuos X *' e = 0, ya no se cumple que los errores estén linealmente incorrelacionados porque no se cumple que ∑ ei = 0 . 4) No se cumple la descomposición de la varianza y por lo tanto el R2 no tiene sentido porque nunca estaría acotado SCT ≠ SCR+SCE Sí se sigue cumpliendo Y’Y = Yˆ ’ Yˆ + e’e
12
Econometría
Curso 2011-2012
e' e Yˆ ' Yˆ = que Y' Y Y' Y sí estará acotado, pero que en realidad no medirá la variabilidad de Y porque Y’Y no es la SCT, simplemente nos dará una idea de como ha sido el ajuste. El R2 de un modelo con término constante y el R*2 del modelo sin término constante no son comparables. En este caso lo único que se puede hacer es definir un R*2 como: R*2 = 1 −
Apéndice 3.- Cambios de origen y escala en las variables En ocasiones nos interesa cambiar las unidades de una, varias o todas las variables del modelo para hacer sus valores numéricos comparables con las demás variables o para que su manejo sea menos engorroso. Otras veces necesitamos hacer un cambio de origen en los valores de las variables. Analizaremos, a continuación, los efectos que, sobre la estimación de un modelo, generan esos cambios. Cambio de escala Sea el modelo: Yi = β0 +β1X1i +β2X2i +β3X3i +…..+βkXki +εi
con i=1,2,3,....N
Supongamos que hacemos un cambio de escala en todas las variables pasando a tener: Yi ' = aYi X 1'i = a1 X 1i
................ X ki' = a k X ki
Ahora el modelo será: Yi' = β 0' + β1' X 1' i + ... + β k' X ki' + ε i Sustituyendo: aYi = β 0' + β1' a1 X 1i + ... + β k' a k X ki + ε i
Yi = donde
εi a
β 0' a
+ β1'
a ε a1 X 1i + ... + β k' k X ki + i a a a
cumple las hipótesis clásicas.
Luego β o =
β1 =
β 0' a
⇒ β 0' = aβ 0
β 1' a1 a
⇒ β 1' =
a β1 a1
.........................................
βk =
β k' a k a
⇒ β 1' =
a βk ak
Estos son los cambios que experimentan los coeficientes cuando hacemos un cambio de escala en todas las variables. Por lo tanto: 13
Econometría
Curso 2011-2012
•
Si hacemos un cambio de escala sólo en Yi ( a1 ,..., a k serán igual a 1) los nuevos coeficientes son los originales multiplicados por la constante por la que hayamos multiplicado los valores de Y.
•
Si hacemos un cambio de escala sólo en Xjt sólo cambia el coeficiente que acompaña a Xjt y lo hace dividiendo el original entre a j .
Otros resultados que también cambian son: •
La SCR. La nueva es e*' e* = a 2 e' e .
•
La SCT. La nueva es SCT*= a 2 SCT.
•
La varianza estimada de los βˆ j :
S β2ˆ** j
=
a2 a 2j
S β2ˆ
j
S β2ˆ** = a 2 S β2ˆ 0
0
Cambio de origen Sea el modelo: Yi = β0 +β1X1i +β2X2i +β3X3i +…..+βKXKi +εi
con i=1,2,3,....N
Supongamos que hacemos un cambio de origen en todas las variables pasando a tener: Yi ' = Yi + a X 1'i = X 1i + a1
................ X ki' = X ki + a k
Ahora el modelo será: Yi' = β 0' + β1' X 1' i + ... + β k' X ki' + ε i Sustituyendo: Yi + a = β 0' + β1' ( X 1i + a1 ) + ... + β k' ( X ki + a k ) + ε i Yi = −a + β 0' + β 1' a1 + ... + β k' a k + β 1' X 1i + ... + β k' X ki + ε i
β 1' = β 1 ...................
β k' = β k β 0 = − a + β 0' + β 1' a1 + ... + β k' a k ⇒ β 0 = − a + β 0' + β 1 a1 + ... + β k a k ⇒ β 0' = β 0 + a − β 1 a1 − ... − β k a k Luego los cambios de origen en alguna o en todas las variables del modelo sólo afectan al término independiente. El único resultado que también cambia es la varianza estimada de βˆ0 .
14
Econometría
Curso 2011-2012
Apéndice 4.- Coeficientes Beta1 Los parámetros estimados de un modelo lineal son valores absolutos y dependen de las unidades de medida en las que se expresen las variables del modelo. Una variable no es más importante que otra por tener un parámetro mayor. Esto ocurre cuando, siendo ambos parámetros significativos, ambas variables están medidas en las mismas unidades. Una solución a este problema es calcular unos coeficientes estandarizados o coeficientes beta a partir de la normalización de las variables (restarles su media y dividirles por su desviación típica)
Yi − Y X − X1 X − Xk = β 1* 1i + ... + β k* ki + ui SY S X1 S Xk donde la relación entre los coeficientes beta y los coeficientes estimados originales es: SXj βˆ *j = βˆ j . SY
1
Pulido (2001): Modelos econométricos. Pirámide.
15
Econometría
Curso 2011-2012
16
Econometría
Curso 2011-2012
TEMA 2. EL MODELO DE REGRESIÓN LINEAL CLÁSICO II 2.1.- Contrastes de restricciones lineales sobre los parámetros. Forma general Hipótesis a contrastar: H o : Rβ = r H 1 : Rβ ≠ r Partiendo de la distribución de las perturbaciones y de los estimadores, obtenemos la de Rβˆ : Rβˆ
(
N Rβ , σ 2 R ( X ' X ) R '
→
−1
)
A partir de aquí, se demuestra que, si la hipótesis nula es cierta:
(Rβˆ − r )' [R(X ' X ) R ] (Rβˆ − r ) −1
' −1
2
S H
→
FNH−k −1
Otra forma alternativa de realizar el contraste es introduciendo las restricciones en el modelo y comparando el modelo restringido con el modelo sin restringir, ya que la expresión anterior coincide con la siguiente:
e' r e r − e ' e S2 H
→ FNH−k −1
Donde er = Y − Xβˆr
2.2.- Contrastes de restricciones lineales sobre los parámetros. Casos particulares A)
Contraste de significación individual de un regresor: Ho : β j = 0 H1 : β j ≠ 0
βˆ j S βˆ B)
Ho → t N − k −1
j
Contraste de significación conjunta de los regresores:
17
Econometría
Curso 2011-2012
β1 0 ⋅ ⋅ Ho : = ⋅ ⋅ 0 β k
≠
H1 : SCE S2 k
Ho → FNk − k −1
o bien
R 2 ( N − k − 1) 1− R2 k
(
)
Ho → FNk − k −1
2.3.- Estimación restringida. Propiedades del estimador restringido Sea la restricción lineal sobre los parámetros: Rβ=r. Intentaremos encontrar el estimador del vector paramétrico β que satisfaga la restricción. En definitiva, vamos a elegir βˆr de forma que minimice e r' e r = (Y − Xβˆ r )' (Y − Xβˆ r ) sujeto a la restricción Rβˆ r = r
Para obtener dicho estimador restringido habría que formar la función lagrangiana. El proceso de minimización da como resultado el estimador restringido siguiente:
[
]
βˆ r = βˆ + ( X ' X ) −1 R ' R ( X ' X ) −1 R '
−1
(r − Rβˆ )
En la práctica este estimador se puede obtener introduciendo las restricciones en el modelo inicial y estimando dicho modelo, denominado modelo restringido, por mínimos cuadrados ordinarios.
Ejemplo: Su pongamos el siguiente modelo Yt = β 0 + β1 X 1t + β 2 X 2 t + ε t Las variables Y, X1 y X2 toman los siguientes valores Yt 3 2 4 5 5 7 6 8 8 12
X1t 1 2 2 3 4 5 5 9 9 15
X2t 8 14 10 9 7 6 8 4 3 1
Si queremos estimar bajo las dos siguientes restricciones podemos proceder de las dos formas siguientes:
18
β1 = 0.5 y β1 + 2β 2 = 0
Econometría
Curso 2011-2012
En primer lugar, se puede aplicar mínimos cuadrados restringidos
βˆ r = βˆ + ( X ' X ) −1 R ' [R( X ' X ) −1 R'] (r − Rβˆ ) −1
5,4118 βˆ = 0,4471 ; - 0,2672
(X ' X )
−1
4.1654 − 0.2941 − 0.3497 0.0235 ; Rβ = r ; = − 0.2941 0.0235 − 0.3497 0.0235 0.0315
βo 0 1 0 0.5 β 1 = 0 1 2 0 1 4243 β 2 123 { R r β
4.1654 − 0.2941 − 0.3497 0 ( X ' X ) R' = − 0.2941 0.0235 0.0235 1 − 0.3497 0.0235 0.0315 0 −1
0 − 0.294 1 = 0.0235 2 0.0235
4.1654 − 0.2941 − 0.3497 0 0 1 0 − 0.2941 0.0235 0.0235 1 R ( X ' X ) R ' = 0 1 2 − 0.3497 0.0235 0.0315 0 −1
[
]
0.0235 0.0706 R ( X ' X ) R ' = 0.0706 0.2435 −1
−1
−1
− 0.993 0.0706 0.0865
0 0.0235 0.0706 1 = 0.0706 0.2435 2
326 − 94.5 = − 94.5 31.5
5.4118 0.5 0.4471 0.0529 0.5 0 1 0 ˆ 0.4471 = − = (r − Rβ ) = − 0 0 1 2 - 0.2672 0 − 0.0874 0.0874
βˆ r = βˆ + ( X ' X ) −1 R ' [R( X ' X ) −1 R'] (r − Rβˆ ) = −1
5.4118 − 0.294 − 0.993 5.4118 - 0,4118 5 326 − 94.5 0.0529 = 0.4471 + 0,0529 = 0.5 0.4471 + 0.0235 0.0706 - 0.2672 0.0235 0.0865 − 94.5 31.5 0.0874 - 0.2672 0,0172 - 0.25 En segundo lugar, se puede introducir la restricción en el modelo: Yt = β 0 + 0.5 X 1t − 0.25 X 2t + ε t ⇒ Yt − 0.5 X 1t + 0.25 X 2t + = β 0 + ε t ⇒ Yt * = β 0 + ε t
βˆo = Y * = Y − 0.5 X 1 + 0.25 X 2 = 6 − 0.5 * 5.5 + 0.25 * 7 = 5
19
Econometría
Curso 2011-2012
5 βˆ r = 0.5 - 0.25 Los residuos restringidos se pueden obtener a partir del modelo original con los estimadores restingidos o a través del modelo restringido: Segunda forma
Primera forma
Yˆ *
Y
Yˆ
er
Y*
3 2 4 5 5 7 6 8 8 12
3,5=5+0.5*1-0.25*8 2,5=5+0.5*2-0.25*14 3,5 4,25 5,25 6 5,5 8,5 8,75 12,25
-0,5=3-3.5 -0,5=2-2.5 0,5 0,75 -0,25 1 0,5 -0,5 -0,75 -0,25
4,5=3-0.5*1+0.25*8 4,5=2-0.5*2+0.25*14 5,5 5,75 4,75 6 5,5 4,5 4,25 4,75
5 5 5 5 5 5 5 5 5 5
er -0,5 -0,5 0,5 0,75 -0,25 1 0,5 -0,5 -0,75 -0,25
Propiedades del estimador restringido: Las propiedades del estimador restringido dependen de si la restricción es cierta o no. Así, el siguiente cuadro enumera las propiedades en ambos casos.
Restricción cierta Rβ=r 1. βˆ r es insesgado
Error en la restricción Rβ≠r 1. βˆ r es sesgado
2. βˆ r es consistente
2. βˆ r es inconsistente
3. βˆ r es más eficiente que βˆ MCO
Σ βˆ
ˆ r βr
3. Σ βˆ
ˆ r βr
= Σ βˆβˆ − Q
= Σ βˆβˆ − Q donde Q es semidefinida ECM βˆ − ECM βˆ = A donde A es semidef.
positiva 4. S r2 es insesgado y consistente
r
posit. o semidef. negat. 4. S r2 es sesgado e inconsistente
20
Econometría
Curso 2011-2012
TEMA 3.- PREDICCIÓN 3.1.- Predicción Objetivo: Obtener valores de observaciones fuera de la muestra que se ha utilizado en la estimación de la variable endógena. Para ello se requieren tres condiciones: 1)
Buen comportamiento del modelo a lo largo del período muestral
2)
Conocer lo más exactamente posible los valores que tomarán las variables explicativas en el período de predicción.
3)
Que el modelo mantenga la misma estructura en el período de predicción que en el muestral.
Punto de partida: Sea el modelo:
Yi = X i' β + ε i que cumple las hipótesis clásicas Yˆ = X ' βˆ i
i
Si esa relación se mantiene para el período de predicción : Yp = X 'p β + ε p siendo Yp y X 'p los valores que toma la variable endógena fuera de la muestra y el vector fila formado por los valores que toman las variables explicativas, respectivamente.
( )
( )
(
)
(
)
Donde: E ε p = 0 , Var ε p = σ 2 , Cov ε jε p = E ε jε p = 0 ∀ j = 1....N Definimos: Predictor: Yˆp = X ′p βˆ
un estimador del valor a predecir.
Error de predicción: f diferencia entre el predictor y lo que queremos predecir. f es una variable aleatoria con media cero E ( f ) = 0 y varianza: σ 2f = E ( f − E ( f ) )
2
Propiedades del predictor: •
Yˆp es un estimador sesgado de Yp , por tanto, para analizar su precisión calculamos su ECM:
( ) (
ECM Yˆp = E Yˆp − Y p
(
)
)2 = E( f )2 = σ 2f
(
)
donde podemos comprobar que: f = Yˆp − Y p = X 'p βˆ − β − ε p = X ′p ( X ' X )−1 X ' ε − ε p Y, por tanto: ' ECM Yˆp = σ 2f = E Yˆp − Y p Yˆp − Y p = σ 2 (1 + X 'p ( X ' X )−1 X p )
( )
(
)(
)
S 2f = S 2 (1 + X 'p ( X ' X ) X p ) −1
21
Econometría
Curso 2011-2012
Queremos predecir
Predictor
Esperanza
Yp= X 'p β +εp
Yˆ p = X 'p βˆ
X 'p β
Valor individual
ECM
σ 2 [1 + X 'p ( X ' X ) −1 X p ]
3.2.- Intervalos de confianza y test de hipótesis para un valor individual
(
→ N 0 , σ 2f
f
) S2
→ N (0,1)
f
σf
N (0,1)
como
χ N2 − k −1
σ2
→
χ N2 − k −1
N − k −1
= t N − k −1
N − k −1 f tenemos: → t N −k −1 Sf donde : f = Yˆp − Y p y S f = S 1 + X 'p ( X ' X )−1 X p •
Intervalo de confianza para la predicción Yˆp − Y p P − tα / 2 ≤ ≤ tα / 2 = 1 − α S f
de
[
Por tanto, el I. C. de Yp vendrá dado por: Yˆp ± tα / 2 ⋅ S f •
un
valor
individual:
]
Test de Hipótesis para la predicción de un valor individual: H o : Y p = Y po H1 : Y p ≠ Ypo
Si la Ho es cierta:
ˆ - Yo Y p p Sf
Ho → t N − k −1
3.3.- Evaluación de la capacidad predictiva del modelo: La capacidad predictiva se puede evaluar a partir de varios estadísticos. Los estadísticos que computa EViews, suponiendo que el tamaño del periodo de predicción es n, son: n
∑ f j2 • Raíz del error cuadrático medio:
22
RECM =
j =1
n
Econometría
Curso 2011-2012 n
∑ • Error absoluto medio: EAM =
j =1
fj
n
• Error absoluto medio del porcentaje de error: EAMP =
1 n fj ∑ n j =1 Y j
• Coeficiente de desigualdad de Theil:
∑ (Yˆ j − Y j ) / n n
U =
2
j =1
n
n
j =1
j =1
0≤U≤1
2 2 ∑ Yˆ j / n + ∑ Y j / n
Todos los estadísticos descritos hasta ahora indican una mejor capacidad predictiva del modelo cuanto más cercanos a cero sean, lo que permite comparar un determinado modelo con otros alternativos. • Descomposición del error cuadrático medio de predicción: 2 1 n ˆ = Y − Y ∑ j n j =1 j
(1 Yˆ −Y ) 23 2
+
(1 S −S ) 23 2
23
Y
+
(
)
2 1 − rYˆ Y S Yˆ S Y 1442443 componente cov arianza componente sesgo componente var ianza El cociente entre cada uno de los componentes en la suma total se denomina proporción del sesgo, proporción de la varianza y proporción de la covarianza. Cada una de estas proporciones varía entre cero y uno, siendo su suma la unidad como es de esperar. Los dos primeros miden, respectivamente, las diferencias entre la media y la varianza de la serie predicha ( Y$ ) y las de la serie observada (Y) en el periodo de predicción. Por tanto, lo deseable es que su valor sea pequeño. La última proporción mide la parte residual o no sistemática de los errores de predicción, en donde debería recaer la mayor parte del error total cometido. Yˆ
Econometría
Curso 2011-2012
24
Econometría
Curso 2011-2012
TEMA 4. VARIABLES FICTICIAS 1.- Introducción Las variables que hemos introducido como regresores en los temas precedentes son variables de tipo cuantitativo. Sin embargo, en ocasiones existen factores de tipo cualitativo que pueden ser relevantes para explicar el comportamiento de la variable endógena. La inclusión de estos factores en un modelo econométrico se realiza a partir de la construcción de lo que se conoce como variables ficticias, variables dicotómicas o variables dummy que toman dos valores arbitrarios, normalmente 1 y 0, que corresponden a las modalidades del factor, aunque no necesariamente ya que podrán tomar otros valores o más de dos. Pueden utilizarse para recoger: •
Efectos temporales:
•
Efectos espaciales:
•
Efectos de tipo puramente cualitativo.
•
Otro tipo de efectos: efectos estacionales, funciones escalonadas, etc
Ejemplo: Queremos explicar el salario de los empleados de varias empresas (Yi) en función del número de años de experiencia laboral (Xi) y del género (factor cualitativo con dos modalidades: hombre/mujer). 0 hom bre Di = 1 mujer 2.- Formas de introducir un factor cualitativo en el modelo de regresión Las variables ficticias se pueden construir e incorporar de forma que actúen en el modelo de tres modos distintos. En el caso de un modelo de dos variables tendríamos: 1º.- Que afecte sólo a la ordenada en el origen (Variables ficticias aditivas) Si tenemos dos ecuaciones con la misma pendiente y diferente ordenada: Yi=α1 +βXi+εi Yi=α2 +βXi+εi las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia: Yi= α1 +β Xi +δDi +εi + δ ) + βX i + ε i 1 Yi = (α 1123 α donde cuando Di = 2 0 Y = α + βX + ε i 1 i i α1+δ = α2
⇒ δ = α2-α1
25
Econometría
Curso 2011-2012
El coeficiente de la variable ficticia δ nos mide el efecto diferencial entre las dos ordenadas en el origen, es decir, el efecto diferencial del valor esperado de la variable dependiente por presentar una de las características del factor cualitativo respecto al hecho de no presentarla. 2º.- Que afecte sólo a la pendiente (Variables multiplicativas o compuestas) Si tenemos dos modelos con la misma ordenada en el origen y distinta pendiente: Yi=α +β1Xi+εi Yi=α +β2Xi+εi las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia de la forma: Yi= α +β1 Xi +γ X i Di +εi 123 Zi
1 Z i = X i donde cuando Di = 0 Z i = 0
β1 + γ ) X i + ε i 1 Yi = α + ( 1 23 β por tanto cuando Di = 2 0 Y = α + β X + ε i 1 i i β1+γ = β2
⇒ γ = β2-β1
El coeficiente de la variable ficticia γ nos mide el efecto diferencial entre las pendientes en los dos grupos, es decir, la diferencia de la influencia de la variable explicativa sobre la variable endógena por presentar una característica respecto de no presentarla. 3º.- Que afecte a ambas (ordenada y pendiente) Si tenemos dos modelos con diferente ordenada en el origen y diferente pendiente: Yi=α1 +β1Xi+εi Yi=α2 +β2Xi+εi las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia de la forma: Yi= α1 +β1 Xi +δDi+ γ X i Di +εi 123 Zi
+ δ ) + ( β1 + γ ) X i + ε i 1 Yi = (α 1123 123 donde cuando Di = α2 β2 0 Yi = α1 + β1 X i + ε i
Todos estos casos podrían generalizarse para un modelo de k variables. Para el caso de Variables ficticias que afectan al término independiente: 26
Econometría
Curso 2011-2012 k
Yi =α1 +δDi + ∑ β j X ji +εi j =1
Para el caso de variables ficticias que afectan a la pendiente dependerá de la variable con la que se relacione la ficticia. Si es X1: k
Yi =α +β1X1i + ∑ β j X ji +γDiX1i +εi j =2
¿Cómo introducir en el modelo un factor cualitativo con m modalidades? Como regla general si tenemos “m” modalidades deberíamos introducir “m-1” variables ficticias. 1) Si las variables ficticias afectan a la ordenada, el número de variables ficticias a introducir dependerá de que el modelo tenga o no término constante. Si el modelo tiene término constante e incluimos tantas variables ficticias aditivas como modalidades tiene el factor, caemos en la “trampa de las variables ficticias” que consiste en que la primera columna de la matriz X será combinación lineal exacta de las columnas que contienen las observaciones de las variables ficticias, por tanto, rg(X)