TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
Tipos de datos
Transversales:
Observaciones sobre individuos, hogares,
empresas, países, etc., en un momento
determinado en el tiempo. (Capítulos 1–10,
Modelos A y B).
Series de tiempo:
Observaciones sobre ingreso, consumo, tasas de
interés, etc., a lo largo de un periodos (años,
meses, trimestres…) (Capítulos 11–13, Modelo C)
Datos de panel:
Observaciones transversales sobre los mismos
individuos, hogares, etc., a lo largo de cierto
periodo de tiempo. (Capítulo 14, Modelo B)
Durante este curso trabajaremos con los tres tipos de datos descritos arriba.
1
Tipos de modelos
Modelo A:
Datos transversales con regresores no-estocásticos. Sus
valores observados en una muestra no tienen componentes
estocásticos o aleatorios.
Modelo B:
Datos transversales con regresores estocásticos. Los valores
de los regresores son elegidos, de manera aleatoria e
independiente, desde una población definida.
Modelo C:
Datos de series de tiempo. Los valores de los regresores
pueden mostrar persistencia o dependencia temporal.
Las regresiones con series de tiempo pueden implicar
complejos problemas técnicos que, al inicio, podremos
pasar por alto.
Diferentes modelos de regesión son apropiados para disntintos tipos de datos. Nosotros
consideraremos tres tipos de modelos de regresión, como se muestra arriba.
2
Tipos de modelos
Modelo A:
Datos transversales con regresores no-estocásticos. Sus
valores observados en una muestra no tienen componentes
estocásticos o aleatorios.
Modelo B:
Datos transversales con regresores estocásticos. Los valores
de los regresores son elegidos, de manera aleatoria e
independiente, desde una población definida.
Modelo C:
Datos de series de tiempo. Los valores de los regresores
pueden mostrar persistencia o dependencia temporal.
Las regresiones con series de tiempo pueden implicar
complejos problemas técnicos que, al inicio, podremos
pasar por alto.
Comenzaremos con el Modelo A por simple conveniencia analitica. Este modelo nos
permite discutir el análisis de regresión dentro de un marco teórico “simple” conocido
como el “Modelo Clásico de Regresión Lineal”.
3
Tipos de modelos
Modelo A:
Datos transversales con regresores no-estocásticos. Sus
valores observados en una muestra no tienen componentes
estocásticos o aleatorios.
Modelo B:
Datos transversales con regresores estocásticos. Los valores
de los regresores son elegidos, de manera aleatoria e
independiente, desde una población definida.
Modelo C:
Datos de series de tiempo. Los valores de los regresores
pueden mostrar persistencia o dependencia temporal.
Las regresiones con series de tiempo pueden implicar
complejos problemas técnicos que, al inicio, podremos
pasar por alto.
En el Capítulo 8, reemplazamos el modelo clásico por un supuesto más débil pero más
realista y adecuado para regresiones con datos de corte transversal: que los regresores
son una muestra aleatoria de una población definida.
4
Supuestos para el Modelo A (regresores no-estocásticos)
A.1: El modelo es lineal en sus parámetros y está correctamente
especificado:
Y = b 1 + b 2X + u
Ejemplos de modelos que no son lineales en los parámetros:
Y  b1X
b2
u
Y = b1 + b2X2 + b3X3 + b2b3X4 + u
‘Lineal en sus parámetros’ significa que cada término del lado derecho una incluye una b
como un factor simple y sin relación alguna con las otras bs. Aplazaremos la discusión
sobre asuntos de linealidad y no-linealidad hasta el Capítulo 4.
5
Supuestos para el Modelo A
A.2: Existe cierta variación en el regresor en la muestra
Debe existir cierta variación en el regresor en la muestra. De lo contrario, no podríamos
explicar ninguna variación observada en Y.
6
Supuestos para el Modelo A
A.2: Existe cierta variación en el regresor en la muestra
b2 
  X  X Y  Y 
 X  X 
i
i
2
i
If X i  X for all i , b 2 
0
0
.
Si intentáramos estimar una regresión de Y en X, cuando X es constante, no podríamos
calcular los coeficientes de regresión. El numerador y el denominador de la expresión para
b2 serían iguales a cero. Y tampoco podríamos obtener b1.
7
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Entonces
Y = b 1 + b 2X + u
vi = ui – mu
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
Asumimos que el valor esperado del término de error para cualquier observación debe ser cero. El
término de error será a veces positivo, a veces negativo, pero no debe tener una tendencia
sistemática en cualquier dirección.
8
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Entonces
Yi = b1 + b2Xi + ui
vi = ui – mu
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
Realmente, si incluimos un intercepto en la ecuación de regresión, es razonable asumir que
esta condición se satisface de manera automática.
9
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Entonces
Yi = b1 + b2Xi + ui
vi = ui – mu
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
El papel del intercepto es capturar cualquier tendencia sistemática pero constante observada en Y
y que no esté explicada por el/los regresor(es).
10
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Entonces
Yi = b1 + b2Xi + ui
E ( ui )  m u  0
vi = ui – mu
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
Supongamos que el término de error tuviera una media poblacional distinta de cero.
11
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Yi = b1 + b2Xi + ui
E ( ui )  m u  0
vi = ui – mu
Yi  b 1  b 2 X i  v i  m u
 b1  b 2 X i  vi
*
Entonces
where b 1  b 1  m u
*
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
Defina una nueva variable aleatoria vi = ui – mu.
12
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Yi = b1 + b2Xi + ui
E ( ui )  m u  0
vi = ui – mu
Yi  b 1  b 2 X i  v i  m u
 b 1  b 2 X i  vi
*
Entonces
donde b 1  b 1  m u
*
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
Entonces podemos reescribir el modelo como se muestra. vi se convierte en el nuevo
término de error y el intercepto ha absorbido a la constante mu.
13
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Yi = b1 + b2Xi + ui
E ( ui )  m u  0
vi = ui – mu
Yi  b 1  b 2 X i  v i  m u
 b1  b 2 X i  vi
*
Entonces
where b 1  b 1  m u
*
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
El término de error en el modelo revisado satisface ahora el supuesto A.3.
14
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Yi = b1 + b2Xi + ui
E ( ui )  m u  0
vi = ui – mu
Yi  b 1  b 2 X i  v i  m u
 b1  b 2 X i  vi
*
Entonces
where b 1  b 1  m u
*
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
Es claro que la interpretación del intercepto cambia un poco pues ahora ha absorbido el
componente distinto de cero del término de error, además de la información que incluía
previamente.
15
Supuestos para el Modelo A
A.3 El término de error tiene valor esperado cero
E(ui) = 0 para toda i
Suponga
Defina
Yi = b1 + b2Xi + ui
E ( ui )  m u  0
vi = ui – mu
Yi  b 1  b 2 X i  v i  m u
 b1  b 2 X i  vi
*
Entonces
where b 1  b 1  m u
*
E(vi) = E(ui – mu) = E(ui) – E(mu) = mu – mu = 0
Esto es generalmente aceptable porque el papel de la constante es captar cualquier tendencia
sistemática en Y no explicada por el/los regresor(es).
16
Supuestos para el Modelo A
A.4 El término de error es homoscedástico
u u
2
i
2
para toda i
Asumimos que el término de error es homoscedástico, lo que significa que, para cada
observación, el término de error proviene de una distribución con varianza poblacional
constante.
17
Supuestos para el Modelo A
A.4 El término de error es homoscedástico
u u
2
i
2
para toda i
En el lenguaje de la sección de muestreo y estimadores del repaso estadístico, esto es un
concepto “asumido de antemano”, pues suponemos el comportamiento potencial del
término de error aún antes de generar la muestra.
18
Supuestos para el Modelo A
A.4 El término de error es homoscedástico
u u
2
i
2
para toda i
Una vez que hemos generado la muestra, el término de error resultará mayor para algunas
observaciones, y más pequeño para otras, pero no debe haber ninguna razón para que éste
sea más errático en algunas observaciones que en otras.
19
Supuestos para el Modelo A
A.4 El término de error es homoscedástico
u u
2
2
para toda i
i

2
ui
 E  u
2

 mu 
i
E (u i )   u
2
2
E u 
2
i
para toda i
Puesto que E(ui) = 0, por el supuesto A.3, la varianza poblacional de ui es igual a E (ui2), así
que la condición puede también ser escrita como se muestra.
20
Supuestos para el Modelo A
A.4 El término de error es homoscedástico
u u
2
2
para toda i
i

2
ui
 E  u
2

 mu 
i
E (u i )   u
2
2
E u 
2
i
para toda i
Si no se cumple el supuesto A.4, los coeficientes de regresión de OLS serán ineficientes y
se podrían obtener resultados más confiables usando una técnica de regresión modificada.
Esto será discutido en el Capítulo 7.
21
Supuestos para el Modelo A
A.5 Los valores del término de error tienen distribuciones
independientes
ui se distribuye independientemente de uj para todo j ≠ i
Asumimos que no existe autocorrelación en el término de error. Es decir que no debe haber
ninguna asociación sistemática entre los errores de dos observaciones cualquiera.
22
Supuestos para el Modelo A
A.5 Los valores del término de error tienen distribuciones
independientes
ui se distribuye independientemente de uj para todo j ≠ i
Por ejemplo, el que el término de error sea grande y positivo para una observación i, no
implica que el error también sea grande y positivo en la siguiente observación--ni grande y
negativo, o pequeño y positivo, o pequeño y negativo, etc.--en última instancia.
23
Supuestos para el Modelo A
A.5 Los valores del término de error tienen distribuciones
independientes
ui se distribuye independientemente de uj para todo j ≠ i
 u u  E [( u i  m u )( u j  m u )]  E ( u i u j )
i
j
 E (ui ) E (u j )  0
Este supuesto implica que la covarianza poblacional entre ui y uj es cero. Nótese que ui y uj
tienen ambas una media poblacional igual a cero, dado el supuesto A.3, y que E(uiuj) se puede
expresar como E(ui)E(uj) siempre que ui y uj sean independientes entre sí (ver el repaso).
24
Supuestos para el Modelo A
A.5 Los valores del término de error tienen distribuciones
independientes
ui se distribuye independientemente de uj para todo j ≠ i
 u u  E [( u i  m u )( u j  m u )]  E ( u i u j )
i
j
 E (ui ) E (u j )  0
Si este supuesto no se cumple, OLS producirá otra vez estimadores ineficientes. El capítulo
12 discute este tipo de problemas y la manera de atenderlos. Las violaciones de este
supuesto en datos de corte transversal son raras (y muy frecuentes en series de tiempo y
de tipo panel).
25
Supuestos para el Modelo A
A.6 El término de error tiene una distribución normal
Usualmente asumimos que el término de error tienen una distribución normal. La
justifación de este supuesto esta basada en el Teorema de Límite Central.
26
Supuestos para el Modelo A
A.6 El término de error tiene una distribución normal
Esencialmente, el Teorema del Límite Central indica que, si una variable aleatoria es el resultado
compuesto de los efectos de una gran cantidad de variables aleatorias, ésta tendrá una
distribución aproximadamente normal incluso si sus componentes no la tienen, siempre y cuando
ninguno de ellos tenga un efecto dominante.
27
Supuestos para el Modelo A
A.6 El término de error tiene una distribución normal
Y como el término de error u se compone de un gran número de factores no incluidos
explícitamente en la regresión, entonces podemos asumir que u se distribuya normalmente-incluso si no sabemos nada sobre la distribución de aquellos factores no incluidos.
28
Copyright Christopher Dougherty 1999–2006. This slideshow may be freely copied for
personal use.
21.06.06
Descargar

No Slide Title