Econometria
2. Modelo de Regresión Lineal Simple
Prof. Ma. Isabel Santana
FRP Y FRM
•
^
La diferencia entre los Yi poblacionales y los Y
estimados es lo que llamaremos residuos
EStimación de β1 y β2
• El objetivo es determinar la FRM de tal manera que
esté lo más cerca posible a la Y observada.
• Una posibilidad sería minimizar la sumatoria de los
residuos
 ˆ

i
 Y
i

Yˆ
i

• Sin embargo, este método no es factible ya que da el
mismo peso a todos los residuos sin considerar qué tan
cerca o qué tan dispersas están las observaciones de
la FRM.
EStimación de β1 y β2
• Esto se puede evitar adoptando el criterio de
mínimos cuadrados


2
ˆ i 
2
ˆ i 
 ˆ i
2
 Y i  Yˆ i 
2

 Y i  ˆ1  ˆ 2 X i

 f ˆ1 , ˆ 2

2

• Adicionalmente, este método posee propiedades
estadísticas deseables (que veremos más
adelante
Derivación
min

2
ˆ i 
2
  ˆ i
 ˆ

 Y i  ˆ1  ˆ 2 X i
  ˆ
CNPO
2
i
 ˆ 2
Resolviendo para ˆ1 :
(1)
0
1

2
2
  ˆ i
 ˆ1

 Y
0
Y

2
 ˆ
2
i
2
 ˆ1

2
 ˆ
2
 ˆ
2
0
i
i

 ˆ1  ˆ 2 X i  0
 ˆ1  1  ˆ 2  X i  0
Y
0
CNSO
2
i

 2  Y i  ˆ1  ˆ 2 X i   1   0
n
i

ˆ 2  X i
n
 ˆ1
Y i  ˆ 2 X i  ˆ1
Derivación
Resolviendo para ˆ 2 :
(2)
2
  ˆ i
 ˆ


 2  Y i  ˆ1  ˆ 2 X i  X i   1   0
2
Y X
i
i
 ˆ1  X i  ˆ
Sustituyendo
Y X
i
Y X
i
i
i
Y
2
X
2
i
0
ˆ1  Y  ˆ 2 X

 Y  ˆ 2 X
X
i
 X
 ˆ 2 X
i
X
 ˆ
 ˆ
i
 Yi X i  Y
2
X
2
i
0
2
X
2
i
0

n
2
X i    ˆ 2  X i  ˆ 2 X
n

Y X
i
2
 n Y X  ˆ 2  X i n ˆ 2 X
Y X
i
 n Y X  ˆ 2
i
i
Y X
X
i
i
2
i
 nY X
n X
2
 X
 ˆ 2
2
i
n X
2
2

n
X i 
n
Derivación
(1) También es igual a:
2
  ˆ i
 ˆ1
 2  ˆ i   1   0
 ˆ
i
0
(2) También se puede expresar como:
2
  ˆ i
 ˆ
 2  ˆ i X i   1   0
2
 ˆ
i
Xi  0
Ejemplo
• Supongamos
que
conocemos los datos
de producción y horas
trabajadas
dee
10
trabajadores de una
fábrica en un momento
de
tiempo
(corte
transversal).
• Definimos Y= producto,
X= horas de trabajo.
Ejemplo
X 8
ˆ1  Y  ˆ 2 X
Y  9 .6
Yi  ˆ1  ˆ 2 X i  uˆ i
ˆ 2 
ˆ 2 
Y X
X
i
i
2
i
ˆ1  9 . 6  ˆ 2  8
ˆ1  9 . 6  0 . 75  8  3 . 6
 nY X
n X
789  10  8  9 . 6
688  10  8
Yˆi  ˆ1  ˆ 2 X i  3 . 6  0 . 75 X
2
2
 0 . 75
MICO expresado en desvíos
• Existe otra manera de representar ˆ 2
xi  X i  X
Si
Las variables en minisculas
representan desvios respecto
a la media de la variable
y i  Yi  Y
Entonces:
ˆ 2 
xy
x
i
2
i
i
Propiedades de la regresión MICO
1. Pasa a través de las medias muestrales de Y y X.
Y
Yi  ˆ1  ˆ 2 X i  uˆ i
Y
i
 Yi
n


 ˆ
1
n ˆ1


Yˆi  ˆ1  ˆ 2 X i
ˆ i  0
  FRM



  
  
 
 ˆ 2  X i   uˆ i
ˆ 2  X i
n
n

0
n
Y







Y  ˆ1  ˆ 2 X
X
X
Propiedades de la regresión MICO
2. El valor promedio del Y estimado= Yˆ , es igual al valor medio del Y
real para:
Yˆi  ˆ1  ˆ 2 X i


Yˆi  Y  ˆ 2 X  ˆ 2 X i
Yˆi  Y  ˆ 2  X i  X
 Yˆ
i
 Yˆ
i

 n Y  ˆ 2  X i  n ˆ 2 X

nY
n
n

ˆ 2  X i
n
Yˆ  Y  ˆ 2 X  ˆ 2 X
Yˆ  Y

n ˆ 2 X
n
Propiedades de la regresión MICO
3. El valor de la media de los residuos ˆ es cero
  ˆ
 2  Y  ˆ  ˆ X   1   0
CNPO
ˆ
i
2
i
i
1
1
2
i
uˆ i  Y i  ˆ1  ˆ 2 X i
Dado que
 2  ˆ i  0
ˆ i  0
* Yi  ˆ1  ˆ 2 X i  uˆ i
Y
Dividiendo por n
Y
**
Restando ** de *
i
i
 n ˆ1  ˆ 2  X i   uˆ i
 n ˆ1  ˆ 2  X i
Y  ˆ1  ˆ 2 X
Y i  Y  ˆ 2  X i  X   ˆ i
y i  ˆ 2 x i  ˆ i
 ˆ
i
0
La regresión muestral
puede ser expresada
como desviaciones de
Y y X.
Propiedades de la regresión MICO
4. Los residuos ˆ no están correlacionados con el valor
predicho de Yi, lo cual puede ser verificado utilizando
la forma de desviación.
i
 y ˆ
i
 y ˆ
i



 ˆ 2  x i y i  ˆ 2 x i
2
2

x
2
i
ˆ 2 
xy
x
i
i
2
i
2
2
2
2
y i ˆ i  ˆ 2  x i  ˆ 2  x i
y i ˆ i  0
5. Los residuos
es:  ˆ x  0
i
 ˆ 2  x i ˆ i
y i ˆ i  ˆ 2  x i y i  ˆ

i
i
i
ˆ i
no están correlacionados con Xi. Esto
Supuestos Clásicos de los MICO
1.
2.
3.
4.
5.
6.
7.
El modelo de regresión es lineal en los parámetros
Los valores de X son fijos en muestreo repetido
El valor medio de ˆ es igual a cero.    / X   0
Homocedasticidad o igual varianza de ˆ . var  / X   s
No autocorrelación entre los ˆ i. cov  ,    0
La covarianza entre ˆ y Xi es cero. cov  , X   0
El número de observaciones debe ser mayor que el
de parámetros
8. Variabilidad en los valores de X.
9. El modelo de regresión está correctamente
especificado
10. No hay multicolinealidad
perfecta
ˆ
i
i
i
2
i
i
i
i
i
j
i
j
i
Supuestos Clásicos de los MICO
1. El modelo de regresión es lineal en los
parámetros
2. Los valores de X son fijos en muestreo repetido
–
–
–
Supone que las variables X no son aleatorias
Es posible mantener fijo el valor de X, y repetir el
experimento, obteniendo en cada observación un
valor de la variable distinto aleatoria Y.
El análisis de regresión es un análisis de regresión
condicional, es decir, condicionado a los valores
dados de los regresores X.
Supuestos Clásicos de los MICO
3. El valor medio de ˆ es igual a cero.
– Los residuos no son más que las desviaciones de
la muestra aleatoria con respecto a la FRP.
– Los factores que no están incluidos en el modelo,
no afectan sistemáticamente el valor esperado de
Y.
– Los valores positivos de ˆ i se cancelan con los
valores negativos, de tal manera que su efecto
promedio sobre Y es cero.
– E Y / X      X
i
1
2
Supuestos Clásicos de los MICO
4. Homocedasticidad o igual varianza de
2
var   i / X i   s
ˆ i
.
– La variación alrededor de la recta de
regresión es la misma para los valores de
X, es decir, las perturbaciones se
distribuyen con igual dispersión respecto a
la media.
–
y dado el supuesto 2
es equivalente a E    
V  i   
2
 E   i  E   i 
2
2
i
2
Homocedasticidad
Heterocestadisticidad
Supuestos Clásicos de los MICO
5. No autocorrelación entre los
-
-
-
ˆ i . cov  i ,  j   0
No existe tendencia de que los errores asociados a
una observación estén relacionados a los errores
de otra.
Si en un momento de tiempo o en un individuo de la
muestra se genera un error positivo, esto no nos da
información alguna sobre si el próximo error será
positivo o negativo.
Los errores no tienen un patrón de comportamiento
sistemático.
Si ˆ t y ˆ t 1 están correlacionados, Yt no sólo
depende de Xt, sino también de ˆ t 1 .
Supuestos Clásicos de los MICO
Supuestos Clásicos de los MICO
Supuestos Clásicos de los MICO
6. La covarianza entre
–
ˆ i
y Xi es cero. cov  , X   0
i
Si hay correlación, no es posible saber como
afecta individualmente ˆ y X a la variable Yi.
Este supuesto se cumple inmediatamente si X
no es una variable aleatoria (sino que es fija).
i
–
j
i
7. El número de observaciones debe ser mayor
que el de parámetros
Supuestos Clásicos de los MICO
8. Variabilidad en los valores de X.
– El modelo de MCO requiere que exista una
dispersión entre las X para poder calcular los
valores de los coeficientes, pues si no, éstos
serían una cantidad infinita.
– Ejemplo.
Si todos los valores de X son
idénticos, entonces
Por lo cual
Y entonces,
Xi  X

ˆ 2 
xi  0
2
xy
x
i
2
i
i

Supuestos Clásicos de los MICO
9. El modelo de regresión está correctamente
especificado
–
–
–
La forma de la FRM es igual a la FRP
El modelo posee las variables correctas: no se
incluyen variables irrelevante ni se excluyen
relevantes.
La forma funcional es la correcta
10. No hay multicolinealidad perfecta
–
No hay una relación perfectamente lineal entre las X
Descargar

2. Modelo Regresión Linea Simple: Estimación