Uso de modelos Mixed Logit en
modelación de elecciones discretas
Marcela A. Munizaga
Ricardo Alvarez-Daziano
Universidad de Chile
Santiago, 3 October, 2015
Contenido de la Presentación
Correlación del término de error
Análisis de Simulación
logverosimilitud y parámetros
iteraciones y tiempo de convergencia
diferencias en modalidad predictiva
Análisis con datos reales
equivalencia entre modelos
capacidad de recuperar efectos de correlación
Elección Discreta y Utilidad
Aleatoria
Teoría de la Utilidad Aleatoria
Individuo maximiza su Utilidad, función de atributos
de la alternativa y características de los individuos
(Domencich y McFadden, 1975)
Modelador no posee información completa del
sistema 
U in  V in   in
Hay componentes y atributos que se desconocen
o no se pueden medir; aleatoriedad inherente a la
naturaleza humana
Elección Discreta (cont.)
No se puede asegurar con certeza qué alternativa
será escogida 
Pin  Pr( i / C n )  Pr( V in   in  V jn   jn ,  j  C n , j  i )
Supuestos sobre distribución de   Modelo de
elección específico (Ortúzar y Willumsen, 1994)
Logit Multinomial MNL (McFadden, 1974)
Supone errores iid Gumbel
Expresión cerrada de la probabilidad de elección:
Pin 
exp(  V in )

j C n
exp(  V jn )
 2

0

 

 0
0


2




0
0 

 
2
  IK
0 

2
 
¿Por qué usar algo distinto del
MNL?
Correlación: Dependencia
Heteroscedasticidad: Distinta varianza
Dependencia  probabilidades y parámetros
inconsistentes, predicciones poco confiables
Propiedad de independencia de alternativas
irrelevantes (patrones de sustitución constantes)
Avances en computación y métodos numéricos
permiten considerar modelos más generales
Correlación del término de
error
Motivación: el estudio de correlación
Fuentes de correlación: alternativas
similares, alternativas con componente
común, variaciones en los gustos,
agregación
Modelos adecuados: Logit Jerárquico,
Probit, Mixed Logit
Logit Jerárquico
Agrupa las alternativas similares en nidos
Ui=Vi+i+nj
alt i  nido j
Matriz de covarianza:
 NL

2
 2
 2
n1


 0

 0
n1
2
0

2
0
0

0
n 2
2
2
0 

0 
2
n 2
2 
 
    n
2
2
correlación, homoscedasticidad
Probit
i ~ Normal
Ui=Vi+i
Matriz de covarianza general, sujeto a restricciones
de identificabilidad
Permite modelar correlación y heteroscedasticidad
  12

 1 2
 
 

  1 J
 1 2

2
2





 1 J 


 J 1 J 

2
J


J
J 1
Modelo Mixed Logit
Se deriva de suponer
U in  V in  h in   in
 iid Gumbel, h término aleatorio adicional que distribuye
f(h/q*) (Ben Akiva y Bolduc, 1996; McFadden y Train, 1997)
Si  es iid Gumbel  probabilidad condicional en h
Pn ( i / h )  L in (h ) 
e

V in  h in
e
V jn  h
j
jn
Por lo tanto, la probabilidad total es:
Pin 
L
in
(h ) f (h / q *) d h
Modelo Mixed Logit (cont.)
Caso Particular (Modelo lineal de error
compuesto):
zin atributos relacionados
t
t
U in   x in   in z in   in
con alternativa i e
 
V
h
individuo n
in
in
Propiedades
ML aproxima cualquier modelo de utilidad aleatoria
(McFadden y Train, 1997): ML con parámetros
distribuidos normal, aproxima a un Probit.
Razón de probabilidades depende de todo el conjunto
de alternativas disponibles.
Modelo Mixed Logit (cont.)
Estimación
Condicional en q*, se
obtiene un valor h 
Pin(h) tiene forma Logit.
Proceso se repite R veces:
Probabilidad Simulada de
escoger la alternativa
Se maximiza la log
verosimilitud simulada
1
~
Pin 
R
l
R

Pin (h )
y
~
ln P jn
n
r
r 1
jC n
jn
Modelos de elección (cont.)
Nested Mixed Logit
Brownstone and Train (1999).
Ui=Vi+i+j i ~ iid Gumbel
j ~ Normal
Matriz de covarianza:
 ML
 2 1   2

2


1
 

0

0

 1
2
0
 1   
0
0
 2   
0
 2
2
2
correlación, heteroscedasticidad
2
2
2


0

2
 2 
2
2
  2    
0
Análisis de Simulación
Objetivo: estudiar los modelos en un caso en
que se cumplen todos los supuestos
Metodología:
atributos según base de datos real
se asume ciertos parámetros de gusto
se genera las componentes determinística y aleatoria
de la función de utilidad
se calcula la elección de acuerdo a máx U
se calibra los modelos con la base generada
estímulo de políticas
Análisis de Simulación
Uso del simulador en modalidad predictiva
Predicciones con los modelos calibrados
¿En qué nos podemos fijar?
Diferencias entre parámetros conocidos y
calibrados
Diferencias entre predicciones del simulador
(realidad virtual) y predicciones modeladas
Influencia del Nº Repeticiones
4000 Observaciones
4 alternativas
Correlación: 0,5 (Nido con dos alternativas)
Dimensión: 3
Probit (Nº de alternativas - 1)
ML (Estructura homsc. anidada: 1 componente
común + 2 términos independientes)
Influencia del Nº Repeticiones
Parámetro de Correlación : Probit
Influencia del Nº Repeticiones
Parámetro de Correlación : MLR
Influencia del Nº Repeticiones
Parámetro de Correlación : MLH
2.0
1.5
1.0

Upper Limit
Parameter
0.5
Lower Limit
0.0
Real
0
250
500
-0.5
Nº Rep
750
1000
Influencia del Nº Repeticiones
log verosimilitud
Nº Rep
-1.04
0
l(q )
-1.044
-1.048
-1.052
-1.056
250
500
750
1000
Probit
ML H
ML R
Influencia del Nº Repeticiones
Diferencias en modalidad predictiva
18
15
Probit
c
2
12
ML H
9
ML R
6
Base
3
0
0
250
500
Nº Rep
750
1000
Influencia del Nº Repeticiones
Iteraciones and tiempo de convergencia
Iterations
12
Probit
9
ML H
6
ML R
3
0
0
250
500
Nº Rep
750
1000
Time for convergence
15
700
600
500
Probit
400
ML H
300
ML R
200
100
0
0
250
500
Nº Rep
750
1000
Caso: alternativas correlacionadas
Síntesis
8000 Observaciones /  = 0,5 / He & Ho
Mejor verosimilitud para ML
ML: recupera adecuadamente todos los parámetros
Probit: importante subestimación de la correlación
LJ: efectos de escala, al usar datos heteroscedásticos
NL – Probit – ML: buen nivel de respuesta
MNL: pobre nivel de respuesta en comparación con
ML y LJ
Datos reales
Contexto:
Corredor Las Condes - Centro, RP
9 alternativas, se incluye combinaciones
auto chofer, auto acompañante, taxi colectivo,
metro, bus, auto chofer-metro, auto acompañante
-metro, taxi colectivo-metro, bus-metro
697 observaciones
Datos reales
Estructura anidada 1
Transporte
Público
Auto Auto
Chofer Acomp
Bus
Taxi
Metro
ACh
Metro
AAc
Metro
Taxi
Metro
Bus
Metro
Datos reales: Estructura 1
Datos reales
Estructura anidada 2
Transporte
Público
Auto
Auto Auto
ACh
Chofer Acomp Metro
AAc
Metro
Bus
Taxi
Metro
Taxi
Metro
Bus
Metro
Datos reales: estructura 2
Síntesis y Discusión
ML es un modelo útil, flexible y aplicable
La estructura de covarianza se deduce de
la especificación y debe ser debidamente
justificada
Nested Mixed Logit no es equivalente al LJ
Probit aparece como un modelo costoso y
muestra dificultades para recoger
correlación
Descargar

Mixed Logit vs Nested Logit and Probit models