ECUACIONES
ESTRUCTURALES CON
LAVAAN
Ejemplo
Kline (2010)
Introducción a SEM
• Derivado del Path Analysis
• Familia de modelos que integra:
• Path Analysis (PA)
• Confirmatory Factorial Analysis (CFA)
• Structural Regresion (SR)
• A su vez pertenece a la familia de modelos
latentes: (clase latente, transición latente,
regresión latente, etc.)
• Origen en el modelo de JWK (Jöreskog, Wiley
and Keesling) que dará lugar a LISREL creado
por Jöreskog.
Características
• Las latentes son continuas, y las observadas
mejor que también lo sean
• Filosofía confirmatoria, no exploratoria
• Deben estar fuertemente guiados por la teoría
• Se debe partir de buenos datos
• Similar al modelo lineal general (se puede
considerar como un caso especial de SEM)
• De forma simplista es la fusión de la regresión
lineal con el análisis factorial
Causación
• Confirmación no es causación
• Mismas condiciones de siempre para la
causación:
• Caeteris Paribus
• Precedencia temporal de causas y efectos
• No te lo da el modelo, sólo el diseño y la forma
de obtener los datos
• Todo el mundo lo sabe pero todo el mundo
sobre-interpreta en las conclusiones
• Capítulo de Mulaik
Conceptos básicos,
• Sistema RAM (Reticular Action Model)
• Variables latentes y observadas
• Variables endógenas y exógenas
• Efectos direccionales
• Varianzas
• Covarianzas
Kline (2010)
Tipos de modelos:
• Se distinguen dos tipos de componentes:
• Componente de medida
• Componente de estructura
• Esto da lugar a los tres tipo de modelos en SEM:
Path Analysis
Componente de estructura
UCLA: SCG (2007)
Confirmatory Factorial Analysis
Componente de medida
Rosseel (2012)
Structural Equation:
•
Componente de medida y de estructura
Rosseel (2012)
Condiciones para los datos
• Problemático, condiciones severas
• Delicado para la estimación
• Mejor tener el modelo y conseguir buenos datos
que tener los datos y “trastear” con el modelo
• Necesita muestras muy numerosas
• Se parte de datos raw o matrices de
correlaciones/covarianzas + sd + medias
(opcional)
• Matrices Definidas Positivas
Condiciones para los datos
• Normalidad multivariada
• Linealidad
• Homocedasticidad
• Independencia de las observaciones
• Especial cuidado con:
• Colinealidad
• Variables excluidas
• Outliers
• Datos missing (sistemas de imputación)
• Varianzas muy extremas
• Condiciones para var, covar y cor
Condiciones para los datos
• Se recomienda partir de buenas
mediciones con fiabilidad alta y poca
varianza error
•
Especificación del modelo:
• Cada SW usa su sistema
• Interfaces gráficas (no tan útiles como parecen)
• Mismas recomendaciones que con el resto de
modelos
• Cuidado con la direccionalidad
• Cuidado con el significado de las varianzas
• Cuidado con la saturación del modelo (dfm=0 ajuste
perfecto)
• Cuidado con la complejidad, bucles, recursividad, etc.
• Mejor guiado por una hipótesis fuerte
Identificación del modelo:
• Determinar si el modelo es estimable o no
• Hay heurísticos simples para casos sencillos
• Para casos complejos nunca es fácil saber si es
o no identificado
• Truco:
• Si no es identificado el modelo no se estima
• Problema:
• Puede estimarse pero dando resultado incongruentes
Estimación:
• Básicamente por Máxima Verosimilitud (ML)
• Estimaciones especiales:
• WLS
• WLSMV
• GLS, ULS
• etc…
• Estadísticos de Satorra-Bentler
• También estimaciones MCMC y Bayes
Indicadores de bondad de ajuste:
• X2
• AIC
• BIC
• RMSEA
• CFI
• Estudio de residuos
• Hay muchos más
• prácticamente lavaan tiene todos
SW para SEM
• De pago:
• Todos los grandes paquetes estadísticos tienen una
versión de SEM:
• Lisrel, Amos, SAS (CALIS y TCALIS), EQS, Mplus,
Ramona (Systat), Sepath (statistica), Matlab
• Gratuitos:
• Hay muchos, destacan:
• Mx
• OpenMx (extensión para R)
• R (sem y lavaan)
Extensiones de SEM
• Mucho trabajo en violaciones de las condiciones
• Armonioso con las tendencias:
• Multinivel
• Longitudinal
• Modelos de crecimiento latente
• Modelos no lineales
• Modelos no normales (generalizados)
• etc.
R: Librería Lavaan
• Creada por Yves Rosseel de Universidad de
Gante (Bélgica)
• Es muy buena, funciona muy bien
• La que más se usa y se extiende en R
• Funciones básicas:
• lavaan()  Control total del usuario
• cfa()  Wrapper sobre lavaan para factorial
confirmatorio
• sem()  Wrapper sobre lavaan para facilitar path
analysis y structural equation
Lavaan
• Básicamente definen la estructura de varianzas
y covarianzas de forma automática
• Recomendable usar lavaan(), especialmente en
la construcción del modelo (dfm1-dfm2=0)
• Opción “mimic”
• mimic="Mplus“
• mimic="EQS“
• mimic="LISREL“
• mimic="AMOS"
Construcción del modelo en lavaan
• No tiene interfaz gráfica, pero es bastante
intuitivo
• Sólo usa dos operadores: = ~
• Variable latente: =~
• Regresión:
• Var y cov:
~
~~
• Otros comandos para las restricciones: *, :=,
==, < y >
Ejemplo con lavaan()
Resultados con summary(…)
Estimación de parámetros
Heywood
Otras utilidades
• parameterEstimates(m1)
• modificationIndices(m1)
• anova(m1,m2)
• inspect(m1) (matrices de LISREL)
• Imputación de missing (missing = "fiml“)
• Datos no normales
• test = "satorra.bentler“
• estimator = "WLS"
• test = "bootstrap“ estimación errores típicos
• Contrastes multigrupos
Conclusiones sobre Lavaan
• Muy completo
• Sigue en desarrollo
• Estima tan bien como permita hacerlo R (Rosseel, 2012)
• Le faltan ciertas herramientas de ayuda (PRELIS) pero
para eso está R
• No hay visualización final del modelo:
• librería sem sí tiene pero no es adaptable
• qgraph.lavaan (Sacha Epskamp)
• Muy Bueno y muy recomendable
Referencias
• Introduction to SAS. UCLA: Statistical Consulting Group. from
•
•
•
•
http://www.ats.ucla.edu/stat/sas/notes2/ (accessed November 24, 2007).
Kline, R. B. (2011). Principles and Practice of Structural Equation Modeling.
Guilford Press.
Mulaik, S. A. (2009). Linear causal modeling with structural equations. Crc
Press.
Rosseel, Y. (2012). Lavaan: An R Package for Structural Equation
Modeling. Journal of Statistical Software, 48, 2.
Mypersonality project
• Inicio en 2007
• mypersonality.org
• http://www.psychometrics.cam.ac.uk/page/255/m
ypersonality.htm
• Mantenida por la universidad de Cambridge
• Bases de datos sobre uso de Facebook
mypersonality
• Se recogen datos de actividad en FB y de
cuestionarios que contestan los sujetos
• 7.5m de usuarios únicos
• 1m de sujetos contestaron el BIG5
• 25 cuestionarios distintos de personalidad
• Datos de más de 40 países
• Acceso a los perfiles de FB (40%)
mypersonality
• Información sobre:
• User's demographic details
• User's geo-location details
• Facebook activity
• User's religion and political views
• BIG5 Personality Scores
• IQ scores
• Satisfaction With Life Scale
• muchas más bases de datos
mypersonality
• Se obtienen las bases de datos bajo registro
• Se firma un contrato legal entre el usuario y la
universidad de Cambridge
• Uso con condiciones
• Una vez firmado te dan acceso a las bases de
datos, en distintos formatos
• Cuidado con la fusión de bases, los datos
perdidos no son aleatorios.
Descargar

Ecuaciones estructurales con lavaan