Generating descriptive statistics
from the MXFLS
Alicia Santana
Características
•Encuesta multi-temática a hogares
•Representativa a nivel nacional, regional, urbano/rural
•Línea basal 8,400 hogares (aprox. 35 mil individuos)
Panel 2002
2005
2009
MXFLS
Hogar
Hogares
Estructura
Comunitario
Personas
Escuelas
Libro C: Control
Libro IIIA:15 años y más
Centros de salud
Libro I: Consumo
Libro IIIB: 15 años y más
Libro II: Economía del
hogar
Libro IV: Salud reproductiva
Infraestructura
comunitaria
Libro V: Menores de 15 años
Libro EA: Edo. Cognoscitivo adultos
Libro EN: Edo. Cognoscitivo niños
Medidas antropométricas de salud
Libro D: Dieta
Precios
Temas
Hogar
-
-
Características de la
vivienda.
Economía del hogar
(Ingresos de negocios y no
laborales del hogar)
Actividades agrícolas del
hogar
Activos del hogar
Choques económicos del
hogar
Personas
-
Educación
Información retrospectiva laboral
Historial de migración (permanente
y temporal)
Violencia e inseguridad
Estado de salud y estado de salud
mental
Consulta externa y hospitalización
Crédito
Transferencias
Trabajo infantil
Nutrición
Riesgo, expectativas y confianza
Biomarcadores de salud: presión
arterial, peso, talla, nivel de
hemoglobina en la sangre,
colesterol y glucosa en sangre para
cada miembro del hogar, en 2009
además proteína C reactiva y
hemoglobina glucosilada.
Comunitario
Escuelas
Centros de salud
Proveedores privados de salud
Infraestructura de la localidad
precios
Página web
http://www.ennvih-mxfls.org/
Datos longitudinales
Objetivo: Re entrevistar a todos los hogares e individuos
que conforman la línea basal.
Para enfrentar los problemas de atrición se actualizó la
muestra de forma “natural” incorporando a la muestra
original a todos aquellos individuos que ya sea por
nacimientos o uniones ahora son considerados como
integrantes del hogar o que por el desdoblamiento
formaron un nuevo hogar.
Combinación de datos
Combinar datos de corte transversal: A nivel hogar usando
el identificador del hogar (FOLIO). A nivel individual usando el
FOLIO y el Identificador individual (LS).
Combinar datos de las dos olas:
Hogares panel el folio será el mismo, siendo los 2 últimos
dígitos 00 para las dos olas.
Datos longitudinales
Un hogar nuevo surge cuando uno o varios individuos
encuestados en el 2002 salieron del hogar original y formaron
un nuevo hogar.
Folio del hogar nuevo: primeros 6 dígitos son iguales al folio
original del cual se desprendió el individuo del nuevo hogar y los
últimos dos dígitos se conforman utilizando el ls asignado en la
ENNViH-1 al individuo que se mudó y que formó este nuevo
hogar.
pid_link es un indicador individual único que se mantiene
constante a través de las diferentes rondas, el cual nos permitirá
hacer el pegado de información individual a través de las
diferentes rondas.
Datos
longitudinales
COMUNITARIO
La forma de rastrear al hogar del cual se desprendieron los
individuos es a través del pid_link
gen str8 var = substr (pid_link, 1,8)
Para convertir el folio de la ENNVIH 1 en string:
gen str8 var1=string(folio, “%08.0f”)
El pid_link no se encuentra generado en la ENNVIH1 para
generar el pid_link de la ENNVIH1 es:
gen str8 var1 = string (folio, “%08.0f”)
gen str2 var2 = string (ls, “%02.0f”)
gen pid_link = var1 + var2
Ponderadores
Para considerar la tasa de no respuesta de cada libro de la
encuesta, se creó un factor de expansión (ponderador)
para cada uno de los libros que integran la ENNVIH.
Los ponderadores que se encuentran en la pagina web
expanden a la población de 2002.
Uso de ponderadores
1) Se usan ponderadores cuando se desea hacer ESTADÍSTICAS que
hablen de la población. Por ejemplo, el 20% de la población ha sufrido
crímenes.
2) No se recomienda usar ponderadores cuando se desea hacer
ANALISIS, por ejemplo, ¿qué tanto determina la salud el nivel de
productividad laboral de las personas? Esto es debido a que:
-Tienes ponderadores distintos para libro S y para el IIIA
-Porque ya se está seleccionando una muestra especifica, los que
trabajan. Los ponderadores expanden a la población no a la población
que trabaja.
Este resultado es estándar y se sigue de lo escrito en la literatura.
Uso de ponderadores
Para llevar a cabo ponderadores de 2005 hay dos opciones:
a) Seguir expandiendo a 2002, por lo que hay que usar los de 2002,
ajustarlos por la no respuesta del 2005 y ajustar por un factor
demográfico que expanda a la población del 2002. Estos ponderadores
se llaman ponderadores longitudinales.
b) Expandir a la población del 2005. Para ello usamos los ponderadores
del 2002, ajustamos por la no respuesta y luego ajustamos por el factor
demográfico que haga representativa la encuesta del 2005.
Aplicación
Migración en México
Estadísticas descriptivas
proportion pobre casa ahorros edocivil rururb genero edocivil
No migrantes
%
std. Err.
Migrantes Internos
%
std. Err.
Migrantes US
%
std. Err.
No pobre
0.7240
0.0001
0.7942
0.0003
0.5566
0.0004
Pobre
0.2760
0.0001
0.2058
0.0003
0.4434
0.0004
No poseía casa
0.7732
0.0001
0.8756
0.0002
0.8763
0.0003
Poseía casa
0.2268
0.0001
0.1244
0.0002
0.1237
0.0003
No tenía ahorros
0.9511
0.0000
0.9306
0.0002
0.9811
0.0001
Tenía ahorros
0.0489
0.0000
0.0694
0.0002
0.0189
0.0001
Soltero
0.3767
0.0001
0.4620
0.0003
0.6386
0.0004
Casado
0.6233
0.0001
0.5380
0.0003
0.3614
0.0004
Pertenecía a zona urbana
0.7509
0.0001
0.7734
0.0003
0.5823
0.0004
Pertenecía a zona rural
0.2491
0.0001
0.2266
0.0003
0.4177
0.0004
Hombre
0.4309
0.0001
0.4442
0.0003
0.6162
0.0004
Mujer
0.5691
0.0001
0.5558
0.0003
0.3838
0.0004
Estadísticas descriptivas
by migration: tabstat añosesc edad02 if edad02>=15, stats(mean median sd var min
max)
Características de la población migrante en el momento de partida
Años de escolaridad
mean
p50
sd
variance
min
max
Edad promedio en el momento de partida
mean
p50
sd
variance
min
max
No migrante Interno
7.3636
9.0505
7.0000
9.0000
4.6863
4.2310
21.9617
17.9015
0.0000
0.0000
18.0000
18.0000
38.0237
35.0000
16.9016
285.6637
15.0000
98.0000
28.8464
25.0000
12.3975
153.6990
15.0000
92.0000
US
7.7907
8.0000
3.4357
11.8043
0.0000
16.0000
25.0690
21.0000
10.9939
120.8649
15.0000
77.0000
. mprobit mig2 edad02
> ahorros, base(0)
Iteration
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
4:
log
log
log
log
log
edocivil2 genero
likelihood
likelihood
likelihood
likelihood
likelihood
=
=
=
=
=
añosesc rururb pobre desempleado casa
-5589.0881
-5549.1463
-5546.2357
-5546.2289
-5546.2289
Multinomial probit regression
Number of obs
Wald chi2(18)
Prob > chi2
Log likelihood = -5546.2289
Coef.
_outcome_2
edad02
edocivil2
genero
añosesc
rururb
pobre
desempleado
casa
ahorros
_cons
-.026771
.0069851
.0182726
.0343012
-.0080512
-.0393422
-.3784337
-.3269157
.3348203
-1.621533
.0019767
.0548054
.0450426
.005957
.0487163
.0560356
.0769324
.0687357
.105434
.1018426
-13.54
0.13
0.41
5.76
-0.17
-0.70
-4.92
-4.76
3.18
-15.92
0.000
0.899
0.685
0.000
0.869
0.483
0.000
0.000
0.001
0.000
-.0306452
-.1004315
-.0700092
.0226258
-.1035334
-.1491701
-.5292185
-.4616353
.1281734
-1.821141
-.0228968
.1144017
.1065544
.0459767
.0874311
.0704856
-.227649
-.1921961
.5414673
-1.421925
_outcome_3
edad02
edocivil2
genero
añosesc
rururb
pobre
desempleado
casa
ahorros
_cons
-.0394108
-.1364025
-.3875056
-.0091584
.3309893
.4298464
-.4313687
-.1660828
-.0957527
-1.276753
.0027055
.0711947
.0559665
.0081427
.0590268
.0608867
.0906552
.0883047
.1819954
.1268858
-14.57
-1.92
-6.92
-1.12
5.61
7.06
-4.76
-1.88
-0.53
-10.06
0.000
0.055
0.000
0.261
0.000
0.000
0.000
0.060
0.599
0.000
-.0447135
-.2759416
-.497198
-.0251179
.2152989
.3105107
-.6090497
-.3391568
-.4524571
-1.525444
-.0341081
.0031367
-.2778132
.0068011
.4466798
.5491821
-.2536877
.0069912
.2609517
-1.028061
.
z
P>|z|
19688
769.83
0.0000
mig2
(mig2=0 is the base outcome)
Std. Err.
=
=
=
[95% Conf. Interval]
. mfx, predict(p outcome(1))
Marginal effects after mprobit
y = Pr(mig2=1) (predict, p outcome(1))
= .03766329
variable
edad02
edociv~2*
genero*
añosesc
rururb*
pobre*
desemp~o*
casa*
ahorros*
dy/dx
-.0014489
.0009108
.0025111
.0020695
-.0017012
-.0040233
-.0175323
-.0169178
.024492
Std. Err.
.00011
.00321
.00263
.00035
.00285
.00317
.00306
.00324
.00895
z
-13.54
0.28
0.96
5.96
-0.60
-1.27
-5.72
-5.22
2.74
P>|z|
[
95% C.I.
]
0.000
0.776
0.340
0.000
0.550
0.204
0.000
0.000
0.006
-.001659 -.001239
-.005376 .007198
-.002642 .007665
.001389
.00275
-.007279 .003877
-.010235 .002188
-.023538 -.011527
-.023275 -.010561
.006948 .042036
X
37.6189
.612251
.556278
7.15995
.425538
.275549
.093306
.230343
.045815
(*) dy/dx is for discrete change of dummy variable from 0 to 1
. mfx, predict(p outcome(2))
Marginal effects after mprobit
y = Pr(mig2=2) (predict, p outcome(2))
= .01567634
variable
edad02
edociv~2*
genero*
añosesc
rururb*
pobre*
desemp~o*
casa*
ahorros*
dy/dx
-.0010508
-.0040966
-.0118732
-.0003889
.0101255
.0148975
-.0088361
-.0035326
-.0037921
Std. Err.
.00007
.00219
.00179
.00024
.00188
.00243
.00158
.00226
.00429
z
-15.42
-1.87
-6.63
-1.65
5.38
6.14
-5.58
-1.56
-0.88
P>|z|
[
95% C.I.
0.000
0.061
0.000
0.098
0.000
0.000
0.000
0.119
0.376
-.001184 -.000917
-.008387 .000193
-.015385 -.008362
-.00085 .000072
.006437 .013814
.010141 .019654
-.011941 -.005731
-.007969 .000904
-.012193 .004609
(*) dy/dx is for discrete change of dummy variable from 0 to 1
.
]
X
37.6189
.612251
.556278
7.15995
.425538
.275549
.093306
.230343
.045815
Descargar

Presentación de PowerPoint