MIDIENDO LA
DESIGUALDAD
Taller Sobre
La Teoría y la Técnica
Para Medir la Desigualdad
San Jose, Costa Rica
August 4 -5, 2004
Sesión Sobre:
Como Construir
el Estadístico T de Theil
Uso de Programas
y Técnicas de Calculo
James K. Galbraith y Enrique Garcilazo
The University of Texas Inequality Project
Sesión 3
http://utip.gov.utexas.edu
Estructura de la Presentación
1. Desagregando Grupos en dos Niveles
Jerárquicos
2. Entre-componente Theil – en Excel
3. Intra-componente Theil – en Excel
4. Programas para Calcular es Estadístico T
de Theil
5. Interpretando los Datos de Interés
La Agrupación con Dos Niveles
Jerárquicos
 Los datos están típicamente agregados
(desagregados) por unidades geográficas.
 Cada unidad geográfica puede estar dividida en
sectores industriales

 n

T  
 i 1




 Y 
 n i   ln


Y
 i 
 i 1 

 Yi


n
 i


 YY  
i 1
 
n

n
 i 
i 1

n
n



 i 1

k 
 Yip 
 Yi 
  ln
    
 Y  p  1   Yi 

 Yip Yi   

 
 n ij n i   

 El entre-componente (grupal) de Theil
 El intra-componente (grupal) de Theil
La Colección de Data
 Variables a nivel geográfico e industrial:
– #1 Compensación renta total – salarios (y)
– #2 Numero de personas trabajando – empleados (n)
 Datos pueden venir en diferentes
formas intentar convertir a:
– Dos bases de datos
– Ordenar datos en matrices anuales - unidades
geográficas en filas, sectores en columnas
Organizando los Datos
Year k
employment
a
1
2
3
4
b
compensation
c
a
b
c
1
2
3
4
 Sectores = {a, b, c}
 Unidades Geográficas= {1, 2, 3}
 Proceso de limpieza
La Limpieza de Data
 Comparar ambas bases de datos y buscar
observaciones que falten en una base de datos
– Función “count” en Excel
– Comparar # observaciones en filas y columnas
 Quitar observaciones cuyo valor es igual a cero
 Si el análisis va a ser comparativo intersectorial
o temporal asegurar que numero de industrias
es consistente e equitativo
Calculando el Entre-Componente de
Theil
 El entre-componente regional (o sectorial) se
calcula:
n
TB 

i 1
TB 
–
–
–

 ni

n

i 1
 y i 
  ln
n i  

Y
 i 
y
 
 Yi 
n
 



Y i  YY  

 n 

  Yi 

i 1

 ln 
 n
n




i

1

Y
n
n
 i

i
i


  i 1 
i 1


La primera ecuación en valor medio mas intuitiva
La segunda ecuación facilita el calculo
Usaremos la segunda ecuación
Calculando el Entre-Componente de
Theil
Year k
employment
a
1
2
3
4
sum
b
c
compensation
sum
a
b
c
sum
1
2
3
4
sum
– Sumar columnas y filas – valor total (agregado) de cada sector y
cada región
– Calcular el valor total en cada matriz
Calculando el Entre-Componente de
Theil
Year k
i
1
2
3
4
sum
TB1
T Ba
employment
j
a
b
c
10 15
11
8
12 14
9 16
42 53
compensation
20
22
21
23
86
sum
45
41
47
48
181
a
c
1 40 65 85
2 30 66 88
3 35 67 90
4 33 60 91
sum 138 258 354
  190 
 190 


 * ln  
750

 750 

  138 
 138 


 * ln  
750
750




b
45 
  0.0048
181 
42 
   0.04269
181 
sum
190
184
192
184
750
b/w i Theil
component
0.0048
0.0196
-0.0036
-0.0191
0.0016
b/w j Theil
component
-0.04269
0.055415
-0.00313
0.009601
4
T B  region 
T
Bi
i 1
4
T B  sec tor 
T
j 1
Bj
Calculando el Entre-Componente de
Theil
 Usar logaritmo natural (ln) en vez de logaritmo
con base 10 (log)
 Interpretando los componentes del entrecomponente
– Componente positivo refleja que ese grupo esta por encima de la media
– Componente negativo refleja que ese grupo esta por debajo de la media
 La sumatoria de todos los componentes del entrecomponente de Theil es positivo y entre un rango
razonable
 El entre-componente de Theil un buen estimador
del estadístico de Theil
Calculando el Intra-Componente de
Theil
n
Tw 

i 1
 Yi 
  T w
Y 
 k   Y 
ip
Tw     
 ln


 p 1   Yi 
T w  Intracom ponente sin ponderar
T w  Intracom ponente ponderado
T w  P rom edio ponderado
 Yip Yi   

 
 n ij n i   
Calculando el Intra-Componente de
Theil
1. Primero: calcular el estadístico de Theil dentro de
cada grupo (entre p individuos / grupos)
relativos de cada grupo i
–
–
–
Tw i
Este grupo esta en el segundo nivel jerárquico
Por sector o por región
El Theil es el intra-componente (de los grupos) sin ponderar
 k   Y 
ip
   
 ln


Y
p

1
i 



 Yip Yi   

 

n
n
 ij i   
Calculando el Intra-Componente de
Theil
2. Segundo - multiplicar en intra-componente sin
ponderar por el peso relativo de cada grupo del
primer nivel jerárquico
3. Tercero - sumar los componentes individuales se
obtiene el promedio ponderado =
intracomponente de Theil
n
Tw 

i 1
 Yi 
  T w i
Y 
Calculando el Intra-Componente de
Theil
Year k
compensation
employment
j
i
a
b
c
sum
w/in Th
Unweigh.
Theil Weights comp
1
40
65
85
190
0.00044
0.2533
0.00011
41
2
30
66
88
184
0.08215
0.2453
0.02015
21
47
3
35
67
90
192
0.01629
0.256
0.00417
16
23
48
4
33
60
91
184
0.0005
0.2453
0.00012
53
86
181
sum
138
258
354
750
a
b
c
sum
1
10
15
20
45
2
11
8
22
3
12
14
4
9
sum
42
-0.0114 0.0089 0.0029
-0.0812 0.2184
-0.055
-0.0614 0.0552 0.0225
-0.008 -0.0072 0.0156
TW i  TW ia  TW ib  TW ic
  40 
 40 
TW 1 a  
*
log



190
190





0.02456
10 
   0.011
45 
TW 1  (  0.011)  .0089  .0029  0.00044
4
TW 
T
Wi
i 1
TW 1  0.2533 * 0.00044  .00011
Output
 De las dos matrices anuales se obtiene:
– Estadístico T de Theil (total)
– Entre-componente de Theil
– Intra-componente de Theil
 Interpretando los componentes individuales del
entre-componente
 Twi el componente sin ponderar del intracomponente de Theil = el estadístico T de Theil
del grupo mas desagregado
– grupo miembro del 2 nivel jerárquico en este caso
– Pueden ser regiones o sectores
Programas i Macros
 Hoja de Calculo en Excel
 Programa en Stata
 Opciones en SAS
Documentación y Datos adicionales disponibles online en:
The University of Texas Inequality Project
http://utip.gov.utexas.edu
Para encontrarnos el Internet, haga una
Búsqueda en Google con la palabra “Inequality”
Descargar

Slide 1