MIDIENDO LA
DESIGUALDAD
Taller Sobre
La Teoría y la Técnica
Para Medir la Desigualdad
San Jose, Costa Rica
August 4 -5, 2004
Sesión Sobre:
Las Matemáticas y la Lógica
del
Estadístico T de Theil
James K. Galbraith y Enrique Garcilazo
The University of Texas Inequality Project
Sesión 2
http://utip.gov.utexas.edu
Estructura de la Presentación
1. Teoría de la Información de Claude Shannon
2. El Índice de Theil como Medida de Desigualdad
entre Individuos
3. La Descomposición del Estadístico T de Theil y
sus propiedades Fractales
4. La Descomposición del Estadistico T de Theil
en el caso de dos Niveles Jerárquicos
Teoría de la Información- Shannon
 Claude Shannon (1948)
– Utilizó su teoría para medir la información y su
contenido.
– Cuanto más inesperado es un suceso, mas cantidad de
información puede generar
– El contenido de la información de un suceso = una
función decreciente de la probabilidad de su aparición.
– Para traducir las probabilidades en información
Shannon uso el logaritmo de la inversa de la
probabilidad
Teoría de la Información- Shannon
 Formalmente si tenemos un conjunto de n sucesos,
uno de los cuales sabemos con certeza que va a ocurrir,
y cada uno con una probabilidad de que ocurra
entonces:
n

xi  1
i 1
 El contenido de información expresado por Shannon
es:
n
H (x) 
x
i 1
i
log
1
xi
Teoría de la Información- Shannon
 El nivel de la entropía se interpreta como la diferencia
relativa del contenido de la información
 Menos entropía es equivalente a más igualdad
n
1
2
4
10
2
2
2
10
10
Sequence of xi
1.00
.
.
.
.
.
.
.
.
.
0.50
0.50
.
.
.
.
.
.
.
.
0.25
0.25 0.25 0.25
.
.
.
.
.
.
0.10
0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10
0.50
0.50
.
.
.
.
.
.
.
.
0.60
0.40
.
.
.
.
.
.
.
.
0.90
0.10
.
.
.
.
.
.
.
.
0.10
0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10
0.91 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01
sum
1
1
1
1
1
1
1
1
1
y=sum x*ln(1/x)
0.000
0.301
0.602
1.000
0.301
0.292
0.141
1.000
0.217
– El caso con más desigualdad es cuando un solo individuo recibe toda la renta
– Si la renta se reparte equitativamente entre mas personas la medida debería incrementarn
– Si quitamos renta a n individual (con la misma renta cada uno) y se la damos a un
individuo la medida debería decrecer
Theil’s Income Equality Measure
 Henry Theil (1967) uso la teoría de Shannon para
construir una medida de igualdad sobre la renta
individual
 El problema es análogo si en vez de
probabilidades (x) usamos la proporción de la
renta individual sobre la renta total (y):
n

yi  1
i 1
 La medida de igualdad en rentas es::
n
H ( y) 

i 1
y i log
1
yi
La Medida de Desigualdad de Theil
 Para obtener una medida de desigualdad, Theil substrajo
su medida de igualdad de rentas de su valor máximo
 El valor máximo de la medida de igualdad es cuando
todos los individuos ganan la misma proporción de rentas
(yi=1/N) :
n
1
1
H (y 
)
log N  log N
N
i 1 N
 La medida de desigualdad es:
log N  H ( y )
La Medida de Desigualdad de Theil
n
.
log N  H ( y )  log N 

y i log(
i 1
1
)
yi
n
 log N 

y i log( y i )
i 1
n
 (  y i ) log N 
i 1


i 1
y i log( y i )
i 1
n

n
n
n
y i log( N * y i ) 

i 1

y i log  y i


i 1
1 

N 
yi  1
La Medida de Desigualdad de Theil
n

i 1

y i log  y i

1 

N 
 Esta ecuación calcula la desigualdad de rentas
sobre una secuencia o distribución de individuos
La Medida de Desigualdad de Theil

La medida de desigualdad sobre rentas (expresada en términos
relativos) se puede expresar en términos absolutos:
yi 

y iT
Y
n

i 1
 y iT
log 
Y
 Y
y iT
1 

N 
Donde
– y(iT) = Renta total del individuó i
– Y=sum Yi = Renta total de todos los individuos
La Partición del Estadístico de Theil
 Si dividimos o partimos nuestra secuencia o
distribución en grupos
– cada individuo pertenece a un grupo
 La desigualdad global se puede dividir en:
– un componente intergrupal y en un componente intragrupal
G ro up A
G ro up B
La Partición del Estadístico T de Theil
 Otra manera de expresarlo es:
k

gi  1
 Yg
log 
Y
 Y
Yg
ng

y gp
n g   Yg 
y gp
log
   

N   Y   p 1 Y g
Yg
1 

n g 
– g grupos van de 1 a k
– p individuos van de 1 a n(g)
 El primer término mide la desigualdad entre
grupos
 El segundo termino mide la desigualad dentro de
cada grupo
– es una media ponderada
La Partición del Estadístico T de Theil
 Formalmente el estadístico se expresa :
T  T B  TW
 Donde: .
k
TB 

gi  1
 Yg
log 
Y
 Y
Yg
 Yg 

  TW
g i 1  Y 
ng 

N 
k
TW
TW 
 n g y gp
 y gp
log 

 Y
 p 1 Y
g
 g

1 
 
ng  

La Partición del Estadístico T de Theil
 El componente intergrupal es ahora el componente
intragrupal
 Si dividimos la distribución en m grupos con n individuos
en cada grupo:
m
T 
mi
1
mi
m1
1 i2
 
i1  1 i 2  1 i 3  1
.......... ...
1 ..... i g  1

i g 1
  Y i i ... i i
Y i1 i 2 ... i g  m i1 ... i g Y i1i 2 .... i g i g  1
 1 2 g g 1

log
 
Y  i g  1  1 Y i1i 2 .... i g
  Y i1i 2 ... i g t






 n i i ... i i
 1 2 g g 1
 n i i ... i
1 2
g

– La renta y la población relativa a un grupo mayor
– Peso (weight) es el salario relativo de cada grupo (al
total)
– A nivel individual la población es igual a uno
  



  
La Partición del Estadístico T de Theil
 El estadístico de Theil se puede decomponer en n niveles
jerárquicos por que tiene las propiedades de un fractal
Matemático – se replica en si mismo
 Los individuos de dividen en grupos mientras se agrupen
de forma mutuamente excluyente y totalmente exhaustiva.
La Partición del Estadístico T de Theil
 Tres niveles jerárquicos





 n Yg
 ln 


 g 1 Y







 Y gg  
 Y gg g 


 n

 n
Yg 


  Yg 
  Yg 
n 
 Y g  n  Y gg 
Yg 
Y gg g 

 i 1


Y 
   n
 ln
 n
  n
 ln i 1


 n  
 n  
ng  Y
gg
gg g
g  1
g   1

Y
Y
Y





 g
 g
 g
n
n
N 

i 1
i 1


 i 1

n

g


  ng


 i 1

 i 1


– La renta y la población relativa a un grupo mayor
– Peso (weight) es el salario relativo de cada grupo (al
total)
– A nivel individual la población es igual a uno









La Partición del Estadístico T de Theil
 Afortunadamente trabajaremos con uno o dos niveles
jerárquicos:
 Los datos típicamente están agregados por unidades
geográficas. Cada unidad geográfica esta dividido en
sectores industriales o cada sector industrial dividido por
unidad geográfica (ya no tenemos datos individuales)

 n

T  
 i 1




 Y 
 n i   ln


Y

i 

 i 1 

 Yi


n
 i


 YY  
i 1
 
n

 n i  
i 1

n
k 
 n Y
 Yip 

 i 
     
  ln

 Y  p  1   Yi 

 i 1
 Yip

 n ij
Yi   
 
n i   

 Ventajas del estadístico T de Theil – flexibilidad y
capacidad de categorizar grupos
Dos Niveles Jerárquicos – El Theil
Intergrupal
 El termino izquierdo de la ecuación anterior
es el entre-componente sectoral o regional

 n

TB  
 i 1






 Y i   ln
 n

  Yi 
 i 1 

 Yi


ni



 YY  
i 1

n

n
 i 
i 1

n
– Expresado en términos absolutos
– También podemos expresar en términos de medios
Dos Niveles Jerárquicos – El Theil
Intergrupal
– De términos absolutos a términos medios:
 n
Y i    Y i
 i 1
y i   Yi n i 
n
TB 

i 1


 yi * ni
n

 Yi *  n i
i 1

n
TB 

i 1

 ni

n

i 1

n i 
i 
n



y
*
n
Y
*
n

 i
i
i
 i
i 1
  ln 

n



n
n

 i
i


i 1



n

i 1
 y i 
  ln
n i  

Y
 i 
y
 
 Yi 
– El entrecomponente expresado en términos medios es muy intuitivo
Dos Niveles Jerárquicos – El Theil
Intergrupal
n
TB 

i 1


 ni
 n
  ni
 i 1


  y i
 Y
 i



 y 
  ln  


 Yi 
– Rango de cero al Logaritmo de N
– Contribución negativa del grupo (i) si el grupo esta por
debajo de la media
– Contribución positiva del grupo (i) si el grupo esta por
encima de la media
– Sumatoria debe de ser positiva
Dos Niveles Jerárquicos – El Theil
Intragrupal
k 
 Yip Yi  
 Yip 
Y
 i 
TW i    
 ln 


TW      TW i


n
n
p  1  Yi 


ij
i



i 1  Y 
 Calcular el estadístico T de Theil dentro de cada
grupo (entre p individuos/grupos) lo ponderamos
con la renta relativa de cada grupo i
n
 Sumar los componentes ponderados individuales
se obtiene el promedio ponderado =
intracomponente de Theil
Proceso de Coleccionar Datos


Cuando una distribución se decompone en
grupos (MECE):
–
las variables necesarias para calcular el estadístico T de Theil entran
en cualquier de estas categorías:
1.
2.
Renta
Populación
Datos sobre renta se obtienen típicamente
en encuestas
–
–
–
–
Falta de objetividad
Se cambia la metodología de la encuesta a través del tiempo
No se puede compara a nivel nacional
Coste elevado
–
Calidad es cuestionable Deininger and Squire data
Proceso de Coleccionar Datos

Sugerimos escoger datos sobre salarios en
diferentes industrias
– Calidad de los Datos de salarios industriales
– Son objetivos
– Consistentes a través del tiempo
– Mas fáciles de obtener
– Mas baratos y de mejor calidad
Proceso de Coleccionar Datos

Con la metodología de Theil necesitamos
dos variables que incluyan:
1.
2.

Cantidad de personas trabajando en un grupo
Variable de compensación como salarios
Obtendremos desigualdad de salarios (payinequality)
–
Salarios elementos básicos en la economía
Ventajas Decomponiendo y Obteniendo
Desigualdades Salarial
 Los datos son consistentes a través del
tiempo:
– Podemos medir la evolución de la desigualdad salarial a
través del tiempo
– Otras medida dependen de la calidad de los datos sobre
encuestas. Difíciles de comparar
 Los datos son consistentes y
comparables entre sectores
Documentación y Datos adicionales disponibles online en:
The University of Texas Inequality Project
http://utip.gov.utexas.edu
Para encontrarnos el Internet, haga una
Búsqueda en Google con la palabra “Inequality”
Descargar

Slide 1 - University of Texas Inequality Project