SEMINARIO DE POSGRADO
ESTRATEGIAS Y DISEÑOS AVANZADOS
DE INVESTIGACIÓN SOCIAL
Titular: Agustín Salvia
MÓDULO 2 A
Análisis de Tablas de Contingencia y
Coeficientes de Asociación
1
SEMINARIO DE POSGRADO
DE LAS TABLAS DE CONTINGENCIA
AL ANÁLISIS DE ASOCIACIÓN
2
SEMINARIO DE POSGRADO
¿CÓMO ANALIZAR Y EVALUAR HIPÓTESIS
CAUSALES
O
DE
COVARIACIÓN
ENTRE
VARIABLES CUANDO LAS MISMAS ESTÁN
MEDIDAS EN ESCALA ORDINAL O NOMINAL?
ANÁLISIS DE TABLAS DE CONTINGENCIA
TEST DE SIGNIFICANCIA NO PARAMÉTRICOS
MEDIDAS DE ASOCIACIÓN
3
ANÁLISIS DE RELACIONES ENTRE VARIABLES
UNA TABLA DE CONTINGENCIA ES UNA DISTRIBUCIÓN EN FILAS
Y COLUMNAS EN LA QUE LOS INDIVIDUOS DE UNA POBLACIÓN
SE CLASIFICAN EN FUNCIÓN DE OTRA VARIABLE.
La tabla de contingencia es un método de representar simultáneamente
dos caracteres observados en una misma población, si son discretos o
continuos reagrupados en clases. Los dos caracteres son x e y, el tamaño
de la muestra es n. Las modalidades o clases de x se escribirán c1.. cr, y
las de y, d1... ds. Estos valores en una tabla de doble entrada:
4
ANÁLISIS DE TABLAS DE CONTINGENCIA
COMPONENTES DE UNA TABLA DE CONTINGENCIA
 DISTRIBUCIONES MARGINALES
 DISTRIBUCIONES CONDICIONALES
 UN TOTAL POBLACIONAL O MUESTRAL
TIPO DE ANÁLISIS QUE PERMITE UNA TABLA DE
CONTINGENCIA
 ANÁLISIS DE PERFILES O CARACTERÍSTICAS POBLACIONALES
 ANÁLISIS DESCRIPTIVO DE GRUPOS O SEGMENTOS DE POBLACIÓN
 ANÁLISIS DE ASOCIACIÓN EN TÉRMINOS PROBABILÍSTICO /
DEPENDENCIA VERSUS INDEPENDENCIA DE PROBABILIDADES
5
ASOCIACIÓN ESTADÍSTICA
La idea de asociación / relación entre variables
se define por lo general en oposición al de
independencia
estadística
y
se
evalúa
examinando el sentido y la fuerza de las
regularidades empíricas
“Las variables X e Y (sexo y condición de
actividad)
son
estadísticamente
independientes si el porcentaje de
observaciones que poseen el atributo Y1
(activo) es el mismo entre X1 (hombres)
que entre X2 (mujeres)”.
6
UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA
A MODO DE EJEMPLO

“La participación en el mercado de trabajo está
condicionada por diversos factores económicos,
sociales y culturales. […] La definición de los roles
masculinos y femeninos ubica a los varones como
principales responsables del sostén económico de
los hogares y […] directamente asociados al
mundo laboral […] Las mujeres […] como
principales responsables de las tareas de
reproducción social en el ámbito doméstico”1.
1.- Drake, I y Philipp, E. (1997)
7
UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA
A MODO DE EJEMPLO
Hipótesis de Trabajo:

“Dentro de la población de 25 a 45 años los
varones tendrán una tasa de actividad
significativamente más alta que las mujeres”
Sexo: Varón (V) – Mujer (M)
Condición de Actividad: Activo (A) – Inactivo (I)
V
A
M
IoA
8
UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA
A MODO DE EJEMPLO
Hipótesis Nula de Independencia Estadística
“Dentro de la población de 25 a 45 años la tasa de
actividad no presentará diferencias por sexo”
Sexo: Varón (V) – Mujer (M)
Condición de Actividad: Activo (A) – Inactivo (I)
V
IoA
M
IoA
9
ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA
A MODO DE EJEMPLO
ESTANDARIZACIÓN POR MEDIO DE PORCENTAJES
P EA * S exo C ro ss tab u la tion
Sintaxis:
S exo
V arón
P EA
A ctivo
Inactivo
T otal
abs .
M ujer
T otal
2656 323
2043 538
4699 861
% fila
56,5%
43,5%
100,0%
% Co l
95,2%
65,6%
79,6%
% T otal
45,0%
34,6%
79,6%
abs .
1339 73
1073 401
1207 374
% fila
11,1%
88,9%
100,0%
% Co l
4,8%
34,4%
20,4%
% T otal
2,3%
18,2%
20,4%
2790 296
3116 939
5907 235
% fila
47,2%
52,8%
100,0%
% Co l
100,0%
100,0%
100,0%
47,2%
52,8%
100,0%
abs .
% T otal
TEMPORARY .
SELECT IF (h12>25 AND h12<45) .
CROSSTABS
/TABLES=cdea BY h13
/FORMAT= AVALUE TABLES
/CELLS= COUNT COLUMN ROW TOTAL .
Valores absolutos
Porcentaje fila
Porcentaje columna
Porcentaje total
10
ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA
A MODO DE EJEMPLO
ANÁLISIS COMPARATIVO DE DEPORCENTAJES
P EA * Se xo C ro sst ab u la tio n
S exo
V arón
P EA
A ctivo
Co unt
% within Se xo
Inac tiv o
Co unt
% within Se xo
T otal
Co unt
% within Se xo
M ujer
T otal
265 6323
204 3538
469 9861
95,2%
65,6%
79,6%
133 973
107 3401
120 7374
4,8%
34,4%
20,4%
279 0296
311 6939
590 7235
100 ,0 %
100 ,0 %
100 ,0 %
Pero sólo se llega a los
máximos en las
hipótesis diagonales
Diferencia porcentual:
29,6 p.p.
Intervalo:
máximo asociación positiva de 100
independencia estadística 0
máxima asociación negativa -100
11
ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA
A MODO DE EJEMPLO
ANÁLISIS DE FRECUENCIAS ESPERADAS VERSUS
FRECUENCIAS OBSERVADAS
Frecuencias esperadas bajo el supuesto de independencia estadística:
PROBABILIDAD CONJUNTA DE QUE OCURRA a y b
PEA * Sexo Crosstabulation
Expected Count
E (v, a ) 
Sexo
Varón
PEA
Activo
Inactivo
Total
N (v ) * N (a )
N
Mujer
Total
2.219.990
2.479.871
4.699.861
570.306
637.068
1.207.374
2.790.296
3.116.939
5.907.235
Sintaxis:
CROSSTABS
/TABLES=cdea BY h13
/FORMAT= AVALUE TABLES
/CELLS= EXPECTED .
12
PRUEBA NO PARAMÉTRICA DE INDEPENDENCIA
ESTADÍSTICA
LAS PRUEBAS JI-CUADRADO PARA TABLAS DE CONTINGENCIA DE DOBLE
ENTRADA EVALÚA SI EXISTE ALGÚN TIPO DE DEPENDENCIA ENTRE LOS
VALORES DE DOS O MÁS VARIABLES OBSERVADAS: SI LOS VALORES DE
UNA CUALQUIERA DE LAS VARIABLES APORTAN INFORMACIÓN SOBRE
LOS VALORES DE LA/S OTRA/S. SUPUESTO QUE ASÍ FUERA RESULTARÁ
DE INTERÉS MEDIR EL GRADO Y TIPO DE DEPENDENCIA O ASOCIACIÓN.
Prueba
Ji-cuadrado de
Pearson
Descripción
Determinar si las diferencias entre las
frecuencias observadas en la tabla de
contingencia corresponde al cruce de los
valores de las dos variables y las
frecuencias esperadas, supuesto que las
variables son independientes, son
estadísticamente significativas.
13
PRUEBA DE HIPÓTESIS JI-CUADRADA
x 
2

k
i 1
(O i  E i )
2
Ei
14
PRUEBA DE HIPÓTESIS JI-CUADRADA
A MODO DE EJEMPLO
Chi-Square Tests
Value
Pearson Chi-Square
N of Valid Cases
As ymp. Sig.
(2-sided)
df
2029,509b
1
,000
15109
b. 0 cells (,0%) have expected count less than 5. The minimum expected count
is 1538,23.
15
Descargar

Seminario.......