4. Análisis de Correspondencias Múltiples
Generalización del ACS. Permite describir grandes tablas binarias,
referidas por ejemplo a ficheros de encuestas socio-económicas.
Líneas: individuos u observaciones.
Columnas: Modalidades de variables nominales.
El ACM es un Análisis de Correspondencias Simple aplicado, no a
tablas de contingencia sino a una tabla disyuntiva completa Z, en la
que para cada modalidad de cada variable hay sólo dos valores
posibles: 0 = el encuestado no contesta esa modalidad. 1= es la
respuesta elegida por él. Las propiedades de Z son interesantes y los
procedimientos de cálculo y sus reglas de interpretación de las
representaciones obtenidas son simples y específicas.
La mayoría de los ficheros de encuestas presentan las respuestas a
las preguntas bajo la forma de una tabla disyuntiva completa.
1
La tabla disyuntiva completa
La forma de la matriz Z (Tabla disyuntiva completa) será:
p
Z  (n, p)
0
1
0
0 0
1
0
00
0
1
0
0
0
1
0 0
0
1
01
0
0
0
0
0
0
1 1
0
0
10
1
0
0
1
0
0
0 0
0
0
00
0
0
1
Si hay alguna variable
continua, debe transformarse
en nominal, ordenándose en
intervalos a los que se da un
rango de valores.
Las frecuencias marginales de las líneas de la tabla disyuntiva
completa son iguales al número de preguntas, s, y las frecuencias
marginales de las columnas corresponden al número de sujetos que
han elegido la modalidad j de la pregunta q, por lo que para cada
subtabla, el número total de individuos es n.
En consecuencia, si para n individuos se dispone de respuestas
respecto a, por ejemplo, dos variables nominales que tienen
respectivamente p1 y p2 modalidades, entonces es equivalente
someter a un Análisis de Correspondencias Simples la tabla de
contingencia (p1, p2) y analizar la tabla binaria de n líneas y (p1 + p2)
columnas que describe las respuestas.
2
La tabla de Burt
A partir de la tabla disyuntiva completa se puede construir la tabla de
contingencia de Burt, B, que es una tabla simétrica de orden (p, p):
B = Z´Z
B es una yuxtaposición de tablas de contingencia y está formada de s2
bloques de la forma:
Cada bloque es una
p1
p2
ps
submatriz
formada
por
tablas
de
0
p1
0
contingencia de las
p2
variables dos a dos,
0
p
0
salvo los bloques
B = Z´Z =
que se están en la
0
ps
diagonal que son las
tablas
de
0
contingencia de cada
variable
consigo
misma.
p
3
Principios del análisis de correspondencias múltiples
Es el análisis de correspondencias de una tabla disyuntiva completa,
estudiándose la nube de los individuos y la nube de las modalidades.
Sus principios son, por tanto, los del análisis de correspondencias:
Iguales transformaciones de la tabla en los perfiles líneas y columnas
Igual criterio de ajuste con ponderación de los puntos por sus
frecuencias marginales
Igual distancia, la chi-cuadrado
Presenta propiedades particulares debido a la naturaleza misma de la
tabla disyuntiva completa.
La Tabla disyuntiva completa es equivalente a la tabla de Burt y
ambos producen los mismos factores
4
Caso:
Estudio de los turistas en función del lugar
de residencia, sexo y alojamiento
A partir de la base de
datos referida a los
turistas que vienen a
Tenerife, se quiere
estudiar la asociación
existente entre el
lugar donde residen
en la isla, el sexo y el
tipo de alojamiento en
el que se quedan, con
sus
respectivas
modalidades.
Residencia
Sexo
Alojamiento
Puerto Cruz
Hombre
Hotel 1 y 2 *
Sur
Mujer
Hotel 3 *
Hotel 4 *
Hotel 5 *
Aparthotel 1 y 2 *
Aparthotel 3 *
Aparthotel 4 y 5 *
Apartamento 1 ll
Apartamento 2 ll
Apartamento 3 ll
Apartamento 4 o 5 ll
T. sharing y Propiedad
5
Con estas tres variables se ha construido la tabla de Burt.
A partir de ella se ha creado una hoja de cálculo en spss (corres
multiple turismo.sav).
Residencia
TABLA DE BURT
Sexo
Alojamiento
Hotel
P. Cruz Sur Hombre Mujer
1y2*
Residencia
Puerto Cruz
Sur
Sexo
3*
4*
99
Apartamento
T. sh y Prop.
5* 1* y 2* 3* 4* y 5* 1 ll 2 ll 3 ll 4 o 5 ll
0
108
102
7
33
3
5 26
7
4
7
4
5
10
0 587
291
296
5
84 162 20
15 73
56
27
26
50
29
40
Hombre
108 291
399
0
7
51 133 12
11 51
31
18
12
32
20
21
Mujer
102 296
0
398
5
66 128 11
9 48
32
13
21
22
14
29
12
Hotel 1 y 2 *
Alojamiento
210
Aparthotel
7
5
7
5
Hotel 3 *
33
84
51
66
Hotel 4 *
99 162
0
0
0
0
0
0
0
0
0
0
0
0 117
0
0
0
0
0
0
0
0
0
0
133
128
0
0 261
0
0
0
0
0
0
0
0
0
Hotel 5 *
3
20
12
11
0
0
0 23
0
0
0
0
0
0
0
0
Aparthotel 1 y 2 *
5
15
11
9
0
0
0
0
20
0
0
0
0
0
0
0
26
73
51
48
0
0
0
0
0 99
0
0
0
0
0
0
Aparthotel 4 y 5 *
7
56
31
32
0
0
0
0
0
0
63
0
0
0
0
0
Apartamento 1 ll
4
27
18
13
0
0
0
0
0
0
0
31
0
0
0
0
Apartamento 2 ll
7
26
12
21
0
0
0
0
0
0
0
0
33
0
0
0
Apartamento 3 ll
4
50
32
22
0
0
0
0
0
0
0
0
0
54
0
0
5
29
20
14
0
0
0
0
0
0
0
0
0
0
34
0
10
40
21
29
0
0
0
0
0
0
0
0
0
0
0
50
Aparthotel 3 *
Apartamento 4 o 5 ll
T. sharing y Propiedad
6
Resultados
Utilizaremos una tabla de Burt.
Con ella se podrán obtener las puntuaciones (distancias al
centro de gravedad), contribuciones absolutas de cada
modalidad y variable a los ejes o factores obtenidos
(contribución de cada modalidad o variable a la inercia de los
nuevos ejes) y contribuciones relativas o correlaciones de cada
modalidad con los nuevos ejes.
El número de ejes considerado fue de 2.
Como en la Tabla de Burt las filas y las columnas representan
las mismas modalidades, el estudio de ambas ofrece iguales
resultados, por lo que sólo presentaremos los de las filas.
Para la resolución en el SPSS, en primer lugar hay que
introducir los datos de la misma forma que en el análisis de
correspondencias simples, creando por tanto tres variables. Las
dos primeras corresponden a los rangos de todas las
modalidades y, en la tercera, se incluirán las frecuencias
conjuntas de los pares de modalidades, las cuales funcionarán
como ponderaciones.
7
Los valores singulares, inercia, porcentajes de varianza explicada y sus
acumulados fueron:
Proporción de inercia
Dimensión
1
2
3
4
5
6
7
8
9
10
11
12
13
Total
Valor propio
0,4176
0,3708
0,3333
0,3333
0,3333
0,3333
0,3333
0,3333
0,3333
0,3333
0,3333
0,2966
0,2482
Inercia
0,1744
0,1375
0,1111
0,1111
0,1111
0,1111
0,1111
0,1111
0,1111
0,1111
0,1111
0,0880
0,0616
1,4615
Chi-cuadrado
10483,6594
Sig.
0,0000
Explicada
0,1193
0,0941
0,0760
0,0760
0,0760
0,0760
0,0760
0,0760
0,0760
0,0760
0,0760
0,0602
0,0422
1,0000
Acumulada
0,1193
0,2134
0,2894
0,3655
0,4415
0,5175
0,5935
0,6696
0,7456
0,8216
0,8976
0,9578
1,0000
1,0000
Confianza para el Valor propio
Correlación
Desviación típica
2
0,0112
0,1794
0,0117
Los valores singulares son los valores propios que se obtendrían si
hubiéramos partido de una tabla disyuntiva completa, cuyo cuadrado es igual a
la Inercia o valores propios resultantes de la matriz de Burt.
En el Análisis de Correspondencias Múltiples, los porcentajes de varianza
explicada suelen ser pequeños para cada eje y no se pueden explicar de igual
forma que en el análisis de correspondencias simples.
8
Examen de los puntos
Las distancias de las modalidades, mientras más alejadas se
encuentren del origen, mejor representados estarán. Mientras
más alejadas estén las modalidades entre sí en el gráfico
menos asociación existirá entre ellas y cuanto más cercanas,
más asociación existirá entre ellas.
La contribución de los puntos a la inercia de cada dimensión o
contribución de cada una de las filas a la inercia o varianza
explicada en cada uno de los ejes considerados
La contribución de las dimensiones a la inercia de cada punto.
Se refiere a la correlación existente entre cada uno de los
caracteres y los nuevos ejes.
A continuación se presentan los resultados y el diagrama de
dispersión de los dos ejes obtenidos.
9
Examen de los puntos de fila(a)
Puntuación
Contribución
dimensión
Modalidades
Masa
Inercia De puntos a inercia De dimensión a inercia
1
2
de la dimensión
del punto
1
2
1
2
Total
Puerto Cruz
0,0878
1,3235 -0,0499 0,0871
0,3684
0,0006 0,7377 0,0009 0,7386
Sur
0,2455
-0,4735 0,0179 0,0312
0,1318
0,0002 0,7377 0,0009 0,7386
Hombre
0,1669
0,0038 -0,7465 0,0562
0,0000
0,2507 0,0000 0,6135 0,6135
Mujer
0,1665
-0,0038 0,7483 0,0563
0,0000
0,2514 0,0000 0,6135 0,6135
Hotel 1 y 2*
0,0050
2,2753 -1,2916 0,1104
0,0622
0,0226 0,0983 0,0281 0,1264
Hotel 3
0,0489
0,1300 0,8489 0,0951
0,0020
0,0951 0,0036 0,1375 0,1411
Hotel 4*
0,1092
0,8233 -0,1887 0,0773
0,1772
0,0105 0,4000 0,0187 0,4187
Hotel 5*
0,0096
-0,9448 -0,2004 0,1082
0,0206
0,0010 0,0331 0,0013 0,0345
Aparh 1 y 2*
0,0084
-0,0944 -0,6479 0,1084
0,0002
0,0095 0,0003 0,0120 0,0123
Aparh 3*
0,0414
-0,0057 -0,1925 0,0973
0,0000
0,0041 0,0000 0,0058 0,0058
Aparh 4 y 5*
0,0263
-1,0830 0,2056 0,1034
0,0740
0,0030 0,1249 0,0040 0,1288
Apart 1 ll
0,0130
-0,9530 -0,9822 0,1073
0,0282
0,0337 0,0458 0,0432 0,0891
Apart 2 ll
0,0138
-0,3691 1,8511 0,1069
0,0045
0,1275 0,0073 0,1640 0,1714
Apart 3 ll
0,0226
-1,3432 -1,1078 0,1052
0,0976
0,0747 0,1617 0,0977 0,2594
Apart 4 o 5 ll
0,0142
-0,8247 -1,0939 0,1068
0,0232
0,0459 0,0378 0,0591 0,0969
T. sh y prop
0,0209
-0,4536 1,1095 0,1045
0,0103
0,0694 0,0172 0,0914 0,1086
Total activo
1,0000
1,4615
1,0000
1,0000
a
Normalización Simétrica
10
11
Eje 1:
Se contraponen los turistas que se quedan en el Puerto de la Cruz y que destacan por
alojarse en hoteles de 1, 2 y 4*, todos ellos en el lado positivo, a los turistas que van al
Sur y que se alojan en hoteles de 5*, aparthoteles de 4 y 5* y apartamentos de 1, 3, 4 y 5
llaves, todos ellos en el lado negativo.
Las variables con mayor contribución absoluta a la inercia del eje 1 son Puerto de la
Cruz, Sur y Hoteles de 4*.
Las variables más correlacionadas con el eje 1 son Puerto Cruz, Sur y Hoteles de 4*.
Eje 2:
Sobresalen en el lado positivo los turistas mujeres, que se alojan en hoteles de 3*,
apartamentos de dos llaves y Time sharing y propiedad, contraponiéndose a los turistas
hombres que se alojan en hoteles de 1 y 2*, apartamentos de 1, 3, 4 y 5 llaves, todas
ellas en el lado negativo.
Las variables con mayor contribución absoluta a la inercia del eje 2 son:
Hombres, mujeres y apartamentos de 2 llaves.
Las variables más correlacionadas con el eje 2 son hombre y mujer.
Por tanto, podemos decir que el eje 1 viene afectado por la variable lugar de
12
residencia, mientras que en el eje 2 influye la variable sexo.
CONCLUSIONES
En cuanto al lugar de residencia y al sexo de los turistas, éstos residen
en el Puerto de La Cruz y en el Sur, independientemente del sexo.
Las diferencias se encuentran en el tipo de alojamiento que utilizan. Así,
en el Puerto de la Cruz se caracterizan los que se quedan en hoteles de
4*, frente al Sur, que se caracterizan por alojarse en aparthoteles de 4 y
5* y en hoteles de 5*.En cuanto al tipo de alojamiento por sexo, las
mujeres se caracterizan por preferir especialmente los apartamentos de
2 llaves y el Time sharing y propiedad, frente a los hombres, que
prefieren especialmente los apartamentos de 1, 3, 4 y 5 llaves.
Nos referimos a que en esos tipos de alojamientos se diferencian
hombres y mujeres o Puerto de la Cruz y Sur.
13
Descargar

Transparencias Tema 4