Técnicas estadísticas multivariantes: de
la visualización al contraste de hipótesis
Técnicas multivariantes:
muestras
especies
aa
aa
b
bb
c
c
c
ordenación
matriz triangular de
similitudes
a
a
b
Ordenación y clasificación son
formas de explorar/visualizar las
relaciones de similitud entre
muestras/tratamientos/factores
b
c
clasificación
2
Clasificación (análisis clúster)
3
Clasificación (análisis clúster)
 Técnicas para agrupar/separar grupos de objetos (e.g.
muestras/especies) “en paquetes” basadas en su
similitud (se basan en índices de similitud)
 Genera en dendograma basado en una clasificación
generalmente jerárquica: pequeños grupos de objetos
(p.e. muestras/especies) dentro de grupos mayores y
estos a su vez dentro de grupos mayores; y
aglomerativa: se parte de tantas clases como objetos
tengamos que clasificar y en pasos sucesivos vamos
obteniendo clases de objetos similares
4
Clasificación: un ejemplo
Diseño experimental y análisis estadístico: su aplicación en biología marina
5
Clasificación: ¿merece la pena?
No sólo depende del tipo de distancia que
seleccionemos, sino tb de las muchos estrategias para
construir el dendograma. Y hay muchísimas¡
Escepticismo respecto a la clasificación
"The availability of computer packages of classification techniques
has led to the waste of more valuable scientific time than any other
statistical innovation (with the possible exception of multiple
regression techniques)." Cormack (1971) A review of classification.
Journal of the Royal Statistical Society A 134, 321-367.
Diseño experimental y análisis estadístico: su aplicación en biología marina
Un dendograma pueden ser re-estructurado alrededor
de cualquier intersección/nodo y objetos que aparecían
distantes pueden aparecer cerca
D
C
B
A
B
A
D
En estudios de ecología la mejor clasificación es una
ordenación
Diseño experimental y análisis estadístico: su aplicación en biología marina
C
 PCA/MDS/cluster son técnicas de visualización de
patrones: no permite contraste de hipótesis
 Necesidad de un test para contrastar las diferencias
entre grupos que acompañe a una técnica de
visualización de patrones
 Rutina ANOSIM
8
Por ejemplo, ¿diferencias entre tratamientos 1 y 2?
Ho = tratamientos son iguales
Ha = tratamientos NO son iguales
Tratamiento 1
Tratamiento 2
9
Ho = verdad
variabilidad entre tratamientos = o <
variabilidad dentro de cada tratamiento
10
Ha = verdad
variabilidad dentro de tratamientos <
variabilidad entre tratamientos
Diseño experimental y análisis estadístico: su aplicación en biología marina
11
ANOSIM
12
ANOSIM
Técnica de contraste hipotético que proporciona un pvalor para contrastar la hipótesis:
Ho = tratamientos son iguales
Ha = tratamientos NO son iguales
Podemos ejecutar tantos contraste como pares de
niveles queramos contrastar. Obtengo un estadístico
(R) y lo importante: un p-valor asociado
13
Rutina BIOENV (regresión múltiple
multivariante)
14
BIOENV
Análisis directo de gradientes: explicar la variabilidad de la matriz
Y (biótica) en términos de variables predictoras “Xs” (abiótica)
X (matriz abiótica)
Y (matriz biótica)
A
B réplica sp 1 sp 2 sp 3
sp 4 sp 5
sp n
A
B réplica V 1 V 2
V3
V4
A1 B1 1
…
…
…
…
…
…
A1 B1 1
…
…
…
…
A1 B1 2
…
…
…
…
…
…
A1 B1 2
…
…
…
…
A1 B2 1
…
…
…
…
…
…
A1 B2 1
…
…
…
…
A1 B2 2
…
…
…
…
…
…
A1 B2 2
…
…
…
…
A1 B3 1
…
…
…
…
…
…
A1 B3 1
…
…
…
…
A1 B3 1
…
…
…
…
…
…
A1 B3 1
…
…
…
…
A2 B1 1
…
…
…
…
…
…
A2 B1 1
…
…
…
…
A2 B1 2
…
…
…
…
…
…
A2 B1 2
…
…
…
…
A2 B2 1
…
…
…
…
…
…
A2 B2 1
…
…
…
…
A2 B2 2
…
…
…
…
…
…
A2 B2 2
…
…
…
…
A2 B3 1
…
…
…
…
…
…
A2 B3 1
…
…
…
…
A2 B3 2
…
…
…
…
…
…
A2 B3 2
…
…
…
…
15
RDA: cómo actúa
Problema:
colinealidad;
muchas
X
están
correlacionadas. Por ello, uso RDA siempre en
combinación la regresión multivariante múltiple para
seleccionar las X apropiadas (rutina/freeware DISTLM
que veremos en las prácticas) = buscar el modelo con
mayor “parsimonia”
16
Técnicas multivariantes:
resumiendo
Diseño experimental y análisis estadístico: su aplicación en biología marina
17
Variables (muestras)
Objetos
(especies)
aa
aa
b
bb
c
c
c
ordenación
matriz triangular de
similitudes
a
a
b
b
c
clasificación
18
Ordenación: casos tipo y sus diferencias
Similitudes
Objetivo/casos tipo
PCA
Distancia euclidiana
(asumo relación lineal
entre variables y ejes)
Visualización de diferencias entre muestras/tratamientos
usando variables abióticas/ambientales. Puedo saber el % de
variabilidad explicada por cada eje (componente)
nmMDS
Cualesquiera (no
asumo relación
lineal); trabajo con
rangos
Visualización de diferencias entre muestras/tratamientos
usando matrices bióticas: respuestas a nivel de comunidad
(datos se “portan muy mal”)
19
Ordenación: casos tipo y sus tests de contraste
PCA, nm-MDS, análisis
indirecto de gradientes
Test = ANOSIM
BIOENV – análisis
directo de
gradientes
Test = reg. múltiple
Multivariante
20
Descargar

Document