GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)
En el módulo NIPALS Algorithm
Si la respuesta es categórica
Para hacer crossvalidations; cambiamos los valores V-fold:
V value: indicando el número de particiones (folds)
Seed: ese número para seleccionar diferentes grupos de muestras al azar
… lo demás, mejor lo dejamos tal y como está por defecto
Solapa Quick
Resultado de la crossvalidación.
NS indica que esa componente
(la última) ya no es significativa.
La podemos quitar con el botón
rectangular “Remove last”.
Para la cuantificación de cómo
de “ruidosas” son las diferentes
unidades muestrales (separación
de los patrones de covariación
definidos por el PLS)
Solapa Advanced
Para interpretar el significado de
las componentes elegidas
atendiendo a las variables X’s e Y’s
(si hay varias variables respuesta)
Para una estima de ‘outliers’
en las variables X’s e Y’s
Para estimar las posiciones de las
muestras (casos) en cada
componente
Para obtener las predicciones (¡ojo! escaladas partiendo de las Y’s originales a media=0 y sd=1) del
modelo teniendo en cuenta las componentes seleccionadas arriba.
El cuadrado de la desviación estándard de las predicciones coincide con la R2Y acumulada del modelo.
GUÍA PRÁCTICA PARA REALIZAR PLS’s EN TANAGRA
Segundo …
Vamos a la solapa de
complementos dentro de una
hoja de MS-Excel.
Seleccionamos TANAGRA y
Execute
Primero …
Seleccionamos nuestro
conjunto de datos dentro de
una hoja de MS-Excel.
Incluimos en la primera fila el
nomber de las variables
Al abrirse TANAGRA en una ventana independiente de programa …
Damos click en este icono ... y aparecerá debajo de Dataset
Simultáneamente
emergerá esta
ventana.
Seleccionaremos las
variables predictoras en el
panel izquierdo y con la
flecha roja las pasamos al
panel derecho INPUT.
Hacemos lo mismo para
la(s) respuesta(s) que
pasamos a TARGET.
click en OK.
Seleccionamos el
componente PLS
…
y dentro de éste la
opción PLSR.
A continuación damos click
con el botón derecho sobre
PLSR 1 y seleccionamos
Parameters…
Aparecerá una ventana
emergente con las solapas:
Parameters
Output
Report
Seleccionamos el número
de componente PLS
que queremos obtener
Marcamos las tres
opciones
Marcamos las cinco
opciones
…
y damos click en OK
Volvemos a dar click con el
botón derecho del ratón
sobre PLSR 1
…
y pulsamos Execute
¡¡ HECHO !!
… y los RESULTADOS SON:
En Component podemos seleccionar
Copy results
para copiar todos los resultados y pegarlos en
MS-Excel o el programa de texto que queramos
Explicación de la variable respuesta Y
por las sucesivas componentes o
Latent Factors
Current: por esa componente
Cumulative: acumulado (1, 1+2, 1+2+3, …)
Retención de información de las variables predictoras X’s por
las sucesivas componentes o Latent Factors
Current: por esa componente
Cumulative: acumulado (1, 1+2, 1+2+3, …)
… y los RESULTADOS SON:
Con Wh tenemos los pesos
Cuyos cuadrados dentro de
cada componente suman 1
y nos indican su contenido
informativo en esa componente
afectando a la respuesta Y
Con VIP tenemos una indicación de cómo
varía la importancia de cada variable en
la secuencia de componentes
Factor 1 … solo considera F1
Factor 2 … considera el conjunto de F1 y F2
Factor 3 … considera el conjunto de F1, F2 y F3
…..
Volvemos a dar al icono de Define status
para abrir otra opción de selección de datos
aplicable a PLSR 1
… y los RESULTADOS SON:
Seleccionamos con el botón derecho
Parameters
Luego nos vamos al componente Data visualization
y seleccionamos el módulo View dataset
…
que arrastramos sin soltarlo hasta colgarlo de
Define status 2
Para acabar damos doble click en View dataset
… y a continuación veremos las
variables continuas (C) que se refieren
a las componentes Y (Utilde)
o de las X’s (las t).
… y los RESULTADOS SON:
Nos sale una ventana azul cobalto con los datos
Que podemos de nuevo copiar para
pegarlos en MS-Excel o el programa
de texto que queramos
… y los RESULTADOS SON:
Seleccionamos otra opción de análisis dentro del componente PLS llamada
PLS Selección que arrastramos sin soltar hasta colgarla del análisis PLSR 1
… y los RESULTADOS SON:
Con el botón derecho sobre PLS Selection 1 entramos en Parameters
… y los RESULTADOS SON:
Seleccionamos el número
de grupos (#folds) para la
crosvalidación
5, 10, …
Seleccionamos la regla de parada
Q2 para elegir las componentes
significativas teniendo en cuenta su
robustez y reproducibilidad
… y los RESULTADOS SON:
Damos doble click … y sale …
… y los RESULTADOS SON:
El número de componentes significativas es …
Sólo una (la primera) es
Significativa atendiendo a la
robustez del significado de
las componentes construidas
con las variables X’s.
Pero por si acaso …
podemos quedarnos con las
dos primeras y valorar como
de significativas son las
relaciones
U1 con T1
U2 con T2
… y los RESULTADOS SON:
Una regresión múltiple con la respuesta Y y las dos componentes X’s t1 y t2
puede efectuarse con el módulo “Multiple linear regression” dentro del
componente Regression.
Ambas componentes son
muy significativas
Descargar

Diapositiva 1 - Atlas Virtual de las Aves Terrestres de