NC STATE
UNIVERSITY
Programa de Movilidad en Educación
Superior para América del Norte
Introducción a la Integración de Procesos para el
Control Ambiental en la Currícula de Ingeniería
MÓDULO 17: “Introducción al
Análisis Multivariable”
Elaborado en:
Ecole Polytechnique de Montreal &
North Carolina State University, 2003.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 3, Rev.: 4
2.4: Ejemplo (3)
Escalas de Tiempo más Cortas
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 3, Rev.: 4
Escalas de Tiempo más Cortas
En los dos ejemplos anteriores se usaron promedios diarios para
las 130 variables del proceso. Sin embargo, pudimos haber
escogido promedios semanales, mensuales u otras muchas
opciones.
Pudimos haber elegido también escalas de tiempo más cortas,
como promedios de 8 horas o 30 minutos. Obviamente, en cierto
punto el número de observaciones sería extremadamente
complicado de manejar. Por ejemplo, una hoja de cálculo de 3
años con promedios por minuto tendría más de un millón de
líneas.
Con el simple hecho de
elegir la escala de
tiempo, se influencian
los resultados del AMV.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Eligiendo una escala de tiempo
Lo primero que debemos de entender es qué escalas de tiempo
están disponibles. Para el proceso TMP que hemos estudiado, el
periodo de tiempo más corto posible entre dos valores registrados
es de 10 segundos (observe que no todas las etiquetas son
actualizados con la misma frecuencia).
1 year
1 mo.
1 wk.
24 h
Chips sampled
every 8 hours
8h
1h
10 min
1 min
10 s
Pulp sampled
every 2 hours
Varios valores clave, como las características de la pulpa y la
madera, son medidos sólo cada unas pocas horas, como se mostró
con anterioridad. Estas etiquetas no tendrán uso, o lo tendrán muy
poco en escalas de tiempo muy cortas.
CONCEPTO IMPORTANTE: Algunas variables pueden ser
estudiadas sólo en escalas de tiempo grandes,
dependiendo en su frecuencia de muestreo/registro.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Escalas de Tiempo más Cortas Posibles
Con propósito ilustrativo, usaremos la escala de tiempo más corta
posible en este ejemplo, que es de 10 segundos. Debido a que
algunas etiquetas son actualizadas con menos frecuencia,
emplearemos valores interpolados para todas las variables, que
pueden o no representar la realidad.
10 segundos
Para mantener manejable el tamaño de la base de datos, hemos
tomado estos datos en un periodo de 24 horas, que corresponde a
cerca de 9,000 observaciones. Ya que tenemos más de 100
etiquetas, el conjunto de datos resultante tiene alrededor de un
millón de valores.
Un millón de valores por día, para una sola sección del
proceso de producción de papel – si incluyéramos por
varios años toda la planta industrial, tendríamos que
analizar miles de millones de datos.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
ACP para un periodo completo de
24 horas
R2X(cum)
Q2(cum)
Jun 20 02(1). 10 segundos COMPLETO CON 45 min LAG.M1 (PCA-X), Sin Título
1.00
0.80
0.60
0.40
Comp No.
Comp[3]
Comp[2]
0.00
Comp[1]
0.20
Simca encontró
numerosos componentes
 3 retenidos
El ACP para un periodo completo de 24 horas muestra un
modelo fuerte, con un R2 acumulativo de más del 60%. Sin
embargo esto es engañoso. Como se muestra en la gráfica de
resultados, existe un importante proceso de desviación que
“tuerce” totalmente los resultados del AMV.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Proceso importante de desviación
segundos COMPLETO CON
Proceso importante de
desviación de 8h15 a 8h45
Una revisión de los datos originales indica que lo producción
cayó por debajo de 10 t/d durante un periodo de 10 minutos
(8:15 a 8:25). La causa fue una obstrucción importante en el
refinador conocida como “evento de alimentación desprevenida”,
que provoca que el motor del refinador se apague.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Exclusión del proceso de desviación
El proceso de desviación salta a la vista en una gráfica de resultados.
Esto significa que el proceso temporalmente fue a un “lugar”
radicalmente diferente o régimen de operación, donde las relaciones
entre las variables son diferentes.
Resalta como una
llama solar… o un
gesto de aprobación
Tratar de hacer ACP en varios regímenes de operación diferentes
simultáneamente es una pérdida de tiempo. El software tratará de
establecer correlaciones entre las diferentes variables, y si estas
correlaciones cambian abruptamente los resultados serán inservibles.
Para evitar este problema es necesario dividir las observaciones en
diferentes regímenes de operación, y estudiar cada régimen por
separado.
En este caso, removeremos el periodo de baja producción para prevenir
que “tuerza” el resto de los resultados.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
ACP con el proceso de
desviación removido
Removimos el periodo completo cuando el proceso fue perturbado
(8:10 a 8:45) e hicimos ACP al resto de las observaciones.
Jun 20 02(1). 10 seconds COMPLETE WITH 45 min LAG.M2 (PCA-X), Extreme outliers removed
R2X(cum)
Q2(cum)
1.00
0.80
0.60
0.40
C om p[3]
C om p[2]
0.00
C om p[1]
0.20
Comp No.
Interesante, los valores de R2 bajaron ligeramente. Esto debido a
que varias de las variables cambiaron abruptamente en conjunto
cuando el proceso fue parado, haciendo parecer a las variables
como si estuvieran “correlacionadas” entre sí.
Recuerde, el AMV no sabe nada acerca del proceso, sólo usa los
datos del mismo.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Gráfica de resultados de operación normal
Ahora que hemos removido las perturbaciones del proceso, la gráfica
de resultados toma una condición totalmente diferente.
Ahora es obvia la influencia del tiempo. Durante el periodo de 24
horas, el proceso “serpentea” alrededor del espacio multi
dimensional. Es un blanco móvil.
Mientras que la gráfica de resultados para
periodos largos promediados
generalmente parecen nubes, la gráfica
de resultados para escalas de tiempo
cortas parece una serpiente.
Casi todos los datos del proceso muestran esta característica,
porque el proceso real nunca está en estado estacionario. Los
sistemas de proceso de control están respondiendo constantemente
a perturbaciones externas, como cambios en la calidad de la
alimentación. La intervención del operador es otra fuente de
perturbación. Existen muchas otras. Una meta operativa es mantener
el “serpenteo” dentro de una zona deseable.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Gráfica de resultados mostrando la
tendencia del tiempo
segundos COMPLETO CON
Fin:
00:59
Inicio:
01:00
Tendencia
de tiempo
obvia…
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
¿Cuál es su importancia?
Este “serpenteo” del proceso con escalas de tiempo cortas es muy
importante. Esto no so observó cuando se usaron promedio diarios.
Al observar qué variables cambian con el tiempo, podemos entender
mucho mejor la dinámica del proceso. Una forma de hacer esto es
comparar las gráficas de contribución (como se vio en el Ejemplo 2)
a diferentes tiempos.
Las gráficas de contribución para los puntos de inicio y fin del
periodo de 24 horas se muestran en la siguiente página. Obviamente
es imposible leer los nombres de las variables, pero ese no es el
punto. Sólo observe la gráfica de barras. Es muy diferente, indicando
un cambio continuo en el régimen de operación desde el inicio hasta
el fin.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Jun 20 02(1). 10 seconds COMP LETE W ITH 45 m in LA G. M3 (P CA-X), M ore extrem e outliers removed
S core Cont rib(Obs 7910 - Average), Wei ght= p1p2
33LI214.AI
52FFC117.PV
52FFC166.PV
52FIC115.PV
52FIC116.PV
52FIC154.PV
52FIC164.PV
52FIC165.PV
52FIC167.PV
52FIC177.PV
52HIC812.PV
52IIC128.PV
52IIC178.PV
52JCC139.PV
52JI189.AI
52JIC139.AI
52LIC106.PV
52PCA111.PV
52PCA161.PV
52PCB111.PV
52PCB161.PV
52PIC105.PV
52PIC159.PV
52PIC705.PV
52PIC961.PV
52SIC110.PV
52SQ I110.AI
52TI011.AI
52TI031.AI
52TI118.AI
52TI168.AI
52TIC010.CO
52TIC793.PV
52XAI130.AI
52XIC130.AI
52XIC180.AI
52XPI130.AI
52XQ I195.AI
52ZIC147.PV
52ZIC148.PV
52ZIC197.PV
52ZIC198.PV
53AI034.AI
53FFC455.PV
53FI012.AI
53HIC762.PV
53LIC011.PV
53LIC301.PV
53NI716.AI
53NIC013.PV
53PIC210.PV
53PIC305.PV
53PIC308.PV
53PIC309.PV
53WI012.AI
Pex_L1_Blan
Pex_L1_Cons
Pex_L1_CSF
Pex_L1_LMF
Pex_L1_P200
Pex_L1_PFC
Pex_L1_PFL
Pex_L1_PFM
Pex_L1_R100
Pex_L1_R14
Pex_L1_R28
Pex_L1_R48
53LIC510.PV
52FR960.AI
52FRA703.AI
52KQ C139.AI
52KQ
C189.AI
52PI128.AI
52PI178.AI
52PI706.AI
52PIA143.AI
52PIA193.AI
52PIB143.AI
52PIB193.AI
52PIP143.AI
52PIP193.AI
52SI055.AI
52SIA110.AI
52TIC102.PV
52TIC711.PV
52TR964.AI
52XIC811.PV
52X_130.AI_sp
lit_L1.
52ZI144.AI
52ZI194.AI
53AIC453.PV
53LR405.AI
53LV301.AI
53NIC100.PV
85LCB320.AI
Score Contrib( O bs 7910 - Average), Weight=p1p2
Jun 20 02(1). 10 s ec onds COMP LETE W ITH 45 m in LA G. M3 (P CA-X), M ore ex trem e outl iers removed
S core Cont rib(Obs 457 - A verage), W ei ght= p1p2
33LI214.AI
52FFC117.PV
52FFC166.PV
52FIC115.PV
52FIC116.PV
52FIC154.PV
52FIC164.PV
52FIC165.PV
52FIC167.PV
52FIC177.PV
52HIC812.PV
52IIC128.PV
52IIC178.PV
52JCC139.PV
52JI189.AI
52JIC139.AI
52LIC106.PV
52PCA111.PV
52PCA161.PV
52PCB111.PV
52PCB161.PV
52PIC105.PV
52PIC159.PV
52PIC705.PV
52PIC961.PV
52SIC110.PV
52SQI110.AI
52TI011.AI
52TI031.AI
52TI118.AI
52TI168.AI
52TIC010.CO
52TIC793.PV
52XAI130.AI
52XIC130.AI
52XIC180.AI
52XPI130.AI
52XQI195.AI
52ZIC147.PV
52ZIC148.PV
52ZIC197.PV
52ZIC198.PV
53AI034.AI
53FFC455.PV
53FI012.AI
53HIC762.PV
53LIC011.PV
53LIC301.PV
53NI716.AI
53NIC013.PV
53PIC210.PV
53PIC305.PV
53PIC308.PV
53PIC309.PV
53WI012.AI
Pex_L1_Blan
Pex_L1_Cons
Pex_L1_CSF
Pex_L1_LMF
Pex_L1_P200
Pex_L1_PFC
Pex_L1_PFL
Pex_L1_PFM
Pex_L1_R100
Pex_L1_R14
Pex_L1_R28
Pex_L1_R48
53LIC510.PV
52FR960.AI
52FRA703.AI
52KQC139.AI
52KQC189.AI
52PI128.AI
52PI178.AI
52PI706.AI
52PIA143.AI
52PIA193.AI
52PIB143.AI
52PIB193.AI
52PIP143.AI
52PIP193.AI
52SI055.AI
52SIA110.AI
52TIC102.PV
52TIC711.PV
52TR964.AI
52XIC811.PV
52X_130.AI_split_L1.
52ZI144.AI
52ZI194.AI
53AIC453.PV
53LR405.AI
53LV301.AI
53NIC100.PV
85LCB320.AI
Score Contrib( Obs 457 - Average), Weight=p1p2
Tendencia del tiempo dentro del proceso
01:00
Gráficas de contribución…
4
2
0
-2
V ar ID (Primary)
00:59
3
2
1
0
-1
-2
NAMP Módulo 17: “Introducción al Análisis Multivariable”
V ar ID (Primary)
Tier 3, Rev.: 4
Estudiando la “serpiente”
Para adquirir mayor conocimiento, podemos dar color a las
observaciones en la gráfica de resultados. Hicimos algo similar en el
Ejemplo 1, cuando dimos colores específicos a los días para mostrar
las temporadas. Esto es muy fácil de hacer con el software del AMV.
En este caso, hemos modificado la gráfica de resultados para
mostrar en qué rango caen las observaciones para una de las
variables. En este caso hemos elegido “freeness”, un parámetro
importante de calidad de la pulpa que el sistema de control trata de
mantener en un valor constante. Pudimos haber escogido cualquier
variable.
Observe que durante el curso del periodo de 24 horas, el freeness
empieza alto, luego baja, y luego vuelve a subir. Alguien con poco
conocimiento del proceso podría aprender de estos resultados.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Gráfica de resultados con
color para “freeness”
Exactamente la
misma gráfica,
pero con color
el “freeness”
de la pulpa
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Gráfica de resultados en 3-D
Componente 3
Componente 1
La misma
gráfica
mostrando el
3er componente
Componente 2
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
“Previsión” del AMV
Otro uso importante del AMV sobre las escalas de tiempo cortas es
predecir problemas antes de que se hagan más visibles.
La gráfica de residuos de la siguiente página, cuenta la historia
completa. ¿Recuerda que mencionamos que el refinador se apagó a
las 8:15 debido al bloqueo? Es obvio que el proceso se desvió
mucho antes de la operación normal. Los operadores tienden a
observar las útiles variables claves cuando monitorean el proceso,
pero el AMV observa todas las variables al mismo tiempo, y por lo
tanto, es mucho más sensitivo.
Una analogía sería un
sismómetro usado para
predecir las erupciones
volcánicas.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Un sismómetro es
extremadamente
sensible a las
vibraciones más
ligeras.
Ejemplo 3
Tier 3, Rev.: 4
Gráfica de residuos mostrando
la “previsión” del AMV
Construida hasta 8h15¡algo está pasando en el
proceso!
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Usando escalas de tiempo más cortas
Por ahora sería claro que hacer AMV en escalas de tiempo más cortas
es totalmente diferente a estudiar los promedios tomados por lapsos de
tiempo más largos. Otra vez, concluimos que la mejor solución es tratar
con varias aproximaciones diferentes. Ningún AMV por sí solo dará
todas las respuestas que estamos buscando.
Parte del poder de esta técnica es la forma completamente distinta en
que los resultados pueden ser obtenidos de la misma base de datos,
simplemente “cortando y tomando” los datos en distintas formas:
• Más largas vs. más cortas escalas de tiempo
• Más vs. menos variables
• ACP vs. PEL
El AMV es sólo una “caja negra”. Su uso DEBE
“Number Cruncher”
ser empleado para entender el proceso estudiado,
de otra forma el “number-crunching” no tendría sentido.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 3
Tier 3, Rev.: 4
Fin del Ejemplo 3:
Un paso a la vez…
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 3, Rev.: 4
Fin del Tier 2
¡Felicidades!
Este es el fin del Tier 2. Obviamente los detalles de estos ejemplos son
difíciles de comprender para un novato, pero por fortuna algunos de los
patrones generales empiezan a emerger. Un verdadero entendimiento
del AMV puede adquirirse sólo haciéndolo uno mismo, lo cual es el
propósito del Tier 3.
Todo lo que queda por completar es un pequeño quiz que se presenta
a continuación…
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 1:
¿Cuál es la diferencia entre etiqueta y variable?
a) La palabras “etiqueta” y “variable” son sinónimos.
b) Una etiqueta es un indicador de identidad o dirección,
mientras que una variable es un atributo del proceso.
c) Las etiquetas cambian con el tiempo, pero las variables son fijas.
d) Las variables miden atributos similares, mientras que las
etiquetas miden atributos distintos.
e) Respuestas (b) y (c).
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 2:
¿Promediar reduce o aumenta el ruido?
a)
b)
c)
d)
e)
Promediar aumenta el ruido significativamente.
Promediar aumenta el ruido, pero muy ligeramente.
Promediar no afecta al ruido.
Promediar reduce el ruido.
Promediar reduce el ruido, pero aumenta la probabilidad de
desviaciones.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 3:
¿Cuál es el peligro de interpolar entre lecturas que están muy
separadas en tiempo?
a) La interpolación dará mucho más peso a estas lecturas del que
merecen.
b) Los valores interpolados indicarán ligeras tendencias hacia
arriba y hacia abajo donde no hay ninguna tendencia.
c) El efecto de las desviaciones será el aumento en el doblez.
d) El ingeniero tendrá el falso sentimiento de comparar variables
que son similares, cuando en realidad son muy diferentes.
e) Todas las anteriores.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 4:
Si la interpolación es un problema, ¿por qué no podemos usar los
valores discretos?
a) Esto dará demasiado peso a los periodos con un gran
número de valores discretos.
b) Los valores discretos deben ser promediados para tener sentido.
c) Ninguna etiqueta es realmente discreta.
d) Los valores discretos no dependen del tiempo.
e) Respuestas (b) y (c).
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 5:
¿Cuál es la diferencia entre una demora de proceso y un retraso de
lectura?
a) Una es causada por el mismo proceso, la otra por los
instrumentos de medición.
b) Son lo mismo.
c) Una demora de proceso se debe al tiempo de residencia,
mientras que una lectura retrasada se debe al tiempo requerido
para el muestreo, medición y registro.
d) Una es más larga que la otra.
e) Respuestas (a) y (c).
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 6:
¿Por qué el software del AMV rechaza la variables que no cambian
suficiente con el tiempo?
a) Sólo las variables que son parte del “experimento” están
permitidas.
b) Las etiquetas cambian con el tiempo, pero estas variables son
fijas.
c) Hay insuficientes datos.
d) Si una variable no cambia con el tiempo, entonces, no
puede ser correlacionada con otras variables.
e) Ninguna de las anteriores.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 7:
¿Qué haría usted si sus ACP iniciales dan una gráfica de resultados
con dos nubes de datos distintas y separadas?
a) Estudiar cada nube de datos separadamente.
b) Tratar de determinar qué representan estas dos nubes.
c) Ignorar el primer componente, el cual es probablemente
introducido artificialmente por las dos nubes.
d) Realizar un AMV a todo el conjunto de datos.
e) Respuestas (a), (b) y (c).
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 8:
Su gráfica residual (“DModX”) muestra varias desviaciones
moderadas. ¿Qué haría usted?
a)
b)
c)
d)
e)
Removerlas y continuar.
Dejarlas y continuar.
Estudiar sus gráficas de contribución.
Observar los datos originales para tratar de determinar la causa.
Respuestas (c) y (d).
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Pregunta 9:
Dos variables están localizadas en las esquinas opuestas de su
gráfica de entradas de ACP (componentes 1 y 2). ¿Qué
concluye?
a)
b)
c)
d)
Estas variables no están correlacionadas entre sí.
Estas variables están correlacionadas negativamente entre sí.
Estas variables contribuyen al primer y segundo componente.
Estas variables no contribuyen ni al primer ni al segundo
componente.
e) Respuestas (b) y (c).
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
Tier 2 Quiz
Preguntas 10:
Teóricamente, ¿en promedio, qué proporción de los residuos deberían
estar arriba del 95% de la línea de confianza? (la línea roja en la
gráfica “DModX”)
a)
b)
c)
d)
e)
Exactamente el 0.05%
Exactamente 5%.
Más del 5%.
Menos del 5%.
Depende del conjunto de datos.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2 Quiz
Tier 3, Rev.: 4
TIER 3:
Problema Propuesto-Resuelto
(Open-Ended)
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 3, Rev.: 4
Tier 3: Objetivo
Tier 3: Objetivo:
La meta del Tier 3 es permitir finalmente al estudiante realizar el
AMV independientemente, en un contexto controlado. Al final del
Tier 3, el estudiante deberá saber cómo realizar los siguiente:
• Preparar una hoja de cálculo para usar en AMV
• Transferir la hoja de cálculo al software del AMV
• Organizar el conjunto de datos en el software del AMV
• Crear gráfica simples de ACP
• Identificar e investigar desviaciones grandes y moderadas
• Crear e interpretar gráficas complejas de ACP
Con el fin de evitar que el estudiante se pierda, cada uno de estos
pasos se subdivide en una serie de sub-pasos con instrucciones
claras.
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Tier 3: Contenido
El Tier 3 se subdivide en cuatro secciones:
3.1 Enunciado del Problema y Conjunto de Datos
3.2 Preparación e Importación de la Hoja de Cálculo
3.3 Resultados Iniciales del AMV
3.4 Desviaciones y Gráficas de AMV Más Elaboradas
A diferencia de las secciones anteriores, el Tier 3 no tiene quiz. El
estudiante deberá presentar los resultados del trabajo en un breve
reporte del proyecto (10-15 páginas).
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
3.1: Enunciado del Problema
y Conjunto de Datos
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Enunciado del Problema
Usted es el ingeniero de proceso en la planta de TMP de los
ejemplos del Tier 2. Su jefe, el gerente de la planta, quiere saber por
qué la pulpa tiene propiedades diferentes en el verano y en el
invierno.
Usted decide empezar por generar resultados de ACP para dos
conjuntos de datos diferentes, uno tomado durante el verano y otro
durante el invierno, y después compararlos entre sí.
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Conjunto de Datos Verano/Invierno
Después de hablar con los operadores, decide tomar dos semanas
completas de datos para 15 etiquetas clave, usando promedio de 1
hora.
Sus datos han sido transferidos por un técnico IT en un software
estándar de hojas de cálculos. Los dos archivos son:
• Datosverano.xls
• Datosinvierno.xls
¡Estos son los
archivos de datos
que va a usar!
Abre estos archivos y observa los datos. ¿Puede decir algo acerca
de la pregunta verano/invierno con sólo observar los datos?
¡Claro que no!
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
3.2: Preparación e Importación
de la Hoja de Cálculo
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Preparación de la hoja de cálculo
Como puede notar, la hoja de cálculo tiene dos nombres para cada
variable:
• Nombre largo descriptivo, y
• la “etiqueta” corta para la fácil identificación en las gráficas del AMV.
Queremos hacer algo similar con las observaciones individuales. La
denominación completa es muy larga, lo que hace que las gráficas
de resultados sean imposibles de leer. Además, ya sabemos de qué
mes y año se trata. Esta no es información útil. Por lo tanto,
debemos insertar una columna a la derecha de la denominación del
tiempo, que da el número de horas desde el inicio del periodo de dos
semanas.
Haga esto para las dos hojas de cálculo. Cuando lo haya hecho,
grávelas con un nuevo nombre.
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Importación de la hoja de cálculo
Estamos listos para “abrir” el software del AMV. Hágalo ahora.
Lo primero que debemos hacer es importar los datos. Vaya a
“Archivo: importar datos”, y seleccione el nuevo archivo renombrado
para verano.
El software le hará una serie de preguntas. Contéstelas de acuerdo a
las instrucciones de la Página 2 del archivo de la hoja de cálculo.
Uno de estos pasos involucra guardar el nuevo conjunto de datos
como un archivo de AMV.
Repita esta operación para la hoja de cálculo de invierno.
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
3.3: Resultados Iniciales del AMV
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Resultados iniciales del AMV
Re-abra el archivo verano y cree la siguiente gráfica:
• Gráfica de barras del modelo Copie con el click derecho e importe a un
archivo de procesador de palabras. Todas
estas gráficas deben aparecer en su
reporte.
¿Cuántos componentes sugiere el software? Normalmente para este
tipo de ejercicios iniciales, es normal usar 3 componentes. Elimine
los componentes que no vaya a utilizar.
Ahora cree las siguientes gráficas básicas de ACP:
• Gráficas de resultados: t(1) vs. t(2)
¿Qué nota en los resultados? ¡Así es!, no hay desviaciones grandes.
Ahora haga lo mismo con el conjunto de datos de invierno.
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
3.4: Desviaciones y Gráficas de
AMV Más Elaboradas
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Investigado las Desviaciones
Los datos de verano contienen un proceso de desviación importante
que es muy visible en la gráfica de resultados. Observando los datos
originales, trate de determinar la causa.
Una vez que esté satisfecho, remueva las desviaciones y guarde el
nuevo modelo.
Los datos de invierno parecen bien en la gráfica de resultados, pero
esa no es la historia completa. Genere la siguiente gráfica de
residuos:
• DModX
¿Qué observa? ¡Así es! No hay una desviación muy grande. Genere
la gráfica de contribución para investigar:
• Gráfica de contribución
¿Qué concluye? Remueva este punto y continúe.
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Comparación del Verano y el Invierno
Ahora estamos listos para comparar los resultados del verano e
invierno. Genere las siguientes gráficas de ACP:
• Gráfica de resultados: t(1) vs. t(2); t(1) vs. t(3); 3-D gráfica
• Gráfica de entradas: p(1) vs. p(2); p(1) vs. p(3); 3-D gráfica
¿Nota alguna diferencia significativa entre el verano y el invierno?
¡Claro que sí! ¿Cuáles?
Y, ¿qué sugiere esto acerca de la causa de las diferencias del
proceso en verano y en invierno?
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Haciendo sus conclusiones
Ahora tenemos algo que reportar al jefe…
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Más Gráficas Elaboradas de AMV
Para familiarizarse con algunas otras salidas del AMV, haga lo
siguiente para los conjuntos de datos de verano e invierno:
• DModX
• X/Y Gráfica de contribución
• Distribución de residuos
¡No adivine!
•…
•…
¿Qué le indican estas gráficas? No se preocupe en encontrar la
respuesta “correcta”, sólo trate de entender lo que estas gráficas
tratan de decirnos. Sin embargo, debe justificar su respuesta. No
adivine.
NAMP Módulo 17: “Introducción al Análisis Multivariable” Problema Propuesto Tier 3,
Rev.: 4
Fin del Tier 3
¡Felicidades!
Este es el fin del Módulo 17. Por favor entregue su reporte a su
profesor para que lo evalúe.
Estamos siempre abiertos a sugerencias para mejorar el curso. Puede
contactarnos en: www.namppimodule.org
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 3, Rev.: 4