perfSONAR en
LHC
[email protected]
Indice
1. Qué es perfSONAR
2. Objetivos de diseño
3. Principales servicios de perfSONAR
4. Ejemplo de interacción de un cliente
5. Herramientas de diagnóstico
6. Arquitectura global perfSONAR-LHC
7. Despliegue perfSONAR en Tier1
8. Despliegue perfSONAR en Tier2
9. Arquitectura LHC en España
10.¿Dónde medimos?
11.¿Cómo medimos?
12.¿Cómo es perfSONAR?
Qué es perfSONAR
1. Es una infraestructura dedicada a la
monitorización del rendimiento de la red
2. Permite solucionar problemas extremo a
extremo en conexiones que atraviesan varios
dominios de red
3. Contiene un conjunto de servicios dedicados a
realizar medidas de rendimiento en entornos
federados
4. Tiene 3 contextos diferenciados
1.
2.
3.
Es un consorcio de organizaciones que buscan
construir una infraestructura de medida de
rendimiento de red interoperable entre múltiples
dominios de red
Es un protocolo basado en SOAP XML
Es un conjunto de paquetes de software
Objetivos de diseño
1. perfSONAR debe ser un despliegue abierto,
flexible, extensible y descentralizado
2. La arquitectura resultante debe ser:
1.
Sistema modular que permita la división en múltiples
componentes
2.
Sistema dinámico que permita eliminar y añadir
componentes durante en operación
3.
Sistema que permita a sus componentes y los Puntos
de Medición anunciar a los demás sus funcionalidades
4.
Sistema descentralizado, que permita a cada dominio
administrativo limitar las funcionalidades del sistema
en función de las necesidades
Objetivos de diseño II
5. Sistema escalable, que permita incorporar
múltiples redes, servicios, fuentes de
información y herramientas de monitorización
6. Sistema seguro que no pueda ser utilizado
para otros fines que para la monitorización
del rendimiento de la red
7. Sistema seguro, que no pueda provocar
congestión en las redes que monitoriza
8. Sistema con tolerancia a fallos, que no sea
inestable ante los posibles fallos de alguno de
sus componentes
9. Sistema que proporcione mensajes regulares
y claros en el caso de que se produzcan fallos
Principales servicios de perfSONAR
1. Measurement Point Service
1. Crea y/o publica la información de
monitorización relativa a las medidas activas
o pasivas
2. Measuremente Archive Service
1. Guarda y publica la información recibida por
los Measurement Point Services
3. Transformation Service
1. Proporciona la posibilidad de manipular
(agregar, concatenar, correlar, traducir) los
datos archivados de las medidas realizadas
Estos servicios están específicamente dedicados a tareas de medidas
de rendimiento y análisis de la red
Principales servicios de perfSONAR II
1. Lookup Service
1. Permite al cliente descubrir los servicios
existentes y otros LS
2. Topology Service
1. Permite que la información de la topología de
la red está disponible para los demás
servicios
2. Se encarga de encontrar al MP más cercano
3. Proporciona información de la topología de
red a las herramientas de visualización
3. Autentication Service
1. Controla el acceso a los servicios
Ejemplo de interacción de un cliente
¿Dónde consigo información Red A y Red B?
gLS
Gráfico
LS A, LS B
¿Utilización enlace – IPs a,b,c?
Cliente
a,b,c : Red A, MA A
Obtener utilización enlace a,b,c
Respuesta
LS A
a
MA A
LS B
b
e
c
Red A
MA B
d
Red B
f
Herramientas de diagnóstico
1.
pingER (latencia)
1.
2.
–
–
–
2.
Herramienta que realiza pings regularmente y almacena los
resultados
Proporciona:
Información de Disponibilidad
Referencia temporal sobre problemas
Visión preliminar sobre las razones de una degradación del
rendimiento
OWAMP (One Way Active Measurement Protocol)
1.
2.
–
–
–
–
Demonio que solicita y ejecuta pruebas de latencia en un
solo sentido
Proporciona:
Visión más exacta sobre la degradación de rendimiento
(dirección de la degradación, más sensible al jitter)
Visión acerca del routing (saltos, latencia en una dirección)
Información de Disponibilidad
Referencia temporal sobre problemas
Herramientas de diagnóstico II
3.
4.
BWCTL (BandWidth test ConTroLler)
1.
Demonio que solicita y ejecuta pruebas de iperf y que soporta
múltiples instancias
2.
Proporciona:
–
Detección de problemas ya que la herramienta hace un uso de la red
del mismo modo que lo haría un usuario
–
Archivado de pruebas realizadas con límite de tráfico alcanzado
–
Informa de cuándo los problemas de rendimiento comenzaron
NDT (Network Diagnostic Tool)
1.
Herramienta que desde un navegador web invoca un test de
diagnóstica avanzado
2.
Proporciona:
–
Informa por qué pueden existir problemas de rendimiento
–
Información de diagnóstico detallada que puede ser utilizada por los
ingenieros de red
–
Orientada a usuarios finales
Herramientas de diagnóstico III
5.
6.
7.
Estado de enlace o circuito
1.
Utilizando la herramienta más adecuada a cada caso (ej: SNMP)
2.
Se realiza un archivado de los diferentes estados (up/down) de los enlaces
más importantes
3.
Genera alarmas que avisan al NOC sobre las incidencias de circuitos
multidominio
SNMP MA (SNMP Measurement Archive)
1.
Almacena la información de errores y utilización de enlaces
2.
Simplifica los diagnósticos de problemas
3.
Proporciona una visión sobre los patrones de utilización de la red
CACTI
1.
Herramienta para generar gráficas de red basada en RRDTool
2.
Requiere:
–
SNMP
–
MySQL
–
PHP
3.
Gestión de usuarios y perfiles
Herramientas de diagnóstico IV
8.
9.
NPAD (Network Path and Application Diagnosis)
1.
Herramienta diseñada para realizar diagnósticos precisos sobre problemas en
la red de usuario y sistemas finales
2.
Pruebas realizadas desde un navegador web
3.
Genera un informe que enumera todos los problemas que afectan la descarga
de archivos de un sitio remoto
4.
El diagnóstico incluye una guía para los usuarios finales y administradores de
red para localizar la fuente de los problemas encontrados
Thrulay
1.
Se utiliza para medir capacidad, retardo y otras medidas del rendimiento de
una red enviando tráfico TCP o UDP sobre la misma
2.
Mediante TCP permite medir RTT Delay con Throughput
3.
Mediante UDP permite medir:
–
One-Way Delay
–
Paquetes perdidos
–
Paquetes duplicados
10. NTP (Network Time Protocol)
1.
Protocolo diseñado para sincronizar los relojes de los elementos de una red
2.
Se utiliza para realizar medidas de rendimiento con la mayor precisión
Arquitectura Global perfSONAR-LHC
CERN
T0
Tier 1
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier 1
Tier
2
Tier
2
Tier
2
Tier
2
Tier
2
Despliegue perfSONAR para LHC
Análisis
Interface de Usuario
Pruebas programadas
Almacenamiento de resultados
Demonios para diagnóstico
ICMP
Despliegue perfSONAR en Tier1
1. Despliegue en Tiers1 coordinado por DANTE
2. En España PIC-RedIRIS-DANTE
3. Prerequisitos para instalación
1.
•
•
•
•
•
•
•
Máquina HADES (OWAMP - IPPM)
Interfaz de gestión (100Mbps)
Interfaz de medida (100/1000Mbps)
Direccionamiento IPv4 para interfaces de gestión y
medida
Acceso HTTP y HTTPS a interfaz de gestión
Soporte IPv6
Acceso ssh
Para las medidas deben abrirse los puertos superiores
al 50000 (UDP)
Despliegue perfSONAR en Tier1 II
2.
Máquina BWCTL - Puede ser la misma que HADES
•
Interfaz de gestión (100Mbps)
•
Interfaz de medida (100/1000Mbps)
•
Direccionamiento IPv4 para interfaces de gestión y medida
•
Acceso HTTP y HTTPS a interfaz de gestión
•
Soporte IPv6
•
Acceso ssh
•
Puerto de control (4823) accesible
•
Para las medidas iperf deben abrirse los puertos superiores
al 5000
•
Se recomienda que el servicio BWCTL tenga salida
independiente del servicio HADES
•
NO se contempla como válido un servicio en el que los
servicios BWCTL y HADES utilicen la misma interfaz
Despliegue perfSONAR en Tier1 III
1. Conexiones de las máquinas (PC)
1. Interfaz de gestión RJ45
2. Interfaz de servicio HADES (100Mbps)
3. Interfaz de servicio BWCTL opcional
(100/1000Mbps)
4. Puerto BNC - conector de la tarjeta GPS
5. Puerto RS232
6. Fuente de alimentación 1
7. Fuente de alimentación 2 opcional
Despliegue perfSONAR en Tier1 IV
1. Descripción de las máquinas (PC)
1.
2.
3.
4.
5.
6.
7.
8.
Tamaño 3U
CPU 1x3.0GHz
Disco Duro 2xSATA 80GB
512 MB RAM
Tarjetas de red: 2x1Gbps en placa
BUS: 2x32, 2xPCI-X 64 Bit
Fuente de alimentación 460W
Tarjeta de Gestión remota: eRIC express
Despliegue perfSONAR en Tier2
1. Funcionalidad
1.
•
2.
•
•
•
3.
4.
•
•
•
Hosts con conectividad ICMP
Necesidad de hacer ping y traceroute
Demonios para diagnóstico de problemas
NDT
OWAMPD
BWCTLD
Registro de disponibilidad
Almacenamiento de datos
Pruebas realizadas regularmente (pingER, OWAMP,
BWCTL)
Estado de enlace/circuito
Utilización de enlaces/circuitos
Despliegue perfSONAR en Tier2 II
1. Recursos necesarios
1. Host accesible (firewall)
2. 2 Sistemas linux no muy sofisticados
3. Puede optarse por utilizar la misma
configuración HW de los Tier1
4. Se debe correr un demonio que registre la
disponibilidad de las herramientas al LS
global (gLS)
5. Espacio en disco para almacenamiento de
datos
6. Configuración para interactuar con la
infraestructura existente
Despliegue perfSONAR en Tier2 III
1. Requerimientos Hardware
1. 2 Sistemas linux no muy sofisticados (500 €
cada uno)
2. Diferenciar y aislar pruebas de rendimiento
de red de las pruebas de las aplicaciones
LHC propiamente dichas
3. 1 máquina para pruebas de latencia a poder
ser con ahorro de energía deshabilitado y en
condiciones ambientales controladas
–
2Ghz/1GB RAM/50GB HDD
–
Tarjeta de red 10/100/100
1. 1 máquina similar para pruebas de ancho de
banda
Arquitectura de LHC en España
TIER 2
USC
EB-Santander0
EB-Bilbao0
CESGA
TIER 2
TIER 1
IFCA
EB-Santiago0
TIER 2
PIC
Red Regional
UB
EB-Iris4
GW-Barcelona0
GW-Nacional2
Anella
GW-Madrid0
EB-Barcelona0
CAM
UAB
GW-Nacional1
GW-Valencia0
UAM
EB-Madrid0
TIER 2
TIER 2
EB-Iris2
CIEMAT
UV
TIER 2
TIER 2
GW-Sevilla0
TIER 2
SW-Tenerife2
UMA
UNICAN
EB-Tenerife0
TIER 2
¿Dónde medimos?
1. La medida debe contemplar todo el camino, debe
ser extremo a extremo. Esto es de usuario final a
usuario final
1.
2.
Medida entre Tier1 y RedIRIS
1.
Sondas o máquinas de medida en PIC
2.
Sondas o máquinas de medida en RedIRIS
Medida entre Tier2 y RedIRIS
1.
Sondas en cada Tier2
2.
Sonda en RedIRIS - Resuelto en 1
3.
Medida entre Tier2 y Tier1
4.
Medida entre Tier2 y Tier2
2. Redes Regionales. Si no despliegan perfSONAR
hay que saber cuándo un problema de
rendimiento está en ellas
¿Cómo medimos?
1. Utilizando las herramientas propocionadas en el paquete
perfSONAR.
2. Estableciendo un conjunto de parámetros de red necesarios
para que una aplicación determinada funcione
adecuadamente
3. Homogeneizando servicios perfSONAR en Tier2
4. Realizando un despliegue conjunto
5. Caracterizando la red (NREN, Tier1, Tier2, Red Regional??)
6. Utilizando la información recogida para su posterior análisis
y detección de problemas
7. Cuidado con los firewalls, deben permitir que las medidas se
realicen con propiedad
¿Cómo es perfSONAR?
¿Cómo es perfSONAR? II
¿Cómo es perfSONAR? III
¿Cómo es perfSONAR? IV
¿Cómo es perfSONAR? V
¿Preguntas?
www.rediris.es
Edificio Bronce
Plaza Manuel Gómez Moreno s/n
28020 Madrid. España
Tel.: 91 212 76 20 / 25
Fax: 91 212 76 35
www.red.es
30