1 / 30

perfSONAR en LHC

perfSONAR en LHC. alberto.escolano@rediris.es. Indice. Qu é es perfSONAR Objetivos de diseño Principales servicios de perfSONAR Ejemplo de interacci ón de un cliente Herramientas de diagn óstico Arquitectura global perfSONAR-LHC Despliegue perfSONAR en Tier1 Despliegue perfSONAR en Tier2

marcin
Télécharger la présentation

perfSONAR en LHC

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. perfSONAR en LHC alberto.escolano@rediris.es

  2. Indice Qué es perfSONAR Objetivos de diseño Principales servicios de perfSONAR Ejemplo de interacción de un cliente Herramientas de diagnóstico Arquitectura global perfSONAR-LHC Despliegue perfSONAR en Tier1 Despliegue perfSONAR en Tier2 Arquitectura LHC en España ¿Dónde medimos? ¿Cómo medimos? ¿Cómo es perfSONAR?

  3. Qué es perfSONAR • Es una infraestructura dedicada a la monitorización del rendimiento de la red • Permite solucionar problemas extremo a extremo en conexiones que atraviesan varios dominios de red • Contiene un conjunto de servicios dedicados a realizar medidas de rendimiento en entornos federados • Tiene 3 contextos diferenciados • Es un consorcio de organizaciones que buscan construir una infraestructura de medida de rendimiento de red interoperable entre múltiples dominios de red • Es un protocolo basado en SOAP XML • Es un conjunto de paquetes de software

  4. Objetivos de diseño • perfSONAR debe ser un despliegue abierto, flexible, extensible y descentralizado • La arquitectura resultante debe ser: • Sistema modular que permita la división en múltiples componentes • Sistema dinámico que permita eliminar y añadir componentes durante en operación • Sistema que permita a sus componentes y los Puntos de Medición anunciar a los demás sus funcionalidades • Sistema descentralizado, que permita a cada dominio administrativo limitar las funcionalidades del sistema en función de las necesidades

  5. Objetivos de diseño II • Sistema escalable, que permita incorporar múltiples redes, servicios, fuentes de información y herramientas de monitorización • Sistema seguro que no pueda ser utilizado para otros fines que para la monitorización del rendimiento de la red • Sistema seguro, que no pueda provocar congestión en las redes que monitoriza • Sistema con tolerancia a fallos, que no sea inestable ante los posibles fallos de alguno de sus componentes • Sistema que proporcione mensajes regulares y claros en el caso de que se produzcan fallos

  6. Principales servicios de perfSONAR • Measurement Point Service • Crea y/o publica la información de monitorización relativa a las medidas activas o pasivas • Measuremente Archive Service • Guarda y publica la información recibida por los Measurement Point Services • Transformation Service • Proporciona la posibilidad de manipular (agregar, concatenar, correlar, traducir) los datos archivados de las medidas realizadas Estos servicios están específicamente dedicados a tareas de medidas de rendimiento y análisis de la red

  7. Principales servicios de perfSONAR II • Lookup Service • Permite al cliente descubrir los servicios existentes y otros LS • Topology Service • Permite que la información de la topología de la red está disponible para los demás servicios • Se encarga de encontrar al MP más cercano • Proporciona información de la topología de red a las herramientas de visualización • Autentication Service • Controla el acceso a los servicios

  8. Ejemplo de interacción de un cliente ¿Dónde consigo información Red A y Red B? gLS Gráfico Cliente LS A, LS B ¿Utilización enlace – IPs a,b,c? a,b,c : Red A, MA A Obtener utilización enlace a,b,c Respuesta LS A LS B MA B MA A a b f e c d Red A Red B

  9. Herramientas de diagnóstico pingER (latencia) Herramienta que realiza pings regularmente y almacena los resultados Proporciona: Información de Disponibilidad Referencia temporal sobre problemas Visión preliminar sobre las razones de una degradación del rendimiento OWAMP (One Way Active Measurement Protocol) Demonio que solicita y ejecuta pruebas de latencia en un solo sentido Proporciona: Visión más exacta sobre la degradación de rendimiento (dirección de la degradación, más sensible al jitter) Visión acerca del routing (saltos, latencia en una dirección) Información de Disponibilidad Referencia temporal sobre problemas

  10. Herramientas de diagnóstico II BWCTL (BandWidth test ConTroLler) Demonio que solicita y ejecuta pruebas de iperf y que soporta múltiples instancias Proporciona: Detección de problemas ya que la herramienta hace un uso de la red del mismo modo que lo haría un usuario Archivado de pruebas realizadas con límite de tráfico alcanzado Informa de cuándo los problemas de rendimiento comenzaron NDT (Network Diagnostic Tool) Herramienta que desde un navegador web invoca un test de diagnóstica avanzado Proporciona: Informa por qué pueden existir problemas de rendimiento Información de diagnóstico detallada que puede ser utilizada por los ingenieros de red Orientada a usuarios finales

  11. Herramientas de diagnóstico III Estado de enlace o circuito Utilizando la herramienta más adecuada a cada caso (ej: SNMP) Se realiza un archivado de los diferentes estados (up/down) de los enlaces más importantes Genera alarmas que avisan al NOC sobre las incidencias de circuitos multidominio SNMP MA (SNMP Measurement Archive) Almacena la información de errores y utilización de enlaces Simplifica los diagnósticos de problemas Proporciona una visión sobre los patrones de utilización de la red CACTI Herramienta para generar gráficas de red basada en RRDTool Requiere: SNMP MySQL PHP Gestión de usuarios y perfiles

  12. Herramientas de diagnóstico IV NPAD (Network Path and Application Diagnosis) Herramienta diseñada para realizar diagnósticos precisos sobre problemas en la red de usuario y sistemas finales Pruebas realizadas desde un navegador web Genera un informe que enumera todos los problemas que afectan la descarga de archivos de un sitio remoto El diagnóstico incluye una guía para los usuarios finales y administradores de red para localizar la fuente de los problemas encontrados Thrulay Se utiliza para medir capacidad, retardo y otras medidas del rendimiento de una red enviando tráfico TCP o UDP sobre la misma Mediante TCP permite medir RTT Delay con Throughput Mediante UDP permite medir: One-Way Delay Paquetes perdidos Paquetes duplicados NTP (Network Time Protocol) Protocolo diseñado para sincronizar los relojes de los elementos de una red Se utiliza para realizar medidas de rendimiento con la mayor precisión

  13. C E R N T 0 T i e r 1 T i e r 1 T i e r 1 T i e r 1 T i e r 1 T i e r 1 T i e r 1 T i e r 1 T i e r 1 T i e r 1 T i e r 1 T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r T i e r 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Arquitectura Global perfSONAR-LHC

  14. Despliegue perfSONAR para LHC Análisis Interface de Usuario Pruebas programadas Almacenamiento de resultados Demonios para diagnóstico ICMP

  15. Despliegue perfSONAR en Tier1 • Despliegue en Tiers1 coordinado por DANTE • En España PIC-RedIRIS-DANTE • Prerequisitos para instalación • Máquina HADES (OWAMP - IPPM) • Interfaz de gestión (100Mbps) • Interfaz de medida (100/1000Mbps) • Direccionamiento IPv4 para interfaces de gestión y medida • Acceso HTTP y HTTPS a interfaz de gestión • Soporte IPv6 • Acceso ssh • Para las medidas deben abrirse los puertos superiores al 50000 (UDP)

  16. Máquina BWCTL - Puede ser la misma que HADES Interfaz de gestión (100Mbps) Interfaz de medida (100/1000Mbps) Direccionamiento IPv4 para interfaces de gestión y medida Acceso HTTP y HTTPS a interfaz de gestión Soporte IPv6 Acceso ssh Puerto de control (4823) accesible Para las medidas iperf deben abrirse los puertos superiores al 5000 Se recomienda que el servicio BWCTL tenga salida independiente del servicio HADES NO se contempla como válido un servicio en el que los servicios BWCTL y HADES utilicen la misma interfaz Despliegue perfSONAR en Tier1 II

  17. Despliegue perfSONAR en Tier1 III • Conexiones de las máquinas (PC) • Interfaz de gestión RJ45 • Interfaz de servicio HADES (100Mbps) • Interfaz de servicio BWCTL opcional (100/1000Mbps) • Puerto BNC - conector de la tarjeta GPS • Puerto RS232 • Fuente de alimentación 1 • Fuente de alimentación 2 opcional

  18. Despliegue perfSONAR en Tier1 IV • Descripción de las máquinas (PC) • Tamaño 3U • CPU 1x3.0GHz • Disco Duro 2xSATA 80GB • 512 MB RAM • Tarjetas de red: 2x1Gbps en placa • BUS: 2x32, 2xPCI-X 64 Bit • Fuente de alimentación 460W • Tarjeta de Gestión remota: eRIC express

  19. Despliegue perfSONAR en Tier2 • Funcionalidad • Hosts con conectividad ICMP • Necesidad de hacer ping y traceroute • Demonios para diagnóstico de problemas • NDT • OWAMPD • BWCTLD • Registro de disponibilidad • Almacenamiento de datos • Pruebas realizadas regularmente (pingER, OWAMP, BWCTL) • Estado de enlace/circuito • Utilización de enlaces/circuitos

  20. Despliegue perfSONAR en Tier2 II • Recursos necesarios • Host accesible (firewall) • 2 Sistemas linux no muy sofisticados • Puede optarse por utilizar la misma configuración HW de los Tier1 • Se debe correr un demonio que registre la disponibilidad de las herramientas al LS global (gLS) • Espacio en disco para almacenamiento de datos • Configuración para interactuar con la infraestructura existente

  21. Despliegue perfSONAR en Tier2 III • Requerimientos Hardware • 2 Sistemas linux no muy sofisticados (500 € cada uno) • Diferenciar y aislar pruebas de rendimiento de red de las pruebas de las aplicaciones LHC propiamente dichas • 1 máquina para pruebas de latencia a poder ser con ahorro de energía deshabilitado y en condiciones ambientales controladas • 2Ghz/1GB RAM/50GB HDD • Tarjeta de red 10/100/100 • 1 máquina similar para pruebas de ancho de banda

  22. IFCA USC CIEMAT UMA CESGA UNICAN UV Arquitectura de LHC en España TIER 2 TIER 2 EB-Santander0 EB-Bilbao0 TIER 1 EB-Santiago0 TIER 2 PIC UB Red Regional EB-Iris4 GW-Barcelona0 Anella GW-Nacional2 GW-Madrid0 EB-Barcelona0 CAM UAB GW-Nacional1 GW-Valencia0 TIER 2 UAM EB-Madrid0 TIER 2 TIER 2 EB-Iris2 TIER 2 TIER 2 GW-Sevilla0 TIER 2 SW-Tenerife2 EB-Tenerife0

  23. ¿Dónde medimos? • La medida debe contemplar todo el camino, debe ser extremo a extremo. Esto es de usuario final a usuario final • Medida entre Tier1 y RedIRIS • Sondas o máquinas de medida en PIC • Sondas o máquinas de medida en RedIRIS • Medida entre Tier2 y RedIRIS • Sondas en cada Tier2 • Sonda en RedIRIS - Resuelto en 1 • Medida entre Tier2 y Tier1 • Medida entre Tier2 y Tier2 • Redes Regionales. Si no despliegan perfSONAR hay que saber cuándo un problema de rendimiento está en ellas

  24. ¿Cómo medimos? Utilizando las herramientas propocionadas en el paquete perfSONAR. Estableciendo un conjunto de parámetros de red necesarios para que una aplicación determinada funcione adecuadamente Homogeneizando servicios perfSONAR en Tier2 Realizando un despliegue conjunto Caracterizando la red (NREN, Tier1, Tier2, Red Regional??) Utilizando la información recogida para su posterior análisis y detección de problemas Cuidado con los firewalls, deben permitir que las medidas se realicen con propiedad

  25. ¿Cómo es perfSONAR?

  26. ¿Cómo es perfSONAR? II

  27. ¿Cómo es perfSONAR? III

  28. ¿Cómo es perfSONAR? IV

  29. ¿Cómo es perfSONAR? V

  30. ¿Preguntas? www.rediris.es

More Related