Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Descripción general de J-Insight Device Monitor

A medida que las redes se vuelven cada vez más complejas, la necesidad de adoptar características que simplifiquen el proceso de supervisión, mantenimiento y mejora del estado general de los dispositivos de red se vuelve cada vez más crítica para ofrecer servicios de una manera más predecible y manejable.

J-Insight es una solución de monitoreo de dispositivos basada en datos que proporciona visibilidad e información sobre el estado de un sistema en ejecución. A partir de Junos OS versión 18.2R1, el marco J-Insight facilita la supervisión en tiempo real de los recursos del sistema para FPC FRU. También se ha integrado con la infraestructura existente de administración de errores de conectividad para normalizar la detección, el monitoreo y la generación de informes de errores. El objetivo a largo plazo para el diseño arquitectónico del monitor de dispositivo J-Insight se muestra en la Figura 1.

Figura 1: Arquitectura de alto nivel a largo plazo para J-Insight Long-term High-level Architecture for J-Insight

J-Insight es una aplicación de sistema local que utiliza la interfaz de telemetría de Junos para recopilar continuamente datos que reflejan el estado actual y el estado del componente del dispositivo que se está monitoreando.

Descripción de cómo funciona J-Insight Health Monitoring

A partir de Junos OS versión 18.2R1, J-Insight proporciona capacidades de monitoreo de estado para FPC FRU en los enrutadores de la serie MX. Como parte de esta versión inicial, el monitor de estado de J-Insight admite el siguiente flujo de procesos (consulte la figura 1):

  1. Consume un perfil de estado estático predefinido. El perfil de mantenimiento no se puede configurar por el usuario a través de la CLI de Junos OS.

  2. Mediante el marco de la interfaz de telemetría de Junos (JTI), se suscribe a los KPI de estado especificados en el perfil de estado predeterminado. El monitor de estado J-Insight se suscribe a los sensores JTI mediante una interfaz estándar. La suscripción al monitor de estado y los informes están deshabilitados de forma predeterminada y se pueden habilitar a través de la CLI de Junos OS. A partir de Junos OS versión 18.2R1, se admiten los siguientes KPI de estado para FPC basados en MX:

    • Utilización de la CPU

    • Sensores de temperatura

    • Utilización de memoria PFE

    • Accesibilidad de la estructura

  3. Coteja los flujos de datos de JTI recopilados de varios subsistemas.

  4. Evalúa los datos de mantenimiento con respecto a los umbrales configurados e informa del estado de mantenimiento.

Comprender cómo funciona el monitoreo de fallas de J-Insight

A partir de Junos OS versión 18.2R1, J-Insight utiliza la infraestructura de administración de errores de conectividad para normalizar la detección, el monitoreo y la generación de informes de errores. A través de esta infraestructura, J-Insight también proporciona la capacidad de definir políticas de fallas basadas en datos. Cada módulo puede definir propiedades de error leyendo un archivo DST/capability. La capacidad de monitoreo de errores está disponible de forma predeterminada en Junos OS y no se puede habilitar ni deshabilitar a través de la CLI.

Cada error se define por las siguientes propiedades:

  • URI: identificador de error. Cada error se identifica de forma única con un identificador de error que se representa como un identificador uniforme de recursos (URI).

  • Error: nombre de error.

  • Scope—Ámbito del error. Un ámbito de error proporciona un nivel de clasificación por encima de la categoría de error. Algunos ejemplos de valores de ámbito de error son: pfe y board.

  • Category—Categoría de error. Una categoría de error clasifica los errores en varios subgrupos según un nivel de ámbito de error específico. Algunos ejemplos de valores de categoría de error son: memoria, procesamiento y almacenamiento.

  • Details: descripción del error.

  • Count: el número de veces que se han producido instancias de error.

  • Clear count: el número de veces que se borraron las instancias de error.

  • Support: detalles de soporte para el tipo de error.