Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Surveiller la qualité du service réseau à l’aide de RMON

RMON pour la surveillance de la qualité de service

La surveillance de l’intégrité et des performances peut bénéficier de la surveillance à distance des variables SNMP par les agents SNMP locaux s’exécutant sur chaque routeur. Les agents SNMP comparent les valeurs MIB par rapport à des seuils prédéfinis et génèrent des alarmes d’exception sans qu’une plateforme de gestion SNMP centrale n’ait besoin d’une interrogation. Il s’agit d’un mécanisme efficace de gestion proactive, à condition que les seuils aient été déterminés et définis correctement. Pour plus d’informations, reportez-vous à la RFC 2819, MIB de surveillance du réseau à distance.

Cette rubrique comprend les sections suivantes :

Définition des seuils

En définissant un seuil ascendant et un seuil descendant pour une variable surveillée, vous pouvez être alerté chaque fois que la valeur de la variable tombe en dehors de la plage opérationnelle autorisée. (Reportez-vous à la section Figure 1.)

Figure 1 : Définition des seuilsDéfinition des seuils

Les événements ne sont générés que lorsque le seuil est franchi pour la première fois dans une direction plutôt qu’après chaque période d’échantillonnage. Par exemple, si un événement de franchissement de seuil ascendant est déclenché, aucun autre événement de franchissement de seuil ne se produira jusqu’à ce qu’un événement de franchissement de seuil correspondant se produise. Cela réduit considérablement la quantité d’alarmes produites par le système, ce qui permet au personnel d’exploitation de réagir plus facilement lorsque des alarmes se produisent.

Pour configurer la surveillance à distance, spécifiez les informations suivantes :

  • La variable à surveiller (par son identifiant d’objet SNMP)

  • Le temps écoulé entre chaque inspection

  • Un seuil qui s’élève

  • Un seuil descendant

  • Un événement en plein essor

  • Un événement de chute

Avant de pouvoir configurer la surveillance à distance, vous devez identifier les variables à surveiller et leur plage de fonctionnement autorisée. Cela nécessite une certaine période de référence pour déterminer les plages opérationnelles autorisées. Il n’est pas inhabituel d’avoir une période de référence initiale d’au moins trois mois lorsqu’il s’agit d’identifier les plages opérationnelles et de définir des seuils, mais la surveillance de base doit se poursuivre tout au long de la durée de vie de chaque variable surveillée.

Interface de ligne de commande RMON

Junos OS fournit deux mécanismes que vous utilisez pour contrôler l’agent de surveillance à distance sur le routeur : interface de ligne de commande (CLI) et SNMP. Pour configurer une entrée RMON à l’aide de l’interface de ligne de commande, incluez les instructions suivantes au niveau de la [edit snmp] hiérarchie :

Si vous ne disposez pas d’un accès CLI, vous pouvez configurer la surveillance à distance à l’aide du gestionnaire SNMP ou de l’application de gestion, en supposant que l’accès SNMP a été accordé. (Reportez-vous à la section Tableau 1.) Pour configurer RMON à l’aide de SNMP, effectuez des requêtes SNMP Set vers les tables d’événements et d’alarmes RMON.

Table d’événements RMON

Configurez un événement pour chaque type que vous souhaitez générer. Par exemple, vous pouvez avoir deux événements génériques, croissant et décroissant, ou de nombreux événements différents pour chaque variable surveillée (par exemple, événement d’augmentation de température , événement de baisse de température , événement d’impact de pare-feu , événement d’utilisation d’interface , etc.). Une fois les événements configurés, vous n’avez pas besoin de les mettre à jour.

Tableau 1 : Table d’événements RMON

Champ

Description

eventDescription

Description textuelle de cet événement

eventType

Type d’événement (par exemple, log, trapou log et trap)

eventCommunity

Groupe d’interruptions auquel envoyer cet événement (tel que défini dans la configuration de Junos OS, qui n’est pas la même que la communauté)

eventOwner

Entité (par exemple, manager) qui a créé cet événement

eventStatus

Statut de cette ligne (par exemple, valid, invalidou createRequest)

Tableau d’alarme RMON

La table d’alarmes RMON stocke les identificateurs d’objets SNMP (y compris leurs instances) des variables surveillées, ainsi que tous les seuils ascendants et descendants et leurs index d’événements correspondants. Pour créer une requête RMON, spécifiez les champs affichés dans Tableau 2.

Tableau 2 : Tableau d’alarme RMON

Champ

Description

alarmStatus

Statut de cette ligne (par exemple, valid, invalidou createRequest)

alarmInterval

Période d’échantillonnage (en secondes) de la variable surveillée

alarmVariable

OID (et instance) de la variable à surveiller

alarmValue

Valeur réelle de la variable échantillonnée

alarmSampleType

Type d’échantillon (absolute ou delta changements)

alarmStartupAlarm

Alarme initiale (rising, falling, ou either)

alarmRisingThreshold

Seuil ascendant auquel comparer la valeur

alarmFallingThreshold

Seuil de chute auquel comparer la valeur

alarmRisingEventIndex

Index (ligne) de l’événement ascendant dans la table des événements

alarmFallingEventIndex

Index (ligne) de l’événement tombant dans la table des événements

Les champs et eventStatus sont des primitives, telles que définies dans la alarmStatus RFC 2579, Conventions textuelles pour SMIv2entryStatus.

Dépannage RMON

Vous dépannez l’agent RMON, rmopd, qui s’exécute sur le routeur en inspectant le contenu de la MIB RMON d’entreprise de Juniper Networks, jnxRmon, qui fournit les extensions répertoriées dans Tableau 3 la RFC 2819 alarmTable.

Tableau 3 : Extensions d’alarme jnxRmon

Champ

Description

jnxRmonAlarmGetFailCnt

Nombre d’échecs de la requête interne Get pour la variable

jnxRmonAlarmGetFailTime

Valeur de la date à sysUpTime laquelle le dernier échec s’est produit

jnxRmonAlarmGetFailReason

Raison de l’échec de la Get demande

jnxRmonAlarmGetOkTime

Valeur du sysUpTime moment où la variable est sortie de l’état d’échec

jnxRmonAlarmState

Statut de cette entrée d’alarme

La surveillance des extensions de ce tableau fournit des indices sur les raisons pour lesquelles les alarmes à distance peuvent ne pas se comporter comme prévu.

Comprendre les points de mesure, les indicateurs clés de performance et les valeurs de référence

Ce chapitre fournit des instructions pour la surveillance de la qualité de service d’un réseau IP. Il décrit comment les fournisseurs de services et les administrateurs réseau peuvent utiliser les informations fournies par les routeurs Juniper Networks pour surveiller les performances et la capacité du réseau. Vous devez bien comprendre le protocole SNMP et la MIB associée prise en charge par Junos OS.

REMARQUE :

Pour une bonne introduction au processus de surveillance d’un réseau IP, reportez-vous à la RFC 2330, Framework for IP Performance Metrics.

Cette rubrique contient les sections suivantes :

Points de mesure

Il est tout aussi important de définir les points de mesure où les mesures sont mesurées que de définir les mesures elles-mêmes. Cette section décrit les points de mesure dans le contexte de ce chapitre et permet d’identifier les endroits où les mesures peuvent être effectuées à partir d’un réseau de fournisseurs de services. Il est important de comprendre exactement où se trouve un point de mesure. Les points de mesure sont essentiels pour comprendre l’implication de ce que signifie la mesure réelle.

Un réseau IP est constitué d’un ensemble de routeurs connectés par des liaisons physiques qui exécutent tous le protocole Internet. Vous pouvez visualiser le réseau comme un ensemble de routeurs avec un point d’entrée (entrée) et un point de sortie (sortie). Reportez-vous à la section Figure 2.

  • Les mesures centrées sur le réseau sont effectuées aux points de mesure qui correspondent le mieux aux points d’entrée et de sortie du réseau lui-même. Par exemple, pour mesurer le retard sur le réseau du fournisseur entre le site A et le site B, les points de mesure doivent être le point d’entrée vers le réseau du fournisseur sur le site A et le point de sortie sur le site B.

  • Les mesures centrées sur les routeurs sont prises directement à partir des routeurs eux-mêmes, mais veillez à ce que les sous-composants corrects du routeur aient été identifiés à l’avance.

Figure 2 : Points d’entrée réseauPoints d’entrée réseau
REMARQUE :

Figure 2 n’affiche pas les réseaux clients dans les locaux du client, mais ils sont situés de part et d’autre des points d’entrée et de sortie. Bien que ce chapitre n’explique pas comment mesurer les services réseau tels qu’ils sont perçus par ces réseaux clients, vous pouvez utiliser les mesures prises pour le réseau du fournisseur de services comme entrée dans ces calculs.

Indicateurs clés de performance de base

Par exemple, vous pouvez surveiller le réseau d’un fournisseur de services à l’aide de trois indicateurs clés de performance (KPI) de base :

  • mesure « l’accessibilité » d’un point de mesure par rapport à un autre point de mesure au niveau de la couche réseau (par exemple, en utilisant le ping ICMP). L’infrastructure de routage et de transport sous-jacente du réseau du fournisseur prend en charge les mesures de disponibilité, les échecs étant mis en évidence comme indisponibles.

  • mesure le nombre et le type d’erreurs qui se produisent sur le réseau du fournisseur et peut consister en des mesures centrées sur le routeur et sur le réseau, telles que les pannes matérielles ou la perte de paquets.

  • du réseau du fournisseur mesure sa capacité à prendre en charge les services IP (par exemple, en termes de délai ou d’utilisation).

Définition des lignes de base

Quel est le niveau de performance du réseau de fournisseurs ? Nous recommandons une première période de surveillance de trois mois afin d’identifier les paramètres opérationnels normaux d’un réseau. Grâce à ces informations, vous pouvez reconnaître les exceptions et identifier les comportements anormaux. Vous devez poursuivre la surveillance de base pendant toute la durée de vie de chaque métrique mesurée. Au fil du temps, vous devez être en mesure de reconnaître les tendances de performance et les modèles de croissance.

Dans le contexte du présent chapitre, bon nombre des paramètres identifiés ne sont pas associés à une plage opérationnelle admissible. Dans la plupart des cas, vous ne pouvez pas identifier la plage opérationnelle autorisée tant que vous n’avez pas déterminé une référence pour la variable réelle sur un réseau spécifique.

Définir et mesurer la disponibilité du réseau

Cette rubrique comprend les sections suivantes :

Définir la disponibilité du réseau

La disponibilité du réseau IP d’un fournisseur de services peut être considérée comme l’accessibilité entre les points de présence régionaux (POP), comme illustré à la .Figure 3

Figure 3 : Points de présence régionauxPoints de présence régionaux

Avec l’exemple ci-dessus, lorsque vous utilisez un maillage complet de points de mesure, où chaque POP mesure la disponibilité par rapport à tous les autres POP, vous pouvez calculer la disponibilité totale du réseau du fournisseur de services. Cet indicateur clé de performance (KPI) peut également être utilisé pour surveiller le niveau de service du réseau, et peut être utilisé par le fournisseur de services et ses clients pour déterminer s’ils respectent les termes de leur accord de niveau de service (SLA).

Lorsqu’un POP peut être constitué de plusieurs routeurs, effectuez des mesures sur chacun d’eux, comme illustré à Figure 4la .

Figure 4 : Mesures pour chaque routeurMesures pour chaque routeur

Les mesures comprennent :

  • Path availability (Disponibilité du chemin) : disponibilité d’une interface de sortie B1 vue à partir d’une interface d’entrée A1.

  • Router availability (Disponibilité du routeur) : pourcentage de disponibilité des chemins de tous les chemins mesurés se terminant sur le routeur.

  • Disponibilité POP : pourcentage de disponibilité du routeur entre deux POP régionaux, A et B.

  • Disponibilité du réseau : pourcentage de disponibilité des POP pour tous les POP régionaux du réseau du fournisseur de services.

Pour mesurer la disponibilité POP du POP A vers le POP B en Figure 4, vous devez mesurer les quatre chemins suivants :

Mesurer la disponibilité du POP B au POP A nécessiterait quatre mesures supplémentaires, et ainsi de suite.

Un maillage complet de mesures de disponibilité peut générer un trafic de gestion important. D’après l’exemple de schéma ci-dessus :

  • Chaque POP dispose de deux routeurs Provider Edge (PE) colocalisés, chacun avec 2 interfaces STM1, pour un total de 18 routeurs PE et 36 interfaces STM1.

  • Il existe six routeurs Core Provider (P), quatre avec 2xSTM4 et 3xSTM1 chacun, et deux avec 3xSTM4 et 3xSTM1 chacun.

Cela fait un total de 68 interfaces. Un maillage complet de chemins entre chaque interface est :

[n x (nl)] / 2 donne [68 x (681)] / 2=2278 chemins

Pour réduire le trafic de gestion sur le réseau du fournisseur de services, au lieu de générer un maillage complet de tests de disponibilité des interfaces (par exemple, de chaque interface à toutes les autres interfaces), vous pouvez effectuer des mesures à partir de l’adresse de bouclage de chaque routeur. Cela réduit le nombre de mesures de disponibilité requises à un total d’une pour chaque routeur, ou :

n[ x (n1)] / 2 donne [24 x (241)] / 2=276 mesures

Cela mesure la disponibilité de chaque routeur à tous les autres routeurs.

Surveillance du SLA et de la bande passante requise

Un SLA typique entre un fournisseur de services et un client peut indiquer :

Un taux de disponibilité des SLA de 99,999 % pour le réseau d’un fournisseur correspond à un temps d’arrêt d’environ 5 minutes par an. Par conséquent, pour mesurer cela de manière proactive, vous devez prendre des mesures de disponibilité avec une granularité inférieure à une toutes les cinq minutes. Avec une taille standard de 64 octets par requête ping ICMP, un test ping par minute générerait 7 680 octets de trafic par heure et par destination, y compris les réponses ping. Un maillage complet de tests ping vers 276 destinations générerait 2 119 680 octets par heure, ce qui représente ce qui suit :

  • Sur une liaison OC3/STM1 de 155,52 Mbit/s, soit une utilisation de 1,362 %

  • Sur une liaison OC12/STM4 de 622,08 Mbit/s, soit une utilisation de 0,340 %

Avec une taille de 1 500 octets par requête ping ICMP, un test ping par minute générerait 180 000 octets par heure et par destination, y compris les réponses ping. Un maillage complet de tests ping vers 276 destinations générerait 49 680 000 octets par heure, ce qui représente ce qui suit :

  • Sur une liaison OC3/STM1, 31,94 % d’utilisation

  • Sur une liaison OC12/STM4, 7,986 % d’utilisation

Chaque routeur peut enregistrer les résultats pour chaque destination testée. Avec un test par minute vers chaque destination, un total de 1 x 60 x 24 x 276 = 397 440 tests par jour serait effectué et enregistré par chaque routeur. Tous les résultats ping sont stockés dans le (voir RFC 2925) et peuvent être récupérés par une application de reporting de performances SNMP (par exemple, le logiciel de gestion des performances de service d’InfoVista, Inc. ou de Concord Communications, Inc.) pour post-traitement pingProbeHistoryTable . Cette table a une taille maximale de 4 294 967 295 lignes, ce qui est plus que suffisant.

Mesurer la disponibilité

Il existe deux méthodes que vous pouvez utiliser pour mesurer la disponibilité :

  • Proactif : la disponibilité est mesurée automatiquement aussi souvent que possible par un système d’assistance opérationnelle.

  • Réactif : la disponibilité est enregistrée par un support technique lorsqu’une défaillance est signalée pour la première fois par un utilisateur ou un système de surveillance des pannes.

Cette section traite de la surveillance des performances en temps réel en tant que solution de surveillance proactive.

Surveillance des performances en temps réel

Juniper Networks fournit un service de surveillance des performances en temps réel (RPM) pour surveiller les performances du réseau en temps réel. Utilisez la fonction de configuration rapide de J-Web pour configurer les paramètres de surveillance des performances en temps réel utilisés dans les tests de surveillance des performances en temps réel. (J-Web Quick Configuration est une interface graphique basée sur un navigateur qui s’exécute sur les routeurs Juniper Networks. Pour plus d’informations, reportez-vous au Guide de l’utilisateur de l’interface J-Web.)

Configuration de la surveillance des performances en temps réel

Certaines des options les plus courantes que vous pouvez configurer pour les tests de surveillance des performances en temps réel sont illustrées à la section Tableau 4.

Tableau 4 : Options de configuration de la surveillance des performances en temps réel

Champ

Description

Demande d’information

Probe Type

Type de sonde à envoyer dans le cadre du test. Les types de sondes peuvent être :

  • http-get

  • http-get-metadata

  • icmp-ping

  • icmp-ping-timestamp

  • tcp-ping

  • udp-ping

Interval

Temps d’attente (en secondes) entre chaque transmission de sonde. La plage est de 1 à 255 secondes.

Test Interval

Temps d’attente (en secondes) entre les tests. La plage est comprise entre 0 et 86400 secondes.

Probe Count

Nombre total de sondes envoyées pour chaque test. La plage est de 1 à 15 sondes.

Destination Port

Port TCP ou UDP vers lequel les sondes sont envoyées. Utilisez le numéro 7 (un numéro de port TCP ou UDP standard) ou sélectionnez un numéro de port compris entre 49152 et 65535.

DSCP Bits

Bits DSCP (Differentiated Services Code Point). Cette valeur doit être un modèle 6 bits valide. La valeur par défaut est 000000.

Data Size

Taille (en octets) de la partie données des sondes ICMP. La plage est comprise entre 0 et 65507 octets.

Data Fill

Contenu de la partie données des sondes ICMP. Le contenu doit être une valeur hexadécimale. La gamme est de 1 à 800h.

Seuils maximaux de sonde

Successive Lost Probes

Nombre total de sondes qui doivent être perdues successivement pour déclencher une défaillance de la sonde et générer un message de journal système. La plage est comprise entre 0 et 15 sondes.

Lost Probes

Nombre total de sondes qui doivent être perdues pour déclencher une défaillance de la sonde et générer un message de journal système. La plage est comprise entre 0 et 15 sondes.

Round Trip Time

Temps d’aller-retour total (en microsecondes) entre le routeur de services et le serveur distant qui, s’il est dépassé, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Jitter

Gigue totale (en microsecondes) pour un test qui, en cas de dépassement, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Standard Deviation

Écart type maximal autorisé (en microsecondes) pour un test qui, s’il est dépassé, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Egress Time

Temps total d’unidirection (en microsecondes) entre le routeur et le serveur distant qui, s’il est dépassé, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Ingress Time

Temps unidirectionnel total (en microsecondes) entre le serveur distant et le routeur qui, s’il est dépassé, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Jitter Egress Time

Gigue totale en temps sortant (en microsecondes) pour un test qui, si elle est dépassée, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Jitter Ingress Time

Gigue totale en temps entrant (en microsecondes) pour un test qui, si elle est dépassée, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Egress Standard Deviation

Écart-type maximal autorisé des temps d’appel sortant (en microsecondes) pour un test qui, s’il est dépassé, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Ingress Standard Deviation

Écart-type maximal autorisé des temps entrants (en microsecondes) pour un test qui, s’il est dépassé, déclenche une défaillance de la sonde et génère un message de journal système. La plage est comprise entre 0 et 60 000 000 microsecondes.

Affichage des informations de surveillance des performances en temps réel

Pour chaque test de surveillance des performances en temps réel configuré sur le routeur, les informations de surveillance comprennent le temps d’aller-retour, la gigue et l’écart type. Pour afficher ces informations, sélectionnez Monitor > RPM dans l’interface J-Web ou entrez la commande de l’interface show services rpm de ligne de commande (CLI).

Pour afficher les résultats des sondes de surveillance des performances en temps réel les plus récentes, entrez la show services rpm probe-results commande CLI :

Mesurer l’intégrité

Vous pouvez surveiller les métriques d’intégrité de manière réactive à l’aide d’un logiciel de gestion des pannes tel que SMARTS InCharge, Micromuse Netcool Omnibus ou Concord Live Exceptions. Nous vous recommandons de surveiller les métriques d’intégrité affichées à la section Tableau 5.

Tableau 5 : Indicateurs d’intégrité

Métrique

Description

Paramètres

Nom

Valeur

Des erreurs dans

Nombre de paquets entrants contenant des erreurs empêchant leur livraison

Nom de la MIB

IF-MIB (RFC 2233)

Nom de la variable

ifInErrors

Variable OID

.1.3.6.1.31.2.2.1.14

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Interfaces logiques

Sorties d’erreurs

Nombre de paquets sortants contenant des erreurs, empêchant leur transmission

Nom de la MIB

IF-MIB (RFC 2233)

Nom de la variable

ifOutErrors

Variable OID

.1.3.6.1.31.2.2.1.20

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Interfaces logiques

Rejets dans

Nombre de paquets entrants rejetés, même si aucune erreur n’a été détectée

Nom de la MIB

IF-MIB (RFC 2233)

Nom de la variable

ifInDiscards

Variable OID

.1.3.6.1.31.2.2.1.13

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Interfaces logiques

Protocoles inconnus

Nombre de paquets entrants rejetés parce qu’ils appartenaient à un protocole inconnu

Nom de la MIB

IF-MIB (RFC 2233)

Nom de la variable

ifInUnknownProtos

Variable OID

.1.3.6.1.31.2.2.1.15

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Interfaces logiques

État de fonctionnement de l’interface

État de fonctionnement d’une interface

Nom de la MIB

IF-MIB (RFC 2233)

Nom de la variable

ifOperStatus

Variable OID

.1.3.6.1.31.2.2.1.8

Fréquence (minutes)

15

Plage autorisée

1 (haut)

Objets gérés

Interfaces logiques

État du chemin de commutation d’étiquettes (LSP)

État opérationnel d’un chemin de commutation d’étiquettes MPLS

Nom de la MIB

MPLS-MIB

Nom de la variable

mplsLspState

Variable OID

mplsLspEntry.2

Fréquence (minutes)

60

Plage autorisée

2 (haut)

Objets gérés

Tous les chemins de commutation d’étiquettes dans le réseau

État de fonctionnement des composants

État de fonctionnement d’un composant matériel d’un routeur

Nom de la MIB

MIB JUNIPER

Nom de la variable

jnxOperatingState

Variable OID

.1.3.6.1.4.1.2636.1.13.1.6

Fréquence (minutes)

60

Plage autorisée

2 (en cours d’exécution) ou 3 (prêts)

Objets gérés

Tous les composants de chaque routeur Juniper Networks

Température de fonctionnement des composants

Température de fonctionnement d’un composant matériel, en degrés Celsius

Nom de la MIB

MIB JUNIPER

Nom de la variable

jnxOperatingTemp

Variable OID

.1.3.6.1.4.1.2636.1.13.1.7

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Tous les composants d’un châssis

Temps de fonctionnement du système

Durée, en millisecondes, pendant laquelle le système a été opérationnel.

Nom de la MIB

MIB-2 (RFC 1213)

Nom de la variable

sysUpTime

Variable OID

.1.3.6.1.1.3

Fréquence (minutes)

60

Plage autorisée

Croissant uniquement (la décrémentation indique un redémarrage)

Objets gérés

Tous les routeurs

Pas d’erreurs de routage IP

Nombre de paquets qui n’ont pas pu être livrés car il n’y avait pas de route IP vers leur destination.

Nom de la MIB

MIB-2 (RFC 1213)

Nom de la variable

ipOutNoRoutes

Variable OID

ip.12

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Chaque routeur

Noms de communauté SNMP incorrects

Nombre de noms de communauté SNMP incorrects reçus

Nom de la MIB

MIB-2 (RFC 1213)

Nom de la variable

snmpInBadCommunityNames

Variable OID

snmp.4

Fréquence (minutes)

24

Plage autorisée

Pour être la base de référence

Objets gérés

Chaque routeur

Violations de la communauté SNMP

Nombre de communautés SNMP valides utilisées pour tenter des opérations non valides (par exemple, tentative d’exécution de requêtes d’ensemble SNMP)

Nom de la MIB

MIB-2 (RFC 1213)

Nom de la variable

snmpInBadCommunityUses

Variable OID

snmp.5

Fréquence (minutes)

24

Plage autorisée

Pour être la base de référence

Objets gérés

Chaque routeur

Commutation de la redondance

Nombre total de basculements de redondance déclarés par cette entité

Nom de la MIB

MIB JUNIPER

Nom de la variable

jnxRedundancySwitchoverCount

Variable OID

jnxRedundancyEntry.8

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Tous les routeurs Juniper Networks avec moteurs de routage redondants

État de la FRU

État opérationnel de chaque unité remplaçable sur site (FRU)

Nom de la MIB

MIB JUNIPER

Nom de la variable

jnxFruState

Variable OID

jnxFruEntry.8

Fréquence (minutes)

15

Plage autorisée

2 à 6 pour les états prêt/en ligne. Reportez-vous à la section jnxFruOfflineReason en cas de défaillance d’une FRU.

Objets gérés

Toutes les FRU sur tous les routeurs Juniper Networks.

Taux de paquets abandonnés à la fin

Débit de paquets abandonnés en queue de peloton par file d’attente de sortie, par classe de transfert et par interface.

Nom de la MIB

JUNIPER-COS-MIB

Nom de la variable

jnxCosIfqTailDropPktRate

Variable OID

jnxCosIfqStatsEntry.12

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Pour chaque classe de transfert par interface dans le réseau du fournisseur, lorsque CoS est activé.

Utilisation de l’interface : octets reçus

Nombre total d’octets reçus sur l’interface, y compris les caractères de tramage.

Nom de la MIB

IF-MIB

Nom de la variable

ifInOctets

Variable OID

.1.3.6.1.2.1.2.2.1.10.x

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Toutes les interfaces opérationnelles du réseau

Utilisation de l’interface : octets transmis

Nombre total d’octets transmis hors de l’interface, y compris les caractères de tramage.

Nom de la MIB

IF-MIB

Nom de la variable

ifOutOctets

Variable OID

.1.3.6.1.2.1.2.2.1.16.x

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Toutes les interfaces opérationnelles du réseau

REMARQUE :

Le nombre d’octets varie en fonction du type d’interface, de l’encapsulation utilisée et du PIC pris en charge. Par exemple, avec l’encapsulation vlan-ccc sur un PIC 4xFE, GE ou GE 1Q, le nombre d’octets inclut la surcharge des mots de trame et de contrôle. (Reportez-vous à la section Tableau 6.)

Tableau 6 : Valeurs de compteur pour l’encapsulation vlan-ccc

PIC Type

Encapsulation

entrée (niveau de l’unité)

Sortie (niveau de l’unité)

SNMP

4xFE

VLAN-CCC

Trame (pas de séquence de vérification de trame [FCS])

Cadre (y compris FCS et mot de contrôle)

ifInOctets, ifOutOctets

GE

VLAN-CCC

Cadre (pas de FCS)

Cadre (y compris FCS et mot de contrôle)

ifInOctets, ifOutOctets

GE IQ

VLAN-CCC

Cadre (pas de FCS)

Cadre (y compris FCS et mot de contrôle)

ifInOctets, ifOutOctets

Les pièges SNMP sont également un bon mécanisme à utiliser pour la gestion de la santé. Pour plus d’informations, reportez-vous aux sections «Interruptions SNMP prises en charge par Junos OS » et « Interruptions SNMP spécifiques à l’entreprise prises en charge par Junos OS ».

Mesurer les performances

La performance du réseau d’un fournisseur de services est généralement définie comme sa capacité à prendre en charge des services, et est mesurée à l’aide d’indicateurs tels que le délai et l’utilisation. Nous vous suggérons de surveiller les mesures de performances suivantes à l’aide d’applications telles qu’InfoVista Service Performance Management ou Concord Network Health (reportez-vous à la section Tableau 7).

Tableau 7 : Mesures de performance
Métrique:

Délai moyen

Description

Temps moyen aller-retour (en millisecondes) entre deux points de mesure.

Nom de la MIB

DISMAN-PING-MIB (RFC 2925)

Nom de la variable

pingResultsAverageRtt

Variable OID

pingResultsEntry.6

Fréquence (minutes)

15 (ou en fonction de la fréquence du test ping)

Plage autorisée

Pour être la base de référence

Objets gérés

Chaque trajet mesuré dans le réseau

Métrique:

Utilisation de l’interface

Description

Pourcentage d’utilisation d’une connexion logique.

Nom de la MIB

IF-MIB

Nom de la variable

ifInOctets ( & ) ifOutOctets* 8 /ifSpeed

Variable OID

Entrées ifTable

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Toutes les interfaces opérationnelles du réseau

Métrique:

Utilisation du disque

Description

Utilisation de l’espace disque sur le routeur Juniper Networks

Nom de la MIB

HÔTE-RESSOURCES-MIB (RFC 2790)

Nom de la variable

hrStorageSizehrStorageUsed

Variable OID

hrStorageEntry.5 – hrStorageEntry.6

Fréquence (minutes)

1440

Plage autorisée

Pour être la base de référence

Objets gérés

Tous les disques durs du moteur de routage

Métrique:

Utilisation de la mémoire

Description

Utilisation de la mémoire sur le moteur de routage et le FPC.

Nom de la MIB

JUNIPER-MIB (Juniper Networks enterprise Chassis MIB)

Nom de la variable

jnxOperatingHeap

Variable OID

Tableau pour chaque composant

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Tous les routeurs Juniper Networks

Métrique:

Charge CPU

Description

Utilisation moyenne d’un processeur au cours de la dernière minute.

Nom de la MIB

JUNIPER-MIB (Juniper Networks enterprise Chassis MIB)

Nom de la variable

jnxOperatingCPU

Variable OID

Tableau pour chaque composant

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Tous les routeurs Juniper Networks

Métrique:

Utilisation du LSP

Description

Utilisation du chemin de commutation d’étiquettes MPLS.

Nom de la MIB

MPLS-MIB

Nom de la variable

mplsPathBandwidth / (mplsLspOctets * 8)

Variable OID

mplsLspEntry.21 et mplsLspEntry.3

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Tous les chemins de commutation d’étiquettes dans le réseau

Métrique:

Taille de la file d’attente de sortie

Description

Taille, en paquets, de chaque file d’attente de sortie par classe de transfert et par interface.

Nom de la MIB

JUNIPER-COS-MIB

Nom de la variable

jnxCosIfqQedPkts

Variable OID

jnxCosIfqStatsEntry.3

Fréquence (minutes)

60

Plage autorisée

Pour être la base de référence

Objets gérés

Pour chaque classe de transfert par interface du réseau, une fois que CoS est activé.

Cette section aborde les sujets suivants :

Mesurer la classe de service

Vous pouvez utiliser des mécanismes de classe de service (CoS) pour réguler la manière dont certaines classes de paquets sont traitées au sein de votre réseau pendant les pics de congestion. En règle générale, vous devez effectuer les étapes suivantes lors de l’implémentation d’un mécanisme CoS :

  • Identifiez le type de paquets qui est appliqué à cette classe. Par exemple, vous pouvez inclure tout le trafic client provenant d’une interface de périphérie entrante spécifique au sein d’une classe, ou inclure tous les paquets d’un protocole particulier tel que la voix sur IP (VoIP).

  • Identifiez le comportement déterministe requis pour chaque classe. Par exemple, si la VoIP est importante, donnez la priorité la plus élevée au trafic VoIP en période de congestion du réseau. À l’inverse, vous pouvez réduire l’importance du trafic Web en cas de congestion, car il peut ne pas avoir trop d’impact sur les clients.

Grâce à ces informations, vous pouvez configurer des mécanismes à l’entrée du réseau pour surveiller, marquer et contrôler les classes de trafic. Le trafic marqué peut ensuite être traité de manière plus déterministe au niveau des interfaces de sortie, généralement en appliquant des mécanismes de file d’attente différents pour chaque classe en période de congestion du réseau. Vous pouvez collecter des informations sur le réseau pour fournir aux clients des rapports montrant comment le réseau se comporte en période d’encombrement. (Reportez-vous à la section Figure 5.)

Figure 5 : Comportement du réseau en cas d’encombrementComportement du réseau en cas d’encombrement

Pour générer ces rapports, les routeurs doivent fournir les informations suivantes :

  • Trafic envoyé : quantité de trafic reçu par classe.

  • Trafic distribué : quantité de trafic transmis par classe.

  • Trafic abandonné : quantité de trafic abandonnée en raison des limites CoS.

La section suivante décrit comment ces informations sont fournies par les routeurs Juniper Networks.

Compteurs de filtres de pare-feu entrants par classe

Les compteurs de filtres de pare-feu sont un mécanisme très flexible que vous pouvez utiliser pour faire correspondre et compter le trafic entrant par classe et par interface. Par exemple :

Par exemple, Tableau 8 affiche des filtres supplémentaires utilisés pour faire correspondre les autres classes.

Tableau 8 : Trafic entrant par classe

Valeur DSCP

Condition de correspondance du pare-feu

Description

10

af11

Classe de transfert assurée 1 profil de chute 1

12

af12

Classe de transfert assurée 1 profil de chute 2

18

af21

Classe d’effort 2 profil de goutte 1

20

af22

Classe d’effort 2 profil de goutte 2

26

af31

Classe d’effort 3 profil de goutte 1

Tout paquet avec un point de code CoS DiffServ (DSCP) conforme à la RFC 2474 peut être compté de cette manière. La MIB de filtre de pare-feu spécifique à l’entreprise de Juniper Networks présente les informations du compteur dans les variables illustrées à la .Tableau 9

Tableau 9 : Compteurs entrants

Nom de l’indicateur

Compteurs entrants

MIB

jnxFirewalls

Table

jnxFirewallCounterTable

Index

jnxFWFilter.jnxFWCounter

Variables

jnxFWCounterPacketCount

jnxFWCounterByteCount

Description

Nombre d’octets comptés relatifs au compteur de filtres de pare-feu spécifié

Version SNMP

SNMPv2

Ces informations peuvent être collectées par n’importe quelle application de gestion SNMP prenant en charge SNMPv2. Les produits de fournisseurs tels que Concord Communications, Inc. et InfoVista, Inc. prennent en charge la MIB du pare-feu Juniper Networks avec leurs pilotes de périphérique Juniper Networks natifs.

Surveiller les octets de sortie par file d’attente

Vous pouvez utiliser la MIB CoS ATM d’entreprise de Juniper Networks pour surveiller le trafic sortant, par classe de transfert de circuit virtuel et par interface. (Reportez-vous à la section Tableau 10.)

Tableau 10 : Compteurs sortants pour les interfaces ATM

Nom de l’indicateur

Compteurs sortants

MIB

JUNIPER-ATM-COS-MIB

Variable

jnxCosAtmVcQstatsOutBytes

Index

ifIndex.atmVclVpi.atmVclVci.jnxCosFcId

Description

Nombre d’octets appartenant à la classe de transfert spécifiée qui ont été transmis sur le circuit virtuel spécifié.

Version SNMP

SNMPv2

Les compteurs d’interface autres que les distributeurs automatiques de billets sont fournis par la MIB CoS spécifique à l’entreprise de Juniper Networks, qui fournit les informations illustrées à Tableau 11la .

Tableau 11 : Compteurs sortants pour les interfaces non-ATM

Nom de l’indicateur

Compteurs sortants

MIB

JUNIPER-COS-MIB

Table

jnxCosIfqStatsTable

Index

jnxCosIfqIfIndex.jnxCosIfqFc

Variables

jnxCosIfqTxedBytes

jnxCosIfqTxedPkts

Description

Nombre d’octets ou de paquets transmis par interface et par classe de transfert

Version SNMP

SNMPv2

Calculer la perte de trafic

Vous pouvez calculer la quantité de trafic abandonné en soustrayant le trafic sortant du trafic entrant :

Vous pouvez également sélectionner des compteurs à partir de la MIB CoS, comme illustré à Tableau 12la .

Tableau 12 : Compteurs de trafic abandonnés

Nom de l’indicateur

Trafic interrompu

MIB

JUNIPER-COS-MIB

Table

jnxCosIfqStatsTable

Index

jnxCosIfqIfIndex.jnxCosIfqFc

Variables

jnxCosIfqTailDropPkts

jnxCosIfqTotalRedDropPkts

Description

Nombre de paquets abandonnés en queue de peloton ou RED par interface et par classe de transfert

Version SNMP

SNMPv2