Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Gestion des erreurs

Configuration des niveaux d’erreur et des actions FPC

À partir de Junos OS version 13.3 ou version 14.2 pour routeurs M320, vous pouvez utiliser les routeurs MX Series, PTX Series et T Series pour configurer les niveaux d’erreur liés au moteur de transfert de paquets (PFE) sur les FPC et les actions à effectuer lorsqu’un seuil spécifié est atteint. Dans Junos OS version 13.2 et antérieure, les erreurs du moteur de transfert de paquets désactivaient le FPC. Lorsque vous utilisez cette error commande, les erreurs du moteur de transfert de paquets peuvent être isolées, ce qui réduit le besoin de remplacement de champ. À l’aide de la error commande, vous pouvez classer les erreurs en fonction de leur gravité, définir une action de récupération automatique pour chaque gravité et configurer les actions à effectuer lorsqu’un seuil spécifié est atteint. Cette commande est disponible dans les [edit chassis fpc slot-number] hiérarchies et [edit chassis] .

Pour configurer les niveaux d’erreur et les actions du moteur de transfert de paquets pour un FPC :

  • (Facultatif) Configurez le seuil et l’action de niveau d’erreur fatale. Une erreur fatale est une erreur qui entraîne le blocage d’une quantité considérable de trafic entre les modules.

    Si le niveau de gravité de l’erreur est fatal, l’action est exécutée lorsque le nombre total d’erreurs atteint la valeur seuil. Une fois la valeur seuil franchie, pour chaque occurrence de l’erreur, une action est effectuée.

  • (Facultatif) Configurez le seuil et l’action de niveau d’erreur majeur. Une erreur majeure est une erreur qui entraîne une perte continue du trafic de paquets, mais qui n’affecte pas les autres modules.

    Si le niveau de gravité de l’erreur est majeur, l’action est effectuée lorsque le nombre total d’erreurs atteint la valeur seuil. Une fois la valeur seuil franchie, pour chaque occurrence de l’erreur, une action est effectuée.

  • (Facultatif) Configurez le seuil de niveau d’erreur mineure et l’action. Une erreur mineure est une erreur qui entraîne la perte d’un seul paquet, mais qui peut être entièrement récupérée.

    Si le niveau de gravité est mineur, l’action n’est effectuée qu’une seule fois lorsque le nombre total d’erreurs atteint la valeur seuil

À partir de Junos OS version 18.1R3, les routeurs MX Series prennent en charge la configuration de seuils d’erreur et d’actions au niveau de la portée de l’erreur et de la catégorie d’erreur. Utilisez la commande set chassis fpc fpc-slot error scope error-scope category category (fatal | major | minor) threshold error-threshold action (alarm | disable-pfe | get-state | offline | log | reset | trap | online-pfe | reset-pfe) pour configurer un seuil et une action pour une étendue et une catégorie d’erreur particulières au niveau FPC. Vous pouvez également configurer ces fonctionnalités au niveau du châssis (au niveau de la [edit chassis] hiérarchie). Toutefois, le seuil et l’action configurés au niveau de la [edit chassis fpc] hiérarchie remplacent la même configuration au niveau de la [edit chassis] hiérarchie.

Vous pouvez utiliser la commande show chassis fpc errors pour afficher les informations d’erreur au niveau de l’étendue de l’erreur et de la catégorie.

Pour Junos OS Evolved, vous pouvez utiliser les commandes suivantes show pour afficher les informations d’erreur :

  • show system errors count: affiche les erreurs à l’échelle du système et leur nombre.

  • show system errors active: affiche les erreurs actives actuelles dans le système.

  • show system errors active fpc <slot number> : affiche les erreurs actives pour le FPC spécifié.

  • show system errors fru detail: affiche une erreur détaillée spécifique à la FRU.

  • show system errors fru detail fpc <slot number>: affiche des informations sur les erreurs détectées en fonction de la FRU.

Si vous avez configuré l’action log par rapport à un seuil d’erreur particulier, le système consigne l’événement lorsque le nombre d’erreurs dépasse le seuil défini. Les exemples de messages syslog suivants indiquent un dépassement de seuil d’erreur et l’action qui en résulte :

Les offline, reset, disable-pfe, offline-pfe actions et reset-pfe s’excluent mutuellement en ce qui concerne la configuration. Le PFE spécifié est désactivé automatiquement, si offline-pfe ou reset-pfe est configuré.

Note: Une action d’alarme majeure FPC par défaut est ajoutée pour MPC6E. L’option disable-pfe est disponible à partir de Junos 17.4 et des versions ultérieures.

Le tableau suivant fournit des détails sur les actions de mappage des erreurs PFE et la réponse du système :

Tableau 1 : action et réponse au mappage des erreurs PFE
Action et réponse
disable-pfe Désactive toutes les interfaces, alarmes et journaux PFE.
offline Met le FPC hors ligne, désactive les alarmes et les journaux.
reset Met le FPC hors ligne et se réinitialise en ligne, active les alarmes et les journaux.
reset-pfe Éteint le PFE, désactive les alarmes et les journaux, puis met le PFE sous tension, active les alarmes et les journaux.
offline-pfe Éteint le PFE, désactive les alarmes et les journaux,

Exemple : Configuration de la détection d’erreur FPC et de la réparation automatique sur des routeurs centraux T Series

Cet exemple montre comment configurer la détection des erreurs et la réparation automatique sur un routeur central Juniper Networks T Series avec FPC de type 5.

Exigences

Cet exemple utilise les composants matériels et logiciels suivants :

  • Routeur central Juniper Networks T4000 avec FPC de type 5.

  • Junos OS version 13.3 ou ultérieure.

Avant de continuer, vérifiez que les connexions requises sont complètes et que les interfaces sont fonctionnelles.

Aperçu

La détection et l’autoréparation des erreurs FPC impliquent la configuration d’un ensemble d’actions à effectuer sur chaque FPC, lorsque le nombre d’erreurs pour une gravité particulière augmente au-delà d’un seuil configuré par l’utilisateur. La gravité de l’erreur est classée en trois catégories : fatale, majeure et mineure. Les actions de récupération incluent le déclenchement d’une alarme, la génération d’entrées de journal, l’obtention de l’état actuel du FPC, le redémarrage du FPC, la mise hors ligne du FPC et la réinitialisation du FPC. Pour un FPC et une gravité d’erreur particuliers, vous pouvez configurer le seuil d’erreur sur n’importe quelle valeur comprise dans les limites autorisées et mapper le seuil à une action. Dans cet exemple, vous allez définir ces erreurs sur FPC 0 dans le routeur central T4000 de Juniper Networks.

Configuration

Pour configurer la détection d’erreur et la réparation automatique, vous devez définir la gravité de l’erreur, les valeurs de seuil correspondant à chaque gravité d’erreur et les actions à effectuer lorsque la valeur seuil est franchie.

Configuration rapide de la CLI

Pour configurer rapidement cet exemple, copiez les commandes suivantes, collez-les dans un fichier texte, supprimez les sauts de ligne, modifiez tous les détails nécessaires pour qu’ils correspondent à votre configuration réseau, puis copiez et collez les commandes dans l’interface de ligne de commande au niveau de la hiérarchie [modifier les interfaces].

Configuration de la détection d’erreur et de la réparation automatique

Procédure étape par étape

L’exemple suivant vous oblige à naviguer à différents niveaux dans la hiérarchie de configuration. Pour plus d’informations sur la navigation dans l’interface de ligne de commande, reportez-vous aux sections Utilisation de l’éditeur CLI en mode configuration et Guide de l’utilisateur de l’interface de ligne de commande.

  • Configurez la valeur seuil et l’action associée pour les erreurs fatales.

    1. Définissez la gravité de l’erreur sur fatale.

      [edit interfaces]

      user@host# set chassis fpc 0 error fatal

    2. Définissez la valeur seuil pour les erreurs fatales.

      [edit interfaces]

      user@host# set chassis fpc 0 error fatal threshold 1

    3. Définissez l’action associée pour les erreurs fatales.

      [edit interfaces]

      user@host# set chassis fpc 0 error fatal threshold 1 action reset

  • Configurez la valeur seuil et l’action associée en cas d’erreurs majeures.

    1. Définissez la gravité de l’erreur sur majeur.

      [edit interfaces]

      user@host# set chassis fpc 0 error major

    2. Définissez la valeur seuil pour les erreurs majeures.

      [edit interfaces]

      user@host# set chassis fpc 0 error major threshold 1

    3. Définissez l’action associée pour les erreurs majeures.

      [edit interfaces]

      user@host# set chassis fpc 0 error major threshold 1 action alarm

  • Configurez la valeur seuil et l’action associée pour les erreurs mineures.

    1. Définissez la gravité de l’erreur sur mineure.

      [edit interfaces]

      [edit interfaces]

      user@host# set chassis fpc 0 error minor

    2. Définissez la valeur seuil pour les erreurs mineures.

      [edit interfaces]

      user@host# set chassis fpc 0 error minor threshold 10

    3. Définissez l’action associée pour les erreurs mineures.

      [edit interfaces]

      user@host# set chassis fpc 0 error minor threshold 10 action log

Résultats

Voici le résultat de la configuration du niveau de gravité fatal.

Si vous avez terminé de configurer les périphériques, entrez dans commit le mode de configuration.

Vérification

Pour vérifier que la configuration est réussie et que le routeur est configuré avec l’action correcte, utilisez la show chassis fpc errors commande.

Vérification des actions configurées liées à la gravité fatale de l’erreur FPC

But

Assurez-vous que la valeur seuil et l’action associée sont définies pour les erreurs fatales.

Action
Signification

L’exemple de sortie affiche Fatal une erreur au niveau du FPC 0 avec 0 erreur Occurred (pas d’occurrences précédentes), 0 erreur Cleared (pas d’occurrences précédentes) avec Threshold la valeur définie sur 1 et Action-Taken définie sur RESET.

Gestion des erreurs FPC

Sur les routeurs PTX Series, vous pouvez désactiver une erreur FPC ou modifier la gravité de l’erreur au niveau de l’ID d’erreur. Reportez-vous à la section Réparation automatique FPC pour plus de détails sur les plates-formes PTX qui prennent en charge cette fonctionnalité.

L’identifiant d’erreur, qui identifie de manière unique une erreur FPC, est représenté au format URI (Uniform Resource Identifier) et est composé d’un identificateur de module et d’un identificateur d’erreur. Si une erreur se produit, vous pouvez trouver l’ID d’erreur dans les messages du journal système.

Modification de la gravité d’une erreur

Bien que vous ne puissiez pas configurer une nouvelle gravité d’erreur, vous pouvez modifier la gravité existante d’une erreur. Par exemple, si vous ne souhaitez plus traiter une erreur particulière (identifiée par un ID d’erreur) comme fatale, vous pouvez modifier sa gravité en majeure ou mineure selon vos besoins.

Note:

Vous ne pouvez pas modifier la gravité de l’erreur au niveau d’un groupe (par exemple, une catégorie).

Pour modifier la gravité d’une erreur, utilisez la commande suivante :

Reportez-vous à l’exemple suivant :

Dans l’exemple ci-dessus, vous avez modifié la gravité de l’ID “/cpu/0/memory/0/memory-uncorrected-error” d’erreur dans FPC 3 en minor.

Désactivation d’une erreur

Pour configurer le système afin qu’il cesse de signaler une erreur, identifiez l’ID d’erreur et désactivez-le. Vous pouvez trouver l’ID d’erreur dans les messages du journal système. Pour désactiver une erreur, utilisez la commande suivante :

Reportez-vous à l’exemple suivant :

Dans l’exemple ci-dessus, vous avez désactivé l’erreur “/cpu/0/memory/0/memory-uncorrected-error” dans FPC 3.

Mise hors tension des moteurs de transfert de paquets

Vous pouvez mettre sous tension ou hors tension les moteurs de transfert de paquets dans un système en cours d’exécution, ou laisser un moteur de transfert de paquets hors tension lorsque le FPC est activé. Voici quelques scénarios dans lesquels cette fonctionnalité est utilisée.

  • Lorsque l’ASIC du moteur de transfert de paquets fonctionne mal.

  • Pour économiser l’énergie au cas où le déploiement ne nécessiterait pas la pleine capacité du système.

Pour mettre hors tension un moteur de transfert de paquets, procédez comme suit :

Pour mettre sous tension un moteur de transfert de paquets, procédez comme suit :

Note:

Vous devez appliquer cette configuration aux deux moteurs de transfert de paquets d’un ASIC pour pouvoir valider la configuration.

Note:

Sur les routeurs MX Series équipés de MPC10E-15C-MRATE, vous pouvez mettre hors tension ou mettre sous tension uniquement le moteur de transfert de paquets 2. Les moteurs de transfert de paquets 0 et 1 ne prennent pas en charge cette commande. Sur le MPC10E-15C-MRATE, l’utilisation du moteur de transfert de paquets 2 nécessite le fonctionnement des moteurs de transfert de paquets 0 et 1. Vous pouvez utiliser la commande show chassis fpc fpc-lot detail pour afficher l’état marche/arrêt de l’alimentation du moteur de transfert de paquets et la bande passante des moteurs de transfert de paquets individuels dans le MPC10E-15C-MRATE.

Vous pouvez utiliser la show chassis fpc fpc-slot detail commande pour afficher l’état de configuration marche/arrêt du moteur de transfert de paquets. Voir un exemple ci-dessous :

Configuration de l’analyse de l’intégrité

Vous pouvez configurer l’instruction d’un sanity-poll FPC, d’une FEB ou d’un CFEB particulier afin de lancer un contrôle d’intégrité périodique pour ce FPC, FEB ou CFEB. Le contrôle périodique de l’intégrité comprend la recherche de conditions d’erreur telles que « problèmes d’intégrité du registre », « température élevée », « défaillance matérielle », etc. Si vous ne configurez pas l’instruction sanity-poll , l’interrogation d’intégrité est désactivée.

Note:

Actuellement, le contrôle périodique de l’intégrité n’est effectué que sur le registre de la puce de routage.

L’analyse de l’intégrité recherche régulièrement une condition d’erreur dans un FPC, un FEB ou un CFEB et effectue les actions appropriées en cas d’erreur.

  • Pour configurer l’interrogation d’intégrité d’un FPC sur les routeurs T Series et les routeurs M320, incluez l’instruction sanity-poll et ses sous-déclarations au niveau de la [edit chassis fpc slot-number] hiérarchie :

  • Pour configurer l’interrogation d’intégrité d’un FEB sur le routeur M120, incluez l’instruction sanity-poll et ses sous-déclarations au niveau de la [edit chassis feb slot-number] hiérarchie :

  • Pour configurer l’interrogation d’intégrité pour un CFEB sur les routeurs M7i et M10, incluez l’instruction sanity-poll et ses sous-déclarations au niveau de la [edit chassis cfeb slot-number] hiérarchie :

Note:

Sur un routeur TX Matrix ou TX Matrix Plus, vous pouvez configurer l’instruction sanity-poll au niveau de la [edit chassis lcc number fpc number] hiérarchie.

L’énoncé sanity-poll comprend les sous-énoncés suivants :

  • L’instruction retry-count spécifie le nombre de revérifications à effectuer après l’apparition d’une condition d’erreur particulière. S’il existe une erreur dans toutes les vérifications périodiques, l’analyse d’intégrité signale une erreur et effectue les actions appropriées (décrites comme options de l’instruction on-error ).

    Par exemple, si la vérification périodique de l’intégrité détecte une erreur dans le FPC, la FEB ou le CFEB et que vous configurez le sur 15, l’analyse d’intégrité retry count number ne signale pas immédiatement l’erreur. L’analyse d’intégrité vérifie 15 fois la même condition d’erreur. Si une erreur persiste dans les 15 revérifications, il signale une erreur et prend les mesures appropriées.

    Si vous ne configurez pas l’instruction retry-count , par défaut, l’instruction sanity-poll revérifie l’erreur détectée 10 fois avant de signaler une condition d’erreur.

  • Si l’interrogation d’intégrité détecte une condition d’erreur, l’instruction on-error effectue les actions appropriées pour éliminer l’erreur.

    Les actions suivantes sont communes à tous les types de conditions d’erreur :

    • Pour générer une alarme de châssis, configurez l’instruction raise-alarm . L’alarme du châssis s’affiche sur le panneau avant du châssis.

    • Pour redémarrer le FPC, le FEB ou le CFEB après avoir généré un fichier central, configurez l’instruction power cycle . Cette instruction est utile pour les erreurs logicielles temporaires qui sont éliminées après le redémarrage.

    • Pour arrêter le FPC, le FEB ou le CFEB, configurez l’instruction power off . Cette déclaration est utile en cas de défaillance matérielle permanente.

      PRUDENCE:

      La power off déclaration met fin au FPC. Assurez-vous d’avoir des chemins de secours via un FPC, FEB ou CFEB différent pour éviter les interruptions de service.

      Note:

      Les power cycle instructions et power off s’excluent mutuellement : vous pouvez configurer l’action ou power cycle l’action power off pour une erreur.

    • Pour déclencher le fichier core, configurez l’instruction write-coredump .

Vous pouvez configurer plusieurs actions pour un FPC, un FEB ou un CFEB donné. Si vous ne configurez aucune action, l’instruction génère uniquement des sanity-poll messages de journal système FPC, FEB ou CFEB.

Configuration de Junos OS pour qu’un concentrateur PIC flexible reste hors ligne

Par défaut, un concentrateur PIC flexible (FPC) est configuré pour redémarrer après un redémarrage du système. Vous pouvez utiliser la commande du request chassis fpc mode opérationnel pour mettre un FPC hors ligne, mais sous Junos OS, le FPC tente de redémarrer lorsque vous entrez une commit commande CLI. Pour configurer un FPC afin qu’il reste hors ligne et l’empêche de redémarrer, incluez l’instruction au power off niveau de la [edit chassis fpc slot-number] hiérarchie :

Pour mettre en ligne un FPC configuré pour rester hors connexion et le configurer pour rester en ligne, incluez l’instruction suivante power on au niveau de la [edit chassis fpc slot-number] hiérarchie :

Configuration d’un SFM pour qu’il reste hors ligne

Par défaut, si vous utilisez la request chassis sfm commande CLI pour mettre hors ligne un module de commutation et de transfert (SFM), le SFM tente de redémarrer lorsque vous entrez une commit commande CLI. Pour éviter un redémarrage, vous pouvez configurer un SFM pour qu’il reste hors ligne. Cette fonction est utile pour les situations de réparation.

Pour configurer un SFM afin qu’il reste hors ligne, incluez l’instruction suivante sfm au niveau de la [edit chassis] hiérarchie :

  • slot number: numéro de l’emplacement dans lequel le SFM est installé.

  • power off: mettez le SFM hors ligne et configurez-le pour qu’il reste hors ligne.

Par exemple, l’instruction suivante met hors connexion un SFM dans l’emplacement 3 :

Utilisez la show chassis sfm commande CLI pour confirmer l’état hors ligne :

Pour remettre le SFM en ligne, supprimez l’instruction edit chassis sfm , puis validez la configuration.

Resynchronisation des numéros de séquence FPC avec les FPC actifs lorsqu’un FPC est activé

Sur les routeurs M320, T320, T640, T1600, T4000, TX Matrix et TX Matrix Plus, lorsque vous mettez un concentrateur PIC flexible (FPC) en ligne, le numéro de séquence du FPC peut ne pas être synchronisé avec les autres FPC actifs dans le routeur, ce qui peut entraîner la perte d’une petite quantité de trafic initial.

Pour éviter toute perte de trafic, incluez l’instruction fpc-resync au niveau de la [edit chassis] hiérarchie. Cela garantit que les numéros de séquence du FPC mis en ligne sont resynchronisés avec les autres FPC actifs dans le routeur.

Note:

Afin d’empêcher le filtrage de route nulle, la fpc-resync commande n’aura aucun effet si un seul FPC basé sur LMNR et un ou plusieurs FPC de puce I existent dans le même châssis.

Activation d’un moteur de routage pour le redémarrage en cas d’erreurs de disque dur

Lorsqu’une erreur de disque dur se produit, un moteur de routage peut entrer dans un état dans lequel il répond aux pings locaux et les interfaces restent actives, mais aucun autre processus ne répond.

Pour récupérer de cette situation, vous pouvez configurer un seul moteur de routage pour qu’il redémarre automatiquement lorsqu’une erreur de disque dur se produit. Pour activer cette fonctionnalité, incluez l’instruction on-disk-failure reboot au niveau de la [edit chassis routing-engine] hiérarchie.

Pour les environnements à double moteur de routage, vous pouvez configurer un moteur de routage de sauvegarde pour qu’il assume automatiquement le rôle principal s’il détecte une erreur de disque dur sur le moteur de routage principal. Pour activer cette fonctionnalité, incluez l’instruction on-disk-failure au niveau de la [edit chassis redundancy failover] hiérarchie. Pour plus d’informations sur cette déclaration, reportez-vous au Guide de l’utilisateur de la haute disponibilité de Junos OS.

Vous pouvez configurer le moteur de routage pour qu’il s’arrête (au lieu de redémarrer) lorsque le disque dur tombe en panne sur le moteur de routage. Pour configurer cette fonctionnalité, incluez l’instruction au disk-failure-action (halt | reboot) niveau de la [edit chassis routing-engine on-disk-failure] hiérarchie :

Utilisez l’option halt pour configurer le moteur de routage afin qu’il s’arrête en cas de défaillance du disque dur. Utilisez l’option de redémarrage pour configurer le moteur de routage afin qu’il redémarre en cas de défaillance du disque dur.

Gestion des événements d’intégrité thermique à l’aide du bilan de santé thermique et du chien de garde PSM

Vous pouvez utiliser la fonctionnalité de vérification de l’état thermique pour configurer une action à effectuer lors de la détection d’un événement d’état thermique, tel qu’une fuite de courant. La fonction de contrôle thermique surveille la puissance de sortie du module d’alimentation (PSM) et la consommation d’énergie FRU. Si elle détecte que la puissance de sortie PSM dépasse la consommation d’énergie FRU d’un seuil défini par l’utilisateur, elle suppose qu’il y a un événement d’intégrité thermique et prend une mesure en fonction de la configuration de l’utilisateur. Vous pouvez configurer des actions telles que l’arrêt automatique ou le déclenchement d’alarmes lors de la détection d’un événement thermique. Voici un exemple de configuration : set chassis thermal-health-check action-onfail auto-shutdown shutdown-timer 10 power-threshold 700. Cet exemple de configuration permet au logiciel de détecter un événement d’intégrité thermique si la fuite de courant dépasse 700 W et d’arrêter le système 10 secondes après la détection de la défaillance d’intégrité thermique.

La fonctionnalité de vérification de l’état thermique ne fonctionne que si :

  • Les unités de distribution d’alimentation (PDU) CA ou CC haute capacité du routeur sont installées dans les deux emplacements, et chaque PDU possède le même nombre de PSM. Les PSM CA et CC sont tous deux pris en charge.

    Les PSM et PDU pris en charge sont répertoriés ci-dessous :

    • PSM CA haute capacité (modèle : PSM2-PTX-AC ; firmware : 0210 ou version ultérieure ; révision matérielle : 06 ou version ultérieure)

    • PSM CC 60 A haute capacité (modèle : PSM2-PTX-DC ; firmware : 0315 ou version ultérieure ; révision matérielle : 09 ou version ultérieure)

    • PDU CC haute capacité de 60 A (modèle : PDU2-PTX-DC ; utilisez la version 0404 ou ultérieure du firmware avec la révision matérielle 07 ; utilisez la version 0503 ou ultérieure du firmware avec la révision matérielle 08)

    • PDU Delta CA haute capacité (modèle : PDU2-PTX-AC-D ; firmware : 0305 ou version ultérieure ; révision matérielle : 04 ou version ultérieure)

    • PDU en Wye CA haute capacité (modèle : PDU2-PTX-AC-W ; firmware : 0305 ou version ultérieure ; révision matérielle : 03 ou version ultérieure)

    • PDU CA monophasé haute capacité (modèle : PDU2-PTX-AC-SP ; firmware : 0102 ou version ultérieure ; révision matérielle : 03 ou ultérieure)

  • Chaque PDU a au moins trois PSM qui sont en ligne, et chaque PSM en ligne consomme un courant supérieur à 60 A (dans le cas d’un PSM CA) ou supérieur à 100 A (dans le cas d’un PSM CC).

  • Aucune des FRU (RE, SIB et FPC) n’est à l’état « Présent ».

Sur le routeur, vous pouvez également configurer la fonction de surveillance PSM au niveau de la hiérarchie [modifier le châssis]. Si Junos tombe en panne en raison d’un problème thermique, la fonction de surveillance PSM le détecte et arrête le routeur. Dans la configuration du chien de garde, vous pouvez spécifier le minuteur du chien de garde en secondes. Après la durée spécifiée, le chien de garde expire. Vous pouvez également spécifier la fréquence (en minutes) à laquelle Junos réinitialise le compteur de surveillance. Si le compteur de surveillance n’est pas réinitialisé pour des raisons telles qu’un plantage du moteur de routage, le PSM coupe la puissance de sortie à l’expiration de la minuterie de surveillance et arrête ainsi le routeur.

Voici quelques exemples de configurations :

  • Utilisez set chassis psm watchdog timeout 600 pat-frequency 2. Cette commande active le chien de garde PSM avec la minuterie de chien de garde réglée sur 600 secondes et le compteur est réglé pour être réinitialisé toutes les 2 minutes.
  • Utilisez set chassis thermal-health-check fet-failure-check action-onfail auto-shutdown shutdown-timer 10.. Cette commande active la vérification thermique de l’état et arrête le système 10 secondes après la détection d’une défaillance du FET.
Note:

La fonction de surveillance PSM ne fonctionne que si tous les PSM en ligne du routeur prennent en charge cette fonctionnalité.

En bref, si le logiciel du moteur de routage est en cours d’exécution lorsqu’un événement thermique se produit, la fonctionnalité de vérification de l’état thermique détecte l’événement thermique et entreprend une action. Toutefois, si le logiciel du moteur de routage tombe en panne lors d’un événement thermique, c’est le minuteur de surveillance PSM qui détecte ce problème et interrompt le système.

Tableau de l’historique des modifications

La prise en charge des fonctionnalités est déterminée par la plateforme et la version que vous utilisez. Utilisez l’explorateur de fonctionnalités pour déterminer si une fonctionnalité est prise en charge sur votre plateforme.

Libérer
Description
13.3
À partir de Junos OS version 13.3 ou version 14.2 pour routeurs M320, vous pouvez utiliser les routeurs MX Series, PTX Series et T Series pour configurer les niveaux d’erreur liés au moteur de transfert de paquets (PFE) sur les FPC et les actions à effectuer lorsqu’un seuil spécifié est atteint.