Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Surveillance d’objets de niveau global dans un cluster de châssis

Utilisez l’explorateur de fonctionnalités pour confirmer la prise en charge de fonctionnalités spécifiques par la plate-forme et la version.

Consultez la section Comportement des objets de surveillance spécifiques à la plate-forme pour obtenir des remarques relatives à votre plate-forme.

Il existe différents types d’objets à surveiller lorsque vous travaillez avec des équipements configurés en tant que clusters de châssis, y compris les objets de niveau global et les objets spécifiques aux groupes de redondance. Cette section décrit la surveillance des objets de niveau global.

Comprendre la surveillance SPU

La surveillance de l’USP permet de suivre l’état de santé des unités d’alimentation et du point central (CP). Le gestionnaire de châssis de chaque SPC surveille les SPU et le point central, et maintient également le rythme cardiaque avec le châssis du moteur de routage. Dans ce système de surveillance hiérarchique, chassisd est le centre de détection des défaillances matérielles. La surveillance SPU est activée par défaut.

Une défaillance persistante de l’USP et du point central sur un nœud est considérée comme une défaillance catastrophique du moteur de transfert de paquets (PFE). Dans ce cas, le PFE du nœud est désactivé dans le cluster en réduisant les priorités des groupes de redondance x à 0.

  • Une défaillance du point central déclenche un basculement vers le nœud secondaire. Le PFE du nœud défaillant, qui inclut tous les SPC et toutes les cartes d'E/S (IOC), est automatiquement redémarré. Si le point central secondaire est également défaillant, le cluster ne peut pas s’afficher car il n’y a pas d’équipement principal. Seul le plan de données (groupe de redondance x) est basculé.

  • La défaillance d’un seul SPU entraîne le basculement du groupe de redondance x vers le nœud secondaire. Tous les IOC et SPC sur le nœud défaillant sont redémarrés et le groupe de redondance x est basculé vers le nœud secondaire. Le basculement vers le nœud secondaire est automatique et ne nécessite aucune intervention de l’utilisateur. Lorsque le composant défaillant du nœud principal défaillant (ancien) est restauré, la restauration automatique est déterminée par la configuration de préemption du groupe de redondance x. L’intervalle de détection des SPU morts est de 30 secondes.

Cet événement déclenche une alarme, indiquant qu’une nouvelle unité remplaçable sur site (FRU) est nécessaire.

Comprendre la surveillance avec flux

La surveillance des flux permet de suivre l’intégrité du processus en flux. La surveillance en flux est activée par défaut.

Une défaillance persistante d’un flux sur un nœud est considérée comme une défaillance catastrophique du moteur de transfert de paquets (PFE). Dans ce cas, le PFE du nœud est désactivé dans le cluster en réduisant les priorités des groupes de redondance x à 0.

L’échec d’un processus entraîné le basculement du groupe de redondance x vers le nœud secondaire. Le basculement vers le nœud secondaire est automatique et ne nécessite aucune intervention de l’utilisateur. Lorsque le composant défaillant du nœud principal défaillant (ancien) est restauré, la restauration automatique est déterminée par la configuration de préemption du groupe de redondance x.

Lors d’échecs SPC et de surveillance de flux sur un nœud local, le groupe de redondance du plan de données RG1+ bascule sur l’autre nœud qui est en bon état. Toutefois, le plan de contrôle RG0 ne bascule pas et reste principal sur le même nœud qu’avant la défaillance.

Comprendre la surveillance de la synchronisation à froid

Le processus de synchronisation des objets d’exécution (RTO) du plan de données au démarrage des SPU ou des flux est appelé synchronisation à froid. Lorsque tous les RTO sont synchronisés, le processus de synchronisation à froid est terminé et le SPU ou le flux sur le nœud est prêt à prendre le relais du nœud principal, si nécessaire. Le processus de surveillance de l’état de synchronisation à froid de tous les SPU ou flux sur un nœud est appelé surveillance de synchronisation à froid. Gardez à l’esprit que lorsque la préemption est activée, la surveillance de la synchronisation à froid empêche le nœud de jouer le rôle principal tant que le processus de synchronisation à froid n’est pas terminé pour les SPU ou que le flux sur le nœud n’est pas terminé. La surveillance de la synchronisation à froid est activée par défaut.

Lorsque le nœud est redémarré, ou lorsque les SPU ou les flux reviennent après une défaillance, la priorité de tous les groupes de redondance 1+ est 0. Lorsqu’un SPU ou un flowd apparaît, il tente de démarrer le processus de synchronisation à froid avec son SPU miroir ou flowd sur l’autre nœud.

S’il s’agit du seul nœud du cluster, les priorités de tous les groupes de redondance 1+ restent à 0 jusqu’à ce qu’un nouveau nœud rejoigne le cluster. Bien que la priorité soit à 0, l’appareil peut toujours recevoir et envoyer du trafic sur ses interfaces. Une priorité de 0 implique qu’il ne peut pas basculer en cas de défaillance. Lorsqu’un nouveau noeud rejoint le cluster, tous les SPU ou SPU découlés, au fur et à mesure qu’ils apparaissent, démarrent le processus de synchronisation à froid avec les SPU miroirs ou distribués du noeud existant.

Lorsque le SPU ou le flux d’un nœud déjà actif détecte la demande de synchronisation à froid du SPU ou du flux du nœud pair, il publie un message au système indiquant que le processus de synchronisation à froid est terminé. Les SPU ou flux du nœud nouvellement rejoint publient un message similaire. Toutefois, ils ne publient ce message qu’une fois que tous les RTO ont été appris et que la synchronisation à froid est terminée. À la réception des messages d’achèvement de toutes les SPU ou flux distribués, la priorité des groupes de redondance 1+ passe à la priorité configurée sur chaque nœud s’il n’y a pas d’autres défaillances des composants surveillés, tels que les interfaces. Cette action permet de s’assurer que le nœud principal existant pour les groupes de redondance 1+ passe toujours à la priorité configurée en premier. Le nœud qui rejoint le cluster n’est ensuite déplacé vers les priorités configurées qu’une fois que tous ses SPU ou flux ont terminé leur processus de synchronisation à froid. Cette action garantit à son tour que le nœud nouvellement ajouté est prêt avec tous les RTO avant qu’il ne prenne le rôle principal.

Comprendre la surveillance de la synchronisation à froid lors du remplacement ou de l’extension d’un SPU

Si votre pare-feu SRX5600 ou SRX5800 fait partie d’un cluster de châssis, lorsque vous remplacez une carte de traitement des services (SPC) par un SPC2 ou un SPC3 sur l’équipement, vous devez basculer tous les groupes de redondance vers un seul nœud.

Les événements suivants se produisent au cours de ce scénario :

  • Lorsque SPC2 est installé sur un noeud (par exemple, sur le noeud 1, le noeud secondaire), le noeud 1 est arrêté afin que le SPC2 puisse être installé.

  • Une fois que le noeud 1 est mis sous tension et rejoint le cluster, le nombre de SPU sur le noeud 1 est supérieur au nombre de SPU sur le noeud 0, le noeud principal. Désormais, un noeud (noeud 0) a toujours un ancien SPC tandis que l’autre noeud a le nouveau SPC2 ; Les SPC2 ont quatre SPU par carte, tandis que les SPC plus anciens en ont deux par carte.

    Le processus de synchronisation à froid est basé sur le nombre total d’unités du réseau intégré (SSU) du nœud 0. Une fois que les SPU du nœud 1 correspondant aux SPU du nœud 0 ont terminé la synchronisation à froid, le nœud 1 déclare la synchronisation à froid terminée. Étant donné que les SPU supplémentaires du nœud 1 n’ont pas les SPU de nœud 0 correspondants, il n’y a rien à synchroniser et le basculement du nœud 0 vers le nœud 1 ne pose aucun problème.

    La fonctionnalité de surveillance SPU surveille tous les SPU et signale toute défaillance du SPU.

    Par exemple, supposons que les deux noeuds ont à l’origine 2 SPC existants et que vous avez remplacé les deux SPC par SPC2 sur le noeud 1. Nous avons désormais 4 SPU dans le nœud 0 et 8 SPU dans le nœud 1. La fonction de surveillance SPU surveille les 4 SPU sur le noeud 0 et les 8 SPU sur le noeud 1. Si l’un de ces 8 SPU tombe en panne dans le nœud 1, la surveillance de l’USP signale tout de même au processus jsrpd (Juniper Services Redundancy Protocol) qu’il y a une défaillance de l’USP. Le processus jsrpd contrôle la mise en cluster des châssis.

  • Une fois que le nœud 1 est prêt à basculer, vous pouvez lancer manuellement le basculement de tous les groupes de redondance vers le nœud 1. Le noeud 0 sera arrêté pour remplacer son SPC par le SPC2. Après le remplacement, le nœud 0 et le nœud 1 auront exactement la même configuration matérielle.

Une fois que le nœud 0 est mis sous tension et qu’il rejoint le cluster, le système fonctionne comme un cluster de châssis normal.

Lorsque le processus de synchronisation à froid est toujours en cours sur le pare-feu SRX Series dans le cluster du châssis, et si la liaison de contrôle est inactive, un délai (de 30 secondes) est prévu avant que le nœud ne passe de l’état secondaire à l’état primaire.

Comportement des objets de surveillance spécifique à la plate-forme

Utilisez l’explorateur de fonctionnalités pour confirmer la prise en charge de fonctionnalités spécifiques par la plate-forme et la version.

Utilisez le tableau suivant pour passer en revue les comportements spécifiques à votre plateforme.

Plateforme

Différence

SRX Series

  • Les pare-feu de la série SRX5000 qui prennent en charge la surveillance SPU sur les SPC, le moteur de routage surveille l'état du gestionnaire de châssis. Le gestionnaire de châssis envoie une pulsation au châssis du moteur de routage toutes les secondes. Le moteur de routage redémarre le SPC lorsqu’il détecte une perte de pulsation. Après plusieurs échecs de restauration, le moteur de routage met le SPC hors tension pour protéger l’ensemble du système.

  • Les pare-feu SRX5000 Series présentent les limitations suivantes pour l’insertion d’un SPC :

    • Le cluster de châssis doit être en mode actif/passif avant et pendant la procédure d’insertion SPC.

    • Il n’est pas possible d’insérer un nombre différent de SPC dans deux nœuds différents.

    • Un nouveau SPC doit être inséré dans une fente plus haute que la fente du point central.

      Le point central du combo existant ne peut pas être remplacé par un point central complet après l’insertion du nouveau SPC.

    • Lors d’une procédure d’insertion SPC, les configurations IKE et IPsec ne peuvent pas être modifiées.

      Un SPC n’est pas insérable à chaud. Avant d’insérer un SPC, l’appareil doit être mis hors ligne. Après avoir inséré un SPC, l’appareil doit être redémarré.

    • Vous ne pouvez pas spécifier l’instance SPU et l’instance IKE pour ancrer un tunnel.

    • Une fois qu’un nouveau SPC est inséré, les tunnels existants ne peuvent pas utiliser la puissance de traitement du nouveau SPC et la redistribuer au nouveau SPC.

  • Les pare-feu SRX5000 Series dotés d’un ou plusieurs SPU s’exécutent sur une carte de traitement des services (SPC). Ces pare-feu utilisent l’USP pour tous les services basés sur les flux. D’autres pare-feu SRX Series s’appuient sur le processus de transfert basé sur les flux ( flowd) pour transférer les paquets.