Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Présentation du cluster de châssis

Utilisez l’explorateur de fonctionnalités pour confirmer la prise en charge de fonctionnalités spécifiques par la plate-forme et la version.

Consultez la section Comportement du cluster de châssis spécifique à la plate-forme pour obtenir des remarques relatives à votre plate-forme.

Un cluster de châssis assure la haute disponibilité sur les pare-feu SRX Series, où deux équipements fonctionnent comme un seul équipement. Le cluster de châssis inclut la synchronisation des fichiers de configuration et des états de session d’exécution dynamiques entre les pare-feu SRX Series, qui font partie de la configuration du cluster de châssis.

Présentation du cluster de châssis

Junos OS offre une haute disponibilité sur le pare-feu SRX Series à l’aide de la mise en cluster des châssis. Les pare-feu SRX Series peuvent être configurés pour fonctionner en mode cluster, c’est-à-dire qu’une paire d’appareils peut être connectée et configurée pour fonctionner comme un nœud unique, fournissant ainsi une redondance des appareils, des interfaces et des niveaux de service.

Pour les pare-feu SRX Series, qui font office de pare-feu dynamiques, il est important de préserver l’état du trafic entre deux équipements. Dans une configuration de cluster de châssis, en cas de défaillance, la persistance des sessions est requise afin que les sessions établies ne soient pas abandonnées, même si l’équipement défaillant transférait du trafic.

Lorsqu’ils sont configurés en tant que cluster de châssis, les deux nœuds se sauvegardent mutuellement, l’un faisant office d’équipement principal et l’autre d’équipement secondaire, ce qui garantit un basculement dynamique des processus et des services en cas de défaillance du système ou du matériel. En cas de défaillance de l’équipement principal, l’équipement secondaire prend en charge le traitement du trafic. Les nœuds du cluster sont connectés à l’aide de deux liaisons, appelées lien de contrôle et liaison de structure, et les périphériques d’un cluster de châssis synchronisent les états de la configuration, du noyau et des sessions PFE sur l’ensemble du cluster pour faciliter la haute disponibilité, le basculement des services dynamiques et l’équilibrage de charge.

Aucune licence distincte n’est requise pour activer le cluster de châssis. Toutefois, certaines fonctionnalités du logiciel Junos OS nécessitent une licence pour être activées. Pour plus d’informations, reportez-vous aux sections Comprendre les exigences en matière de licences pour les clusters de châssis, Installation de licences sur les équipements SRX Series d’un cluster de châssis et Vérification des licences sur un équipement SRX Series dans un cluster de châssis. Reportez-vous au Guide des licences Juniper pour obtenir des informations générales sur la gestion des licences. Pour plus de détails, reportez-vous aux fiches techniques des passerelles de services SRX Series ou contactez votre équipe de compte Juniper ou votre partenaire Juniper.

Avantages du cluster de châssis

  • Empêche la défaillance d’un seul appareil entraînant une perte de connectivité.

  • Assure une haute disponibilité entre les équipements lors de la connexion des filiales et des sites distants aux bureaux plus importants de l’entreprise. La fonctionnalité de cluster de châssis permet aux entreprises d’assurer la connectivité en cas de défaillance d’un équipement ou d’une liaison.

Fonctionnalité de cluster de châssis

La fonctionnalité de cluster de châssis comprend :

  • Architecture système résiliente, avec un seul plan de contrôle actif pour l’ensemble du cluster et plusieurs moteurs de transfert de paquets. Cette architecture présente une vue unique du cluster sur un seul appareil.

  • Synchronisation des états de configuration et d’exécution dynamique entre les nœuds d’un cluster.

  • Surveillance des interfaces physiques et basculement si les paramètres de défaillance dépassent un seuil configuré.

Modes des clusters de châssis

Un cluster de châssis peut être configuré en mode actif/actif ou actif/passif.

  • Active/passive mode: En mode actif/passif, le trafic de transit passe par le noeud primaire tandis que le noeud de secours n’est utilisé qu’en cas de panne. Lorsqu’une panne survient, le périphérique de sauvegarde devient principal et prend en charge toutes les tâches de transfert.

  • Active/active mode: En mode actif/actif, le trafic de transit passe par les deux nœuds du cluster en permanence.

Comment fonctionne la mise en cluster des châssis ?

Les ports de contrôle des nœuds respectifs sont connectés pour former un plan de contrôle qui synchronise la configuration et l’état du noyau afin de faciliter la haute disponibilité des interfaces et des services.

Le plan de données des nœuds respectifs est connecté sur les ports de la structure pour former un plan de données unifié.

Lors de la création d’un cluster de châssis, les ports de contrôle des nœuds respectifs sont connectés pour former un plan de contrôle qui synchronise la configuration et l’état du noyau afin de faciliter la haute disponibilité des interfaces et des services.

De même, le plan de données des nœuds respectifs est connecté sur les ports de la structure pour former un plan de données unifié.

La liaison de structure permet de gérer le traitement des flux inter-nœuds et la gestion de la redondance des sessions.

Le logiciel du plan de contrôle fonctionne en mode actif ou de secours. Lorsqu’ils sont configurés en tant que cluster de châssis, les deux nœuds se sauvegardent mutuellement, l’un faisant office d’équipement principal et l’autre d’équipement secondaire, ce qui garantit un basculement dynamique des processus et des services en cas de défaillance du système ou du matériel. En cas de défaillance de l’équipement principal, l’équipement secondaire prend en charge le traitement du trafic.

Le logiciel du plan de données fonctionne en mode actif/actif. Dans un cluster en châssis, les informations de session sont mises à jour au fur et à mesure que le trafic traverse l’un ou l’autre des équipements, et ces informations sont transmises entre les nœuds via la liaison de structure pour garantir que les sessions établies ne sont pas abandonnées lorsqu’un basculement se produit. En mode actif/actif, il est possible que le trafic pénètre dans le cluster sur un nœud et en ressorte de l’autre nœud. Lorsqu’un équipement rejoint un cluster, il devient un nœud de ce cluster. À l’exception des paramètres de nœud uniques et des adresses IP de gestion, les nœuds d’un cluster partagent la même configuration.

À tout moment, un cluster peut se trouver dans l’un des états suivants : en attente, principal, en attente secondaire, secondaire, inéligible et désactivé. Une transition d’état peut être déclenchée en raison de n’importe quel événement, tel qu’une surveillance d’interface, une surveillance SPU, des défaillances et des basculements manuels.

Prise en charge de la mise en cluster IPv6

Outre la prise en charge des configurations de clusters de châssis actives/passives (basculement), les pare-feu SRX Series exécutant IP version 6 (IPv6) peuvent être déployés dans des configurations de clusters de châssis actif/actif (basculement). Une interface peut être configurée avec une adresse IPv4, une adresse IPv6 ou les deux. Les entrées du carnet d’adresses peuvent inclure n’importe quelle combinaison d’adresses IPv4, d’adresses IPv6 et de noms DNS (Domain Name System).

Le cluster de châssis prend en charge les tunnels GRE (Generic Routing Encapsulation) utilisés pour acheminer le trafic IPv4/IPv6 encapsulé au moyen d’une interface interne, gr-0/0/0. Cette interface est créée par Junos OS au démarrage du système et n’est utilisée que pour le traitement des tunnels GRE. Reportez-vous au Guide de l’utilisateur des interfaces pour les dispositifs de sécurité.

Cas d’utilisation des clusters de châssis SRX

Les réseaux d’entreprises et de fournisseurs de services utilisent diverses méthodes de redondance et de résilience au niveau du réseau de périphérie client. Ce niveau représentant l’entrée ou le point d’appairage sur Internet, sa stabilité et sa disponibilité sont d’une grande importance. Les informations transactionnelles des clients, les e-mails, la voix sur IP (VoIP) et le trafic sur site peuvent tous utiliser ce point d’entrée unique vers le réseau public. Dans les environnements où un VPN de site à site est la seule interconnexion entre les sites du client et le site du siège, ce lien devient encore plus vital.

Traditionnellement, plusieurs équipements avec des configurations discrètes ont été utilisés pour assurer la redondance au niveau de cette couche réseau, avec des résultats mitigés. Dans ces configurations, l’entreprise s’appuie sur des protocoles de routage et de redondance pour assurer une périphérie client hautement disponible et redondante. Ces protocoles sont souvent lents à reconnaître les défaillances et ne permettent généralement pas la synchronisation nécessaire pour gérer correctement le trafic dynamique. Étant donné qu’une bonne partie du trafic de l’entreprise transitant par la périphérie (vers/depuis Internet ou entre les sites clients) est dynamique, la configuration de cette couche réseau a toujours été difficile à relever pour garantir que l’état de session n’est pas perdu en cas de basculement ou de réversion.

Un autre défi lié à la configuration des équipements redondants est la nécessité de configurer, de gérer et de maintenir des équipements physiques distincts avec des configurations différentes. La synchronisation de ces configurations peut également être difficile, car plus les mesures de sécurité sont nécessaires et plus complexes, plus la probabilité que les configurations ne correspondent pas augmente également. Dans un environnement sécurisé, une configuration inadaptée peut entraîner des conséquences aussi simples qu’une perte de connectivité ou aussi complexes et coûteuses qu’une faille de sécurité totale. Tout événement anormal à la périphérie du client peut affecter la disponibilité, et par conséquent sur la capacité à fournir des services aux clients, voire à assurer la sécurité des données des clients.

Pour résoudre le problème de la configuration redondante de la périphérie client, il faut adopter une architecture de clustering sensible à l’état qui permet à deux équipements ou plus de fonctionner comme un seul équipement. Dans ce type d’architecture, les appareils peuvent partager des informations de session entre tous les appareils, ce qui permet un basculement quasi instantané et une réversion du trafic dynamique. L’une des principales mesures de réussite dans ce domaine est la capacité du cluster à basculer et à annuler le trafic tout en maintenant l’état des sessions actives.

L’utilisation de la configuration du cluster de châssis SRX décrite dans Exemple : La configuration d’une passerelle de services SRX Series en tant que cluster de châssis maillé complet réduit les temps d’arrêt du système.

Les équipements d’une architecture de clustering efficace peuvent également être gérés comme un seul appareil. partage d’un seul plan de contrôle. Cette fonction est essentielle car elle réduit les coûts d’exploitation associés à la gestion de plusieurs appareils. Plutôt que de gérer et d’exploiter des équipements distincts avec des configurations et des portails de gestion différents, vous pouvez gérer plusieurs équipements qui remplissent la même fonction via un seul point de gestion.

Enfin, dans une configuration de cluster, les équipements ont la possibilité de surveiller les interfaces actives pour déterminer leur état de service. Un cluster efficace surveille de manière proactive toutes les interfaces payantes et doit basculer vers des interfaces de secours si une défaillance est détectée. Cette opération doit être effectuée à intervalles quasi instantanés afin de minimiser l’impact d’une panne de service (interruption des appels des clients, etc.).

Limites des clusters de châssis

Les pare-feu SRX Series présentent les limitations de cluster de châssis suivantes :

Chassis Cluster

  • Le VPN de groupe n’est pas pris en charge.

  • Sur les pare-feu SRX Series dans un cluster de châssis, la surveillance des flux pour les versions 5 et 8 est prise en charge. Toutefois, la surveillance de flux pour la version 9 n’est pas prise en charge.

  • Lorsqu’un pare-feu SRX Series fonctionne en mode cluster de châssis et que vous rencontrez un problème d’accès à la puce IA dans un SPC ou une carte d’E/S (IOC), une alarme FPC mineure est activée pour déclencher le basculement du groupe de redondance.

Flow and Processing

  • Si vous utilisez la capture de paquets sur les interfaces reth, deux fichiers sont créés, l’un pour les paquets entrants et l’autre pour les paquets sortants en fonction du nom de l’interface reth. Ces fichiers peuvent être fusionnés en dehors de l’appareil à l’aide d’outils tels que Wireshark ou Mergecap.

  • Si vous utilisez la mise en miroir des ports sur les interfaces reth, l’interface reth ne peut pas être configurée en tant qu’interface de sortie. Vous devez utiliser une interface physique comme interface de sortie. Si vous configurez l’interface reth en tant qu’interface de sortie à l’aide de la set forwarding-options port-mirroring family inet output commande, le message d’erreur suivant s’affiche.

    Port-mirroring configuration error. Interface type in reth1.0 is not valid for port-mirroring or next-hop-group config

  • Lorsqu’un pare-feu SRX Series fonctionne en mode cluster de châssis et qu’il rencontre une puce IA (la puce IA fait partie de Juniper SPC1 et IOC1. Cela a un impact direct sur le problème d’accès au plan de contrôle SPC1/IOC1) dans un SPC ou une carte d’E/S (IOC), une alarme FPC mineure est activée pour déclencher le basculement du groupe de redondance.

  • Sur les pare-feu SRX Series dans un cluster de châssis, lorsque deux systèmes logiques sont configurés, la limite de mise à l’échelle dépasse 13 000, ce qui est très proche de la limite de mise à l’échelle standard de 15 000, et le temps de convergence est de 5 minutes. Ce problème se produit parce que l’apprentissage des routes multicast prend plus de temps lorsque le nombre de routes augmente.

Interfaces

  • Sur l’interface lsq-0/0/0, les services de liaison MLPPP, MLFR et CRTP ne sont pas pris en charge.

  • Sur l’interface lt-0/0/0, CoS pour RPM n’est pas pris en charge.

  • L’interface de numérotation 3G n’est pas prise en charge.

  • La mise en file d’attente sur l’interface ae n’est pas prise en charge.

Layer 2 Switching

Lors du basculement du pare-feu SRX Series, les points d’accès du commutateur de couche 2 redémarrent et tous les clients sans fil perdent leur connectivité pendant 4 à 6 minutes.

MIBs

  • La MIB du cluster de châssis n’est pas prise en charge.

IPv6

  • La surveillance des adresses IP des groupes de redondance n’est pas prise en charge pour les destinations IPv6.

MIBs

  • La MIB du cluster de châssis n’est pas prise en charge.

Nonstop Active Routing (NSR)

  • NSR peut préserver les informations de l’interface et du noyau, et enregistrer les informations relatives au protocole de routage en exécutant le processus RPD (Routing Protocol Process) sur le moteur de routage de secours. Cependant, la plupart des plates-formes SRX ne prennent pas encore en charge NSR. Donc, sur le nœud secondaire, il n’y a pas de démon RPD existant. Une fois le basculement RG0 effectué, le nouveau maître RG0 dispose d’un nouveau RPD et doit renégocier avec l’appareil homologue.

Les fonctions d’échantillonnage telles que la surveillance de flux, la capture de paquets et la mise en miroir des ports sont prises en charge sur les interfaces reth.

Comportement des clusters de châssis spécifiques à la plate-forme

Utilisez l’explorateur de fonctionnalités pour confirmer la prise en charge de fonctionnalités spécifiques par la plate-forme et la version.

Utilisez le tableau suivant pour passer en revue les comportements spécifiques à votre plateforme.

Plateforme

Différence

SRX Series

  • Les pare-feu SRX5000 Series qui prennent en charge les clusters de châssis présentent les limitations suivantes :

    • Vous pouvez collecter des données de statistiques d’écran sur l’appareil principal uniquement.

    • Les configurations à huit files d’attente ne sont pas reflétées sur l’interface du cluster de châssis.

    • Un filtre APN ou IMSI doit être limité à 600 pour chaque profil GTP. Le nombre de filtres est directement proportionnel au nombre d’entrées de préfixe IMSI. Par exemple, si un APN est configuré avec deux entrées de préfixe IMSI, le nombre de filtres est de deux.

  • Les pare-feu SRX4600 et SRX5000 Series qui prennent en charge les clusters de châssis présentent les limitations suivantes :

    • Dans les configurations de clusters à châssis de grande taille, si plus de 1 000 interfaces logiques sont utilisées, il est recommandé d’augmenter les temporisateurs de pulsation du cluster par rapport au temps d’attente par défaut avant de déclencher le basculement. Dans une implémentation à pleine capacité, nous recommandons d’augmenter l’attente à 8 secondes en modifiant heartbeat-threshold les valeurs et heartbeat-interval dans la [edit chassis cluster] hiérarchie.

    • Le produit des heartbeat-threshold valeurs et heartbeat-interval définit le temps avant le basculement. Les valeurs par défaut (heartbeat-threshold de 3 battements et heartbeat-interval de 1000 millisecondes) produisent un temps d’attente de 3 secondes.

    • Pour modifier le temps d’attente, modifiez les valeurs des options afin que le produit soit égal au réglage souhaité. Par exemple, la définition de la heartbeat-threshold valeur 8 et le maintien de la valeur par défaut de ( heartbeat-interval 1000 millisecondes) donnent un temps d’attente de 8 secondes. De même, le réglage de 4 heartbeat-threshold et de heartbeat-interval 2000 millisecondes donne également un temps d’attente de 8 secondes.

    • Si le noeud principal exécutant le processus LACP (lacpd) subit un redémarrage gracieux ou disgracieux, le démarrage du lacpd sur le nouveau noeud principal peut prendre quelques secondes ou réinitialiser les interfaces et les machines d’état pour récupérer des résultats synchrones inattendus. De même, lors du basculement, lorsque le système traite des paquets de trafic ou des paquets internes à haute priorité (suppression de sessions ou rétablissement de tâches), les paquets LACP de priorité moyenne provenant de l’homologue (commutateur) sont repoussés dans les files d’attente, ce qui entraîne un retard supplémentaire.

  • SRX300 Series, SRX1500, SRX1600, SRX2300, SRX4120 et SRX4300 Les pare-feu qui prennent en charge les clusters de châssis présentent les limitations suivantes :

    • Le nombre maximal d’adresses IP de surveillance pouvant être configurées par cluster est de 64 .

    • Les journaux ne peuvent pas être envoyés à Network and Security Manager (NSM) lorsque la journalisation est configurée en mode flux. Les journaux ne peuvent pas être envoyés, car le journal de sécurité ne prend pas en charge la configuration de l’adresse IP source pour l’interface fxp0 et la destination du journal de sécurité en mode flux ne peut pas être acheminée via l’interface fxp0. Cela signifie que vous ne pouvez pas configurer le serveur de journaux de sécurité dans le même sous-réseau que l’interface fxp0 et acheminer le serveur de journaux via l’interface fxp0.

    • Pour les pare-feu SRX300 Series qui prennent en charge les clusters de châssis, le paramètre n’est reboot pas disponible, car les équipements d’un cluster sont automatiquement redémarrés après une mise à niveau du cluster intrabande (ICU).

Tableau de l’historique des modifications

La prise en charge des fonctionnalités est déterminée par la plateforme et la version que vous utilisez. Utilisez l’explorateur de fonctionnalités pour déterminer si une fonctionnalité est prise en charge sur votre plateforme.

Libérer
Description
12.1X45
À partir de la version 12.1X45-D10 de Junos OS et versions ultérieures, les interfaces reth prennent en charge les fonctions d’échantillonnage telles que la surveillance des flux, la capture de paquets et la mise en miroir des ports.