Présentation du cluster de châssis
Utilisez l’explorateur de fonctionnalités pour confirmer la prise en charge de fonctionnalités spécifiques par la plate-forme et la version.
Consultez la section Comportement du cluster de châssis spécifique à la plate-forme pour obtenir des remarques relatives à votre plate-forme.
Un cluster de châssis assure la haute disponibilité sur les pare-feu SRX Series, où deux équipements fonctionnent comme un seul équipement. Le cluster de châssis inclut la synchronisation des fichiers de configuration et des états de session d’exécution dynamiques entre les pare-feu SRX Series, qui font partie de la configuration du cluster de châssis.
Présentation du cluster de châssis
Junos OS offre une haute disponibilité sur le pare-feu SRX Series à l’aide de la mise en cluster des châssis. Les pare-feu SRX Series peuvent être configurés pour fonctionner en mode cluster, c’est-à-dire qu’une paire d’appareils peut être connectée et configurée pour fonctionner comme un nœud unique, fournissant ainsi une redondance des appareils, des interfaces et des niveaux de service.
Pour les pare-feu SRX Series, qui font office de pare-feu dynamiques, il est important de préserver l’état du trafic entre deux équipements. Dans une configuration de cluster de châssis, en cas de défaillance, la persistance des sessions est requise afin que les sessions établies ne soient pas abandonnées, même si l’équipement défaillant transférait du trafic.
Lorsqu’ils sont configurés en tant que cluster de châssis, les deux nœuds se sauvegardent mutuellement, l’un faisant office d’équipement principal et l’autre d’équipement secondaire, ce qui garantit un basculement dynamique des processus et des services en cas de défaillance du système ou du matériel. En cas de défaillance de l’équipement principal, l’équipement secondaire prend en charge le traitement du trafic. Les nœuds du cluster sont connectés à l’aide de deux liaisons, appelées lien de contrôle et liaison de structure, et les périphériques d’un cluster de châssis synchronisent les états de la configuration, du noyau et des sessions PFE sur l’ensemble du cluster pour faciliter la haute disponibilité, le basculement des services dynamiques et l’équilibrage de charge.
Aucune licence distincte n’est requise pour activer le cluster de châssis. Toutefois, certaines fonctionnalités du logiciel Junos OS nécessitent une licence pour être activées. Pour plus d’informations, reportez-vous aux sections Comprendre les exigences en matière de licences pour les clusters de châssis, Installation de licences sur les équipements SRX Series d’un cluster de châssis et Vérification des licences sur un équipement SRX Series dans un cluster de châssis. Reportez-vous au Guide des licences Juniper pour obtenir des informations générales sur la gestion des licences. Pour plus de détails, reportez-vous aux fiches techniques des passerelles de services SRX Series ou contactez votre équipe de compte Juniper ou votre partenaire Juniper.
- Avantages du cluster de châssis
- Fonctionnalité de cluster de châssis
- Modes des clusters de châssis
- Comment fonctionne la mise en cluster des châssis ?
- Prise en charge de la mise en cluster IPv6
- Cas d’utilisation des clusters de châssis SRX
Avantages du cluster de châssis
-
Empêche la défaillance d’un seul appareil entraînant une perte de connectivité.
-
Assure une haute disponibilité entre les équipements lors de la connexion des filiales et des sites distants aux bureaux plus importants de l’entreprise. La fonctionnalité de cluster de châssis permet aux entreprises d’assurer la connectivité en cas de défaillance d’un équipement ou d’une liaison.
Fonctionnalité de cluster de châssis
La fonctionnalité de cluster de châssis comprend :
-
Architecture système résiliente, avec un seul plan de contrôle actif pour l’ensemble du cluster et plusieurs moteurs de transfert de paquets. Cette architecture présente une vue unique du cluster sur un seul appareil.
-
Synchronisation des états de configuration et d’exécution dynamique entre les nœuds d’un cluster.
-
Surveillance des interfaces physiques et basculement si les paramètres de défaillance dépassent un seuil configuré.
Modes des clusters de châssis
Un cluster de châssis peut être configuré en mode actif/actif ou actif/passif.
-
Active/passive mode: En mode actif/passif, le trafic de transit passe par le noeud primaire tandis que le noeud de secours n’est utilisé qu’en cas de panne. Lorsqu’une panne survient, le périphérique de sauvegarde devient principal et prend en charge toutes les tâches de transfert.
-
Active/active mode: En mode actif/actif, le trafic de transit passe par les deux nœuds du cluster en permanence.
Comment fonctionne la mise en cluster des châssis ?
Les ports de contrôle des nœuds respectifs sont connectés pour former un plan de contrôle qui synchronise la configuration et l’état du noyau afin de faciliter la haute disponibilité des interfaces et des services.
Le plan de données des nœuds respectifs est connecté sur les ports de la structure pour former un plan de données unifié.
Lors de la création d’un cluster de châssis, les ports de contrôle des nœuds respectifs sont connectés pour former un plan de contrôle qui synchronise la configuration et l’état du noyau afin de faciliter la haute disponibilité des interfaces et des services.
De même, le plan de données des nœuds respectifs est connecté sur les ports de la structure pour former un plan de données unifié.
La liaison de structure permet de gérer le traitement des flux inter-nœuds et la gestion de la redondance des sessions.
Le logiciel du plan de contrôle fonctionne en mode actif ou de secours. Lorsqu’ils sont configurés en tant que cluster de châssis, les deux nœuds se sauvegardent mutuellement, l’un faisant office d’équipement principal et l’autre d’équipement secondaire, ce qui garantit un basculement dynamique des processus et des services en cas de défaillance du système ou du matériel. En cas de défaillance de l’équipement principal, l’équipement secondaire prend en charge le traitement du trafic.
Le logiciel du plan de données fonctionne en mode actif/actif. Dans un cluster en châssis, les informations de session sont mises à jour au fur et à mesure que le trafic traverse l’un ou l’autre des équipements, et ces informations sont transmises entre les nœuds via la liaison de structure pour garantir que les sessions établies ne sont pas abandonnées lorsqu’un basculement se produit. En mode actif/actif, il est possible que le trafic pénètre dans le cluster sur un nœud et en ressorte de l’autre nœud. Lorsqu’un équipement rejoint un cluster, il devient un nœud de ce cluster. À l’exception des paramètres de nœud uniques et des adresses IP de gestion, les nœuds d’un cluster partagent la même configuration.
À tout moment, un cluster peut se trouver dans l’un des états suivants : en attente, principal, en attente secondaire, secondaire, inéligible et désactivé. Une transition d’état peut être déclenchée en raison de n’importe quel événement, tel qu’une surveillance d’interface, une surveillance SPU, des défaillances et des basculements manuels.
Prise en charge de la mise en cluster IPv6
Outre la prise en charge des configurations de clusters de châssis actives/passives (basculement), les pare-feu SRX Series exécutant IP version 6 (IPv6) peuvent être déployés dans des configurations de clusters de châssis actif/actif (basculement). Une interface peut être configurée avec une adresse IPv4, une adresse IPv6 ou les deux. Les entrées du carnet d’adresses peuvent inclure n’importe quelle combinaison d’adresses IPv4, d’adresses IPv6 et de noms DNS (Domain Name System).
Le cluster de châssis prend en charge les tunnels GRE (Generic Routing Encapsulation) utilisés pour acheminer le trafic IPv4/IPv6 encapsulé au moyen d’une interface interne, gr-0/0/0. Cette interface est créée par Junos OS au démarrage du système et n’est utilisée que pour le traitement des tunnels GRE. Reportez-vous au Guide de l’utilisateur des interfaces pour les dispositifs de sécurité.
Cas d’utilisation des clusters de châssis SRX
Les réseaux d’entreprises et de fournisseurs de services utilisent diverses méthodes de redondance et de résilience au niveau du réseau de périphérie client. Ce niveau représentant l’entrée ou le point d’appairage sur Internet, sa stabilité et sa disponibilité sont d’une grande importance. Les informations transactionnelles des clients, les e-mails, la voix sur IP (VoIP) et le trafic sur site peuvent tous utiliser ce point d’entrée unique vers le réseau public. Dans les environnements où un VPN de site à site est la seule interconnexion entre les sites du client et le site du siège, ce lien devient encore plus vital.
Traditionnellement, plusieurs équipements avec des configurations discrètes ont été utilisés pour assurer la redondance au niveau de cette couche réseau, avec des résultats mitigés. Dans ces configurations, l’entreprise s’appuie sur des protocoles de routage et de redondance pour assurer une périphérie client hautement disponible et redondante. Ces protocoles sont souvent lents à reconnaître les défaillances et ne permettent généralement pas la synchronisation nécessaire pour gérer correctement le trafic dynamique. Étant donné qu’une bonne partie du trafic de l’entreprise transitant par la périphérie (vers/depuis Internet ou entre les sites clients) est dynamique, la configuration de cette couche réseau a toujours été difficile à relever pour garantir que l’état de session n’est pas perdu en cas de basculement ou de réversion.
Un autre défi lié à la configuration des équipements redondants est la nécessité de configurer, de gérer et de maintenir des équipements physiques distincts avec des configurations différentes. La synchronisation de ces configurations peut également être difficile, car plus les mesures de sécurité sont nécessaires et plus complexes, plus la probabilité que les configurations ne correspondent pas augmente également. Dans un environnement sécurisé, une configuration inadaptée peut entraîner des conséquences aussi simples qu’une perte de connectivité ou aussi complexes et coûteuses qu’une faille de sécurité totale. Tout événement anormal à la périphérie du client peut affecter la disponibilité, et par conséquent sur la capacité à fournir des services aux clients, voire à assurer la sécurité des données des clients.
Pour résoudre le problème de la configuration redondante de la périphérie client, il faut adopter une architecture de clustering sensible à l’état qui permet à deux équipements ou plus de fonctionner comme un seul équipement. Dans ce type d’architecture, les appareils peuvent partager des informations de session entre tous les appareils, ce qui permet un basculement quasi instantané et une réversion du trafic dynamique. L’une des principales mesures de réussite dans ce domaine est la capacité du cluster à basculer et à annuler le trafic tout en maintenant l’état des sessions actives.
L’utilisation de la configuration du cluster de châssis SRX décrite dans Exemple : La configuration d’une passerelle de services SRX Series en tant que cluster de châssis maillé complet réduit les temps d’arrêt du système.
Les équipements d’une architecture de clustering efficace peuvent également être gérés comme un seul appareil. partage d’un seul plan de contrôle. Cette fonction est essentielle car elle réduit les coûts d’exploitation associés à la gestion de plusieurs appareils. Plutôt que de gérer et d’exploiter des équipements distincts avec des configurations et des portails de gestion différents, vous pouvez gérer plusieurs équipements qui remplissent la même fonction via un seul point de gestion.
Enfin, dans une configuration de cluster, les équipements ont la possibilité de surveiller les interfaces actives pour déterminer leur état de service. Un cluster efficace surveille de manière proactive toutes les interfaces payantes et doit basculer vers des interfaces de secours si une défaillance est détectée. Cette opération doit être effectuée à intervalles quasi instantanés afin de minimiser l’impact d’une panne de service (interruption des appels des clients, etc.).
Limites des clusters de châssis
Les pare-feu SRX Series présentent les limitations de cluster de châssis suivantes :
Chassis Cluster
-
Le VPN de groupe n’est pas pris en charge.
-
Sur les pare-feu SRX Series dans un cluster de châssis, la surveillance des flux pour les versions 5 et 8 est prise en charge. Toutefois, la surveillance de flux pour la version 9 n’est pas prise en charge.
-
Lorsqu’un pare-feu SRX Series fonctionne en mode cluster de châssis et que vous rencontrez un problème d’accès à la puce IA dans un SPC ou une carte d’E/S (IOC), une alarme FPC mineure est activée pour déclencher le basculement du groupe de redondance.
Flow and Processing
-
Si vous utilisez la capture de paquets sur les interfaces reth, deux fichiers sont créés, l’un pour les paquets entrants et l’autre pour les paquets sortants en fonction du nom de l’interface reth. Ces fichiers peuvent être fusionnés en dehors de l’appareil à l’aide d’outils tels que Wireshark ou Mergecap.
-
Si vous utilisez la mise en miroir des ports sur les interfaces reth, l’interface reth ne peut pas être configurée en tant qu’interface de sortie. Vous devez utiliser une interface physique comme interface de sortie. Si vous configurez l’interface reth en tant qu’interface de sortie à l’aide de la
set forwarding-options port-mirroring family inet outputcommande, le message d’erreur suivant s’affiche.Port-mirroring configuration error.Interface type in reth1.0 is not valid for port-mirroring or next-hop-group config -
Lorsqu’un pare-feu SRX Series fonctionne en mode cluster de châssis et qu’il rencontre une puce IA (la puce IA fait partie de Juniper SPC1 et IOC1. Cela a un impact direct sur le problème d’accès au plan de contrôle SPC1/IOC1) dans un SPC ou une carte d’E/S (IOC), une alarme FPC mineure est activée pour déclencher le basculement du groupe de redondance.
-
Sur les pare-feu SRX Series dans un cluster de châssis, lorsque deux systèmes logiques sont configurés, la limite de mise à l’échelle dépasse 13 000, ce qui est très proche de la limite de mise à l’échelle standard de 15 000, et le temps de convergence est de 5 minutes. Ce problème se produit parce que l’apprentissage des routes multicast prend plus de temps lorsque le nombre de routes augmente.
Interfaces
-
Sur l’interface lsq-0/0/0, les services de liaison MLPPP, MLFR et CRTP ne sont pas pris en charge.
-
Sur l’interface lt-0/0/0, CoS pour RPM n’est pas pris en charge.
-
L’interface de numérotation 3G n’est pas prise en charge.
-
La mise en file d’attente sur l’interface ae n’est pas prise en charge.
Layer 2 Switching
Lors du basculement du pare-feu SRX Series, les points d’accès du commutateur de couche 2 redémarrent et tous les clients sans fil perdent leur connectivité pendant 4 à 6 minutes.
MIBs
-
La MIB du cluster de châssis n’est pas prise en charge.
IPv6
-
La surveillance des adresses IP des groupes de redondance n’est pas prise en charge pour les destinations IPv6.
MIBs
-
La MIB du cluster de châssis n’est pas prise en charge.
Nonstop Active Routing (NSR)
-
NSR peut préserver les informations de l’interface et du noyau, et enregistrer les informations relatives au protocole de routage en exécutant le processus RPD (Routing Protocol Process) sur le moteur de routage de secours. Cependant, la plupart des plates-formes SRX ne prennent pas encore en charge NSR. Donc, sur le nœud secondaire, il n’y a pas de démon RPD existant. Une fois le basculement RG0 effectué, le nouveau maître RG0 dispose d’un nouveau RPD et doit renégocier avec l’appareil homologue.
Les fonctions d’échantillonnage telles que la surveillance de flux, la capture de paquets et la mise en miroir des ports sont prises en charge sur les interfaces reth.
Voir aussi
Comportement des clusters de châssis spécifiques à la plate-forme
Utilisez l’explorateur de fonctionnalités pour confirmer la prise en charge de fonctionnalités spécifiques par la plate-forme et la version.
Utilisez le tableau suivant pour passer en revue les comportements spécifiques à votre plateforme.
| Plateforme |
Différence |
|---|---|
| SRX Series |
|
Tableau de l’historique des modifications
La prise en charge des fonctionnalités est déterminée par la plateforme et la version que vous utilisez. Utilisez l’explorateur de fonctionnalités pour déterminer si une fonctionnalité est prise en charge sur votre plateforme.