Grundlegendes zu Hochverfügbarkeitsfunktionen auf Routern von Juniper Networks
Für Routing-Plattformen von Juniper Networks, die auf dem Betriebssystem Junos (Junos OS) ausgeführt werden, bezieht sich Hochverfügbarkeit auf die Hardware- und Softwarekomponenten, die Redundanz und Zuverlässigkeit für die paketbasierte Kommunikation bieten. Dieses Thema enthält eine kurze Übersicht über die folgenden Hochverfügbarkeitsfeatures:
Routing-Engine-Redundanz
Redundante Routing-Engines sind zwei Routing-Engines, die auf derselben Routing-Plattform installiert sind. Eine fungiert als primäre Engine, während die andere als Backup bereitsteht, falls die primäre Routing-Engine ausfällt. Auf Routing-Plattformen mit dualen Routing-Engines erfolgt die Netzwerkrekonvergenz schneller als auf Routing-Plattformen mit einer einzelnen Routing-Engine.
Graceful Routing-Engine Switchover
Graceful Routing-Engine Switchover (GRES) ermöglicht es einer Routing-Plattform mit redundanten Routing-Engines, Pakete weiter weiterzuleiten, selbst wenn eine Routing-Engine ausfällt. Graceful Routing-Engine Switchover behält Schnittstellen- und Kernelinformationen bei. Der Verkehr wird nicht unterbrochen. Bei der ordnungsgemäßen Umschaltung der Routing-Engine wird die Steuerungsebene jedoch nicht beibehalten. Benachbarte Router erkennen, dass der Router neu gestartet wurde, und reagieren auf das Ereignis in einer Weise, die durch individuelle Routing-Protokollspezifikationen vorgeschrieben ist.
Um das Routing während eines Switchovers beizubehalten, muss Graceful Routing-Engine Switchover entweder mit Graceful Restart-Protokollerweiterungen oder aktivem Nonstop-Routing kombiniert werden. Weitere Informationen finden Sie unter Grundlegendes zu Konzepten des Switchovers der Graceful Routing-Engine und des aktiven Nonstop-Routings.
Bei Routern der T-Serie, TX Matrix-Routern und TX Matrix Plus-Routern bleibt die Steuerungsebene im Falle von GRES mit NSR erhalten, und 75 % des Datenverkehrs pro Packet Forwarding Engine bleiben während GRES ununterbrochen.
Nonstop-Bridging
Nonstop-Bridging ermöglicht es einem MX-Serie 5G-Universelle Routing-Plattform mit redundanten Routing-Engines, von einem primären Routing-Engine zu einem Backup-Routing-Engine zu wechseln, ohne dass L2CP-Informationen (Layer 2 Control Protocol) verloren gehen. Nonstop Bridging verwendet dieselbe Infrastruktur wie Graceful Routing-Engine Switchover, um Schnittstellen- und Kernelinformationen zu erhalten. Nonstop-Bridging spart jedoch auch L2CP-Informationen, indem der Layer 2 Control Protocol-Prozess (l2cpd) auf der Backup-Routing-Engine ausgeführt wird.
Um Nonstop-Bridging verwenden zu können, müssen Sie zunächst das Graceful Routing-Engine-Switchover aktivieren.
Nonstop-Bridging wird für die folgenden Layer-2-Steuerungsprotokolle unterstützt:
Spanning Tree Protocol (STP)
Rapid Spanning Tree Protocol (RSTP)
Multiple Spanning Tree Protocol (MSTP)
VLAN Spanning Tree Protocol (VSTP)
Weitere Informationen finden Sie unter Nonstop-Bridging-Konzepte.
Nonstop-Aktives Routing
Nonstop Active Routing (NSR) ermöglicht es einer Routing-Plattform mit redundanten Routing-Engines, von einer primären Routing-Engine zu einer Backup-Routing-Engine zu wechseln, ohne die Peer-Knoten über eine Änderung zu informieren. Nonstop Active Routing verwendet dieselbe Infrastruktur wie Graceful Routing-Engine Switchover, um Schnittstellen- und Kernelinformationen zu erhalten. Beim unterbrechungsfreien, aktiven Routing werden jedoch auch Routinginformationen und Protokollsitzungen beibehalten, indem der Routing-Protokollprozess (rpd) auf beiden Routing-Engines ausgeführt wird. Darüber hinaus bleiben beim Nonstop-Routing die im Kernel gepflegten TCP-Verbindungen erhalten.
Um unterbrechungsfreies aktives Routing verwenden zu können, müssen Sie auch den ordnungsgemäßen Umschaltung der Routing-Engine konfigurieren.
Eine Liste der Protokolle und Funktionen, die vom Nonstop-Routing unterstützt werden, finden Sie unter Nonstop Active Routing Protocol and Feature Support.
Weitere Informationen zum unterbrechungsfreien aktiven Routing finden Sie unter Konzepte für unterbrechungsfreies aktives Routing.
Graceful-Restart
Bei Routing-Protokollen erfordert jede Serviceunterbrechung, dass ein betroffener Router die Nachbarschaften zu benachbarten Routern neu berechnet, Einträge in der Routing-Tabelle wiederherstellt und andere protokollspezifische Informationen aktualisiert. Ein ungeschützter Neustart eines Routers kann zu Verzögerungen bei der Weiterleitung, Routen-Flapping, Wartezeiten aufgrund von Protokoll-Rekonvergenz und sogar zu Paketverlusten führen. Um diese Situation zu verringern, bietet Graceful Restart Erweiterungen für Routing-Protokolle. Diese Protokollerweiterungen definieren zwei Rollen für einen Router: Neustart und Hilfsprogramm. Die Erweiterungen signalisieren benachbarten Routern, dass ein Router neu gestartet wird, und verhindern, dass die Nachbarn die Zustandsänderung während eines ordnungsgemäßen Neustart-Warteintervalls an das Netzwerk weitergeben. Die wichtigsten Vorteile eines ordnungsgemäßen Neustarts sind die ununterbrochene Weiterleitung von Paketen und die vorübergehende Unterdrückung aller Routing-Protokoll-Updates. Ein graceful-Restart ermöglicht es einem Router, zwischenliegende Konvergenzzustände zu durchlaufen, die vor dem Rest des Netzwerks verborgen sind.
Wenn auf einem Router ein ordnungsgemäßer Neustart ausgeführt wird und der Router keine Protokollverfügbarkeitsmeldungen (Hallos) mehr sendet und beantwortet, gehen die Nachbarn von einem ordnungsgemäßen Neustart aus und beginnen mit der Ausführung eines Timers, um den Neustart des Routers zu überwachen. Während dieses Intervalls verarbeiten Hilfsrouter keine Änderung in der Nachbarschaft des Routers, von der sie annehmen, dass sie neu gestartet wird, sondern setzen das aktive Routing mit dem Rest des Netzwerks fort. Die Hilfsrouter gehen davon aus, dass der Router die zustandsbehaftete Weiterleitung basierend auf dem letzten beibehaltenen Routingstatus während des Neustarts fortsetzen kann.
Wenn der Router tatsächlich neu gestartet wurde und vor Ablauf des Graceful-Timers in allen Hilfsroutern wieder betriebsbereit ist, stellen die Hilfsrouter dem Router die Routing-Tabelle, Topologietabelle oder Labeltabelle (je nach Protokoll) zur Verfügung, beenden den Graceful-Zeitraum und kehren zum normalen Netzwerkrouting zurück.
Wenn der Router seine Aushandlung mit den Hilfsroutern nicht vor Ablauf des ordnungsgemäßen Timers in allen Hilfsroutern abschließt, verarbeiten die Hilfsrouter die Zustandsänderung des Routers und senden Routing-Updates, sodass die Konvergenz im gesamten Netzwerk erfolgt. Wenn ein Hilfsrouter einen Verbindungsfehler vom Router erkennt, bewirkt die Topologieänderung, dass der Hilfsrouter die ordnungsgemäße Wartezeit verlässt und Routing-Updates sendet, sodass Netzwerkkonvergenz erfolgt.
Damit ein Router einen ordnungsgemäßen Neustart durchführen kann, müssen Sie die Anweisung graceful-restart
auf globaler [edit routing-options]
oder [edit routing-instances instance-name routing-options]
Hierarchieebene einschließen. Optional können Sie die globalen Einstellungen auf individueller Protokollebene ändern. Wenn eine Routing-Sitzung gestartet wird, muss ein Router, der mit einem ordnungsgemäßen Neustart konfiguriert ist, mit seinen Nachbarn verhandeln, um ihn bei einem ordnungsgemäßen Neustart zu unterstützen. Ein benachbarter Router akzeptiert den Aushandlungs- und Support-Hilfsmodus, ohne dass ein ordnungsgemäßer Neustart auf dem benachbarten Router konfiguriert werden muss.
Ein Routing-Engine-Switchover-Ereignis auf einem Hilfsrouter, der sich im Graceful-Wait-Zustand befindet, bewirkt, dass der Router den Wartestatus löscht und die Statusänderung der benachbarten Router an das Netzwerk weitergibt.
Der ordnungsgemäße Neustart wird für die folgenden Protokolle und Anwendungen unterstützt:
BGP
ES-IS
IS-IS
OSPF/OSPFv3
PIM-Sparse-Mode
RIP/RIPng
MPLS-bezogene Protokolle, einschließlich:
Label Distribution Protocol (LDP)
Resource Reservation Protocol (RSVP)
Circuit Cross-Connect (CCC)
Translational Cross-Connect (TCC)
Virtuelle private Netzwerke (VPNs) der Layer 2 und Layer 3
Weitere Informationen finden Sie unter Konzepte für einen ordnungsgemäßen Neustart.
Nonstop-aktives Routing im Vergleich zu elegantem Neustart
Nonstop-aktives Routing und Graceful-Restart sind zwei verschiedene Methoden zur Aufrechterhaltung der Hochverfügbarkeit. Für einen ordnungsgemäßen Neustart ist ein Neustart des Routers erforderlich. Ein Router, der einen ordnungsgemäßen Neustart durchläuft, verlässt sich bei der Wiederherstellung seiner Routing-Protokollinformationen auf seine Nachbarn (oder Helfer). Der Neustart ist der Mechanismus, durch den Helfer signalisiert werden, das Warteintervall zu verlassen und Routing-Informationen für den neu startenden Router bereitzustellen. Weitere Informationen finden Sie unter Konzepte für einen ordnungsgemäßen Neustart.
Im Gegensatz dazu erfordert aktives Nonstop-Routing keinen Neustart des Routers. Sowohl die primäre als auch die Backup-Routing-Engine führen den Routingprotokollprozess (rpd) aus und tauschen Aktualisierungen mit Nachbarn aus. Wenn eine Routing-Engine ausfällt, schaltet der Router einfach auf die aktive Routing-Engine um, um Routing-Informationen mit Nachbarn auszutauschen. Aufgrund dieser Funktionsunterschiede schließen sich Nonstop-Routing und Graceful-Restart gegenseitig aus. Nonstop-aktives Routing kann nicht aktiviert werden, wenn der Router als Router mit ordnungsgemäßem Neustart konfiguriert ist. Wenn Sie die Anweisung auf einer graceful-restart
beliebigen Hierarchieebene und die nonstop-routing
Anweisung auf der [edit routing-options]
Hierarchieebene einschließen und versuchen, einen Commit für die Konfiguration auszuführen, schlägt die Commitanforderung fehl. Weitere Informationen finden Sie unter Konzepte für aktives Nonstop-Routing.
Auswirkungen einer Routing-Engine-Umschaltung
Auswirkungen eines Routing-Engine-Switchovers beschreibt die Auswirkungen eines Routing-Engine-Switchovers, wenn keine Hochverfügbarkeitsfunktionen aktiviert sind und wenn Graceful-Routing-Engine-Switchover, Graceful-Restart und Nonstop-Routing-Features aktiviert sind.
VRRP
Das Virtual Router Redundancy Protocol (VRRP) ermöglicht es Hosts in einem LAN, redundante Routing-Plattformen (primäre und Backup-Paare) im LAN zu nutzen, sodass nur die statische Konfiguration einer einzigen Standardroute auf den Hosts erforderlich ist.
Die VRRP-Routing-Plattformpaare teilen sich die IP-Adresse, die der auf den Hosts konfigurierten Standardroute entspricht. Zu jeder Zeit ist eine der VRRP-Routing-Plattformen die primäre (aktive) und die anderen sind Backups. Wenn der primäre Router ausfällt, wird einer der Backup-Router oder -Switches zum neuen primären Router.
VRRP hat Vorteile in Bezug auf einfache Administration, Netzwerkdurchsatz und Zuverlässigkeit:
Es stellt eine virtuelle Standard-Routing-Plattform bereit.
Er ermöglicht das Routing von Datenverkehr im LAN ohne einen Single Point of Failure.
Ein virtueller Backup-Router kann einen ausgefallenen Standard-Router übernehmen:
Innerhalb weniger Sekunden.
Mit einem Minimum an VRRP-Traffic.
Ganz ohne Interaktion mit den Hosts.
Geräte, auf denen VRRP ausgeführt wird, wählen dynamisch primäre und Backup-Router aus. Sie können auch die Zuweisung von primären und Backup-Routern mit Prioritäten von 1 bis 255 erzwingen, wobei 255 die höchste Priorität darstellt.
Im VRRP-Betrieb sendet der primäre Standardrouter in regelmäßigen Abständen Ankündigungen an Backup-Router (Standard 1 Sekunde). Wenn ein Backup-Router für einen bestimmten Zeitraum keine Ankündigung erhält, übernimmt der Backup-Router mit der nächsthöheren Priorität die Rolle des Primärrouters und beginnt mit der Weiterleitung von Paketen.
Ab Junos OS Version 13.2 ist VRRP Nonstop Active Routing (NSR) nur aktiviert, wenn Sie die nonstop-routing
Anweisung auf der [edit routing-options]
Hierarchieebene ODER [edit logical system logical-system-name routing-options]
konfigurieren.
Weitere Informationen finden Sie unter Grundlegendes zu VRRP.
Einheitliche ISSU
Ein einheitliches In-Service-Software-Upgrade (Unified ISSU) ermöglicht Ihnen ein Upgrade zwischen zwei verschiedenen Junos OS-Versionen ohne Unterbrechung der Steuerungsebene und mit minimaler Unterbrechung des Datenverkehrs. Unified ISSU wird nur von dualen Routing-Engine-Plattformen unterstützt. Darüber hinaus müssen Graceful Routing-Engine Switchover (GRES) und Nonstop Active Routing (NSR) aktiviert sein.
Mit einer einheitlichen ISSU können Sie Netzwerkausfälle vermeiden, Betriebskosten senken und höhere Servicelevels bereitstellen. Weitere Informationen finden Sie unter Erste Schritte mit einem einheitlichen In-Service-Software-Upgrade.
Interchassis-Redundanz für Router der MX-Serie mit Virtual Chassis
Interchassis-Redundanz ist eine Hochverfügbarkeitsfunktion, die Geräte an verschiedenen Standorten umfassen kann, um Netzwerkausfälle zu verhindern und Router vor Ausfällen von Zugriffsverbindungen, Uplink-Fehlern und Wholesale-Chassis-Ausfällen zu schützen, ohne die angeschlossenen Teilnehmer sichtbar zu stören oder den Netzwerkverwaltungsaufwand für Service Provider zu erhöhen. Da immer mehr Sprach- und Videodatenverkehr mit hoher Priorität über das Netzwerk übertragen wird, ist die Interchassis-Redundanz zu einer Voraussetzung für die Bereitstellung zustandsbehafteter Redundanz auf Breitband-Teilnehmerverwaltungsgeräten wie Breitband-Serviceroutern, Breitbandnetzwerk-Gateways und Breitband-Remote-Access-Servern geworden. Der Interchassis-Redundanz-Support ermöglicht es Service Providern, strenge Service Level Agreements (SLAs) einzuhalten und ungeplante Netzwerkausfälle zu vermeiden, um die Anforderungen ihrer Kunden besser erfüllen zu können.
Um eine zustandsbehaftete Interchassis-Redundanzlösung für die universellen Routing-Plattformen 5G der MX-Serie bereitzustellen, können Sie ein Virtual Chassis konfigurieren. Eine Virtual Chassis-Konfiguration verbindet zwei Router der MX-Serie zu einem logischen System, das Sie als einzelnes Netzwerkelement verwalten können. Die Mitgliedsrouter in einem Virtual Chassis werden als primärer Router (auch als Protokollprimärrouter bezeichnet) und Backup-Router (auch als Protokollsicherung bezeichnet) festgelegt. Die Mitgliedsrouter sind über dedizierte Virtual Chassis-Ports miteinander verbunden, die Sie auf Trio Modular Port Concentrator/Modular Interface Card (MPC/MIC)-Schnittstellen konfigurieren.
Ein Virtual Chassis der MX-Serie wird vom Virtual Chassis Control Protocol (VCCP) verwaltet, einem dedizierten Steuerungsprotokoll auf Basis von IS-IS. VCCP läuft auf den Virtual Chassis-Portschnittstellen und ist verantwortlich für den Aufbau der Virtual Chassis-Topologie, die Auswahl des primären Virtual Chassis-Routers und die Einrichtung der Interchassis-Routing-Tabelle für das Routing des Datenverkehrs innerhalb des Virtual Chassis.
Ab Junos OS Version 11.2 werden Virtual Chassis-Konfigurationen auf universellen Routing-Plattformen MX240, MX480 und MX960 mit Trio-MPC/MIC-Schnittstellen und dualen Routing-Engines unterstützt. Darüber hinaus müssen Graceful Routing-Engine Switchover (GRES) und Nonstop Active Routing (NSR) auf beiden Mitgliedsroutern im Virtual Chassis aktiviert sein.
Plattformspezifisches Hochverfügbarkeitsverhalten auf der ACX7000-Serie
Die Hardwarearchitektur ACX7000 Geräteserie unterscheidet sich von allen Geräten der PTX- und MX-Serie. In Geräten der PTX- und MX-Serie hostet FPC sowohl den Datenpfad-PFE als auch die WAN-orientierten Ports (PIC/MIC). Bei Geräten der PTX- und MX-Serie ist jeder FPC so konzipiert, dass er die CPU-Rechenressource zur Verwaltung der FPC-Komponenten enthält.
Bei ACX7000 Geräteserie enthält die FEB-FRU (Forwarding Engine Board) nur den PFE-Komplex und die Routing-Engine den CPU-Rechenkomplex. Routing-Engine FRU führt sowohl Routing-Engine als auch Linecard-Anwendungen aus.
Die folgende Tabelle zeigt die Hochverfügbarkeitsattribute und -funktionen, die auf ACX7000 Reihe von Geräten unterstützt werden:
Hochverfügbarkeitsattribute und -funktionen |
ACX7509 |
ACX7348 |
---|---|---|
Redundanz der Steuerungsebene (RE) |
Ja |
Ja |
Data Plane (PFE)-Redundanz |
Ja |
Nein |
GRES+GR |
Ja |
Ja |
GRES+NSR |
Ja |
Ja |
Wenn Sie ACX7348 den aktuellen Fluss ändern oder während des Routing-Engine Switchovers einen neuen Flow einführen, erfolgt die Konvergenz erst, wenn der Switchover abgeschlossen ist. Topologieänderungen während der Umschaltung werden erst nach der Umschaltung übernommen. Während der Umstellung sind Datenverkehrsverluste und geringfügige statistische Verluste zu erwarten.
GRES ist unter dem Betriebssystem Junos weiterentwickelt standardmäßig aktiviert und kann nicht deaktiviert werden
Um das Routing während eines Switchovers beizubehalten, muss GRES mit einer der folgenden Optionen kombiniert werden:
- Graceful Restart (GR)-Protokollerweiterungen
- Nonstop Active Routing (NSR) und Nonstop Bridging (NSB)
Wenn auf ACX7348 Gerät während Routing-Engine Umschaltung eine Konfiguration mit Funktionen wie Breitband-Netzwerk-Gateway (BNG), VXLAN, sFlow, J-Flow und Portspiegelung erkannt wird, wird der Datenpfad zurückgesetzt, und es wird eine erneute Datenverkehrskonvergenz festgestellt.
Überprüfen Sie vor dem Ausführen eines Switchover-Befehls von der primären Routing-Engine den Status der Backup-Routing-Engine mit dem Befehl show system switchover auf der Backup-Routing-Engine. Wenn der Umschaltstatus bereit ist, geben Sie den Umschaltbefehl ab.
Der Switchover-Befehl kann auch dann ausgegeben werden, wenn die Backup-Routing-Engine nicht bereit ist. In diesem Fall schaltet die Routing-Engine die primäre Routing-Engine um (obwohl die Sicherung noch nicht bereit ist) und das Systemverhalten ist unbestimmt.
Die Umstellung der Routing-Engine führt zu statistischen Abrechnungsverlusten für die Dauer der Umstellungszeit.
ACX7509 unterstützt Routing-Engine Redundanz, wie in der folgenden Tabelle angegeben:
Systemkonfiguration |
Redundanz |
---|---|
Einzel-RE / Einzel-FEB |
Nicht zutreffend. Das System arbeitet im nicht-redundanten Modus |
Dual-RE / Dual-FEB |
Abgestützt |
Dual-RE / Einzel-FEB |
Nicht unterstützt. Das System arbeitet im nicht-redundanten Modus |
Einzel-RE / Dual-FEB |
Nicht unterstützt. Das System arbeitet im nicht-redundanten Modus |
Zeitprotokolle unterstützen keine hohe Verfügbarkeit. Daher werden Zeitsteuerungsanwendungen nur auf der aktiven primären Routing-Engine und nicht auf der Backup-Routing-Engine ausgeführt. Zeitsteuerungsanwendungen werden beim Switchover der Routing-Engine neu gestartet. Während des Routing-Engine-Switchovers, entweder Graceful- oder Non-Graceful-RE-Switchover, verlieren PTP, GM und SYNCE die Sperre, und die Box wechselt in den FREERUN-Status. Der PTP-Paketpfad innerhalb der Hardware wird unterbrochen. Alle nachgeschalteten Geräte wechseln zu einem alternativen primären Gerät im Netzwerk. Wenn kein alternativer primärer Switch vorhanden ist, wechseln alle nachgeschalteten Geräte in den Status HOLDOVER.
Wenn Sie auf ACX7348 Gerät die Online/Offline-Taste des primären Routing-Engine drücken, erfolgt die Umschaltung auf Backup-Routing-Engine ordnungsgemäß. Sie können die Routing-Engine-Karte sicher entfernen, nachdem die Routing-Engine-LEDs ausgeschaltet wurden. Das Drücken der Online/Offline-Taste auf der Backup-Routing-Engine hat keine Auswirkungen auf die primäre Routing-Engine.