耐障害性と高可用性
Contrail SD-WAN ソリューションは耐障害性に優れ、すべてのレイヤーで高可用性を実現します。その結果、できるだけダウンタイムを最小限に抑えて、障害全体でネットワークがシームレスに動作します。次のセクションでは、各レイヤーの高可用性について説明します。
ネットワーク制御プレーン
コントロールプレーン自体は、Contrail SD-WANソリューション内の分散型エンティティです。制御プレーンは、オンプレミスデバイスとピアリングし、ルーティングマネージャーとPolicy/SLA Managerマイクロサービスからの情報に基づいて動的にルーティングを設定するvRを使用して有効になっています。
ルートリフレクタは階層型構造で導入されます。オンプレミスデバイスは、最も近い地域ルートリフレクタとピアリングし、それ自体が他のルートリフレクタとピアリングします。
ヘッドレス転送
オンプレミスデバイスがSD-WANコントローラのルートリフレクタへの接続を失った場合、デバイスは引き続きトラフィックを転送することができます。これをヘッドレス運用と呼びます。コントローラは新しいルートを監視および提案できないため、この状況は最適とは言えませんが、パスは引き続き存在し、トラフィックはベスト エフォート方式で転送されます。
ヘッドレスモードでは、デバイスに新しい設定やポリシー変更は行われず、デバイスから新しいデータは報告されません。接続が復元されると、デバイスはコントローラとチェックインして、最新のルーティングおよび設定情報を持っていることを確認します。
データ プレーン
CSOリリース3.3以降は、オンプレミスデバイスの冗長性をサポートしています。1 つのサイトには、プライマリとセカンダリとして機能する 2 つのノードのクラスタを含め、デバイスとリンクの障害から保護できます。プライマリ ノードに障害が発生した場合、またはプライマリ ノードへのリンクがダウンした場合、トラフィックはセカンダリ ノードを通過します。
スポークの冗長性
スポーク サイトでは、2 台の CPE デバイスを相互接続して単一の論理セキュア ルーターを作成することで、冗長性を確保できます。NFX シリーズまたは SRX シリーズ デバイスを使用できます。
NFX シリーズ デバイスの使用
図 1 は、NFX シリーズ デバイスを使用したスポークの冗長性設定を示しています。各デバイスに vSRX 仮想ファイアウォールがインストールされています。2 台の CPE デバイスは、SRX シャーシ クラスタを作成して相互接続し、単一の論理ノードを形成します。クラスタは、冗長イーサネット(reth)インターフェイスを使用してJunosコントロールプレーン(JCP)コンポーネントに接続し、デバイスの送受信を提供するスイッチとして機能します。
SRX シリーズ デバイスの使用
図 2 は、SRX シリーズ デバイスを使用したスポークの冗長性設定を示しています。2つのCPEデバイスは、シャーシクラスタリングを使用して相互接続され、単一の論理ノードを形成します。
繰り返しになりますが、デバイスの両側にある複数の接続がリンクの冗長性を提供し、LAN 側では、SRX クラスター上の reth インターフェイスとしてバンドルされたアクティブ/バックアップ リンクを使用します。WAN側は、2台のデバイスに分散した4つのアクティブなWANリンクすべてを使用しています。
フェイルオーバーシナリオ
表 x は、スポークの冗長性設定がさまざまな障害シナリオにどのように対応するかを示しています。
シナリオ |
NFX の動作 |
SRX の動作 |
---|---|---|
デバイス障害 |
vSRX クラスターのノード フェイルオーバー |
SRX シャーシ クラスタのノード フェイルオーバー |
GWR vSRX VM 障害 |
vSRX クラスターのノード フェイルオーバー |
N/a |
LAN 側のリンク障害 |
JCP - 個々のリンク障害に対するLAGベースの保護 vSRX - ノードへのすべての LAN リンクに障害が発生した場合は、他のクラスタ ノードにフェイルオーバーします。 |
個々のリンク障害に対するLAGベースの保護 ノードへのすべての LAN リンクに障害が発生した場合、もう一方のクラスタ ノードへのフェールオーバー |
WAN側リンク障害 |
単一 CPE と同じ - SD-WAN コントローラからの SLA 適用まで、残りのリンク間の ECMP |
|
相互接続の物理リンク障害 |
JCP - LAGベースの保護 |
組み込みなし。ノード間で相互接続された2台のスイッチを使用してLAGベースの保護を追加し |
Usage Notes
NFX シリーズまたは SRX シリーズ デバイスと同じデバイス モデルを使用し、デバイス(プライマリとセカンダリ)が同じバージョンの Junos OS がインストールされている必要があります。
スポークの冗長性を使用する場合、次のSD-WAN機能はサポートされていません。
LTE WAN バックアップ リンク
サービス チェーンのサポート
スポークの冗長性の詳細については、 CSOユーザーガイドの デバイス冗長性サポートの概要 を参照してください。
ハブ冗長性(CPEマルチホーミング)
ハブアンドスポークトポロジーでは、アクティブ/バックアップ設定に2つのハブデバイスを導入することで、ハブ側で冗長性を確保することもできます。プライマリ ハブがダウンした場合、またはプライマリ ハブへのすべてのオーバーレイ トンネルに障害が発生した場合、トラフィックはセカンダリ ハブに切り替えます。プライマリハブが再び立ち上がり、トンネルが確立されると、トラフィックはプライマリハブに戻ります。
デュアル ハブ モードは、プライマリ/セカンダリ モードでも使用できます。例えば、ハブはスポークの半分がプライマリ、残りの半分はセカンダリになります。このようにして、ハブデバイスのすべてのペアに、アクティブ/アクティブな方法で負荷が分散されます。このモードでは、ネットワーク全体でフローの対称性を維持するためにハブデバイスをメッシュ化する必要があることに注意してください。
設計オプション
設計要件に応じて、ハブアンドスポークデバイス間の冗長性を実装するには、いくつかの方法があります。
Single Spoke Device Multihomed to Dual Hub Devices; Single Access
図 3 は、シングル スポーク デバイスがシングル アクセスのデュアル ハブ デバイスにマルチホームされる方法を示しています。
図 3:1 つのスポーク デバイス、各ハブ への 1 つのトンネルこのシナリオでは、ハブ デバイスがアクティブ/バックアップ構成になり、スポーク サイトプレフィックスがアクティブなハブにルーティングされます。
Single Spoke Device Multihomed to Dual Hub Devices; Multiple Access
図 4 は、シングル スポーク デバイスが、複数アクセス可能なデュアル ハブ デバイスにマルチホームされる方法を示しています。
図 4:1 台のスポーク デバイス、各ハブ への 2 つのトンネル前のシナリオと同様に、ハブ デバイスはアクティブ/バックアップ構成で、スポーク サイトのプレフィックスはアクティブなハブにルーティングされます。さらに、スポーク サイトには、各アクセス ネットワークを通じて各ハブへのオーバーレイ リンクがあります。APBRは、CPEデバイスからアクティブハブにトラフィックを、考えられるすべてのオーバーレイ上でルーティングします。
Clustered Spoke Devices Multihomed to Dual Hub Devices; Multiple Access
図 5 は、各 CPE デバイスから複数アクセスできるデュアル CPE デバイスをデュアル ハブ デバイスにマルチホームする方法を示しています。
図 5:スポーク クラスタ、各ハブ への 1 つのトンネル前のシナリオと同様、ハブデバイスはアクティブ/バックアップ構成で、スポークサイトのプレフィックスはアクティブハブにルーティングされ、APBRはアクティブなCPEデバイスからすべての可能なオーバーレイ上でアクティブハブにトラフィックをルーティングします。このシナリオでは、CPE デバイスもアクティブ/パッシブ構成になっています。
スポーク サイトには 8 つのオーバーレイ トンネルがあります。
アクティブ CPE からアクティブ ハブ - 2 つのアクティブ リンク
ハブをバックアップするアクティブ CPE - 2 つのバックアップ リンク
CPEからアクティブハブへのバックアップ - 2つのアクティブリンク
CPE のバックアップとハブのバックアップ - 2 つのバックアップ リンク
メモ:CPE デバイスがマルチホームされているハブは、どちらも同じタイプのデバイスである必要があります。
メモ:NATを使用している場合、プライマリハブ障害が原因でハブスイッチオーバーが発生すると、NATの動作が変更に合わせて調整される中で、サイトツーインターネットとサイトからクラウドアプリケーションセッションがフラップする可能性があります。サイトツーサイト セッションはスイッチオーバーを通じて引き続き機能します。