耐障害性と高可用性
Contrail SD-WAN ソリューションは、あらゆるレイヤーで耐障害性と高可用性を備えています。その結果、ネットワークは障害が発生してもシームレスに動作し、ダウンタイムをできるだけ短くすることができます。次のセクションでは、各レイヤーでの高可用性について説明します。
ネットワークコントロールプレーン
コントロールプレーン自体は、Contrail SD-WANソリューションに分散したエンティティです。コントロールプレーンは、オンプレミスデバイスとピアリングし、ルーティングマネージャーおよびポリシー/SLAマネージャーマイクロサービスからの情報に基づいてルーティングを動的に設定するvRRを使用して有効化されます。
ルートリフレクタは、階層構造で展開されます。オンプレミスデバイスは、最も近い地域ルートリフレクタとピアリングし、それ自体が他のルートリフレクタとピアリングします。
ヘッドレスフォワーディング
オンプレミスデバイスがSD-WANコントローラーのルートリフレクターへの接続を失った場合でも、デバイスは引き続きトラフィックの転送を継続できます。これは、ヘッドレス操作と呼ばれます。コントローラは新しいルートを監視および提案できないため、この状況は最適ではありませんが、パスは引き続き存在し、トラフィックはベスト エフォート方式で転送されます。
ヘッドレスモードでは、デバイスに対して新しい設定やポリシーの変更は行われず、デバイスから新しいデータが報告されることはありません。接続が回復すると、デバイスはコントローラにチェックインして、最新のルーティング情報と設定情報があることを確認します。
データ プレーン
CSO リリース 3.3 以降では、オンプレミスデバイスの冗長性がサポートされています。サイトには、プライマリおよびセカンダリとして機能する 2 つのノードのクラスタを含めることができ、デバイスやリンクの障害から保護します。プライマリ ノードに障害が発生した場合、またはプライマリ ノードへのリンクがダウンした場合、トラフィックはセカンダリ ノードを経由します。
スポークの冗長性
スポーク サイトでは、2 つの CPE デバイスを相互接続して 1 つの論理的でセキュアなルーターを作成することで、冗長性を持たせることができます。NFXシリーズまたはSRXシリーズファイアウォールを使用できます。
NFXシリーズ デバイスの使用
図 1 は、それぞれに vSRX仮想ファイアウォール仮想ファイアウォールがインストールされた NFXシリーズ デバイスを使用したスポーク冗長性の設定を示しています。2つのCPEデバイスは、SRXシャーシクラスターを作成することで相互接続され、単一の論理ノードを形成します。クラスターは、reth(冗長イーサネット)インターフェイスを使用して、スイッチとして機能するJunosコントロールプレーン(JCP)コンポーネントに接続します。このコンポーネントは、デバイス内外の接続性を提供します。
SRXシリーズファイアウォールの使用
図2 は、SRXシリーズファイアウォールを使用したスポーク冗長設定を示しています。2 つの CPE デバイスは、シャーシ クラスタリングを使用して相互接続され、1 つの論理ノードを形成します。
この場合も デバイスの両側に複数の接続があるとリンクの冗長性が得られます LAN側はアクティブ/バックアップリンクを使用します。これはSRXクラスターでrethインターフェイスとしてバンドルされています。WAN側は、2つのデバイスに分散された4つのアクティブなWANリンクすべてを使用します。
フェイルオーバーのシナリオ
表 x は、スポーク冗長設定がさまざまな障害シナリオにどのように対応するかを示しています。
シナリオ |
NFXの動作 |
SRX の動作 |
|---|---|---|
デバイス障害 |
vSRX仮想ファイアウォールクラスタのノードフェイルオーバー |
SRXシャーシクラスターのノードフェイルオーバー |
GWR vSRX仮想ファイアウォールVMの障害 |
vSRX仮想ファイアウォールクラスタのノードフェイルオーバー |
該当なし |
LAN側リンク障害 |
JCP:個々のリンク障害に対するLAGベースの保護 vSRX仮想ファイアウォール - ノードへのすべてのLANリンクに障害が発生した場合、他のクラスタノードにフェイルオーバーする |
個々のリンク障害に対するLAGベースの保護 ノードへのすべてのLANリンクに障害が発生した場合、他のクラスタノードにフェイルオーバーします |
WAN側リンク障害 |
シングルCPEと同様 - SD-WANコントローラからのSLA適用までの残りのリンクにわたるECMP |
|
相互接続の物理リンク障害 |
JCP - LAGベースの保護 |
組み込みはありません。ノード間で相互接続された2つのスイッチを使用してLAGベースの保護を追加できます |
Usage Notes
NFXシリーズまたはSRXシリーズファイアウォールの同じデバイスモデルを使用し、デバイス(プライマリおよびセカンダリ)に同じバージョンのJunos OSがインストールされている必要があります。
以下の SD-WAN 機能は、スポーク冗長を使用する場合サポートされません。
LTE WANバックアップリンク
サービスチェーンのサポート
スポークの冗長性の詳細については、『CSO User Guide』の「 Device Redundancy Support Overview 」を参照してください。
ハブ冗長化(CPEマルチホーミング)
ハブアンドスポーク トポロジーの場合、アクティブ/バックアップ セットアップで 2 つのハブ デバイスを展開することで、ハブ側で冗長性を提供することもできます。プライマリハブがダウンした場合、またはプライマリハブへのオーバーレイトンネルがすべて失敗した場合、トラフィックはセカンダリハブに切り替わります。プライマリハブが再び立ち上がり、トンネルが確立されると、トラフィックはプライマリハブに戻ります。
デュアルハブモードは、プライマリ/セカンダリモードでも使用できます。たとえば、ハブは、スポークの半分がプライマリで、残りの半分がセカンダリである場合があります。このようにして、負荷がハブデバイスのすべてのペアにアクティブ/アクティブに分散されます。このモードでは、ネットワーク全体のフローの対称性を維持するために、ハブデバイスのメッシュ化が必要であることに注意してください。
設計オプション
ハブ デバイスとスポーク デバイス間に冗長性を実装するには、設計要件に応じていくつかの方法があります。
Single Spoke Device Multihomed to Dual Hub Devices; Single Access
図 3 は、シングル スポーク デバイスを、シングル アクセスのデュアル ハブ デバイスにマルチホームする方法を示しています。
図 3:1 つのスポーク デバイス、各ハブ
への 1 つのトンネル
このシナリオでは、ハブ デバイスはアクティブ/バックアップ構成であり、スポーク サイト プレフィックスはアクティブ ハブにルーティングされます。
Single Spoke Device Multihomed to Dual Hub Devices; Multiple Access
図 4 は、1 つのスポーク デバイスを、マルチ アクセスのデュアル ハブ デバイスにマルチホームする方法を示しています。
図 4:1 つのスポーク デバイス、各ハブ
への 2 つのトンネル
前のシナリオと同様に、ハブ デバイスはアクティブ/バックアップ構成であり、スポーク サイトのプレフィックスはアクティブ ハブにルーティングされます。さらに、スポーク サイトには、各アクセス ネットワークを介して各ハブへのオーバーレイ リンクがあります。APBRは、可能なすべてのオーバーレイにわたって、CPE デバイスからアクティブハブにトラフィックをルーティングします。
Clustered Spoke Devices Multihomed to Dual Hub Devices; Multiple Access
図 5 は、各 CPE デバイスからの複数アクセスを使用して、デュアル CPE デバイスをデュアル ハブ デバイスにマルチホームする方法を示しています。
図 5: スポーク クラスター、各ハブ
への 1 つのトンネル
前のシナリオと同様に、ハブデバイスはアクティブ/バックアップ構成であり、スポークサイトプレフィックスはアクティブハブにルーティングされ、APBRは可能なすべてのオーバーレイを介してアクティブCPE デバイスからアクティブハブにトラフィックをルーティングします。このシナリオでは、CPE デバイスもアクティブ/パッシブ構成になっています。
スポーク サイトには、8 つのオーバーレイ トンネルがあります。
アクティブ CPE からアクティブ ハブ - 2 つのアクティブ リンク
アクティブ CPE からバックアップ ハブ - 2 つのバックアップ リンク
アクティブハブへのバックアップCPE-2つのアクティブリンク
バックアップ CPE からバックアップ ハブへのバックアップ - 2 つのバックアップ リンク
手記:CPE デバイスがマルチホームされる両方のハブは、同じタイプのデバイスである必要があります。
手記:NATを使用している場合、プライマリハブの障害によるハブの切り替えにより、NATの動作が変化に合わせて調整されるため、サイトからインターネット間およびサイトからクラウドアプリケーションへのセッションがフラップする可能性があります。サイトツーサイト セッションは、スイッチオーバー中も引き続き機能します。