ルーティングエンジンの冗長性について
ルーティングエンジンの冗長性により、ネットワークの継続的な機能が保証されます。プライマリ ルーティングエンジンが(フェイルオーバーまたはスイッチオーバーによって)オフラインになった場合、スタンバイ ルーティングエンジンがすべてのルーティング機能を引き継ぎます。
ルーティングエンジン冗長性の概要
冗長ルーティングエンジンとは、同じルーティングプラットフォームにインストールされる2つのルーティングエンジンのことです。1つはプライマリとして機能し、もう1つはプライマリルーティングエンジンに障害が発生した場合のバックアップとしてスタンバイします。デュアルルーティングエンジンを搭載したルーティングプラットフォームでは、単一のルーティングエンジンを搭載したルーティングプラットフォームよりも迅速にネットワークの再コンバージェンスを行うことができます。
ルーティングエンジンをプライマリとして構成すると、すべての機能を利用できます。ルーティング情報の送受信、ルーティングテーブルの構築と維持、インターフェイスとパケット転送エンジンコンポーネントとの通信を行い、シャーシを完全に制御します。ルーティングエンジンがバックアップとして設定されている場合、パケット転送エンジンやシャーシコンポーネントとは通信しません。
Junos OS リリース 8.4 以降を実行するデバイスでは、両方のルーティング エンジンを同時にプライマリとして設定することはできません。この設定では、コミット・チェックが失敗します。
プライマリ ルーティングエンジンからバックアップ ルーティングエンジンへのフェイルオーバーは、プライマリ ルーティングエンジンでハードウェア障害が発生した場合、または特定の条件に基づいてプライマリ ロールの変更をサポートするようにソフトウェアを設定した場合に自動的に行われます。また、 request chassis routing-engine
コマンドの 1 つを発行してルーティングエンジンプライマリ ロールを手動で切り替えることもできます。このトピックでは、 フェールオーバー という用語は自動イベントを指し、 スイッチオーバー は自動または手動のいずれかのイベントを指します。
フェイルオーバーまたはスイッチオーバーが発生すると、バックアップルーティングエンジンが新しいプライマリルーティングエンジンとしてシステムを制御します。
-
グレースフル ルーティングエンジン スイッチオーバーが設定されていない場合、バックアップ ルーティングエンジンがプライマリになると、スイッチ プレーンがリセットされ、独自のバージョンのマイクロカーネルがパケット転送エンジン コンポーネントにダウンロードされます。パケット転送エンジンが再初期化されている間、トラフィックは中断されます。すべてのカーネルプロセスと転送プロセスが再起動されます。
-
グレースフル ルーティングエンジン スイッチオーバーが設定されている場合、インターフェイスとカーネルの情報は保持されます。パケット転送エンジンが再起動されないため、スイッチオーバーが高速になります。新しいプライマリ ルーティングエンジンが、ルーティング プロトコル プロセス(rpd)を再起動します。すべてのハードウェアとインターフェイスは、ウォームリスタートに似たプロセスによって取得されます。
-
グレースフル ルーティングエンジン スイッチオーバーと ノンストップ アクティブ ルーティング (NSR)が設定されている場合、スイッチオーバー中にトラフィックが中断されることはありません。インターフェイス、カーネル、およびルーティングプロトコル情報は保持されます。
-
グレースフルルーティングエンジンスイッチオーバーとグレースフルリスタートが設定されている場合、スイッチオーバー中にトラフィックが中断されることはありません。インターフェイスとカーネルの情報は保持されます。グレースフル リスタート プロトコル拡張機能は、隣接ルーターからルーティング情報を迅速に収集および復元します。
ルーティングエンジンのフェイルオーバーをトリガーする条件
以下のイベントが発生すると、構成によっては、ルーティングエンジンのプライマリ ロールが自動的に変更される場合があります:
-
ルーティングプラットフォームでハードウェア障害が発生した。ルーティングエンジン、または関連するホストモジュールもしくはサブシステムの電源が突然オフになった場合、ルーティングエンジンのプライマリロールが変更されます。また、バックアップ ルーティングエンジンがプライマリ ルーティング エンジンでハード ディスク エラーを検出した場合に、バックアップ ルーティングエンジンがプライマリの役割を担うように設定することもできます。この機能を有効にするには、
[edit chassis redundancy]
階層レベルでfailover on-disk-failure
ステートメントを含めます。 -
ルーティングプラットフォームで、カーネルクラッシュやCPUロックなどのソフトウェア障害が発生する。バックアップ ルーティングエンジンがキープアライブ信号の損失を検出したときに主要な役割を果たすように設定する必要があります。このフェイルオーバー方法を有効にするには、
[edit chassis redundancy]
階層レベルでfailover on-loss-of-keepalives
ステートメントを含めます。 -
ルーティングプラットフォームでは、プライマリルーティングエンジンでem0インタフェース障害が発生します。バックアップのルーティングエンジンがem0インタフェース障害を検出したときに主要な役割を果たすように設定する必要があります。このフェイルオーバー方法を有効にするには、
[edit chassis redundancy failover]
階層レベルでon-re-to-fpc-stale
ステートメントを含めます。 -
特定のソフトウェアプロセスが失敗する。1 つ以上の指定されたプロセスが 30 秒以内に 4 回以上失敗した場合に、バックアップ ルーティングエンジンが主要な役割を果たすように設定できます。
[edit system processes process-name]
階層レベルでfailover other-routing-engine
ステートメントを含めます。
これらの条件のいずれかが満たされた場合、メッセージが記録され、バックアップ ルーティングエンジンが主要な役割を引き受けようとします。デフォルトでは、バックアップ ルーティングエンジンがアクティブになるとアラームが生成されます。バックアップ ルーティングエンジンがプライマリ ロールを引き継いだ後は、最初に設定されたプライマリ ルーティングエンジンが正常に動作を再開した後も、プライマリとして機能し続けます。以前のバックアップ状態に手動で復元する必要があります。(ただし、一方のルーティング エンジンが存在しないときは、冗長性がどのように設定されていても、もう一方のルーティングエンジンが自動的にプライマリになります)。
ルーティングエンジン冗長性のデフォルト動作
デフォルトでは、Junos OSは、プライマリルーティングエンジンとして re0 を使用し、バックアップルーティングエンジンとして re1 を使用します。設定で特に指定されていない限り、動作中のプライマリ ルーティングエンジンが再起動されると、 re0 は常にプライマリになります。
シャーシ内の 1 つのルーティングエンジンが、以前はバックアップ ルーティングエンジンであったとしても、常にプライマリ ルーティングエンジンになります。
以下の手順を実行して、デフォルトのルーティングエンジン冗長設定がどのように機能するかを確認してください:
-
re0 がプライマリ ルーティングエンジンであることを確認します。
-
プライマリ ルーティングエンジンから
request chassis routing-engine master switch
コマンドを発行してルーティングエンジンプライマリ ロールの状態を手動で切り替えます。 re0 はバックアップ ルーティングエンジンになり、 re1 はプライマリ ルーティングエンジンになります。手記:プライマリ ルーティングエンジンの次回の再起動時に、再起動後にこの状態を維持するようにルーティング エンジンを設定していないため、Junos OS はルーターをデフォルトの状態に戻します。
-
プライマリルーティングエンジン re1を再起動します。
ルーティングエンジンが起動し、設定を読み取ります。設定でどのルーティングエンジンをプライマリにするかを指定していないため、 re1 はバックアップとしてデフォルト設定を使用します。これで、 re0 と re1 の両方がバックアップ状態になります。Junos OS はこの競合を検出し、非プライマリ状態を防ぐために、デフォルト設定に戻して re0 をプライマリにします。
ルーティングエンジンの停止が必要な状況
ルーティングエンジンが2つあるルーティングプラットフォームの電源を切る前、またはプライマリルーティングエンジンを取り外す前に、バックアップルーティングエンジンを停止してからプライマリルーティングエンジンを停止する必要があります。そうしないと、Junos OSの再インストールが必要になることがあります。プライマリ ルーティングエンジンで request system halt both-routing-engines
コマンドを使用すると、最初にプライマリ ルーティングエンジンをシャットダウンし、次にバックアップ ルーティングエンジンをシャットダウンできます。バックアップ ルーティングエンジンのみをシャットダウンするには、バックアップ ルーティングエンジンで request system halt
コマンドを発行します。
プライマリ ルーティングエンジンを停止し、電源をオフにしたり取り外したりしない場合、バックアップ ルーティングエンジンは、プライマリ ルーティングエンジンからのキープアライブ信号の損失を検出したときにプライマリになるよう設定されていない限り、非アクティブなままになります。
ルーターを再起動するには、ルーティングエンジンのコンソール ポート(イーサネット管理ポートではなく)にログインする必要があります。プライマリ ルーティングエンジンのコンソール ポートにログインすると、システムは自動的に再起動します。バックアップ ルーティングエンジンのコンソール ポートにログインした後、Enterを押して再起動します。
バックアップ ルーティングエンジンをアップグレードした場合は、まずそれを再起動し、次にプライマリ ルーティングエンジンを再起動します。