ネットワーク監視の高可用性
作成する Junos Space クラスターのタイプによって、ネットワーク監視サービス機能の高可用性が決まります。障害監視およびパフォーマンス監視(FMPM)ノードのない Junos Space ファブリックは、クラスター内の 2 つの HA(高可用性)ノードを使用して、ノード障害からネットワーク監視サービスを保護します。ただし、Junos Space ファブリックに 1 つ以上の FMPM ノードが含まれている場合、Junos Space ノードではネットワーク監視機能は無効になり、FMPM ノードでは有効になります。
このトピックには、以下のセクションが含まれています。
FMPMノードを使用しない高可用性ファブリック
Junos SpaceファブリックにFMPMノードが含まれていない場合、Junos Spaceクラスタは、クラスタ内の2つの高可用性(HA)ノードを使用してノード障害からネットワーク監視サービスを保護するホットスタンバイソリューションを採用します。
図 1 は、ノードに障害が発生した場合にサービスを保護するために、クラスター内の 2 つの HA ノードでネットワーク監視を実行する方法を示しています。
ネットワーク監視サービスは、クラスター内のすべてのノードに自動的にインストールされます。ただし、ネットワーク監視サービスは、現在仮想IP(VIP)アドレスを所有しているノードでのみ実行され、サービスはクラスター全体のすべての障害管理とパフォーマンス管理機能を担当します。ネットワーク監視では、ストレージ のニーズに PostgreSQL 9.1 データベースを使用します。 図 1 に示すように、2 つの HA ノード(クラスタ内のノード 1 とノード 2)間で、継続的なアーカイブによるリアルタイム ストリーミング レプリケーションが設定されており、スタンバイ ノード上のネットワーク監視データベースがアクティブ ノード上のネットワーク監視データベースと継続的に同期されます。さらに、ronジョブは、ネットワーク監視ファイルシステムをスタンバイノードに同期するために、1日に1日1回アクティブノードで実行され、ネットワーク監視が使用するすべてのバックエンド設定ファイルも2つのHAノード間で同期されます。
スタンバイ ノードへの VIP フェイルオーバーが発生すると、そのノードでネットワーク監視が自動的に開始されます。ネットワーク監視サービスは、クラスターのすべての障害監視およびパフォーマンス監視機能を実行する前に、初期化を完了するのに約 3~5 分かかります。このため、Junos Spaceのユーザーは、ネットワーク監視の停止時間が約3~5分続くよう期待できます。
2つのHAノード上のウォッチドッグサービスは、仮想IPアドレスを所有し、もう一方の(スタンバイ)HAノードで実行されていないHAノードで、ネットワーク監視サービスが実行されていることを確認します。すでにご説明したように、ウォッチドッグサービスは、1秒ごとにノード上のすべてのサービスのステータスをチェックします。ウォッチドッグ・サービスが、ノードがVIPアドレスを所有していてもネットワーク監視サービスを実行していないことを検出した場合、ウォッチドッグ・サービスはネットワーク監視サービスを開始し、障害管理およびパフォーマンス管理データを他のノードに同期するcronジョブを作成します。ウォッチドッグサービスが、ノードがVIPアドレスを所有していないがネットワーク監視サービスを実行していることを検出した場合、ウォッチドッグサービスはサービスをシャットダウンし、データ同期のためのcronジョブエントリを削除します。
FMPMノードを使用した高可用性ファブリック
大規模または複雑なネットワークを管理する場合、すべてのパフォーマンスおよびネットワーク監視機能を障害監視およびパフォーマンス監視(FMPM)ノードと呼ばれる特別なノードに適用することができます。1 つ以上の FMPM ノードを使用して Junos Space ファブリックを作成すると、すべての Junos Space ノードでネットワーク監視機能が無効になり、FMPM ノードで有効になります。最初の FMPM ノードがファブリックに追加されると、このノードでネットワーク監視機能が有効になり、PostgreSQL 9.1 データベースがこのノードで実行されます。
2 番目の FMPM ノードをファブリックに追加すると、最初の FMPM ノードが 1 次ノードとして機能し、2 番目の FMPM ノードがスタンバイ・ノードとして機能します。ネットワーク監視サービスは、FMPM チームの両方の FMPM ノードに自動的にインストールされます。ただし、ネットワーク監視サービスは、現在 VIP アドレスを所有している FMPM ノードでのみ実行され、FMPM チームのすべての障害管理(FM)およびパフォーマンス管理(PM)機能を担当します。ネットワーク監視では、ストレージ のニーズに PostgreSQL 9.1 データベースを使用します。
チーム内の 2 つの FMPM ノード間で、継続的アーカイブによるリアルタイム ストリーミング レプリケーションが設定されるため、スタンバイ ノード上のネットワーク監視データベースがアクティブ ノード上のネットワーク監視データベースと継続的に同期されます。さらに、ronジョブは、ネットワーク監視ファイルシステムをスタンバイのFMPMノードに同期させるために、1日1回、アクティブなFMPMノードで実行されます。これにより、ネットワーク監視が使用するすべてのバックエンド設定ファイルも2つのFMPMノード間で同期されます。スタンバイの FMPM ノードへの VIP フェイルオーバーが発生すると、2 番目の FMPM ノードでネットワーク監視が自動的に開始されます。ネットワーク監視サービスは、FMPM チームのすべての FM および PM 機能を実行する前に初期化を完了するのに約 3~5 分かかります。このため、Junos Spaceのユーザーは、ネットワーク監視の停止時間が約3~5分続くよう期待できます。
2つのノードのウォッチドッグ・サービスは、仮想IPアドレスを所有し、もう一方の(スタンバイ)FMPMノードで実行されていないFMPMノードでネットワーク監視サービスが実行されていることを確認する責任があります。すでにご説明したように、ウォッチドッグ・サービスは、1秒ごとにアクティブなFMPMノード上のすべてのサービスのステータスをチェックします。ウォッチドッグ・サービスが、FMPMノードがVIPアドレスを所有しているのにネットワーク監視サービスを実行していないことを検出した場合、ウォッチドッグ・サービスはネットワーク監視サービスを開始し、障害管理およびパフォーマンス管理データを他のノードに同期するcronジョブを作成します。ウォッチドッグサービスが、FMPMノードがVIPアドレスを所有していないがネットワーク監視サービスを実行していることを検出した場合、ウォッチドッグサービスはサービスをシャットダウンし、データ同期のためのcronジョブエントリを削除します。