ネットワーク監視の高可用性
作成するJunos Spaceクラスタのタイプによって、ネットワーク監視サービスの高可用性がどの程度機能するかが決まります。障害監視およびパフォーマンス監視(FMPM)ノードのないJunos Spaceファブリックは、クラスタ内の2つの高可用性(HA)ノードを使用して、ノード障害からネットワーク監視サービスを保護します。ただし、Junos Spaceファブリックに1つ以上のFMPMノードが含まれている場合、ネットワーク監視機能はJunos Spaceノードでは無効になり、FMPMノードでは有効になります。
このトピックは、以下のセクションで構成されています。
FMPMノードを使用しない高可用性ファブリック
Junos Space ファブリックに FMPM ノードが含まれていない場合、Junos Space クラスタは、クラスタ内の 2 つの高可用性(HA)ノードを使用するホットスタンバイ ソリューションを採用して、ノード障害からネットワーク監視サービスを保護します。
図 1 は、ノードに障害が発生した場合にサービスを保護するために、クラスター内の 2 つの HA ノードでネットワーク監視を実行する方法を示しています。
ネットワーク監視サービスは、クラスター内のすべてのノードに自動的にインストールされます。ただし、ネットワーク監視サービスは、常に仮想 IP (VIP) アドレスを現在所有しているノードでのみ実行され、サービスはクラスター全体のすべての障害管理機能とパフォーマンス管理機能を担当します。ネットワーク監視では、ストレージのニーズに PostgreSQL 9.1 データベースを使用します。 図 1 に示すように、2 つの HA ノード(クラスタ内のノード 1 とノード 2)の間に継続的アーカイブによるリアルタイム ストリーミング レプリケーションが設定され、スタンバイ ノード上のネットワーク監視データベースがアクティブ ノード上のネットワーク監視データベースと継続的に同期されます。さらに、cronジョブは1日1回の深夜にアクティブノードで実行され、ネットワーク監視ファイルシステムをスタンバイノードに同期します。これにより、ネットワーク監視で使用されるすべてのバックエンド設定ファイルも2つのHAノード間で同期されます。
スタンバイ ノードへの VIP フェールオーバーが発生すると、ノードでネットワーク監視が自動的に開始されます。ネットワーク監視サービスは、クラスターのすべての障害監視機能とパフォーマンス監視機能を実行する前に、初期化が完了するまでに約 3 分から 5 分かかります。そのため、Junos Spaceユーザーは、ネットワーク監視の停止が3分から5分程度続くことを予想できます。
2 つの HA ノード上のウォッチドッグ サービスは、仮想 IP アドレスを所有する HA ノードでネットワーク監視サービスが実行され、もう一方の(スタンバイ)HA ノードで実行されていないことを確認する役割を担います。すでに述べたように、ウォッチドッグサービスはノード上のすべてのサービスのステータスを毎秒チェックします。ノードが VIP アドレスを所有しているが、ネットワーク監視サービスを実行していないことをウォッチドッグ サービスが検出した場合、ウォッチドッグ サービスはネットワーク監視サービスを開始し、障害管理とパフォーマンス管理のデータを他のノードに同期するための cron ジョブを作成します。ノードが VIP アドレスを所有していないが、ネットワーク監視サービスを実行していることをウォッチドッグ サービスが検出した場合、ウォッチドッグ サービスはサービスをシャットダウンし、データ同期用の cron ジョブ エントリを削除します。
FMPMノードを使用した高可用性ファブリック
大規模または複雑なネットワークを管理する場合は、すべてのパフォーマンスおよびネットワーク監視機能を、障害監視およびパフォーマンス監視 (FMPM) ノードと呼ばれる特別なノード専用にすることができます。1 つ以上の FMPM ノードで Junos Space ファブリックを作成すると、すべての Junos Space ノードでネットワーク監視機能が無効になり、FMPM ノードで有効になります。最初の FMPM ノードがファブリックに追加されると、このノードでネットワーク監視機能が有効になり、PostgreSQL 9.1 データベースがこのノードで実行されます。
ファブリックに 2 番目の FMPM ノードを追加すると、最初の FMPM ノードはプライマリ ノードとして機能し、2 番目の FMPM ノードはスタンバイ ノードとして機能します。ネットワーク監視サービスは、FMPM チームの両方の FMPM ノードに自動的にインストールされます。ただし、どの時点でも、ネットワーク監視サービスは、現在 VIP アドレスを所有している FMPM ノードでのみ実行され、サービスは FMPM チームのすべての障害管理 (FM) およびパフォーマンス管理 (PM) 機能を担当します。ネットワーク監視では、ストレージのニーズに PostgreSQL 9.1 データベースを使用します。
チーム内の 2 つの FMPM ノード間では、継続的なアーカイブを使用したリアルタイム ストリーミング レプリケーションが設定され、スタンバイ ノード上のネットワーク監視データベースがアクティブ ノード上のネットワーク監視データベースと継続的に同期されます。さらに、cron ジョブは 1 日のうちの 1 回の深夜にアクティブ FMPM ノードで実行され、ネットワーク監視ファイル システムをスタンバイ FMPM ノードに同期するため、ネットワーク監視で使用されるすべてのバックエンド構成ファイルも 2 つの FMPM ノード間で同期されます。スタンバイ FMPM ノードへの VIP フェールオーバーが発生すると、2 番目の FMPM ノードでネットワーク監視が自動的に開始されます。ネットワーク監視サービスは、FMPM チームのすべての FM および PM 機能を実行する前に、初期化を完了するのに約 3 分から 5 分かかります。そのため、Junos Spaceユーザーは、ネットワーク監視の停止が3分から5分程度続くことを予想できます。
2 つのノード上のウォッチドッグ サービスは、仮想 IP アドレスを所有する FMPM ノードでネットワーク監視サービスが実行されており、他の (スタンバイ) FMPM ノードで実行されていないことを確認する役割を担います。既に説明したように、ウォッチドッグ サービスは、アクティブな FMPM ノード上のすべてのサービスの状態を毎秒チェックします。ウォッチドッグ サービスは、FMPM ノードが VIP アドレスを所有しているが、ネットワーク監視サービスを実行していないことを検出した場合、ウォッチドッグ サービスはネットワーク監視サービスを開始し、障害管理とパフォーマンス管理のデータを他のノードに同期する cron ジョブを作成します。ウォッチドッグ サービスは、FMPM ノードが VIP アドレスを所有していないが、ネットワーク監視サービスを実行していることを検出すると、ウォッチドッグ サービスはサービスをシャットダウンし、データ同期用の cron ジョブ エントリを削除します。