このページの内容

正常性監視の概要
Junos OSを実行するデバイスでヘルスモニタリングを設定する
正常性監視の設定

SNMP による正常性モニタリング

正常性監視の概要

ヘルスモニタリングは、RMONアラームインフラストラクチャを拡張して、事前定義されたオブジェクトセット(ファイルシステムの使用率、CPUの使用率、メモリ使用率など)とJunos OSプロセスの監視を提供するSNMP機能です。

ヘルスモニター機能を有効にするには、[edit snmp]階層レベルでhealth-monitorステートメントを使用します。下限しきい値、上昇しきい値、間隔などのヘルスモニターパラメーターを設定することもできます。監視対象のオブジェクトの値が上昇または下降しきい値を超えると、アラームがトリガーされ、イベントがログに記録される場合があります。

下限しきい値は、監視対象オブジェクトインスタンスの下限しきい値です。上昇しきい値は、監視対象オブジェクトインスタンスの上限しきい値です。各しきい値は、可能な最大値の割合として表されます。この間隔は、オブジェクトインスタンスがサンプリングされ、上昇および下降しきい値と比較される期間(秒単位)を表します。

イベントは、各サンプル間隔の後ではなく、任意の一方向に最初にしきい値を超えたときにのみ生成されます。例えば、しきい値上昇アラームとそれに対応するイベントが発生した場合、対応する下降アラームが発生するまで、しきい値を超えるイベントは発生しません。

ヘルスモニターイベントのシステムログエントリーには、対応するHEALTHMONITORタグがあり、汎用のSNMPD_RMON_EVENTLOGタグはありません。ただし、正常性監視は汎用の RMON risingThreshold および fallingThreshold トラップを送信します。 show snmp health-monitor 操作コマンドを使用して、正常性監視アラームとログに関する情報を表示できます。

正常性監視を設定すると、表 1 に示すように、特定のオブジェクトインスタンスの監視情報を利用できます。

表1:監視対象のオブジェクトインスタンス
オブジェクト	説明
jnxHrStoragePercentUsed.1	スイッチ上の /dev/ad0s1a: ファイルシステムを監視します。これは、/ にマウントされたルートファイルシステムです。
jnxHrStoragePercentUsed.2	スイッチ上の /dev/ad0s1e: ファイルシステムを監視します。これは、 /config にマウントされた構成ファイルシステムです。
jnx動作CPU(RE0)	ルーティングエンジン(RE0)によるCPU使用率を監視します。
jnxOperatingBuffer(RE0)	ルーティングエンジン(RE0)で使用可能なメモリの量を監視します。
jnxOperatingBuffer(FPC)	FPC(フレキシブルPICコンセントレータ)のバッファメモリ使用率を監視します。
sysApplElmtRunCPU	各 Junos OS プロセス(デーモンとも呼ばれる)の CPU 使用率を監視します。同じプロセスの複数のインスタンスを個別に監視し、インデックスを作成します。
sysApplElmtRunMemory	各 Junos OS プロセスのメモリ使用量を監視します。同じプロセスの複数のインスタンスを個別に監視し、インデックスを作成します。

Junos OSを実行するデバイスでヘルスモニタリングを設定する

一般的なネットワーク管理システム(NMS)で管理されるデバイスの数が増え、デバイス自体の複雑さが増すにつれ、NMSがポーリングを使用してデバイスを監視することはますます現実的ではなくなっています。より拡張性の高いアプローチは、注意が必要なときにネットワークデバイスを使用してNMSに通知することです。

ジュニパーネットワークスのルーターでは、RMONのアラームとイベントが、NMSからのポーリングオーバーヘッドを削減するために必要なインフラストラクチャの多くを提供します。ただし、このアプローチでは、特定の MIB オブジェクトを RMON アラームに設定するように NMS を設定する必要があります。そのために、デバイスに特化した専門知識や、監視アプリケーションのカスタマイズが必要になることがよくあります。また、監視が必要な MIB オブジェクトインスタンスの中には、初期化時や実行時の変更時にのみ設定されるものがあり、事前に設定することはできません。

これらの問題に対処するために、ヘルスモニターはRMONアラームインフラストラクチャを拡張して、選択したオブジェクトインスタンスセット(ファイルシステムの使用率、CPUの使用率、メモリ使用率)に対して事前定義された監視を提供し、不明または動的オブジェクトインスタンス(Junos OSプロセスなど)のサポートが含まれています。

正常性監視は、ユーザーの構成要件を最小限に抑えるように設計されています。正常性監視エントリーを設定するには、[edit snmp]階層レベルでhealth-monitorステートメントを含めます。

[edit snmp health-monitor]階層レベルで監視イベントを設定することで、システム全体の健全性に対するポーリング間隔が設定されます。これらの同じオプションを[edit snmp health-monitor idp]階層レベルで設定した場合、侵入検出および防止(IDP)システムによって使用されているデータプレーンメモリの割合が設定を上回ったり下回ったりすると、デバイスによってSNMPイベントが生成されます。

show snmp health-monitor操作コマンドを使用して、正常性監視アラームとログに関する情報を表示できます。

このトピックでは、最低限必要な設定について説明し、正常性監視を設定するための以下のタスクについて説明します。

監視対象オブジェクト
最小限の正常性監視設定
下限しきい値または上昇しきい値を設定する
間隔を設定する
ログエントリとトラップ

監視対象オブジェクト

正常性監視を設定すると、表2に示すように、特定のオブジェクトインスタンスの監視情報が利用可能になります。

表2:監視対象のオブジェクトインスタンス
オブジェクト	説明
`jnxHrStoragePercentUsed.1`	ルーターまたはスイッチで以下のファイルシステムを監視します。 `/dev/ad0s1a:` これは、/ にマウントされたルートファイルシステムです。
`jnxHrStoragePercentUsed.2`	ルーターまたはスイッチで以下のファイルシステムを監視します。 `/dev/ad0s1e:` これは、 `/config`にマウントされた構成ファイルシステムです。
`jnxOperatingCPU (RE0)`	ルーティングエンジン(`RE0` および `RE1`)のCPU使用率を監視します。ルーティングエンジンに割り当てられるインデックス値は、シャーシ MIB がゼロベースまたは 1 ベースのどちらのインデックス方式を採用しているかによって異なります。インデックス方式は構成可能であるため、ルーターまたはスイッチが初期化されたときや構成が変更されたときに、適切なインデックスが決定されます。ルーターまたはスイッチにルーティングエンジンが1つしかない場合、CPU値の取得に5回失敗すると、アラームエントリ監視 `RE1` が削除されます。
`jnxOperatingCPU (RE1)`
`jnxOperatingBuffer (RE0)`	ルーティングエンジン(`RE0` および `RE1`で使用可能なメモリの量を監視します。このオブジェクトのインデックスは `jnxOperatingCPU`に使用するものと同じであるため、インデックス値はシャーシMIBで使用されているインデックス方式に応じて調整されます。 `jnxOperatingCPU`と同様に、ルーターまたはスイッチにルーティングエンジンが1つしかない場合、アラームエントリ監視 `RE1` は削除されます。
`jnxOperatingBuffer (RE1)`
jnxOperatingBuffer(FPC)	FPC(フレキシブルPICコンセントレータ)のバッファメモリ使用率を監視します。FPCで現在使用中のバッファメモリの割合を示しています。
`sysApplElmtRunCPU`	各 Junos OS プロセス(デーモンとも呼ばれる)の CPU 使用率を監視します。同じプロセスの複数のインスタンスを個別に監視し、インデックスを作成します。
`sysApplElmtRunMemory`	各 Junos OS プロセスのメモリ使用量を監視します。同じプロセスの複数のインスタンスを個別に監視し、インデックスを作成します。

最小限の正常性監視設定

ルーターまたはスイッチの正常性監視を有効にするには、[edit snmp]階層レベルでhealth-monitorステートメントを含めます。

下限しきい値または上昇しきい値を設定する

下限しきい値は、監視対象変数の下限しきい値(可能な最大値の割合で表されます)です。現在のサンプリング値がこのしきい値以下で、最後のサンプリング間隔の値がこのしきい値より大きい場合、単一のイベントが生成されます。このエントリーが有効になった後の最初のサンプルがこのしきい値以下の場合も、単一のイベントが生成されます。下降イベントが生成された後、サンプリングされた値がこのしきい値を超えて上昇しきい値に達するまで、別の下降イベントは生成できません。下限しきい値は、可能な最大値の割合として指定する必要があります。デフォルトは 70 %です。

デフォルトでは、上昇しきい値は、監視対象オブジェクトインスタンスで可能な最大値の 80 %です。上昇しきい値は、監視対象変数の上限しきい値です。現在のサンプリング値がこのしきい値以上で、最後のサンプリング間隔の値がこのしきい値を下回る場合、単一のイベントが生成されます。このエントリーが有効になった後の最初のサンプルがこのしきい値以上の場合も、単一のイベントが生成されます。上昇イベントが生成された後、サンプリングされた値がこのしきい値を下回り、下降しきい値に達するまで、別の立ち上がりイベントは生成できません。上昇しきい値は、監視対象変数で可能な最大値の割合として指定する必要があります。

下限しきい値または上昇しきい値を設定するには、[edit snmp health-monitor]階層レベルでfalling-thresholdまたはrising-thresholdステートメントを含めます。

percentage は、 1 から 100までの値にすることができます。

下降および上昇しきい値は、正常性モニターによって監視されるすべてのオブジェクトインスタンスに適用されます。

間隔を設定する

この間隔は、オブジェクトインスタンスがサンプリングされ、上昇および下降しきい値と比較される期間(秒単位)を表します。

間隔を設定するには、 interval ステートメントを含め、 [edit snmp health-monitor] 階層レベルで秒数を指定します。

seconds は、 1 から 2147483647までの値にすることができます。デフォルトは 300 秒(5 分)です。

ログエントリとトラップ

ヘルスモニターイベント(しきい値を超えた、エラーなど)に対して生成されるシステムログエントリーには、汎用のSNMPD_RMON_EVENTLOGタグではなく、対応するHEALTHMONITORタグが付けられます。ただし、正常性監視は汎用のRMONrisingThresholdとfallingThresholdトラップを送信します。

正常性監視の設定

このトピックでは、QFXシリーズデバイスのヘルスモニター機能を設定する方法について説明します。

ヘルスモニター機能は、SNMP RMONアラームインフラストラクチャを拡張して、選択した一連のオブジェクトインスタンス(ファイルシステムの使用率、CPUの使用率、メモリ使用率など)と動的オブジェクトインスタンス(Junos OSプロセスなど)に対して定義済みの監視を提供します。

この手順では、サンプリング間隔は 600 秒(10 分)ごとで、下限しきい値は監視対象の各オブジェクトインスタンスで可能な最大値の 85 %、上昇しきい値は監視対象の各オブジェクトインスタンスで可能な最大値の 75 % です。

正常性監視を設定するには:

正常性モニターを設定します。

下限しきい値を設定します。

次に例を示します。

上昇しきい値を設定します。

次に例を示します。

間隔を設定します。

次に例を示します。

このページの内容

SNMP による正常性モニタリング

正常性監視の概要

Junos OSを実行するデバイスでヘルスモニタリングを設定する

監視対象オブジェクト

最小限の正常性監視設定

下限しきい値または上昇しきい値を設定する

間隔を設定する

ログエントリとトラップ

関連項目

正常性監視の設定

関連項目