Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

SNMP による正常性監視(RMON アラームの拡張)

正常性監視について

正常性監視は、RMON アラーム インフラストラクチャを拡張して、事前定義されたオブジェクト(ファイル システムの使用状況、CPU 使用率、メモリ使用率など)、および Junos OS プロセスの監視を提供する SNMP 機能です。

正常性監視機能は、階層レベルの[edit snmp]ステートメントをhealth-monitor使用して有効にします。また、下降しきい値、立ち上がりしきい値、間隔などのヘルスモニターパラメータを設定することもできます。監視対象オブジェクトの値が上昇または下降しきい値を超えると、アラームがトリガーされ、イベントがログに記録される可能性があります。

下降しきい値は、監視対象オブジェクト インスタンスの低いしきい値です。上昇しきい値は、監視対象オブジェクト インスタンスの上限しきい値です。各しきい値は、使用可能な最大値の割合で表されます。この間隔は、オブジェクト インスタンスがサンプリングされる時間(秒)を表し、上昇しきい値と下降しきい値と比較します。

イベントは、各サンプル間隔の後ではなく、いずれかの方向でしきい値が最初に交差した場合にのみ生成されます。たとえば、上昇しきい値アラームとそれに対応するイベントが発生した場合、対応する下降アラームが発生するまで、しきい値交差イベントは発生しません。

ヘルス・モニター・イベントのシステム・ログ・エントリーには、対応する HEALTHMONITOR タグがあり、汎用SNMPD_RMON_EVENTLOGタグではありません。ただし、正常性モニターは、一般的な RMON の立ち上がりと下降のしきい値トラップを送信します。運用コマンドを使用して、 show snmp health-monitor 正常性監視アラームとログに関する情報を表示できます。

ヘルス モニターを設定すると、次に示 表 1すように、特定のオブジェクト インスタンスの監視情報を使用できます。

表 1: 監視対象オブジェクト インスタンス

オブジェクト

説明

jnxHrstoragePercented.1

スイッチ上の /dev/ad0s1a: ファイル システムを監視します。これは、/にマウントされているルート ファイル システムです。

jnxHrstoragePercented.2

スイッチ上の /dev/ad0s1e: ファイル システムを監視します。これは、にマウントされている /config設定ファイル システムです。

jnxOperatingCPU(RE0)

ルーティング エンジン(RE0)による CPU 使用率を監視します。

jnxOperatingBuffer(RE0)

ルーティング エンジン(RE0)で使用可能なメモリ量を監視します。

sysApplElmtRunCPU

各 Junos OS プロセスの CPU 使用率を監視します(デーモンとも呼ばれます)。同じプロセスの複数のインスタンスが個別に監視され、インデックスが作成されます。

sysApplElmt実行メモリ

各 Junos OS プロセスのメモリ使用量を監視します。同じプロセスの複数のインスタンスが個別に監視され、インデックスが作成されます。

正常性監視の設定

このトピックでは、QFX シリーズおよび OCX シリーズ デバイスの正常性監視機能を構成する方法について説明します。

正常性監視機能は、SNMP RMON アラーム インフラストラクチャを拡張し、選択した一連のオブジェクト インスタンス(ファイル システムの使用率、CPU 使用率、メモリ使用量など)および動的オブジェクト インスタンス(Junos OS プロセスなど)に対して事前に監視します。

正常性監視を設定するには、以下の手順に関する手順に関する手順

  1. 正常性モニターを設定します。
  2. 下降しきい値を設定します。

    例えば、

  3. 上昇しきい値を設定します。

    例えば、

  4. 間隔を設定します。

    例えば、

Junos OS を実行しているデバイスの正常性監視の設定

一般的な NMS(ネットワーク管理システム)で管理されるデバイスの数が増え、デバイス自体の複雑さが増すにつれ、NMS がポーリングを使用してデバイスを監視することは、ますます現実的ではなくなっています。より拡張性の高いアプローチは、ネットワーク デバイスに依存して、注意が必要な場合に NMS に通知することです。

ジュニパーネットワークスのルーターでは、RMONアラームとイベントにより、NMSからのポーリングオーバーヘッドを削減するために必要なインフラストラクチャの大部分が提供されます。ただし、このアプローチでは、特定の MIB オブジェクトを RMON アラームに設定するように NMS を設定する必要があります。そのため、多くの場合、デバイス固有の専門知識と監視アプリケーションのカスタマイズが必要になります。さらに、監視が必要な MIB オブジェクト インスタンスの一部は、実行時の初期化時または変更時にのみ設定され、事前に設定することはできません。

これらの問題に対処するため、正常性モニターは RMON アラーム インフラストラクチャを拡張して、選択したオブジェクト インスタンスのセット(ファイル システムの使用、CPU 使用率、メモリ使用量)に対して事前定義された監視を提供し、不明または動的なオブジェクト インスタンス(Junos OS プロセスなど)のサポートを含めます。

正常性監視は、ユーザーの構成要件を最小限に抑えるように設計されています。正常性監視エントリを設定するには、階層レベルで health-monitor ステートメントを [edit snmp] 含めます。

階層レベルで監視イベントを構成すると、 [edit snmp health-monitor] システム全体の正常性に対するポーリング間隔が設定されます。これらの同じオプションを [edit snmp health-monitor idp] 階層レベルで設定した場合、侵入検出防御(IDP)システムが利用するデータプレーン メモリの割合が設定を上回るか下回ると、デバイスによって SNMP イベントが生成されます。

運用コマンドを使用して、 show snmp health-monitor 正常性監視アラームとログに関する情報を表示できます。

このトピックでは、必要最小限の構成について説明し、正常性モニターを構成するための以下のタスクについて説明します。

監視対象オブジェクト

ヘルス モニターを設定すると、次に示 表 2すように、特定のオブジェクト インスタンスの監視情報を使用できます。

表 2: 監視対象オブジェクト インスタンス

オブジェクト

説明

jnxHrStoragePercentUsed.1

ルーターまたはスイッチ上の次のファイル システムを監視します。

/dev/ad0s1a:

これは、/にマウントされているルート ファイル システムです。

jnxHrStoragePercentUsed.2

ルーターまたはスイッチ上の次のファイル システムを監視します。

/dev/ad0s1e:

これは、にマウントされている /config設定ファイル システムです。

jnxOperatingCPU (RE0)

ルーティング エンジン(RE0 および RE1)の CPU 使用率を監視します。ルーティング エンジンに割り当てられるインデックス値は、シャーシ MIB がゼロベースまたは 1 ベースのインデックス作成スキームを使用するかどうかによって異なります。インデックス作成スキームは構成可能であるため、ルーターまたはスイッチの初期化時と設定変更時に適切なインデックスが決定されます。ルーターまたはスイッチにルーティング エンジンが 1 つだけの場合、CPU 値の取得に 5 回失敗した後、アラーム エントリ監視 RE1 は削除されます。

jnxOperatingCPU (RE1)

jnxOperatingBuffer (RE0)

ルーティング エンジン(RE0 および RE1)で使用可能なメモリ量を監視します。このオブジェクトのインデックス作成は、使用 jnxOperatingCPUされているインデックスと同じであるため、シャーシ MIB で使用されるインデックススキームに応じてインデックス値が調整されます。同様に jnxOperatingCPU、ルーターまたはスイッチにルーティング エンジンが 1 つだけの場合、アラーム エントリ監視 RE1 は削除されます。

jnxOperatingBuffer (RE1)

sysApplElmtRunCPU

各 Junos OS プロセスの CPU 使用率を監視します(デーモンとも呼ばれます)。同じプロセスの複数のインスタンスが個別に監視され、インデックスが作成されます。

sysApplElmtRunMemory

各 Junos OS プロセスのメモリ使用量を監視します。同じプロセスの複数のインスタンスが個別に監視され、インデックスが作成されます。

最小稼働状況監視構成

ルーターまたはスイッチで正常性監視を有効にするには、階層レベルで health-monitor ステートメントを [edit snmp] 含めます。

下降しきい値または立ち上がりしきい値の設定

下降しきい値は、監視対象の変数の低いしきい値(可能な最大値の割合で表されます)です。現在のサンプリング値がこのしきい値以下で、最後のサンプリング間隔の値がこのしきい値よりも大きい場合、単一のイベントが生成されます。このエントリが有効になった後の最初のサンプルがこのしきい値以下の場合、1 つのイベントも生成されます。下降イベントが生成されると、サンプル値がこのしきい値を超えて上昇しきい値に達するまで、別の下降イベントを生成できません。最大許容値の割合として下降しきい値を指定する必要があります。デフォルトはパーセントです 70

既定では、上昇しきい値は、 80 監視対象のオブジェクト インスタンスで使用可能な最大値のパーセントです。立ち上がりしきい値は、監視対象変数の上限しきい値です。現在のサンプリング値がこのしきい値以上で、最後のサンプリング間隔の値がこのしきい値よりも小さい場合、1 つのイベントが生成されます。このエントリが有効になった後の最初のサンプルがこのしきい値以上の場合は、1 つのイベントも生成されます。立ち上がりイベントが生成されると、サンプル値がこのしきい値を下回り、下降しきい値に達するまで、別の立ち上がりイベントを生成できません。上昇しきい値は、モニター対象変数の使用可能な最大値の割合として指定する必要があります。

下降しきい値または立ち上がりしきい値を設定するには、階層レベルに falling-threshold or rising-threshold ステートメントを [edit snmp health-monitor] 含めます。

percentageからまでの1001を指定できます。

しきい値の低下と上昇のしきい値は、正常性モニターによって監視されるすべてのオブジェクト インスタンスに適用されます。

間隔の設定

この間隔は、オブジェクト インスタンスがサンプリングされる時間(秒)を表し、上昇しきい値と下降しきい値と比較します。

間隔を設定するには、ステートメントを interval 含め、階層レベルで秒数を [edit snmp health-monitor] 指定します。

secondsからまでの21474836471を指定できます。デフォルトは 300 秒(5 分)です。

ログ エントリとトラップ

正常性監視イベント(しきい値を超えた、エラーなど)に対して生成されるシステム ログ エントリには、汎用SNMPD_RMON_EVENTLOGタグではなく対応するHEALTHMONITORタグがあります。ただし、正常性モニターは汎用 RMON risingThresholdfallingThreshold トラップを送信します。

例:正常性監視の設定

正常性モニターを設定します。

この例では、サンプリング間隔は秒ごと 600 (10 分)、下降しきい値は 85 監視対象の各オブジェクト インスタンスの最大値のパーセントであり、上昇しきい値は 75 監視対象の各オブジェクト インスタンスで使用可能な最大値のパーセントです。