Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Zustandsüberwachung mit SNMP

Übersicht über die Integritätsüberwachung

Die Zustandsüberwachung ist eine SNMP-Funktion, die die RMON-Alarminfrastruktur erweitert, um die Überwachung für einen vordefinierten Satz von Objekten (z. B. Dateisystemauslastung, CPU- und Speicherauslastung) und für Junos OS-Prozesse bereitzustellen.

Sie aktivieren die Systemüberwachungsfunktion mithilfe der health-monitor Anweisung auf Hierarchieebene [edit snmp] . Sie können auch Parameter des Integritätsmonitors konfigurieren, z. B. einen fallenden Schwellenwert, einen steigenden Schwellenwert und ein Intervall. Wenn der Wert eines überwachten Objekts den steigenden oder fallenden Schwellenwert überschreitet, wird ein Alarm ausgelöst und ein Ereignis kann protokolliert werden.

Der fallende Schwellenwert ist der untere Schwellenwert für die überwachte Objektinstanz. Der steigende Schwellenwert ist der obere Schwellenwert für die überwachte Objektinstanz. Jeder Schwellenwert wird als Prozentsatz des maximal möglichen Werts ausgedrückt. Das Intervall stellt den Zeitraum in Sekunden dar, über den die Objektinstanz abgetastet und mit den steigenden und fallenden Schwellenwerten verglichen wird.

Ereignisse werden nur generiert, wenn ein Schwellenwert zum ersten Mal in eine Richtung überschritten wird, und nicht nach jedem Abtastintervall. Wenn z. B. ein Alarm mit steigendem Schwellenwert zusammen mit dem entsprechenden Ereignis ausgelöst wird, treten keine Schwellenwertüberschreitungsereignisse mehr auf, bis ein entsprechender fallender Alarm auftritt.

Systemprotokolleinträge für Systemüberwachungsereignisse haben ein entsprechendes HEALTHMONITOR-Tag und kein generisches SNMPD_RMON_EVENTLOG-Tag. Der Systemmonitor sendet jedoch generische RMON-Traps "risingThreshold" und "fallingThreshold". Sie können den show snmp health-monitor Betriebsbefehl verwenden, um Informationen zu Alarmen und Protokollen der Integritätsüberwachung anzuzeigen.

Wenn Sie den Systemmonitor konfigurieren, stehen Überwachungsinformationen für bestimmte Objektinstanzen zur Verfügung, wie in gezeigt. Tabelle 1

Tabelle 1: Überwachte Objektinstanzen

Objekt

Beschreibung

jnxHrStoragePercentUsed.1

Überwacht das /dev/ad0s1a: Dateisystem auf dem Switch. Dies ist das Root-Dateisystem, das auf / gemountet ist.

jnxHrStoragePercentUsed.2

Überwacht das /dev/ad0s1e: Dateisystem auf dem Switch. Dies ist das Konfigurationsdateisystem, das auf gemountet ist /config.

jnxOperatingCPU (RE0)

Überwacht die CPU-Auslastung durch die Routing-Engine (RE0).

jnxOperatingBuffer (RE0)

Überwacht die Menge an Speicher, die auf der Routing-Engine (RE0) verfügbar ist.

sysApplElmtRunCPU

Überwacht die CPU-Auslastung für jeden Junos OS-Prozess (auch Daemon genannt). Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert.

sysApplElmtRunMemory

Überwacht die Speicherauslastung für jeden Junos OS-Prozess. Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert.

Konfigurieren der Zustandsüberwachung auf Geräten mit Junos OS

Da die Anzahl der Geräte, die von einem typischen Netzwerkmanagementsystem (Network Management System, NMS) verwaltet werden, zunimmt und die Komplexität der Geräte selbst zunimmt, wird es für das NMS immer unpraktischer, Polling zur Überwachung der Geräte zu verwenden. Ein skalierbarerer Ansatz besteht darin, sich darauf zu verlassen, dass Netzwerkgeräte das NMS benachrichtigen, wenn etwas Aufmerksamkeit erfordert.

Auf Routern von Juniper Networks stellen RMON-Alarme und -Ereignisse einen Großteil der Infrastruktur bereit, die erforderlich ist, um den Polling-Overhead vom NMS zu reduzieren. Bei diesem Ansatz müssen Sie das NMS jedoch so einrichten, dass bestimmte MIB-Objekte in RMON-Alarmen konfiguriert werden. Dies erfordert oft gerätespezifisches Know-how und Customizing der Monitoring-Anwendung. Darüber hinaus werden einige MIB-Objektinstanzen, die überwacht werden müssen, nur bei der Initialisierung oder Änderung zur Laufzeit festgelegt und können nicht im Voraus konfiguriert werden.

Um diese Probleme zu beheben, erweitert der Zustandsmonitor die RMON-Alarminfrastruktur um eine vordefinierte Überwachung für einen ausgewählten Satz von Objektinstanzen (für Dateisystemnutzung, CPU-Auslastung und Speicherauslastung) und bietet Unterstützung für unbekannte oder dynamische Objektinstanzen (z. B. Junos OS-Prozesse).

Die Systemüberwachung wurde entwickelt, um die Anforderungen an die Benutzerkonfiguration zu minimieren. Um Systemüberwachungseinträge zu konfigurieren, fügen Sie die health-monitor Anweisung auf Hierarchieebene [edit snmp] ein:

Durch das Konfigurieren von Überwachungsereignissen auf Hierarchieebene [edit snmp health-monitor] werden Abrufintervalle für den Gesamtzustand des Systems festgelegt. Wenn Sie dieselben Optionen auf Hierarchieebene [edit snmp health-monitor idp] festlegen, wird vom Gerät ein SNMP-Ereignis generiert, wenn der Prozentsatz des Datenebenenspeichers, der vom Intrusion Detection and Prevention-System (IDP) verwendet wird, Ihre Einstellungen über- oder unterschreitet.

Sie können den show snmp health-monitor Betriebsbefehl verwenden, um Informationen zu Alarmen und Protokollen der Integritätsüberwachung anzuzeigen.

In diesem Thema wird die mindestens erforderliche Konfiguration beschrieben, und es werden die folgenden Aufgaben zum Konfigurieren des Systemmonitors erläutert:

Überwachte Objekte

Wenn Sie den Systemmonitor konfigurieren, stehen Überwachungsinformationen für bestimmte Objektinstanzen zur Verfügung, wie in gezeigt. Tabelle 2

Tabelle 2: Überwachte Objektinstanzen

Objekt

Beschreibung

jnxHrStoragePercentUsed.1

Überwacht das folgende Dateisystem auf dem Router oder Switch:

/dev/ad0s1a:

Dies ist das Root-Dateisystem, das auf / gemountet ist.

jnxHrStoragePercentUsed.2

Überwacht das folgende Dateisystem auf dem Router oder Switch:

/dev/ad0s1e:

Dies ist das Konfigurationsdateisystem, das auf gemountet ist /config.

jnxOperatingCPU (RE0)

Überwacht die CPU-Auslastung für Routing-Engines (RE0 und RE1). Die den Routing-Modulen zugewiesenen Indexwerte hängen davon ab, ob die Chassis-MIB ein null- oder einsbasiertes Indizierungsschema verwendet. Da das Indizierungsschema konfigurierbar ist, wird der richtige Index bei der Initialisierung des Routers oder Switches und bei einer Konfigurationsänderung ermittelt. Wenn der Router oder Switch nur über eine Routing-Engine verfügt, wird die Überwachung RE1 des Alarmeintrags nach fünf fehlgeschlagenen Versuchen, den CPU-Wert abzurufen, entfernt.

jnxOperatingCPU (RE1)

jnxOperatingBuffer (RE0)

Überwacht die Menge an Speicher, die in Routing-Engines verfügbar ist (RE0 und RE1). Da die Indizierung dieses Objekts identisch ist mit der für jnxOperatingCPU, werden die Indexwerte in Abhängigkeit vom Indizierungsschema angepasst, das in der Chassis-MIB verwendet wird. Wie bei wird jnxOperatingCPUdie Überwachung RE1 des Alarmeintrags entfernt, wenn der Router oder Switch nur über eine Routing-Engine verfügt.

jnxOperatingBuffer (RE1)

sysApplElmtRunCPU

Überwacht die CPU-Auslastung für jeden Junos OS-Prozess (auch Daemon genannt). Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert.

sysApplElmtRunMemory

Überwacht die Speicherauslastung für jeden Junos OS-Prozess. Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert.

Minimale Konfiguration der Systemüberwachung

Um die Zustandsüberwachung auf dem Router oder Switch zu aktivieren, fügen Sie die health-monitor folgende Anweisung auf Hierarchieebene [edit snmp] ein:

Konfigurieren des fallenden oder ansteigenden Schwellenwerts

Der fallende Schwellenwert ist der untere Schwellenwert (ausgedrückt als Prozentsatz des maximal möglichen Werts) für die überwachte Variable. Wenn der aktuell abgetastete Wert kleiner oder gleich diesem Schwellenwert ist und der Wert im letzten Abtastintervall größer als dieser Schwellenwert ist, wird ein einzelnes Ereignis generiert. Ein einzelnes Ereignis wird auch generiert, wenn die erste Stichprobe, nachdem dieser Eintrag gültig geworden ist, kleiner oder gleich diesem Schwellenwert ist. Nachdem ein fallendes Ereignis generiert wurde, kann erst dann ein weiteres fallendes Ereignis generiert werden, wenn der abgetastete Wert diesen Schwellenwert überschreitet und den steigenden Schwellenwert erreicht. Sie müssen den fallenden Schwellenwert als Prozentsatz des maximal möglichen Werts angeben. Der Standardwert ist 70 Prozent.

Standardmäßig ist 80 der steigende Schwellenwert Prozent des maximal möglichen Werts für die überwachte Objektinstanz. Der steigende Schwellenwert ist der obere Schwellenwert für die überwachte Variable. Wenn der aktuell abgetastete Wert größer oder gleich diesem Schwellenwert ist und der Wert im letzten Abtastintervall kleiner als dieser Schwellenwert ist, wird ein einzelnes Ereignis generiert. Ein einzelnes Ereignis wird auch generiert, wenn die erste Stichprobe, nachdem dieser Eintrag gültig geworden ist, größer oder gleich diesem Schwellenwert ist. Nachdem ein steigendes Ereignis generiert wurde, kann erst dann ein weiteres ansteigendes Ereignis generiert werden, wenn der abgetastete Wert diesen Schwellenwert unterschreitet und den fallenden Schwellenwert erreicht. Sie müssen den steigenden Schwellenwert als Prozentsatz des maximal möglichen Wertes für die überwachte Variable angeben.

Um den fallenden oder steigenden Schwellenwert zu konfigurieren, fügen Sie die falling-threshold oder-Anweisung rising-threshold auf Hierarchieebene [edit snmp health-monitor] ein:

percentage kann ein Wert von 1 bis 100sein.

Die fallenden und steigenden Schwellenwerte gelten für alle Objektinstanzen, die vom Systemmonitor überwacht werden.

Konfigurieren des Intervalls

Das Intervall stellt den Zeitraum in Sekunden dar, über den die Objektinstanz abgetastet und mit den steigenden und fallenden Schwellenwerten verglichen wird.

Um das Intervall zu konfigurieren, fügen Sie die interval Anweisung ein, und geben Sie die Anzahl der Sekunden auf Hierarchieebene [edit snmp health-monitor] an:

seconds kann ein Wert von 1 bis 2147483647sein. Der Standardwert ist 300 Sekunden (5 Minuten).

Protokolleinträge und Traps

Die Systemprotokolleinträge, die für alle Systemüberwachungsereignisse (überschrittene Schwellenwerte, Fehler usw.) generiert werden, haben ein entsprechendes HEALTHMONITOR Tag anstelle eines generischen SNMPD_RMON_EVENTLOG Tags. Der Systemmonitor sendet jedoch generisches RMON risingThreshold und fallingThreshold Traps.

Konfigurieren der Systemüberwachung

In diesem Thema wird beschrieben, wie die Zustandsüberwachungsfunktion für Geräte der QFX-Serie konfiguriert wird.

Die Zustandsüberwachungsfunktion erweitert die SNMP-RMON-Alarminfrastruktur um eine vordefinierte Überwachung für eine ausgewählte Gruppe von Objektinstanzen (z. B. Dateisystemauslastung, CPU-Auslastung und Speicherauslastung) und dynamische Objektinstanzen (z. B. Junos OS-Prozesse).

Bei diesem Verfahren beträgt das Abtastintervall alle 600 Sekunden (10 Minuten), der fallende Schwellenwert ist 85 Prozent des maximal möglichen Werts für jede überwachte Objektinstanz und der steigende Schwellenwert ist 75 Prozent des maximal möglichen Werts für jede überwachte Objektinstanz.

So konfigurieren Sie die Systemüberwachung:

  1. Konfigurieren Sie den Zustandsmonitor:
  2. Konfigurieren Sie den fallenden Schwellenwert:

    Zum Beispiel:

  3. Konfigurieren Sie den steigenden Schwellenwert:

    Zum Beispiel:

  4. Konfigurieren Sie das Intervall:

    Zum Beispiel: