Zustandsüberwachung mit SNMP
Übersicht über die Integritätsüberwachung
Die Zustandsüberwachung ist eine SNMP-Funktion, die die RMON-Alarminfrastruktur erweitert, um die Überwachung für einen vordefinierten Satz von Objekten (z. B. Dateisystemauslastung, CPU- und Speicherauslastung) und für Junos OS-Prozesse bereitzustellen.
Sie aktivieren die Systemüberwachungsfunktion mithilfe der health-monitor
Anweisung auf Hierarchieebene [edit snmp]
. Sie können auch Parameter des Integritätsmonitors konfigurieren, z. B. einen fallenden Schwellenwert, einen steigenden Schwellenwert und ein Intervall. Wenn der Wert eines überwachten Objekts den steigenden oder fallenden Schwellenwert überschreitet, wird ein Alarm ausgelöst und ein Ereignis kann protokolliert werden.
Der fallende Schwellenwert ist der untere Schwellenwert für die überwachte Objektinstanz. Der steigende Schwellenwert ist der obere Schwellenwert für die überwachte Objektinstanz. Jeder Schwellenwert wird als Prozentsatz des maximal möglichen Werts ausgedrückt. Das Intervall stellt den Zeitraum in Sekunden dar, über den die Objektinstanz abgetastet und mit den steigenden und fallenden Schwellenwerten verglichen wird.
Ereignisse werden nur generiert, wenn ein Schwellenwert zum ersten Mal in eine Richtung überschritten wird, und nicht nach jedem Abtastintervall. Wenn z. B. ein Alarm mit steigendem Schwellenwert zusammen mit dem entsprechenden Ereignis ausgelöst wird, treten keine Schwellenwertüberschreitungsereignisse mehr auf, bis ein entsprechender fallender Alarm auftritt.
Systemprotokolleinträge für Systemüberwachungsereignisse haben ein entsprechendes HEALTHMONITOR-Tag und kein generisches SNMPD_RMON_EVENTLOG-Tag. Der Systemmonitor sendet jedoch generische RMON-Traps "risingThreshold" und "fallingThreshold". Sie können den show snmp health-monitor
Betriebsbefehl verwenden, um Informationen zu Alarmen und Protokollen der Integritätsüberwachung anzuzeigen.
Wenn Sie den Systemmonitor konfigurieren, stehen Überwachungsinformationen für bestimmte Objektinstanzen zur Verfügung, wie in gezeigt. Tabelle 1
Objekt |
Beschreibung |
---|---|
jnxHrStoragePercentUsed.1 |
Überwacht das /dev/ad0s1a: Dateisystem auf dem Switch. Dies ist das Root-Dateisystem, das auf / gemountet ist. |
jnxHrStoragePercentUsed.2 |
Überwacht das /dev/ad0s1e: Dateisystem auf dem Switch. Dies ist das Konfigurationsdateisystem, das auf gemountet ist /config. |
jnxOperatingCPU (RE0) |
Überwacht die CPU-Auslastung durch die Routing-Engine (RE0). |
jnxOperatingBuffer (RE0) |
Überwacht die Menge an Speicher, die auf der Routing-Engine (RE0) verfügbar ist. |
sysApplElmtRunCPU |
Überwacht die CPU-Auslastung für jeden Junos OS-Prozess (auch Daemon genannt). Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert. |
sysApplElmtRunMemory |
Überwacht die Speicherauslastung für jeden Junos OS-Prozess. Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert. |
Siehe auch
Konfigurieren der Zustandsüberwachung auf Geräten mit Junos OS
Da die Anzahl der Geräte, die von einem typischen Netzwerkmanagementsystem (Network Management System, NMS) verwaltet werden, zunimmt und die Komplexität der Geräte selbst zunimmt, wird es für das NMS immer unpraktischer, Polling zur Überwachung der Geräte zu verwenden. Ein skalierbarerer Ansatz besteht darin, sich darauf zu verlassen, dass Netzwerkgeräte das NMS benachrichtigen, wenn etwas Aufmerksamkeit erfordert.
Auf Routern von Juniper Networks stellen RMON-Alarme und -Ereignisse einen Großteil der Infrastruktur bereit, die erforderlich ist, um den Polling-Overhead vom NMS zu reduzieren. Bei diesem Ansatz müssen Sie das NMS jedoch so einrichten, dass bestimmte MIB-Objekte in RMON-Alarmen konfiguriert werden. Dies erfordert oft gerätespezifisches Know-how und Customizing der Monitoring-Anwendung. Darüber hinaus werden einige MIB-Objektinstanzen, die überwacht werden müssen, nur bei der Initialisierung oder Änderung zur Laufzeit festgelegt und können nicht im Voraus konfiguriert werden.
Um diese Probleme zu beheben, erweitert der Zustandsmonitor die RMON-Alarminfrastruktur um eine vordefinierte Überwachung für einen ausgewählten Satz von Objektinstanzen (für Dateisystemnutzung, CPU-Auslastung und Speicherauslastung) und bietet Unterstützung für unbekannte oder dynamische Objektinstanzen (z. B. Junos OS-Prozesse).
Die Systemüberwachung wurde entwickelt, um die Anforderungen an die Benutzerkonfiguration zu minimieren. Um Systemüberwachungseinträge zu konfigurieren, fügen Sie die health-monitor
Anweisung auf Hierarchieebene [edit snmp]
ein:
[edit snmp] health-monitor { falling-threshold percentage; interval seconds; rising-threshold percentage; idp { falling-threshold percentage; interval seconds; rising-threshold percentage; } }
Durch das Konfigurieren von Überwachungsereignissen auf Hierarchieebene [edit snmp health-monitor]
werden Abrufintervalle für den Gesamtzustand des Systems festgelegt. Wenn Sie dieselben Optionen auf Hierarchieebene [edit snmp health-monitor idp]
festlegen, wird vom Gerät ein SNMP-Ereignis generiert, wenn der Prozentsatz des Datenebenenspeichers, der vom Intrusion Detection and Prevention-System (IDP) verwendet wird, Ihre Einstellungen über- oder unterschreitet.
Sie können den show snmp health-monitor
Betriebsbefehl verwenden, um Informationen zu Alarmen und Protokollen der Integritätsüberwachung anzuzeigen.
In diesem Thema wird die mindestens erforderliche Konfiguration beschrieben, und es werden die folgenden Aufgaben zum Konfigurieren des Systemmonitors erläutert:
- Überwachte Objekte
- Minimale Konfiguration der Systemüberwachung
- Konfigurieren des fallenden oder ansteigenden Schwellenwerts
- Konfigurieren des Intervalls
- Protokolleinträge und Traps
Überwachte Objekte
Wenn Sie den Systemmonitor konfigurieren, stehen Überwachungsinformationen für bestimmte Objektinstanzen zur Verfügung, wie in gezeigt. Tabelle 2
Objekt |
Beschreibung |
---|---|
|
Überwacht das folgende Dateisystem auf dem Router oder Switch:
Dies ist das Root-Dateisystem, das auf / gemountet ist. |
|
Überwacht das folgende Dateisystem auf dem Router oder Switch:
Dies ist das Konfigurationsdateisystem, das auf gemountet ist |
|
Überwacht die CPU-Auslastung für Routing-Engines ( |
|
|
|
Überwacht die Menge an Speicher, die in Routing-Engines verfügbar ist ( |
|
|
|
Überwacht die CPU-Auslastung für jeden Junos OS-Prozess (auch Daemon genannt). Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert. |
|
Überwacht die Speicherauslastung für jeden Junos OS-Prozess. Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert. |
Minimale Konfiguration der Systemüberwachung
Um die Zustandsüberwachung auf dem Router oder Switch zu aktivieren, fügen Sie die health-monitor
folgende Anweisung auf Hierarchieebene [edit snmp]
ein:
[edit snmp] health-monitor;
Konfigurieren des fallenden oder ansteigenden Schwellenwerts
Der fallende Schwellenwert ist der untere Schwellenwert (ausgedrückt als Prozentsatz des maximal möglichen Werts) für die überwachte Variable. Wenn der aktuell abgetastete Wert kleiner oder gleich diesem Schwellenwert ist und der Wert im letzten Abtastintervall größer als dieser Schwellenwert ist, wird ein einzelnes Ereignis generiert. Ein einzelnes Ereignis wird auch generiert, wenn die erste Stichprobe, nachdem dieser Eintrag gültig geworden ist, kleiner oder gleich diesem Schwellenwert ist. Nachdem ein fallendes Ereignis generiert wurde, kann erst dann ein weiteres fallendes Ereignis generiert werden, wenn der abgetastete Wert diesen Schwellenwert überschreitet und den steigenden Schwellenwert erreicht. Sie müssen den fallenden Schwellenwert als Prozentsatz des maximal möglichen Werts angeben. Der Standardwert ist 70
Prozent.
Standardmäßig ist 80
der steigende Schwellenwert Prozent des maximal möglichen Werts für die überwachte Objektinstanz. Der steigende Schwellenwert ist der obere Schwellenwert für die überwachte Variable. Wenn der aktuell abgetastete Wert größer oder gleich diesem Schwellenwert ist und der Wert im letzten Abtastintervall kleiner als dieser Schwellenwert ist, wird ein einzelnes Ereignis generiert. Ein einzelnes Ereignis wird auch generiert, wenn die erste Stichprobe, nachdem dieser Eintrag gültig geworden ist, größer oder gleich diesem Schwellenwert ist. Nachdem ein steigendes Ereignis generiert wurde, kann erst dann ein weiteres ansteigendes Ereignis generiert werden, wenn der abgetastete Wert diesen Schwellenwert unterschreitet und den fallenden Schwellenwert erreicht. Sie müssen den steigenden Schwellenwert als Prozentsatz des maximal möglichen Wertes für die überwachte Variable angeben.
Um den fallenden oder steigenden Schwellenwert zu konfigurieren, fügen Sie die falling-threshold
oder-Anweisung rising-threshold
auf Hierarchieebene [edit snmp health-monitor]
ein:
[edit snmp health-monitor] falling-threshold percentage; rising-threshold percentage;
percentage
kann ein Wert von 1
bis 100
sein.
Die fallenden und steigenden Schwellenwerte gelten für alle Objektinstanzen, die vom Systemmonitor überwacht werden.
Konfigurieren des Intervalls
Das Intervall stellt den Zeitraum in Sekunden dar, über den die Objektinstanz abgetastet und mit den steigenden und fallenden Schwellenwerten verglichen wird.
Um das Intervall zu konfigurieren, fügen Sie die interval
Anweisung ein, und geben Sie die Anzahl der Sekunden auf Hierarchieebene [edit snmp health-monitor]
an:
[edit snmp health-monitor] interval seconds;
seconds
kann ein Wert von 1
bis 2147483647
sein. Der Standardwert ist 300
Sekunden (5 Minuten).
Protokolleinträge und Traps
Die Systemprotokolleinträge, die für alle Systemüberwachungsereignisse (überschrittene Schwellenwerte, Fehler usw.) generiert werden, haben ein entsprechendes HEALTHMONITOR
Tag anstelle eines generischen SNMPD_RMON_EVENTLOG
Tags. Der Systemmonitor sendet jedoch generisches RMON risingThreshold
und fallingThreshold
Traps.
Siehe auch
Konfigurieren der Systemüberwachung
In diesem Thema wird beschrieben, wie die Zustandsüberwachungsfunktion für Geräte der QFX-Serie konfiguriert wird.
Die Zustandsüberwachungsfunktion erweitert die SNMP-RMON-Alarminfrastruktur um eine vordefinierte Überwachung für eine ausgewählte Gruppe von Objektinstanzen (z. B. Dateisystemauslastung, CPU-Auslastung und Speicherauslastung) und dynamische Objektinstanzen (z. B. Junos OS-Prozesse).
Bei diesem Verfahren beträgt das Abtastintervall alle 600
Sekunden (10 Minuten), der fallende Schwellenwert ist 85
Prozent des maximal möglichen Werts für jede überwachte Objektinstanz und der steigende Schwellenwert ist 75
Prozent des maximal möglichen Werts für jede überwachte Objektinstanz.
So konfigurieren Sie die Systemüberwachung: