Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Zustandsüberwachung mit SNMP (Erweitern des RMON-Alarms)

Informationen zur Zustandsüberwachung

Die Zustandsüberwachung ist eine SNMP-Funktion, die die RMON-Alarminfrastruktur erweitert, um überwachung für vordefinierte Objekte (z. B. Dateisystemauslastung, CPU-Auslastung und Speicherauslastung) und für Junos OS-Prozesse bereitzustellen.

Sie aktivieren die Statusüberwachungsfunktion mithilfe der health-monitor Anweisung auf Hierarchieebene [edit snmp] . Sie können auch Statusüberwachungsparameter wie einen fallenden Schwellenwert, einen steigenden Schwellenwert und ein Intervall konfigurieren. Wenn der Wert eines überwachten Objekts den steigenden oder fallenden Schwellenwert überschreitet, wird ein Alarm ausgelöst und ein Ereignis kann protokolliert werden.

Der fallende Schwellenwert ist der niedrigere Schwellenwert für die überwachte Objektinstanz. Der steigende Schwellenwert ist der obere Schwellenwert für die überwachte Objektinstanz. Jeder Schwellenwert wird als Prozentsatz des maximal möglichen Wertes ausgedrückt. Das Intervall gibt den Zeitraum in Sekunden an, über den die Objektinstanz beprobt wird, und vergleicht sie mit den steigenden und fallenden Schwellenwerten.

Ereignisse werden nur generiert, wenn ein Schwellenwert zum ersten Mal in eine Richtung überschritten wird, anstatt nach jedem Beispielintervall. Wenn beispielsweise ein steigender Schwellwertalarm zusammen mit seinem entsprechenden Ereignis ausgelöst wird, treten keine Schwellenwertüberquerungsereignisse mehr auf, bis ein entsprechender fallender Alarm auftritt.

Systemprotokolleinträge für Statusüberwachungsereignisse haben ein entsprechendes HEALTHMONITOR-Tag und kein generisches SNMPD_RMON_EVENTLOG-Tag. Der Gesundheitsmonitor sendet jedoch generic RMON risingThreshold und FallingThreshold Traps. Sie können den show snmp health-monitor Betriebsbefehl verwenden, um Informationen über Zustandsüberwachungsalarme und -protokolle anzuzeigen.

Wenn Sie den Statusmonitor konfigurieren, sind Überwachungsinformationen für bestimmte Objektinstanzen verfügbar, wie in Tabelle 1dargestellt.

Tabelle 1: Überwachte Objektinstanzen

Objekt

Beschreibung

jnxHrStoragePercentUsed.1

Überwacht das /dev/ad0s1a: Dateisystem auf dem Switch. Dies ist das Root-Dateisystem, das auf /eingehängt wird.

jnxHrStoragePercentUsed.2

Überwacht das /dev/ad0s1e: Dateisystem auf dem Switch. Dies ist das Konfigurationsdateisystem, das auf /configeingehängt wird.

jnxOperatingCPU (RE0)

Überwacht die CPU-Auslastung durch die Routing-Engine (RE0).

jnxOperatingBuffer (RE0)

Überwacht die verfügbare Speichermenge der Routing-Engine (RE0).

sysApplElmtRunCPU

Überwacht die CPU-Auslastung für jeden Junos OS-Prozess (auch Daemon genannt). Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert.

sysApplElmtRunMemory

Überwacht die Speicherauslastung für jeden Junos OS-Prozess. Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert.

Konfigurieren der Zustandsüberwachung

In diesem Thema wird beschrieben, wie die Statusüberwachungsfunktion für Geräte der QFX- und OCX-Serie konfiguriert wird.

Die Statusüberwachungsfunktion erweitert die SNMP RMON-Alarminfrastruktur, um eine vordefinierte Überwachung für einen ausgewählten Satz von Objektinstanzen (z. B. Dateisystemauslastung, CPU-Auslastung und Speicherauslastung) und dynamische Objektinstanzen (z. B. Junos OS-Prozesse) bereitzustellen.

So konfigurieren Sie die Zustandsüberwachung:

  1. Konfiguration des Statusmonitors:
  2. Konfigurieren Sie den fallenden Schwellenwert:

    Zum Beispiel:

  3. Konfigurieren Sie den steigenden Schwellenwert:

    Zum Beispiel:

  4. Das Intervall konfigurieren:

    Zum Beispiel:

Konfigurieren der Zustandsüberwachung auf Geräten, auf denen Junos OS ausgeführt wird

Da die Anzahl der Geräte, die von einem typischen Netzwerkmanagementsystem (NMS) verwaltet werden, wächst und die Komplexität der Geräte selbst steigt, wird es immer unpraktischer, dass das NMS Polling zur Überwachung der Geräte verwendet. Ein skalierbarerer Ansatz besteht darin, sich darauf zu verlassen, dass Netzwerkgeräte das NMS benachrichtigen, wenn etwas Aufmerksamkeit erfordert.

Auf Routern von Juniper Networks stellen RMON-Alarme und -Ereignisse einen Großteil der Infrastruktur bereit, die erforderlich ist, um den Abruf-Overhead des NMS zu reduzieren. Bei diesem Ansatz müssen Sie jedoch das NMS einrichten, um bestimmte MIB-Objekte in RMON-Alarmen zu konfigurieren. Dies erfordert häufig gerätespezifisches Know-how und eine Anpassung der Überwachungsanwendung. Darüber hinaus werden einige MIB-Objektinstanzen, die überwacht werden müssen, nur bei der Initialisierung oder Änderung zur Laufzeit festgelegt und können nicht im Voraus konfiguriert werden.

Um diese Probleme zu beheben, erweitert der Zustandsmonitor die RMON-Alarminfrastruktur, um eine vordefinierte Überwachung für eine ausgewählte Gruppe von Objektinstanzen (für die Dateisystemnutzung, CPU-Auslastung und Speicherauslastung) bereitzustellen und unterstützt unbekannte oder dynamische Objektinstanzen (z. B. Junos OS-Prozesse).

Die Statusüberwachung wurde entwickelt, um die Konfigurationsanforderungen der Benutzer zu minimieren. Um Statusüberwachungseinträge zu konfigurieren, fügen Sie die health-monitor Anweisung auf Hierarchieebene [edit snmp] ein:

Die Konfiguration von Überwachungsereignissen auf Hierarchieebene [edit snmp health-monitor] legt Abfrageintervalle für den Gesamtzustand des Systems fest. Wenn Sie auf Hierarchieebene [edit snmp health-monitor idp] dieselben Optionen festlegen, wird ein SNMP-Ereignis vom Gerät generiert, wenn der Prozentsatz des vom Intrusion Detection and Prevention (IDP)-System verwendeten Dataplane-Speichers über oder unter Ihre Einstellungen fällt.

Sie können den show snmp health-monitor Betriebsbefehl verwenden, um Informationen über Zustandsüberwachungsalarme und -protokolle anzuzeigen.

In diesem Thema wird die erforderliche Mindestkonfiguration beschrieben und die folgenden Aufgaben für die Konfiguration des Statusmonitors erörtert:

Überwachte Objekte

Wenn Sie den Statusmonitor konfigurieren, sind Überwachungsinformationen für bestimmte Objektinstanzen verfügbar, wie in Tabelle 2dargestellt.

Tabelle 2: Überwachte Objektinstanzen

Objekt

Beschreibung

jnxHrStoragePercentUsed.1

Überwacht das folgende Dateisystem auf dem Router oder Switch:

/dev/ad0s1a:

Dies ist das Root-Dateisystem, das auf /eingehängt wird.

jnxHrStoragePercentUsed.2

Überwacht das folgende Dateisystem auf dem Router oder Switch:

/dev/ad0s1e:

Dies ist das Konfigurationsdateisystem, das auf /configeingehängt wird.

jnxOperatingCPU (RE0)

Überwacht die CPU-Auslastung für Routing-Engines (RE0 und RE1). Die den Routing-Engines zugewiesenen Indexwerte hängen davon ab, ob die Chassis-MIB ein zero- oder eins-basiertes Indizierungsschema verwendet. Da das Indizierungsschema konfigurierbar ist, wird der richtige Index ermittelt, wenn der Router oder Switch initialisiert wird und wann eine Konfigurationsänderung vorliegt. Wenn der Router oder Switch nur über eine Routing-Engine verfügt, wird die Alarmeingangsüberwachung RE1 nach fünf fehlgeschlagenen Versuchen, den CPU-Wert zu erhalten, entfernt.

jnxOperatingCPU (RE1)

jnxOperatingBuffer (RE0)

Überwacht die menge des verfügbaren Speichers auf Routing-Engines (RE0 und RE1). Da die Indizierung dieses Objekts identisch mit der für verwendeten jnxOperatingCPUist, werden Indexwerte je nach dem in der Chassis-MIB verwendeten Indizierungsschema angepasst. Wie bei jnxOperatingCPU, wird die Alarmeingangsüberwachung RE1 entfernt, wenn der Router oder Switch nur über eine Routing-Engine verfügt.

jnxOperatingBuffer (RE1)

sysApplElmtRunCPU

Überwacht die CPU-Auslastung für jeden Junos OS-Prozess (auch Daemon genannt). Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert.

sysApplElmtRunMemory

Überwacht die Speicherauslastung für jeden Junos OS-Prozess. Mehrere Instanzen desselben Prozesses werden separat überwacht und indiziert.

Minimale Statusüberwachungskonfiguration

Um die Zustandsüberwachung auf dem Router oder Switch zu ermöglichen, fügen Sie die health-monitor Anweisung auf Hierarchieebene [edit snmp] ein:

Konfigurieren der fallenden oder steigenden Schwelle

Der fallende Schwellenwert ist der niedrigere Schwellenwert (ausgedrückt als Prozentsatz des maximal möglichen Wertes) für die überwachte Variable. Wenn der aktuelle Stichprobenwert kleiner oder gleich diesem Schwellenwert ist und der Wert im letzten Sampling-Intervall größer als dieser Schwellenwert ist, wird ein einzelnes Ereignis generiert. Ein einzelnes Ereignis wird auch generiert, wenn das erste Beispiel, nachdem dieser Eintrag gültig wird, kleiner oder gleich diesem Schwellenwert ist. Nachdem ein fallendes Ereignis generiert wurde, kann kein weiteres fallendes Ereignis generiert werden, bis der stichprobenierte Wert über diesen Schwellenwert steigt und die steigende Schwelle erreicht. Sie müssen den fallenden Schwellenwert als Prozentsatz des maximal möglichen Wertes angeben. Der Standard ist 70 Prozent.

Standardmäßig beträgt 80 der steigende Schwellenwert Prozent des maximal möglichen Wertes für die überwachte Objektinstanz. Der steigende Schwellenwert ist der obere Schwellenwert für die überwachte Variable. Wenn der aktuelle Stichprobenwert größer oder gleich diesem Schwellenwert ist und der Wert im letzten Sampling-Intervall kleiner als dieser Schwellenwert ist, wird ein einzelnes Ereignis generiert. Ein einzelnes Ereignis wird auch generiert, wenn das erste Beispiel, nachdem dieser Eintrag gültig wird, größer oder gleich diesem Schwellenwert ist. Nachdem ein steigendes Ereignis generiert wurde, kann ein weiteres steigendes Ereignis erst generiert werden, wenn der stichprobenierte Wert unter diesen Schwellenwert fällt und den fallenden Schwellenwert erreicht. Sie müssen den steigenden Schwellenwert als Prozentsatz des maximal möglichen Wertes für die überwachte Variable angeben.

Um den fallenden oder steigenden Schwellenwert zu konfigurieren, fügen Sie die falling-threshold Oder-Anweisung rising-threshold auf Hierarchieebene [edit snmp health-monitor] ein:

percentage kann ein Wert von bis 1100sein.

Die fallenden und steigenden Grenzwerte gelten für alle Objektinstanzen, die vom Zustandsmonitor überwacht werden.

Intervallkonfiguration

Das Intervall gibt den Zeitraum in Sekunden an, über den die Objektinstanz beprobt wird, und vergleicht sie mit den steigenden und fallenden Schwellenwerten.

Um das Intervall zu konfigurieren, fügen Sie die interval Anweisung ein und geben Sie die Anzahl der Sekunden auf der [edit snmp health-monitor] Hierarchieebene an:

seconds kann ein Wert von bis 12147483647sein. Der Standard ist 300 Sekunden (5 Minuten).

Protokolleinträge und Traps

Die für alle Statusüberwachungsereignisse generierten Systemprotokolleinträge (überschrittene Schwellenwerte, Fehler usw.) verfügen über ein entsprechendes HEALTHMONITOR Tag und nicht über ein generisches SNMPD_RMON_EVENTLOG Tag. Der Statusmonitor sendet jedoch generische RMON risingThreshold - und fallingThreshold Traps.

Beispiel: Konfigurieren der Zustandsüberwachung

Konfiguration des Statusmonitors:

In diesem Beispiel beträgt das Sampling-Intervall alle 600 Sekunden (10 Minuten), der fallende Schwellenwert ist 85 Prozent des maximal möglichen Wertes für jede überwachte Objektinstanz und der steigende Schwellenwert ist 75 Prozent des maximal möglichen Wertes für jede überwachte Objektinstanz.