이 페이지에서

상태 모니터링 개요
Junos OS를 실행하는 디바이스에서 상태 모니터링 구성
상태 모니터링 구성

SNMP를 통한 상태 모니터링

상태 모니터링 개요

상태 모니터링은 RMON 알람 인프라를 확장하여 사전 정의된 개체 집합(예: 파일 시스템 사용량, CPU 사용량, 메모리 사용량) 및 Junos OS 프로세스에 대한 모니터링을 제공하는 SNMP 기능입니다.

계층 수준에서 문을 [edit snmp] 사용하여 health-monitor 상태 모니터 기능을 활성화합니다. 또한 하강 임계값, 상승 임계값 및 간격과 같은 상태 모니터 매개 변수를 구성할 수 있습니다. 모니터링되는 객체의 값이 상승 또는 하강 임계값을 초과하면 알람이 트리거되고 이벤트가 기록될 수 있습니다.

하강 임계값은 모니터링되는 개체 인스턴스에 대한 하한 임계값입니다. 상승 임계값은 모니터링되는 개체 인스턴스에 대한 상위 임계값입니다. 각 임계값은 가능한 최대값의 백분율로 표시됩니다. 간격은 객체 인스턴스가 샘플링되고 상승 및 하강 임계값과 비교되는 시간(초)을 나타냅니다.

이벤트는 각 샘플 간격 이후가 아니라 임계값이 한 방향으로 처음 교차될 때만 생성됩니다. 예를 들어, 상승 임계값 알람이 해당 이벤트와 함께 발생하면 해당 하강 알람이 발생할 때까지 더 이상 임계값 교차 이벤트가 발생하지 않습니다.

상태 모니터 이벤트에 대한 시스템 로그 항목에는 일반 SNMPD_RMON_EVENTLOG 태그가 아닌 해당 HEALTHMONITOR 태그가 있습니다. 그러나 상태 모니터는 일반 RMON risingThreshold 및 fallingThreshold 트랩을 전송합니다. 작동 명령을 사용하여 show snmp health-monitor 상태 모니터 경보 및 로그에 대한 정보를 볼 수 있습니다.

상태 모니터 구성 시, 표 1에 표시된 것처럼 특정 개체 인스턴스에 대한 모니터링 정보를 사용할 수 있습니다.

표 1: 모니터링된 개체 인스턴스
개체	설명
jnxHrStoragePercentUsed.1	스위치의 /dev/ad0s1a: 파일 시스템을 모니터링합니다. 이것은 /에 마운트된 루트 파일 시스템입니다.
jnxHrStoragePercentUsed.2	스위치의 /dev/ad0s1e: 파일 시스템을 모니터링합니다. 이것은 /config에 마운트된 구성 파일 시스템입니다.
jnxOperatingCPU (RE0)	라우팅 엔진(RE0)에 의한 CPU 사용량을 모니터링합니다.
jnxOperatingBuffer (RE0)	라우팅 엔진(RE0)에서 사용할 수 있는 메모리 양을 모니터링합니다.
sysApplElmtRunCPU	각 Junos OS 프로세스(데몬이라고도 함)에 대한 CPU 사용량을 모니터링합니다. 동일한 프로세스의 여러 인스턴스가 개별적으로 모니터링되고 인덱싱됩니다.
sysApplElmtRunMemory	각 Junos OS 프로세스에 대한 메모리 사용량을 모니터링합니다. 동일한 프로세스의 여러 인스턴스가 개별적으로 모니터링되고 인덱싱됩니다.

Junos OS를 실행하는 디바이스에서 상태 모니터링 구성

일반적인 네트워크 관리 시스템(NMS)이 관리하는 디바이스의 수가 증가하고 디바이스 자체의 복잡성이 증가함에 따라 NMS가 폴링을 사용하여 디바이스를 모니터링하는 것은 점점 더 비현실적입니다. 보다 확장 가능한 접근 방식은 네트워크 디바이스에 의존하여 주의가 필요할 때 NMS에 알리는 것입니다.

주니퍼 네트웍스 라우터에서 RMON 알람과 이벤트는 NMS의 폴링 오버헤드를 줄이는 데 필요한 많은 인프라를 제공합니다. 그러나 이 접근 방식을 사용하면 특정 관리 정보 베이스(MIB) 개체를 RMON 알람으로 구성하도록 NMS를 설정해야 합니다. 이를 위해서는 장치별 전문 지식과 모니터링 애플리케이션의 사용자 지정이 필요한 경우가 많습니다. 또한 모니터링이 필요한 일부 관리 정보 베이스(MIB) 개체 인스턴스는 초기화 시에만 설정되거나 런타임 시 변경되므로 미리 구성할 수 없습니다.

이러한 문제를 해결하기 위해 상태 모니터는 RMON 알람 인프라를 확장하여 선택한 개체 인스턴스 집합(파일 시스템 사용량, CPU 사용량 및 메모리 사용량)에 대해 사전 정의된 모니터링을 제공하고 알 수 없거나 동적인 개체 인스턴스(예: Junos OS 프로세스)에 대한 지원을 포함합니다.

상태 모니터링은 사용자 구성 요구 사항을 최소화하도록 설계되었습니다. 상태 모니터링 항목을 구성하려면 계층 수준에서 명령문을 포함합니다health-monitor.[edit snmp]

계층 수준에서 모니터링 이벤트를 [edit snmp health-monitor] 구성하면 전체 시스템 상태에 대한 폴링 간격이 설정됩니다. 계층 수준에서 [edit snmp health-monitor idp] 이와 동일한 옵션을 설정하는 경우, 침입 탐지 및 방지(IDP) 시스템에서 사용하는 데이터 플레인 메모리의 비율이 설정보다 높거나 낮으면 디바이스에서 SNMP 이벤트가 생성됩니다.

작동 명령을 사용하여 show snmp health-monitor 상태 모니터 경보 및 로그에 대한 정보를 볼 수 있습니다.

이 주제에서는 최소 필수 구성에 대해 설명하고 상태 모니터 구성을 위한 다음 작업에 대해 설명합니다.

모니터링되는 개체
최소 상태 모니터링 구성
하강 임계값 또는 상승 임계값 구성
간격 구성
로그 항목 및 트랩

모니터링되는 개체

상태 모니터 구성 시, 표 2에 표시된 것처럼 특정 개체 인스턴스에 대한 모니터링 정보를 사용할 수 있습니다.

표 2: 모니터링된 개체 인스턴스
개체	설명
`jnxHrStoragePercentUsed.1`	라우터 또는 스위치에서 다음 파일 시스템 모니터링합니다. `/dev/ad0s1a:` 이것은 /에 마운트된 루트 파일 시스템입니다.
`jnxHrStoragePercentUsed.2`	라우터 또는 스위치에서 다음 파일 시스템 모니터링합니다. `/dev/ad0s1e:` 이것은 `/config`에 마운트된 구성 파일 시스템입니다.
`jnxOperatingCPU (RE0)`	라우팅 엔진(`RE0` 및 `RE1`)의 CPU 사용량을 모니터링합니다. 라우팅 엔진에 할당된 인덱스 값은 섀시 관리 정보 베이스(MIB)가 0부터 시작하는 인덱스 체계를 사용하는지 또는 1부터 시작하는 인덱스 체계를 사용하는지에 따라 다릅니다. 인덱싱 체계는 구성 가능하기 때문에 라우터 또는 스위치가 초기화되고 구성이 변경될 때 적절한 인덱스가 결정됩니다. 라우터 또는 스위치에 라우팅 엔진이 하나만 있는 경우, CPU 값을 획득하려는 시도가 5회 실패한 후 알람 항목 모니터링 `RE1` 이 제거됩니다.
`jnxOperatingCPU (RE1)`
`jnxOperatingBuffer (RE0)`	라우팅 엔진(`RE0` 및 `RE1`)에서 사용할 수 있는 메모리 양을 모니터링합니다. 이 개체의 인덱싱은 에 `jnxOperatingCPU`사용된 것과 동일하기 때문에 인덱스 값은 섀시 관리 정보 베이스(MIB)에 사용된 인덱싱 체계에 따라 조정됩니다. 와 `jnxOperatingCPU`마찬가지로, 라우터 또는 스위치에 라우팅 엔진이 하나만 있는 경우 경보 항목 모니터링 `RE1` 이 제거됩니다.
`jnxOperatingBuffer (RE1)`
`sysApplElmtRunCPU`	각 Junos OS 프로세스(데몬이라고도 함)에 대한 CPU 사용량을 모니터링합니다. 동일한 프로세스의 여러 인스턴스가 개별적으로 모니터링되고 인덱싱됩니다.
`sysApplElmtRunMemory`	각 Junos OS 프로세스에 대한 메모리 사용량을 모니터링합니다. 동일한 프로세스의 여러 인스턴스가 개별적으로 모니터링되고 인덱싱됩니다.

최소 상태 모니터링 구성

라우터 또는 스위치에서 상태 모니터링을 활성화하려면 계층 수준에서 명령문을 [edit snmp] 포함합니다health-monitor.

하강 임계값 또는 상승 임계값 구성

하강 임계값은 모니터링되는 변수에 대한 하한 임계값(가능한 최대값의 백분율로 표시됨)입니다. 현재 샘플링된 값이 이 임계값보다 작거나 같고 마지막 샘플링 간격의 값이 이 임계값보다 크면 단일 이벤트가 생성됩니다. 이 항목이 유효한 후 첫 번째 샘플이 이 임계값보다 작거나 같은 경우에도 단일 이벤트가 생성됩니다. 떨어지는 이벤트가 생성된 후에는 샘플링된 값이 이 임계값을 초과하여 상승 임계값에 도달할 때까지 다른 떨어지는 이벤트를 생성할 수 없습니다. 떨어지는 임계값을 가능한 최대값의 백분율로 지정해야 합니다. 기본값은 퍼센트입니다 70 .

기본적으로 상승 임계값은 모니터링되는 개체 인스턴스에 대해 가능한 최대값의 백분율입니다 80 . 상승 임계값은 모니터링되는 변수의 상한 임계값입니다. 현재 샘플링된 값이 이 임계값보다 크거나 같고 마지막 샘플링 간격의 값이 이 임계값보다 작으면 단일 이벤트가 생성됩니다. 이 항목이 유효해진 후 첫 번째 샘플이 이 임계값보다 크거나 같은 경우에도 단일 이벤트가 생성됩니다. 상승 이벤트가 생성된 후에는 샘플링된 값이 이 임계값 아래로 떨어지고 하락 임계값에 도달할 때까지 다른 상승 이벤트를 생성할 수 없습니다. 상승 임계값을 모니터링되는 변수에 대해 가능한 최대값의 백분율로 지정해야 합니다.

하강 임계값 또는 상승 임계값을 구성하려면 계층 수준에서 또는 rising-threshold 문을 [edit snmp health-monitor] 포함합니다falling-threshold.

percentage에서 까지의 100값 1 일 수 있습니다.

하강 및 상승 임계값은 상태 모니터에서 모니터링하는 모든 개체 인스턴스에 적용됩니다.

간격 구성

간격은 객체 인스턴스가 샘플링되고 상승 및 하강 임계값과 비교되는 시간(초)을 나타냅니다.

간격을 구성하려면 문을 포함하고 interval 계층 수준에서 초 수를 지정합니다.[edit snmp health-monitor]

seconds에서 까지의 2147483647값 1 일 수 있습니다. 기본값은 초(5분)입니다 300 .

로그 항목 및 트랩

상태 모니터 이벤트(임계값 초과, 오류 등)에 대해 생성된 시스템 로그 항목에는 일반 SNMPD_RMON_EVENTLOG 태그가 아닌 해당 HEALTHMONITOR 태그가 있습니다. 그러나 상태 모니터는 일반 RMON risingThreshold 및 fallingThreshold 트랩을 보냅니다.

상태 모니터링 구성

이 주제는 QFX 시리즈 디바이스에 대한 상태 모니터 기능을 구성하는 방법을 설명합니다.

상태 모니터 기능은 SNMP RMON 알람 인프라를 확장하여 선택된 개체 인스턴스 집합(예: 파일 시스템 사용량, CPU 사용량, 메모리 사용량) 및 동적 개체 인스턴스(예: Junos OS 프로세스)에 대해 사전 정의된 모니터링을 제공합니다.

이 절차에서 샘플링 간격은 매 600 초(10분)이고, 하강 임계값은 85 모니터링되는 각 객체 인스턴스에 대해 가능한 최대값의 백분율이며, 상승 임계값은 모니터링되는 각 개체 인스턴스에 대해 가능한 최대값의 백분율입니다 75 .

상태 모니터링 구성 방법:

상태 모니터 구성:

떨어지는 임계값을 구성합니다.

몇 가지 예를 들면 다음과 같습니다.

상승 임계값을 구성합니다.

몇 가지 예를 들면 다음과 같습니다.

간격을 구성합니다.

몇 가지 예를 들면 다음과 같습니다.

이 페이지에서

SNMP를 통한 상태 모니터링

상태 모니터링 개요

Junos OS를 실행하는 디바이스에서 상태 모니터링 구성

모니터링되는 개체

최소 상태 모니터링 구성

하강 임계값 또는 상승 임계값 구성

간격 구성

로그 항목 및 트랩

참조

상태 모니터링 구성

참조