Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

SNMP를 통한 상태 모니터링(RMON 알람 확장)

상태 모니터링의 이해

상태 모니터링은 RMON 경보 인프라를 확장하여 미리 정의된 객체 세트(파일 시스템 사용, CPU 사용, 메모리 사용 등)와 Junos OS 프로세스에 대한 모니터링을 제공하는 SNMP 기능입니다.

계층 수준에서 명령문을 [edit snmp] 사용하여 health-monitor 상태 모니터 기능을 활성화합니다. 또한 떨어지는 임계값, 상승 임계값 및 간격과 같은 상태 모니터 매개 변수를 구성할 수도 있습니다. 모니터링된 객체의 값이 상승 또는 하강 임계값을 초과하는 경우 알람이 트리거되고 이벤트가 로깅될 수 있습니다.

떨어지는 임계값은 모니터링된 객체 인스턴스의 하한 임계값입니다. 상승 임계값은 모니터링되는 객체 인스턴스의 상위 임계값입니다. 각 임계값은 가능한 최대 값의 비율로 표현됩니다. 간격은 객체 인스턴스가 샘플링되고 상승 및 하강 임계값과 비교되는 시간(초 단위)의 기간을 나타냅니다.

이벤트는 각 샘플 간격이 아닌 한 방향으로 임계값이 처음 교차하는 경우에만 생성됩니다. 예를 들어, 임계값 상승 알람과 해당 이벤트가 제기되는 경우, 해당 떨어지는 알람이 발생할 때까지 더 이상 임계값 교차 이벤트가 발생하지 않습니다.

상태 모니터 이벤트에 대한 시스템 로그 엔트리에는 일반 SNMPD_RMON_EVENTLOG 태그가 아닌 해당 HEALTHMONITOR 태그가 있습니다. 그러나 상태 모니터는 일반 RMON 상승여러홀드(RisingThreshold) 트랩을 전송합니다. 운영 명령을 사용하여 show snmp health-monitor 상태 모니터링 알람 및 로그에 대한 정보를 볼 수 있습니다.

상태 모니터를 구성할 때와 같이 표 1특정 객체 인스턴스에 대한 모니터링 정보를 사용할 수 있습니다.

표 1: 모니터링된 객체 인스턴스

객체

설명

jnxHrStorage페이스센터 사용.1

스위치에서 /dev/ad0s1a: 파일 시스템을 모니터링합니다. 이것은 /에 탑재된 루트 파일 시스템입니다.

jnxHrStorage페이스센터 사용.2

스위치에서 /dev/ad0s1e: 파일 시스템을 모니터링합니다. 이것은 에 탑재된 구성 /config파일 시스템입니다.

jnx개요CPU(RE0)

RE0(Routing Engine)의 CPU 사용량을 모니터링합니다.

jnx개요회(RE0)

RE0(Routing Engine)에서 사용할 수 있는 메모리 양을 모니터링합니다.

sysApplElmtRunCPU

각 Junos OS 프로세스의 CPU 사용량을 모니터링합니다(데몬이라고도 함). 동일한 프로세스의 여러 인스턴스가 별도로 모니터링 및 인덱싱됩니다.

sys애플엘름트런메모리

각 Junos OS 프로세스의 메모리 사용량을 모니터링합니다. 동일한 프로세스의 여러 인스턴스가 별도로 모니터링 및 인덱싱됩니다.

상태 모니터링 구성

이 항목에서는 QFX 시리즈 및 OCX 시리즈 디바이스에 대한 상태 모니터 기능을 구성하는 방법을 설명합니다.

상태 모니터 기능은 SNMP RMON 경보 인프라를 확장하여 선택된 객체 인스턴스 세트(파일 시스템 사용, CPU 사용, 메모리 사용 등)와 동적 객체 인스턴스(예: Junos OS 프로세스)에 대해 미리 정의된 모니터링을 제공합니다.

상태 모니터링을 구성하려면 다음을 수행합니다.

  1. 상태 모니터 구성:
  2. 떨어지는 임계값 구성:

    예를 들어,

  3. 상승 임계값 구성:

    예를 들어,

  4. 간격 구성:

    예를 들어,

Junos OS를 실행하는 디바이스에서 상태 모니터링 구성

일반적인 네트워크 관리 시스템(NMS)으로 관리되는 디바이스의 수가 증가하고 장치 자체의 복잡성이 증가함에 따라 NMS가 폴링을 사용하여 디바이스를 모니터링하는 것은 점점 더 실용적이지 않습니다. 보다 확장 가능한 접근 방식은 네트워크 디바이스에 의존하여 주의가 필요할 때 NMS에 이를 통보하는 것입니다.

주니퍼 네트웍스 라우터에서 RMON 알람 및 이벤트는 NMS의 폴링 오버헤드를 줄이는 데 필요한 인프라스트럭처의 상당 부분을 제공합니다. 그러나 이러한 접근 방식을 사용하면 NMS를 설정하여 특정 MIB 객체를 RMON 경보로 구성해야 합니다. 이를 위해서는 모니터링 애플리케이션에 대한 장치별 전문 지식과 커스터마이징이 필요한 경우가 많습니다. 또한 모니터링이 필요한 일부 MIB 객체 인스턴스는 런타임 초기화 또는 변경 시만 설정되며 사전에 구성할 수 없습니다.

이러한 문제를 해결하기 위해 상태 모니터는 RMON 경보 인프라를 확장하여 선택한 객체 인스턴스 집합(파일 시스템 사용, CPU 사용 및 메모리 사용)에 대한 사전 정의된 모니터링을 제공하며 알려지지 않은 또는 동적 객체 인스턴스(예: Junos OS 프로세스)에 대한 지원을 포함합니다.

상태 모니터링은 사용자 구성 요구 사항을 최소화하도록 설계되었습니다. 상태 모니터링 항목을 구성하려면 계층 수준에 명령문을 [edit snmp] 포함 health-monitor 하십시오.

계층 수준에서 모니터링 이벤트를 [edit snmp health-monitor] 구성하여 전체 시스템 상태에 대한 폴링 간격을 설정합니다. 계층 수준에서 이러한 동일한 옵션을 [edit snmp health-monitor idp] 설정하는 경우 침입 탐지 및 방지(IDP) 시스템에서 사용하는 데이터 플레인 메모리 비율이 설정값 위로 상승하거나 아래에 있는 경우 디바이스가 SNMP 이벤트를 생성합니다.

운영 명령을 사용하여 show snmp health-monitor 상태 모니터링 알람 및 로그에 대한 정보를 볼 수 있습니다.

이 주제는 필요한 최소 구성을 설명하고 상태 모니터를 구성하기 위한 다음과 같은 작업에 대해 설명합니다.

모니터링된 객체

상태 모니터를 구성할 때와 같이 표 2특정 객체 인스턴스에 대한 모니터링 정보를 사용할 수 있습니다.

표 2: 모니터링된 객체 인스턴스

객체

설명

jnxHrStoragePercentUsed.1

라우터 또는 스위치에서 다음 파일 시스템을 모니터링합니다.

/dev/ad0s1a:

이것은 /에 탑재된 루트 파일 시스템입니다.

jnxHrStoragePercentUsed.2

라우터 또는 스위치에서 다음 파일 시스템을 모니터링합니다.

/dev/ad0s1e:

이것은 에 탑재된 구성 /config파일 시스템입니다.

jnxOperatingCPU (RE0)

RE(RE0RE1)의 CPU 사용량을 모니터링합니다. Routing Engines에 할당된 인덱스 값은 섀시 MIB가 제로 기반 또는 원스 기반 인덱싱 체계를 사용하는지에 따라 달라집니다. 인덱싱 체계가 구성 가능하기 때문에 라우터 또는 스위치가 초기화되고 구성 변경이 있을 때 적절한 인덱스는 결정됩니다. 라우터 또는 스위치에 ROUTING Engine이 하나만 있는 경우, CPU 값을 얻기 위해 5번의 시도에 실패한 후 경보 엔트리 모니터링 RE1 이 제거됩니다.

jnxOperatingCPU (RE1)

jnxOperatingBuffer (RE0)

RE(RE0RE1)에서 사용할 수 있는 메모리 양을 모니터링합니다. 이 객체의 인덱싱은 사용된 jnxOperatingCPU것과 동일하기 때문에 섀시 MIB에서 사용되는 인덱싱 체계에 따라 인덱스 값이 조정됩니다. jnxOperatingCPU라우터 또는 스위치에 라우팅 엔진이 하나만 있으면 알람 엔트리 모니터링 RE1 이 제거됩니다.

jnxOperatingBuffer (RE1)

sysApplElmtRunCPU

각 Junos OS 프로세스의 CPU 사용량을 모니터링합니다(데몬이라고도 함). 동일한 프로세스의 여러 인스턴스가 별도로 모니터링 및 인덱싱됩니다.

sysApplElmtRunMemory

각 Junos OS 프로세스의 메모리 사용량을 모니터링합니다. 동일한 프로세스의 여러 인스턴스가 별도로 모니터링 및 인덱싱됩니다.

최소 상태 모니터링 구성

라우터 또는 스위치에서 상태 모니터링을 활성화하려면 계층 레벨에 health-monitor[edit snmp] 다음과 같은 명령문을 포함하십시오.

떨어지는 임계값 또는 상승 임계값 구성

떨어지는 임계값은 모니터링된 변수에 대한 하한 임계값(최대 가능한 값의 비율로 표시)입니다. 현재 샘플링된 값이 이 임계값과 같거나 낮고 마지막 샘플링 간격의 값이 이 임계값보다 큰 경우 단일 이벤트가 생성됩니다. 이 항목의 유효성이 확인된 후 첫 번째 샘플이 이 임계값에 미치지 못하거나 같으면 단일 이벤트도 생성됩니다. 떨어지는 이벤트가 생성되면 샘플링된 값이 이 임계값을 초과하여 상승 임계값에 도달할 때까지 다른 떨어지는 이벤트를 생성할 수 없습니다. 낙하 임계값을 최대 가능한 값의 비율로 지정해야 합니다. 기본값은 %입니다 70 .

기본적으로 임계값 상승은 80 모니터링되는 객체 인스턴스에 대해 가능한 최대 값의 백분율입니다. 상승 임계값은 모니터링된 변수의 상위 임계값입니다. 현재 샘플링된 값이 이 임계값보다 높거나 같고 마지막 샘플링 간격의 값이 이 임계값보다 낮으면 단일 이벤트가 생성됩니다. 이 항목이 유효해짐에 따라 첫 번째 샘플이 이 임계값을 초과하거나 같으면 단일 이벤트도 생성됩니다. 상승 이벤트가 생성되면 샘플링된 값이 이 임계값 이하로 떨어지고 떨어지는 임계값에 도달할 때까지 또 다른 상승 이벤트를 생성할 수 없습니다. 모니터링된 변수에 대한 최대값의 비율로 상승 임계값을 지정해야 합니다.

떨어지는 임계값 또는 상승 임계값을 구성하려면 계층 레벨에 [edit snmp health-monitor] 다음 또는 rising-threshold 명령문을 포함 falling-threshold 하십시오.

percentage를 통해 100가치를 1 창출할 수 있습니다.

임계값 하락 및 상승은 상태 모니터에서 모니터링하는 모든 객체 인스턴스에 적용됩니다.

간격 구성

간격은 객체 인스턴스가 샘플링되고 상승 및 하강 임계값과 비교되는 시간(초 단위)의 기간을 나타냅니다.

간격을 구성하려면 명령문을 포함하고 interval 계층 수준에서 초 [edit snmp health-monitor] 수를 지정합니다.

seconds를 통해 2147483647가치를 1 창출할 수 있습니다. 기본값은 초(5분)입니다 300 .

로그 엔트리 및 트랩

모든 상태 모니터 이벤트(임계값 교차, 오류 등)에 대해 생성된 시스템 로그 엔트리에는 일반 SNMPD_RMON_EVENTLOG 태그가 아닌 해당 HEALTHMONITOR 태그가 있습니다. 그러나 상태 모니터는 일반 RMON risingThresholdfallingThreshold 트랩을 보냅니다.

예를 들면 다음과 같습니다. 상태 모니터링 구성

상태 모니터 구성:

이 예에서는 샘플링 간격이 매 600 초(10분)이며, 떨어지는 임계값은 85 모니터링되는 각 객체 인스턴스에 대해 가능한 최대 값의%이며, 임계값 상승은 모니터링되는 각 객체 인스턴스에 대해 가능한 최대 값의 백분율입니다 75 .