Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

SNMP를 통해 상태 모니터링(RMON Alarm 확장)

상태 모니터링 이해

상태 모니터링은 RMON 경보 인프라스트럭처를 확장하여 사전 정의한 객체 세트(파일 시스템 사용량, CPU 사용량, 메모리 사용 등)와 프로세스에 대한 모니터링을 Junos OS 기능을 제공하는 SNMP 기능입니다.

계층 수준에서 명령문을 사용하여 상태 모니터 health-monitor[edit snmp] 기능을 활성화합니다. 또한, 떨어지는 임계값, 상승 임계값, 간격과 같은 상태 모니터링 매개 변수를 구성할 수도 있습니다. 모니터링된 객체의 값이 상승 또는 하락 임계값을 초과하면 경보가 트리거되고 이벤트가 로깅될 수 있습니다.

떨어지는 임계값은 모니터링되는 객체 인스턴스에 대한 낮은 임계값입니다. 상승 임계값은 모니터링되는 객체 인스턴스의 상한 임계값입니다. 각 임계값은 최대 가능한 값의 비율로 표현됩니다. 간격은 상승 및 하락 임계값과 비교하여 객체 인스턴스가 샘플링되고 있는 초 동안의 기간을 나타냅니다.

임계값이 각 샘플 간격 이후가 아닌 한 방향에서 처음 교차할 때만 이벤트가 생성됩니다. 예를 들어, 상승하는 임계값 경보와 해당 이벤트가 발생하면 해당 떨어지는 경보가 발생될 때까지 임계값을 넘지 못하게 됩니다.

상태 모니터 이벤트에 대한 시스템 로그 엔트리에는 일반적인 테스트 태그가 아닌 해당 HEALTHMONITOR 태그가 SNMPD_RMON_EVENTLOG 있습니다. 그러나 상태 모니터는 일반적인 RMON이 증가하고Threshold 트랩을 전송합니다. 운영 명령을 사용하여 상태 모니터 알람 및 로그에 대한 show snmp health-monitor 정보를 볼 수 있습니다.

상태 모니터를 구성하면 에 표시된와 같이 특정 객체 인스턴스에 대한 모니터링 정보를 사용할 수 표 1 있습니다.

표 1: 모니터링된 객체 인스턴스

객체

설명

jnxHrStoragePercentUsed.1

스위치의 /dev/ad0s1a: 파일 시스템을 모니터링합니다. /에 장착된 루트 파일 시스템입니다.

jnxHrStoragePercentUsed.2

스위치의 /dev/ad0s1e: 파일 시스템을 모니터링합니다. 에 장착된 구성 파일 /config 시스템입니다.

jnxOperatingCPU(RE0)

RE0(라우팅 엔진)을 통해 CPU 사용량을 모니터링합니다.

jnxOperatingBuffer(RE0)

RE0에서 사용 가능한 메모리 라우팅 엔진 모니터링합니다.

sysApplElmtunCPU

각 Junos OS 프로세스에 대한 CPU 사용량을 모니터링합니다(데몬이라고도도 합니다). 동일한 프로세스의 여러 인스턴스가 개별적으로 모니터링 및 인덱싱됩니다.

sysApplElmtunMemory

각 각 프로세스의 메모리 사용량을 Junos OS 모니터링합니다. 동일한 프로세스의 여러 인스턴스가 개별적으로 모니터링 및 인덱싱됩니다.

상태 모니터링 구성

이 주제는 QFX 시리즈 및 OCX 시리즈 디바이스의 상태 모니터링 기능을 구성하는 방법을 설명하고 있습니다.

상태 모니터링 기능은 SNMP RMON 경고 인프라스트럭처를 확장하여 선택한 객체 인스턴스 세트(파일 시스템 사용량, CPU 사용량, 메모리 사용 등)와 동적 객체 인스턴스(예: Junos OS 프로세스)에 대해 사전 정의된 모니터링을 제공합니다.

상태 모니터링을 구성하는 경우:

  1. 상태 모니터 구성:
  2. 빠지는 임계치 구성:

    몇 가지 예를 들면 다음과 같습니다.

  3. 증가하는 임계값 구성:

    몇 가지 예를 들면 다음과 같습니다.

  4. 간격 구성:

    몇 가지 예를 들면 다음과 같습니다.

운영되는 장치에서 상태 모니터링 Junos OS

일반적인 NMS(Network Management System)에서 관리하는 장치의 수가 증가하고 장치 자체의 복잡성이 증가함에 따라 NMS에서 폴링(polling)을 사용하여 디바이스를 모니터링하기가 점점 더 어려워지고 있습니다. 보다 확장 가능한 방법은 네트워크 디바이스를 통해 무언가 주의가 필요한 경우 NMS에 이를 알리는 것입니다.

라우터 주니퍼 네트웍스에서 RMON 경보와 이벤트는 NMS의 폴링 오버헤드를 줄이는 데 필요한 인프라스트럭처의 상당 수를 제공합니다. 그러나 이 접근 방식을 사용하면 특정 관리 정보 베이스(MIB) 객체를 RMON 경보로 구성하도록 NMS를 설정해야 합니다. 이러한 요구에는 종종 디바이스별 전문 지식과 모니터링 애플리케이션의 사용자 지정이 필요합니다. 또한 모니터링이 관리 정보 베이스(MIB) 필요한 일부 객체 인스턴스는 초기화 시에만 설정되거나 런타임 시 변경될 수 있으며 사전에 구성할 수 없습니다.

이러한 문제를 해결하기 위해 상태 모니터는 RMON 경고 인프라를 확장하여 선택한 객체 인스턴스 세트(파일 시스템 사용, CPU 사용 및 메모리 사용에 대한 사전 정의된 모니터링)를 제공하고 알려지거나 동적 객체 인스턴스(예: Junos OS 프로세스)에 대한 지원을 포함합니다.

상태 모니터링은 사용자 구성 요구 사항을 최소화하도록 설계됩니다. 상태 모니터링 항목을 구성하기 위해 계층 수준에서 health-monitor[edit snmp] 명령문을 포함하십시오.

계층 수준에서 모니터링 이벤트를 구성하면 전체 시스템 상태의 폴링 [edit snmp health-monitor] 간격이 설정됩니다. 계층 수준에서 이러한 옵션을 설정하는 경우, 침입 탐지 및 방지(침입 탐지 및 방지(IDP)) 시스템에서 활용하는 데이터플레인 메모리의 비율이 설정보다 높거나 설정에 미준수인 경우 SNMP 이벤트가 디바이스에 의해 [edit snmp health-monitor idp] 생성됩니다.

운영 명령을 사용하여 상태 모니터 알람 및 로그에 대한 show snmp health-monitor 정보를 볼 수 있습니다.

이 주제는 최소 필수 구성을 설명하고 상태 모니터를 구성하기 위한 다음 작업에 대해 설명합니다.

모니터링된 객체

상태 모니터를 구성하면 에 표시된와 같이 특정 객체 인스턴스에 대한 모니터링 정보를 사용할 수 표 2 있습니다.

표 2: 모니터링된 객체 인스턴스

객체

설명

jnxHrStoragePercentUsed.1

라우터 또는 스위치에서 다음 파일 시스템을 모니터링합니다.

/dev/ad0s1a:

/에 장착된 루트 파일 시스템입니다.

jnxHrStoragePercentUsed.2

라우터 또는 스위치에서 다음 파일 시스템을 모니터링합니다.

/dev/ad0s1e:

에 장착된 구성 파일 /config 시스템입니다.

jnxOperatingCPU (RE0)

라우팅 엔진의 CPU 사용량 모니터링 RE0RE1 및. Routing Engine에 할당된 인덱스 관리 정보 베이스(MIB) 섀시가 제로 기반 또는 일 기반 인덱싱 체계를 사용하는지 여부에 따라 결정됩니다. 인덱싱 체계가 구성 가능하기 때문에 라우터 또는 스위치가 초기화될 때 그리고 구성 변경이 있는 경우 적절한 인덱스가 결정됩니다. 라우터 또는 스위치가 단 하나의 스위치만 라우팅 엔진 경우, CPU 라우팅 엔진 5개 시도가 실패하면 경보 입력 모니터링이 RE1 제거됩니다.

jnxOperatingCPU (RE1)

jnxOperatingBuffer (RE0)

라우팅 엔진에서 사용 가능한 메모리의 양을 RE0 모니터링합니다. RE1 이 객체의 인덱싱은 사용된 인덱스와 동일하기 때문에, 섀시 및 섀시에서 사용되는 인덱싱 체계에 따라 인덱스 jnxOperatingCPU 값이 관리 정보 베이스(MIB). 라우터 또는 스위치에 단 1개만 추가하면 경보 입력 모니터링이 jnxOperatingCPURE1 라우팅 엔진.

jnxOperatingBuffer (RE1)

sysApplElmtRunCPU

각 Junos OS 프로세스에 대한 CPU 사용량을 모니터링합니다(데몬이라고도도 합니다). 동일한 프로세스의 여러 인스턴스가 개별적으로 모니터링 및 인덱싱됩니다.

sysApplElmtRunMemory

각 각 프로세스의 메모리 사용량을 Junos OS 모니터링합니다. 동일한 프로세스의 여러 인스턴스가 개별적으로 모니터링 및 인덱싱됩니다.

최소 상태 모니터링 구성

라우터 또는 스위치에서 상태 모니터링을 활성화하려면 계층 수준에서 health-monitor[edit snmp] 명령문을 포함합니다.

빠지는 임계값 또는 상승 임계값 구성

떨어지는 임계값은 모니터링된 변수에 대한 최소 임계값(최대 가능한 값의 비율로 표시)입니다. 현재 샘플링된 값이 이 임계값보다 작거나 같고 마지막 샘플링 간격에 있는 값이 이 임계값보다 큰 경우, 단일 이벤트가 생성됩니다. 이 엔트리 이후의 첫 번째 샘플이 이 임계값 이하로 유효할 경우 단일 이벤트도 생성됩니다. 떨어지는 이벤트가 생성된 후, 샘플링된 값이 이 임계값을 넘어 상승하는 임계값에 도달할 때까지 또 다른 떨어지는 이벤트를 생성할 수 없습니다. 가능한 최대 값의 비율로 폴링 임계값을 지정해야 합니다. 기본 설정은 70 %입니다.

기본적으로, 상승하는 임계값은 모니터링되는 객체 인스턴스에 대해 가능한 최대 값의 80 비율입니다. 상승 임계값은 모니터링되는 변수의 상한 임계값입니다. 현재 샘플링된 값이 이 임계값을 초과하거나 같고 마지막 샘플링 간격에 있는 값이 이 임계값보다 작은 경우, 단일 이벤트가 생성됩니다. 이 엔트리 이후의 첫 번째 샘플이 이 임계값을 초과하거나 같인 경우 단일 이벤트도 생성됩니다. 상승 이벤트가 생성된 후 샘플링된 값이 이 임계값 이하로 떨어지고 떨어지는 임계값에 도달할 때까지 다른 상승 이벤트를 생성할 수 없습니다. 모니터링된 변수에 대한 최대 가능한 값의 비율로 상승하는 임계값을 지정해야 합니다.

폴링 임계값 또는 상승 임계값을 구성하기 위해 계층 수준에서 또는 falling-thresholdrising-threshold[edit snmp health-monitor] 명령문을 포함합니다.

percentage 를 통해 가치가 있을 1100 있습니다.

떨어지고 증가하는 임계값은 상태 모니터가 모니터링하는 모든 객체 인스턴스에 적용됩니다.

간격 구성

간격은 상승 및 하락 임계값과 비교하여 객체 인스턴스가 샘플링되고 있는 초 동안의 기간을 나타냅니다.

간격을 구성하기 위해 명령문을 포함하고 계층 수준에서 초 interval[edit snmp health-monitor] 수를 지정합니다.

seconds 를 통해 가치가 있을 12147483647 있습니다. 기본 300 설정은 초(5분)

로그 엔트리 및 트랩

상태 모니터링 이벤트(초과 임계값, 오류 등)에 대해 생성된 시스템 로그 엔트리에는 일반 태그가 아닌 해당 HEALTHMONITOR 태그가 SNMPD_RMON_EVENTLOG 있습니다. 그러나 상태 모니터는 일반 RMON과 risingThresholdfallingThreshold 트랩을 전송합니다.

예를 들면 다음과 같습니다. 상태 모니터링 구성

상태 모니터 구성:

이 예제에서 샘플링 간격은 매초(10분)로, 떨어지는 임계치(falling threshold)는 모니터링되는 각 객체 인스턴스에 대해 가능한 최대 값의 퍼센트 를 차지하며, 상승하는 임계값은 모니터링되는 각 객체 인스턴스에 대해 가능한 최대 값의 6008575 비율입니다.