이 페이지 내용
멀티노드 고가용성 모니터링 옵션
모니터링 유형
고가용성 장애 감지는 내부 오류에 대해 시스템, 소프트웨어 및 하드웨어를 모두 모니터링합니다. 또한 시스템은 인터페이스 모니터링, BFD 경로 모니터링 및 IP 모니터링을 통해 네트워크 연결 문제를 모니터링하거나 더 멀리 있는 대상의 도달 가능성을 감지할 수 있습니다.
표 1 은 멀티노드 고가용성에 사용되는 다양한 모니터링 유형에 대한 세부 정보를 제공합니다.
Montitoring 유형 | 이란 무엇입니까 | ? 탐지 유형 | 범위 |
---|---|---|---|
BFD 모니터링 | 실제 링크와 함께 링크 레이어를 검사하여 다음 홉에 대한 도달 가능성을 모니터링합니다. |
|
|
IP 모니터링 | 직접 연결된 인터페이스 또는 다음 홉 너머에 위치한 호스트 또는 서비스에 대한 연결을 모니터링합니다. |
|
|
인터페이스 모니터링 | 링크 레이어의 작동 여부를 검사합니다. |
링크 실패 |
|
멀티노드 고가용성에서 모니터링이 호스트 또는 서비스에 대한 연결 실패를 감지하면 영향을 받는 경로를 다운/사용할 수 없음으로 표시하고 영향을 받는 노드의 해당 SRG(서비스 경로 그룹)를 부적격으로 표시합니다. 영향을 받는 SRG는 트래픽 중단 없이 상태 저장 방식으로 다른 노드로 전환됩니다.
트래픽 손실을 방지하기 위해 멀티노드 고가용성은 다음과 같은 예방 조치를 취합니다.
- 레이어 3 모드 - 트래픽이 올바르게 리디렉션되도록 경로가 다시 그려집니다
- 기본 게이트웨이 또는 하이브리드 모드 - SRG의 새 액티브 노드는 트래픽 재라우팅을 보장하기 위해 연결된 스위치에 GARP(Gratuitous ARP)를 전송합니다
멀티노드 고가용성 장애 시나리오
다음 섹션에서는 가능한 오류 시나리오, 즉 오류를 감지하는 방법, 수행할 복구 작업 및 해당하는 경우 오류로 인해 시스템에 미치는 영향에 대해 설명합니다.노드 장애
하드웨어 오류
- 원인 - 실패한 하드웨어 구성 요소 또는 전원 장애와 같은 환경 문제입니다.
- 탐지 - 멀티노드 고가용성
- 영향을 받는 장치/노드에 액세스할 수 없음
- 하드웨어 장애가 있는 노드에서 SRG1 상태가 로
INELIGIBLE
변경됩니다.
- 영향 — 그림 1과 같이 트래픽이 다른 노드(정상인 경우)로 페일오버됩니다. .
그림 1: 멀티노드 고가용성
의 하드웨어 장애
- Recovery—섀시 하드웨어 장애를 지울 때 실패 복구가 발생합니다(예: 장애가 발생한 하드웨어 구성 요소를 교체하거나 복구합니다.
- 결과 - 다음 명령을 사용하여 상태를 확인합니다.
시스템/소프트웨어 오류
- 원인 - 소프트웨어 프로세스 또는 서비스의 오류 또는 운영 체제 문제입니다.
- 탐지 - 멀티노드 고가용성
- 영향을 받는 장치/노드에 액세스할 수 없음
- 시스템/소프트웨어 오류가 있는 영향을 받는 노드에서 시스템 상태를 로
INELIGIBLE
변경합니다.
- 영향 - 그림 2와 같이 트래픽이 정상이면 다른 노드로 페일오버됩니다
그림 2: 멀티노드 고가용성
의 소프트웨어 장애
- 복구 - 문제가 해결되면 가동 중단에서 자동으로 정상적으로 복구합니다. 활성 역할을 맡은 백업 노드는 계속 활성 상태로 유지됩니다. 이전 활성 노드는 백업 노드로 유지됩니다.
- 결과 - 명령을 사용하여 상태를 show chassis high-availability information detail 확인합니다.
네트워크/연결 실패
물리적 인터페이스(링크) 실패
- 원인—인터페이스 장애는 네트워크 장비 중단, 물리적 케이블 중단 또는 일관되지 않은 구성으로 인해 발생할 수 있습니다.
- 탐지 - 멀티노드 고가용성
- 영향을 받는 장치/노드에 액세스할 수 없습니다.
- 영향을 받는 노드에서 SRG1 상태가 로
INELIGIBLE
변경됩니다.네트워크 또는 연결 실패(interface-monitor가 구성된 경우). 또한 경로 연결은 BFD 또는 IP 모니터링으로 감지하고 구성된 동작에 따라 이벤트를 트리거할 수 있습니다.
- 영향 - 인터페이스의 링크 상태가 변경되면 장애 조치가 트리거됩니다. 백업 노드가 활성 역할을 맡고 장애가 발생한 노드에서 실행 중이던 서비스는 그림 3과 같이 다른 노드로 마이그레이션됩니다.
그림 3: 인터페이스 장애
-
구성 - BFD 모니터링 및 인터페이스 모니터링을 구성하려면 다음 구성 문을 사용합니다.
set chassis high-availability services-redundancy-group <1> monitor bfd-liveliness <source-ip-address> <destination-ip-address> routing-instance <routing-instance-name> <single-hop| multihop> <interface-name>
set chassis high-availability services-redundancy-group <1> monitor interface <interface-name>
트래픽 흐름에 중요한 모든 링크를 모니터링해야 합니다.
체크 아웃 예: 전체 구성 세부 정보를 보려면 레이어 3 네트워크에서 멀티노드 고가용성 구성을 참조하십시오.
- Recovery(복구) - 장애가 발생한 인터페이스를 복구/교체할 때 복구합니다. 네트워크/연결 오류가 복구되면 SRG1은 부적합 상태에서 백업 상태로 이동합니다. 새 활성 노드는 더 나은 메트릭을 업스트림 라우터에 계속 보급하고 트래픽을 처리합니다.
- 결과 - 다음 명령을 사용하여 상태를 확인합니다.
-
인터페이스 구성에 대한 정보는 레이어 3 네트워크에서 멀티노드 고가용성 구성, 하이브리드 구축에서 멀티노드 고가용성 구성, 기본 게이트웨이 구축에서 멀티노드 고가용성 구성, 인터페이스 문제 해결을 참조하십시오.
ICL(Interchassis Link) 실패
- 원인 - ICL의 오류는 네트워크 중단 또는 일관되지 않은 구성으로 인해 발생할 수 있습니다.
- 탐지 - 멀티노드 고가용성에서는 노드가 서로 연결할 수 없으며 ICMP 프로브(Activeness Determination Probe)를 시작합니다.
- 영향 - 멀티노드 고가용성 시스템에서 ICL은 활성 노드와 백업 노드를 연결합니다. ICL이 다운되면 두 디바이스 모두 이 변경 사항을 인식하고 활성도 프로브(ICMP 프로브)를 시작합니다. 각 SRG1+에 대해 활성 역할을 수행할 수 있는 노드를 결정하기 위해 Activeness 프로브가 수행됩니다. 프로브 결과에 따라 노드 중 하나가 활성 상태로 전환됩니다.
그림 4와 같이 SRX-1과 SRX-2 사이의 ICL이 중단됩니다. 두 디바이스 모두 서로 연결할 수 없으며 업스트림 라우터로 활성도 프로브를 보낼 수 없습니다. SRX-1은 라우터 구성에서 더 높은 선호 경로에 있기 때문에 활성 역할을 수행하고 트래픽을 계속 처리하며 더 높은 선호 경로를 보급합니다. 다른 하나는 백업 역할을 맡습니다.
그림 4: 멀티노드 고가용성의 ICL 장애
-
구성 - 활성도 프로빙을 구성하려면 다음 구성 문을 사용합니다.
set chassis high-availability services-redundancy-group <1> activeness-probe <destination-ip-address> routing-instance <routing-instance-name>
자세한 구성 정보는 레이어 3 네트워크에서 멀티노드 고가용성 구성을 확인하십시오.
- 결과 - 다음 명령을 사용하여 상태를 확인합니다.
show chassis high-availability information detail
show chassis high-availability services-redundancy-group 1
-
ping 옵션을 사용하여 업스트림 라우터에서 ICMP 패킷 응답을 확인합니다. 예:
ping <activeness-probe-dest-ip> source <activeness-probe-source-ip> routing-instance <routing-instance-name>
.
-
Recovery(복구) - 노드 중 하나가 활성 역할을 맡으면 멀티노드 고가용성(High Availability)이 콜드 동기화 프로세스를 다시 시작하고 컨트롤 플레인 서비스(IPSec VPN)를 재동기화합니다. SRG 상태 정보는 노드 간에 다시 교환됩니다.
노드가 격리 상태로 유지됨
- 원인—멀티노드 고가용성 설정에서 노드는 재부팅 후 격리된 상태로 유지되고 다음과 같은 경우 연결된 인터페이스가 계속 다운 상태로 유지됩니다.
-
부팅 후 콜드 싱크가 완료될 때까지 ICL(Inter Chassis Link)이 다른 노드에 연결되지 않습니다
그리고
-
shutdown-on-failure
옵션은 SRG0에서 구성됩니다메모:위의 원인은 다른 장치가 작동하지 않는 경우에도 발생할 수 있습니다.
-
- 탐지—명령 출력에서와 같이
ISOLATED
표시되는 SRG0 상태. -
복구 - 다른 노드가 온라인 상태가 되고 ICL이 시스템 정보를 교환할 수 있거나 문을 제거하고 구성을 커밋하면 노드가
shutdown-on-failure
자동으로 복구됩니다.을(를
delete chassis high-availability services-redundancy-group 0 shutdown-on-failure
) 사용하여 문을 제거합니다.위의 해결 방법이 사용자 환경에 적합하지 않은 경우 옵션을 사용할
install-on-failure-route
수 있습니다. 이 옵션에서 멀티노드 고가용성 설정은 SRG1+에서 사용할 수 있는 active-signal-route 및 backup-signal-route 접근 방식과 유사한 라우팅 정책 옵션을 사용하여 위의 상황을 보다 원활하게 처리하기 위해 정의된 신호 경로를 사용합니다.
유연한 경로 모니터링
Junos OS 릴리스 23.4R1부터 다음과 같은 기존 경로 모니터링 기능에 대한 새로운 개선 사항이 추가되었습니다.
- IP 모니터링
- BFD 모니터링
- 인터페이스 모니터링
향상된 기능은 다음을 통해 경로 모니터링 기능에 대한 보다 세분화된 제어 기능을 추가합니다.
- SRG1+ 외에 SRG0에 대한 모니터링 확장
- 모니터링 기능 그룹화
- SRG(Service Redundancy Group) 경로와 관련된 방향에 따라 모니터링 지원
- 각 모니터링 기능과 연관된 가중치 추가
관련 기능을 그룹화하면 시스템이 하나의 단위로 처리할 수 있으므로 보다 효율적인 계산과 리소스 활용이 가능합니다.
SRG 모니터링 개체
다음 그림과 함께 개체 모니터링의 개념을 이해해 보겠습니다.

서비스 중복 그룹별로 모니터링 옵션을 구성할 수 있습니다. 즉, SRG의 특정 항목에 장애가 발생하면 해당 SRG가 다른 노드로 페일오버할 수 있습니다. 각 SRG에는 하나 이상의 모니터링 객체가 포함되어 있습니다.
모니터링 객체에서 사용할 수 있는 모니터링 기능은 BFD 활성화, 인터페이스 모니터링 및 IP 모니터링입니다. 이러한 각 기능에는 연관된 임계값과 가중치 속성이 있습니다.
모니터 개체 내에서 특정 개체가 IP/인터페이스/BFD 모니터링 결과로 페일오버를 트리거하지 못할 때마다 시스템은 이벤트를 모니터링 실패로 간주합니다. 소프트웨어는 실패한 객체의 가중치를 기준으로 개수를 추가합니다.
카운트가 IP/인터페이스/BFD의 임계값을 초과하면 시스템은 상위 모니터링 객체의 임계값에 카운트를 추가합니다.
SRG에 바인딩된 모든 모니터링 객체의 임계값 합계가 SRG에 구성된 임계값 이상이면 시스템은 해당 SRG에 대한 모니터 실패를 트리거합니다. SRG는 다른 노드로 페일오버됩니다.
경로 모니터링 구성
그림 6에 표시된 토폴로지에 대한 다음 예를 살펴보겠습니다. 이 설정에서는 노드 2 디바이스의 SRG1에 대한 경로 모니터링 옵션을 구성합니다.

이 예에서 경로 모니터링 옵션을 구성하려면,
- 섀시 간 링크(ICL)에는 어그리게이션 이더넷 인터페이스(ae)를 사용하고 이웃 라우터 연결에는 xe-1/0/x 인터페이스를 사용합니다.
- 두 개의 모니터 개체 "network-A" 및 "network-B"를 만듭니다. network-A 및 network-B 모니터 개체 모두 SRX 시리즈 디바이스와 인접 라우터 간에 구성된 모든 IP 주소와 인터페이스를 포함합니다.
- BFD를 구성하여 이웃 경로를 모니터링합니다.
- SRG1에 직접 연결되지 않은 경로를 모니터링하도록 IP 모니터링을 구성합니다.
- 직접 연결된 링크 또는 다음 홉에서 인터페이스 모니터링을 구성합니다.
다음 표는 샘플 가중치와 임계값 할당을 보여줍니다.
모니터 개체 |
BFD (BFD) |
지적재산권 |
인터페이스 |
모니터 개체 임계값 |
SRG 임계값 |
|||
---|---|---|---|---|---|---|---|---|
문지방 |
무게 |
문지방 |
무게 |
문지방 |
무게 |
|
|
|
네트워크-A | 100 |
50 |
100 |
50 (10.10.10.1, 10.20.20.1, 10.30.30.1) |
100 |
25(xe-1/0/1 및 xe-1/0/2) 50(ae0 및 ae1) |
100 |
100 |
네트워크-B | 100 |
50 |
100 |
50 (10.11.11.1, 10.12.12.1, 10.13.13.1) | 100 |
25(xe-1/0/3 및 xe-1/0/4) 50(ae2 및 ae3) |
200 |
- SRG당 최대 10개의 모니터링 객체를 구성할 수 있습니다.
- Junos OS 23.4에서와 같이 SRG 모니터링을 구성하거나(SRG 임계값 및 모니터링 개체 포함) Junos OS 릴리스 23.4R1 전에 지원되는 모니터링 옵션을 구성할 수 있습니다. 두 구성 스타일을 모두 결합하는 것은 지원되지 않습니다.
- monitor-objects 구성은 SRG 0 및 SRG1+와 동일합니다.
구성 샘플:
다음 구성 스니펫에서 서비스 중복 그룹(SRGx)은 network-A 및 network-B라는 두 개의 모니터 객체를 포함합니다. 이러한 각 모니터링 객체에는 IP 모니터링, 인터페이스 모니터링 및 각각의 가중치 및 임계값으로 구성된 BFD 감지가 있습니다.
- SRG 임계값을 설정합니다.
set chassis high-availability services-redundancy-group x monitor srg-threshold 100
- monitor-object
network-A
를 구성합니다.- 모니터 개체 임계값을 설정합니다.
set chassis high-availability services-redundancy-group x monitor monitor-object network-A object-threshold 100
-
BFD 모니터링 옵션을 구성합니다.
set chassis high-availability services-redundancy-group x monitor monitor-object network-A bfd-liveliness threshold 100 set chassis high-availability services-redundancy-group x monitor monitor-object network-A bfd-liveliness dst-ip 10.1.1.1 src-ip 10.1.1.2 session-type multi-hop weight 100
-
IP 모니터링에 대한 가중치 및 임계값을 구성합니다.
set chassis high-availability services-redundancy-group x monitor monitor-object network-A ip threshold 100 set chassis high-availability services-redundancy-group x monitor monitor-object network-A ip destination-ip 10.10.10.1 weight 50 set chassis high-availability services-redundancy-group x monitor monitor-object network-A ip destination-ip 20.20.20.1 weight 50 set chassis high-availability services-redundancy-group x monitor monitor-object network-A ip destination-ip 30.30.30.1 weight 50
- 인터페이스 모니터링을 위한 가중치 및 임계값을 구성합니다.
set chassis high-availability services-redundancy-group x monitor monitor-object network-A interface threshold 100 set chassis high-availability services-redundancy-group x monitor monitor-object network-A interface interface-name xe-1/0/1 weight 25 set chassis high-availability services-redundancy-group x monitor monitor-object network-A interface interface-name xe-1/0/2 weight 25 set chassis high-availability services-redundancy-group x monitor monitor-object network-A interface interface-name ae0 weight 50 set chassis high-availability services-redundancy-group x monitor monitor-object network-A interface interface-name ae1 weight 50
- 모니터 개체 임계값을 설정합니다.
-
monitor-object
network-B
를 구성합니다.-
모니터 개체 임계값을 설정합니다.
set chassis high-availability services-redundancy-group x monitor monitor-object network-B object-threshold 200
-
모니터 객체에서 BFD 모니터링을 구성합니다.
set chassis high-availability services-redundancy-group x monitor monitor-object network-B bfd-liveliness threshold 100 set chassis high-availability services-redundancy-group x monitor monitor-object network-B bfd-liveliness dst-ip 10.2.2.1 src-ip 10.2.2.2 session-type multi-hop weight 100
-
IP 모니터링에 대한 가중치 및 임계값을 구성합니다.
set chassis high-availability services-redundancy-group x monitor monitor-object network-B ip threshold 100 set chassis high-availability services-redundancy-group x monitor monitor-object network-B ip destination-ip 10.11.11.1 weight 50 set chassis high-availability services-redundancy-group x monitor monitor-object network-B ip destination-ip 10.21.21.1 weight 50 set chassis high-availability services-redundancy-group x monitor monitor-object network-B ip destination-ip 10.31.31.1 weight 50
-
인터페이스 모니터링을 위한 가중치 및 임계값을 구성합니다.
set chassis high-availability services-redundancy-group x monitor monitor-object network-B interface threshold 100 set chassis high-availability services-redundancy-group x monitor monitor-object network-B interface interface-name xe-1/0/3 weight 25 set chassis high-availability services-redundancy-group x monitor monitor-object network-B interface interface-name xe-1/0/4 weight 25 set chassis high-availability services-redundancy-group x monitor monitor-object network-B interface interface-name ae2 weight 50 set chassis high-availability services-redundancy-group x monitor monitor-object network-B interface interface-name ae3 weight 50
-
샘플에서 network-B monitor-object의 경우를 살펴보겠습니다.
시스템은 인터페이스 모니터링에 대한 임계값 100과 멤버 인터페이스(50, 50, 25 및 25)에 할당된 가중치를 갖습니다. 가중치 50의 인터페이스가 감소하면 인터페이스(50)의 가중치 값이 카운트에 추가되고 인터페이스 모니터링의 임계값과 비교됩니다. 즉, count는 50이고 인터페이스 임계값은 100입니다. 카운트는 여전히 인터페이스 임계값보다 적습니다.
가중치 50의 또 다른 인터페이스가 감소하면 카운트는 50씩 증가하고 인터페이스 모니터링의 임계값과 비교됩니다. 카운트는 이제 인터페이스 임계값 100과 같습니다. 카운트가 임계값과 같으므로 시스템은 이 값(100)을 monitor-object(network-B)의 카운트에 추가합니다. monitor-object network-B의 임계값은 200입니다. 개수(100)는 여전히 object-monitor의 임계값보다 작습니다.
마찬가지로, IP 모니터 또는 BFD 모니터도 각각의 임계값에 도달하고 object-monitor의 카운트에 추가되면, 카운트는 증가하며 object-monitor의 임계값과 비교됩니다. 카운트가 object-monitor의 임계값을 억제하면 시스템은 SRG-1(service-redundancy-group)의 카운트에 카운트를 추가합니다. network-A 및 network-B object-monitor 수의 합계가 SRG-1의 임계값을 초과하면 시스템은 다른 노드로 페일오버를 트리거합니다.
모니터링 개체 구성 확인
또는 show chassis high-availability services-redundancy-group <id> monitor-object <name>
명령을 show chassis high-availability services-redundancy-group 1
사용합니다.
다음 샘플은 명령의 show chassis high-availability services-redundancy-group 1
출력을 보여줍니다.
user@host> show chassis high-availability services-redundancy-group 1 SRG failure event codes: BF BFD monitoring IP IP monitoring IF Interface monitoring PM Path monitoring CP Control Plane monitoring ............................................. SRG Path Monitor Info: SRG Monitor Status: UP SRG Monitor Threshold: 100 SRG Monitor Weight: 0 SRG Monitor Failed Objects: [ NONE ] Object Name: Network-B Object Status: UP Object Monitored Entries: [ IP IF BFD ] Object Failures: [ IP ] Object Threshold: 200 Object Current Weight: 0 Object Name: Network-A Object Status: UP Object Monitored Entries: [ IP IF BFD] Object Failures: NONE Object Threshold: 100 Object Current Weight: 0
명령 출력에서 모니터링 개체 Network-B
Network-A
와 의 상태를 모두 확인할 수 있습니다. 또한 임계값 및 가중치와 함께 출력에 실패 개체 세부 정보가 있음을 확인할 수 있습니다.