Graceful Routing Engine Switchover의 이해
이 항목에는 다음 섹션이 포함되어 있습니다.
Graceful Routing Engine Switchover 개념
Junos OS 및 Junos OS Evolved의 GRES(Graceful Routing Engine Switchover) 기능을 통해 이중 라우팅 엔진을 장착한 라우터는 라우팅 엔진 하나에 장애가 발생하더라도 패킷을 계속 포워딩할 수 있습니다. GRES는 인터페이스 및 커널 정보를 보존합니다. 트래픽이 중단되지 않습니다. 그러나 GRES는 컨트롤 플레인을 보존하지 않습니다.
Junos OS Evolved를 실행하는 PTX10004, PTX10008 및 PTX10016 플랫폼에서 GRES는 기본적으로 활성화되며 비활성화할 수 없습니다.
T 시리즈 라우터, TX Matrix 라우터 및 TX Matrix Plus 라우터에서 컨트롤 플레인은 NSR(Nonstop Active Routing)이 없는 GRES의 경우 보존되며, GRES 동안에도 거의 75%에 달하는 패킷 포워딩 엔진당 회선 속도의 거의 75%가 중단되지 않습니다.
인접 라우터는 라우터가 재시작을 경험했음을 감지하고 개별 라우팅 프로토콜 사양에서 규정한 방식으로 이벤트에 대응합니다.
GRES는 전환 중에 라우팅을 보존하려면 다음 중 하나와 결합해야 합니다.
Graceful Restart 프로토콜 확장
NSR(Nonstop Active Routing)
기본 라우팅 엔진에 대한 모든 업데이트는 발생 즉시 백업 라우팅 엔진에 복제됩니다.
동기화 요구 사항과 로직 때문에 NSR/GRES 성능은 시스템에서 가장 느린 라우팅 엔진에 의해 제한됩니다.
다음과 같은 경우에 백업 라우팅 엔진으로의 기본 역할 스위치
기본 라우팅 엔진 커널이 작동을 중지합니다.
주 라우팅 엔진은 하드웨어 장애를 경험합니다.
관리자는 수동 전환을 시작합니다.
GRES는 전환 중에 라우팅 프로토콜 상태 정보를 신속하게 복원하거나 보존하기 위해 Graceful Restart 또는 무중단 활성 라우팅과 결합되어야 합니다. graceful Restart에 대한 자세한 내용은 Graceful Restart 개념(Graceful Restart Concepts)을 참조하십시오. 무중단 활성 라우팅에 대한 자세한 내용은 무 중단 활성 라우팅 개념을 참조하십시오.
백업 라우팅 엔진이 2초(M20 라우터에서 4초) 후에 기본 라우팅 엔진으로부터 유지를 받지 못하는 경우, 기본 라우팅 엔진에 장애가 있는지 확인합니다. 기본 역할을 가정합니다.
패킷 전달 엔진:
기존 기본 라우팅 엔진의 원활한 연결 해제
새로운 기본 라우팅 엔진으로의 재연결
재부팅 안 함
트래픽 중단 없음
새로운 기본 라우팅 엔진과 패킷 포워딩 엔진이 동기화됩니다. 새 기본 라우팅 엔진이 Packet Forwarding Engine 상태가 최신 상태가 아니라는 것을 감지하면 상태 업데이트 메시지가 다시 전송됩니다.
Junos OS Release 12.2부터 시작하여 재시작 라우터와 인접한 피어 '헬퍼' 라우터 간의 인접이 시간 종료되는 경우, graceful restart 프로토콜 확장은 피어 '헬퍼' 라우터에 임박한 재시작에 대해 알릴 수 없습니다. 그러면 Graceful Restart가 중단되어 트래픽이 중단됩니다.
이러한 인접성이 유지되도록 하기 위해 IS-IS 프로토콜의 기본값을 27초에서 40초 이상의 값으로 변경 hold-time
합니다.
연속 라우팅 엔진 전환 이벤트는 두 RE가 발생한 후 최소 240초(4분) 간격으로 진행되어야 합니다.
라우터 또는 스위치가 유사한 Standby Routing Engine is not ready for graceful switchover. Packet Forwarding Engines that are not ready for graceful switchover might be reset
경고 메시지를 표시하는 경우, 전환을 시도하지 마십시오. 전환으로 진행하려면 Graceful Switchover를 수행할 준비가 되지 않은 패킷 전달 엔진만 리셋됩니다. FPC 중 어느 것도 자발적으로 다시 시작해서는 안 됩니다. 경고가 더 이상 나타나지 않을 때까지 기다렸다가 전환으로 진행하는 것이 좋습니다.
Junos OS 릴리스 14.2부터 MX 시리즈 라우터에서 GRES를 수행할 때는 새로운 기본 라우팅 엔진에서 운영 모드 명령을 실행 clear synchronous-ethernet wait-to-restore
해야만 복구 대기 타이머를 비워야 합니다. 운영 모드 명령이 로컬 라우팅 엔진에서만 복원 대기 타이머를 지우기 때문입니다 clear synchronous-ethernet wait-to-restore
.
3D SIB를 장착한 TX Matrix Plus 라우터를 이용한 라우팅 매트릭스에서 연속적인 Routing Engine 스위치오버를 위해서는 두 RE가 등장한 후 최소 900초(15분) 간격으로 이벤트가 진행되어야 합니다.
GRES는 동기화 문제를 피하기 위해 한 번에 하나의 라인 카드 섀시(LCC)(3D SIB를 갖춘 TX Matrix 라우터)에서 수행되어야 합니다.
GRES가 라우터 또는 스위치에서 활성화될 때 백업 라우팅 엔진에서 커밋 작업을 수행하는 것은 권장 하지 않습니다 .
어떤 시나리오에서도 백업 라우팅 엔진에서 GRES를 활성화하는 것은 권장되지 않습니다.
QFX10000 스위치의 경우 GRES를 통해 무중단 라우팅이 실행될 때 계층 수준에서 명령문을 [edit routing-options]
구성할 nsr-phantom-holdtime seconds
것을 강력히 권장합니다. 이를 통해 트래픽 손실을 방지할 수 있습니다. 이 명령문을 구성하면 지정된 보류 시간 간격이 만료될 때까지 전환 중에 팬텀 IP 주소가 커널에 유지됩니다. 간격이 만료되면 해당 라우팅 테이블에 이러한 경로가 추가됩니다. EVPN(Ethernet VPN)/VXLAN 환경에서는 300초(5분)의 대기 시간 값을 지정하는 것이 좋습니다.
그림 1 은 graceful Routing Engine 스위치오버의 시스템 아키텍처와 라우팅 플랫폼이 전환에 대비한 프로세스를 보여줍니다.
다음 두 가지를 모두 실행하여 GRES 준비 상태를 확인합니다.
request chassis routing-engine master switch check
기본 라우팅 엔진의 명령show system switchover
백업 라우팅 엔진의 명령
GRES의 전환 준비 프로세스는 다음과 같습니다.
기본 라우팅 엔진이 시작됩니다.
라우팅 플랫폼 프로세스(예: 섀시 프로세스[섀시드])가 시작됩니다.
Packet Forwarding Engine은 기본 라우팅 엔진을 시작하고 연결합니다.
모든 상태 정보는 시스템에서 업데이트됩니다.
백업 라우팅 엔진이 시작됩니다.
시스템은 GRES의 활성화 여부를 결정합니다.
커널 동기화 프로세스(ksyncd)는 백업 라우팅 엔진을 기본 라우팅 엔진과 동기화합니다.
ksyncd가 동기화를 완료하면 모든 상태 정보와 포워딩 테이블이 업데이트됩니다.
그림 2 는 라우팅(또는 스위칭) 플랫폼에 대한 전환의 영향을 보여줍니다.
전환 프로세스는 다음 단계로 구성됩니다.
기본 라우팅 엔진으로부터 유지보수(keepalives)가 손실되면 시스템은 백업 라우팅 엔진으로 우아하게 오버됩니다.
패킷 전달 엔진은 백업 라우팅 엔진에 연결되며 이는 새로운 기본 엔진이 됩니다.
GRES에 포함되지 않은 라우팅 플랫폼 프로세스(예: 라우팅 프로토콜 프로세스 rpd).
전환 시점부터 학습한 상태 정보는 시스템에서 업데이트됩니다.
구성된 경우 graceful restart 프로토콜 확장은 인접한 피어 헬퍼 라우터로부터 라우팅 정보를 수집하고 복원합니다.
향상된 가입자 관리를 사용하는 MX 시리즈 라우터의 경우, graceful Routing Engine 스위치오버가 수행되면 새로운 백업 라우팅 엔진(이전의 기본 라우팅 엔진)이 재부팅됩니다. 이러한 콜드 재시작은 백업 라우팅 엔진 상태를 새로운 기본 라우팅 엔진의 상태로 재동기화하여 전환 중에 발생할 수 있는 상태의 불일치를 방지합니다.
GRES 동안 T Series 및 M320 라우터에서 GRES가 실행되는 동안 SIB(Switch Interface Boards)는 오프라인으로 전환되고 하나씩 다시 시작됩니다. 이는 SIB가 관련 SIB에 대한 상태 정보를 채우는 데 충분한 시간을 관리하는 SPMB(Switch Processor Mezzanine Board)를 제공하기 위해 수행됩니다. 그러나 모든 FPC가 전체 회선 속도로 트래픽을 전송하는 완전 장착 섀시에서는 전환 중에 순간적인 패킷 손실이 발생할 수 있습니다.
GRES가 구성되고 restart chassis-control
3D SIB가 있는 TX Matrix Plus 라우터에서 명령이 실행되면 어떤 라우팅 엔진이 기본 엔진인지 확인할 수 없습니다. 이는 섀시드 프로세스가 명령 실행과 함께 다시 시작하기 때문입니다 restart chassis-control
. 섀시드 프로세스는 기본 역할을 유지 및 유지하는 역할을 담당하며, 재시작되면 라우터 또는 스위치 로드에 따라 새로운 섀시가 처리됩니다. 그 결과, 모든 라우팅 엔진이 기본 엔진으로 구성됩니다.
라우팅 엔진 전환의 효과
표 1 은 여러 기능이 활성화될 때 RE(Routing Engine) 전환의 영향을 설명합니다.
고가용성 기능 없음
Graceful Routing Engine 스위치오버
Graceful Restart
무중단 활성 라우팅
기능 |
혜택 |
고려 사항 |
---|---|---|
듀얼 라우팅 엔진만 해당(기능 활성화 없음) |
|
|
GRES 지원 |
|
|
GRES 및 NSR 지원 |
|
|
GRES 및 Graceful Restart 지원 |
|
|
어그리게이션된 서비스 인터페이스에서 Graceful Routing Engine Switchover
GRES(Graceful Routing Engine Switchover)가 운영 모드 명령에 의해 트리거되는 경우, 어그리게이션된 서비스 인터페이스(ASIS)의 상태는 보존되지 않습니다. 예를 들어:
request interface <switchover | revert> asi-interface
그러나 GRES가 CLI 커밋 또는 FPC 재시작 또는 충돌에 의해 트리거되는 경우 백업 라우팅 엔진은 ASI 상태를 업데이트합니다. 예를 들어:
set interface si-x/y/z disable commit
또는:
request chassis fpc restart
clear synchronous-ethernet wait-to-restore
해야만 복구 대기 타이머를 비워야 합니다.