오류 관리

FPC 오류 수준 및 작업 구성

M320 라우터용 Junos OS 릴리스 13.3 또는 릴리스 14.2부터 MX 시리즈, PTX 시리즈 및 T 시리즈 라우터를 사용하여 FPC에서 PFE(Packet Forwarding Engine) 관련 오류 수준과 지정된 임계값에 도달했을 때 수행할 작업을 구성할 수 있습니다. Junos OS 릴리스 13.2 및 이전 버전에서는 패킷 전달 엔진 오류로 인해 FPC가 비활성화됩니다. 명령을 사용하면 error 패킷 전달 엔진 오류를 격리할 수 있으므로 필드 교체의 필요성이 줄어듭니다. error 명령을 사용하여 심각도에 따라 오류를 분류하고, 각 심각도에 대한 자동 복구 작업을 설정하고, 지정된 임계값에 도달할 때 수행할 작업을 구성할 수 있습니다. 이 명령은 및 [edit chassis] 계층에서 [edit chassis fpc slot-number] 사용할 수 있습니다.

FPC에 대한 패킷 전달 엔진 오류 수준 및 작업을 구성하려면:

(선택 사항) 치명적 오류 수준 임계값 및 작업을 구성합니다. 치명적인 오류는 모듈 간에 상당한 양의 트래픽이 차단되는 오류입니다.
오류의 심각도 수준이 치명적이면 총 오류 수가 임계값에 도달할 때 작업이 수행됩니다. 임계값을 초과하면 오류가 발생할 때마다 작업이 수행됩니다.
(선택 사항) 주요 오류 수준 임계값 및 작업을 구성합니다. 중대한 오류는 패킷 트래픽의 지속적인 손실을 초래하지만 다른 모듈에는 영향을 미치지 않는 오류입니다.
오류의 심각도 수준이 중요한 경우 총 오류 수가 임계값에 도달하면 작업이 수행됩니다. 임계값을 초과하면 오류가 발생할 때마다 작업이 수행됩니다.
(선택 사항) 사소한 오류 수준 임계값 및 작업을 구성합니다. 경미한 오류는 단일 패킷의 손실을 초래하지만 완전히 복구할 수 있는 오류입니다.
심각도 수준이 경미한 경우 총 오류 수가 임계값에 도달할 때 작업이 한 번만 수행됩니다

Junos OS 릴리스 18.1R3부터 MX 시리즈 라우터는 오류 범위 및 오류 범주 수준에서 오류 임계값 및 작업 구성을 지원합니다. 명령을 set chassis fpc fpc-slot error scope error-scope category category (fatal | major | minor) threshold error-threshold action (alarm | disable-pfe | get-state | offline | log | reset | trap | online-pfe | reset-pfe) 사용하여 FPC 수준에서 특정 오류 범위 및 범주에 대한 임계값 및 작업을 구성합니다. 섀시 수준( [edit chassis] 계층 구조)에서 이러한 기능을 구성할 수도 있습니다. 그러나 계층에서 [edit chassis fpc] 구성된 임계값 및 작업은 계층에서 동일한 구성을 재정의합니다 [edit chassis] .

명령을 show chassis fpc errors 사용하여 오류 범위 및 범주 수준에서 오류 정보를 볼 수 있습니다.

Junos OS Evolved의 경우 다음 show 명령을 사용하여 오류 정보를 확인할 수 있습니다.

show system errors count- 시스템 전체 오류 및 개수를 표시합니다.
show system errors active- 시스템의 현재 활성 오류를 표시합니다.
show system errors active fpc <slot number> - 지정된 FPC에 대한 활성 오류를 표시합니다.
show system errors fru detail- 자세한 FRU 관련 오류를 표시합니다.
show system errors fru detail fpc <slot number>- FRU를 기반으로 탐지된 오류에 대한 정보를 표시합니다.

특정 오류 임계값에 대해 작업을 log 구성한 경우 오류 수가 설정된 임계값을 위반하면 시스템이 이벤트를 로깅합니다. 다음 샘플 syslog 메시지는 오류 임계값 위반 및 수행 중인 결과 작업을 나타냅니다.

offline, reset, disable-pfe, offline-pfe 및 reset-pfe 작업은 구성과 관련하여 상호 배타적입니다. 또는 reset-pfe 가 구성된 경우 offline-pfe 지정된 PFE는 자동으로 비활성화됩니다.

참고: MPC6E에 대한 기본 FPC 주요 알람 작업이 추가됩니다. 이 옵션은 disable-pfe Junos 17.4 이상 버전에서 사용할 수 있습니다.

다음 표는 PFE 오류 매핑 작업 및 시스템 응답에 대한 세부 정보를 제공합니다.

표 1: PFE 오류 매핑 작업 및 응답
작업	응답
`disable-pfe`	모든 PFE 인터페이스, 경보 및 로그를 비활성화합니다.
`offline`	FPC를 오프라인으로 전환하고 알람과 로그를 비활성화합니다.
`reset`	FPC를 오프라인으로 전환하고 온라인으로 재설정하여 알람과 로그를 활성화합니다.
`reset-pfe`	PFE의 전원을 끄고, 알람과 로그를 비활성화한 다음, PFE의 전원을 켜고, 알람과 로그를 활성화합니다.
`offline-pfe`	PFE의 전원을 끄고, 알람과 로그를 비활성화하고,

예: T 시리즈 코어 라우터에서 FPC 오류 감지 및 자가 치유 구성

다음 예에서는 Type 5 FPC를 사용하는 주니퍼 네트웍스 T 시리즈 코어 라우터에서 오류 감지 및 자가 치유를 구성하는 방법을 보여줍니다.

요구 사항
개요
구성
확인

요구 사항

이 예에서 사용되는 하드웨어 및 소프트웨어 구성 요소는 다음과 같습니다.

주니퍼 네트웍스 T4000 코어 라우터(Type 5 FPC 포함).
Junos OS 릴리스 13.3 이상.

계속하기 전에 필요한 연결이 완료되었고 인터페이스가 작동하는지 확인하십시오.

개요

FPC 오류 감지 및 자가 치유에는 특정 심각도에 대한 오류 수가 사용자 구성 임계값을 초과하여 증가할 때 각 FPC에서 수행할 일련의 작업을 구성하는 작업이 포함됩니다. 오류 심각도는 치명적, 주 및 경미로 분류됩니다. 복구 작업에는 알람 발생, 로그 항목 생성, FPC의 현재 상태 가져오기, FPC 재시작, FPC 오프라인 전환, FPC 재설정 등이 포함됩니다. 특정 FPC 및 오류 심각도의 경우, 오류 임계값을 허용된 한도 내의 모든 값으로 구성하고 임계값을 작업에 매핑할 수 있습니다. 이 예에서는 주니퍼 네트웍스 T4000 코어 라우터의 FPC 0에서 이러한 오류를 설정합니다.

구성

오류 감지 및 자가 복구를 구성하려면 오류 심각도, 각 오류 심각도에 해당하는 임계값 및 임계값을 초과할 때 수행할 작업을 설정해야 합니다.

CLI 빠른 구성
오류 감지 및 자동 복구 구성
결과

CLI 빠른 구성

이 예를 빠르게 구성하려면, 아래 명령을 복사하여 텍스트 파일로 붙여 넣은 다음 모든 라인브레이크를 제거하고, 네트워크 구성을 일치하는 데 필요한 세부 사항을 변경한 다음, 명령을 복사하여 [edit interfaces] 계층 수준에서 CLI에 붙여 넣습니다.

오류 감지 및 자동 복구 구성

단계별 절차

다음 예제에서는 구성 계층의 다양한 수준을 탐색해야 합니다. CLI 탐색에 대한 정보는 구성 모드에서 CLI 편집기 사용 및 CLI 사용자 가이드를 참조하십시오.

치명적 오류에 대한 임계값 및 관련 작업을 구성합니다.
1. 오류 심각도를 치명적으로 설정합니다.
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error fatal
2. 치명적 오류에 대한 임계값을 설정합니다.
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error fatal threshold 1
3. 치명적 오류에 대한 관련 작업을 설정합니다.
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error fatal threshold 1 action reset

주요 오류에 대한 임계값 및 관련 작업을 구성합니다.
1. 오류 심각도를 major로 설정합니다.
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error major
2. 주요 오류에 대한 임계값을 설정합니다.
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error major threshold 1
3. 중대한 오류에 대해 연관된 작업을 설정합니다.
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error major threshold 1 action alarm

사소한 오류에 대한 임계값 및 관련 작업을 구성합니다.
1. 오류 심각도를 마이너로 설정합니다.
  
  [edit interfaces]
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error minor
2. 사소한 오류에 대한 임계값을 설정합니다.
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error minor threshold 10
3. 사소한 오류에 대해 연관된 작업을 설정합니다.
  
  [edit interfaces]
  
  user@host# set chassis fpc 0 error minor threshold 10 action log

결과

다음은 치명적 심각도 수준에 대한 구성 결과입니다.

디바이스 구성을 마쳤으면 구성 모드에서 을 입력합니다 commit .

확인

구성이 성공적이었는지, 라우터가 올바른 동작으로 구성되었는지 확인하려면 명령을 사용합니다 show chassis fpc errors .

목적

임계값 및 관련 작업이 치명적 오류에 대해 설정되어 있는지 확인합니다.

작업

의미

샘플 출력은 FPC 0 0 에서 오류 Occurred (이전 발생 없음), 0 값(으)로 설정되고 Action-Taken (으)로 RESET설정된 오류(이전 발생 없음)가 Threshold 있는 1 오류를 Cleared 보여줍니다Fatal.

FPC 오류 관리

PTX 시리즈 라우터에서는 FPC 오류를 비활성화하거나 error-id 수준에서 오류의 심각도를 수정할 수 있습니다. 이 기능을 지원하는 PTX 플랫폼에 대한 자세한 내용은 FPC 자가 치유 를 참조하십시오.

FPC 오류를 고유하게 식별하는 error-id는 URI(Uniform Resource Identifier) 형식으로 표시되며 모듈 식별자와 오류 식별자로 구성됩니다. 오류가 발생하면 시스템 로그 메시지에서 오류 ID를 찾을 수 있습니다.

오류 심각도 수정
오류 비활성화

오류 심각도 수정

새 오류 심각도를 구성할 수는 없지만 오류의 기존 심각도를 수정할 수 있습니다. 예를 들어 특정 오류(오류 ID로 식별됨)를 더 이상 치명적 오류로 처리하지 않으려면 필요에 따라 심각도를 major 또는 minor로 수정할 수 있습니다.

참고:

그룹(예: 범주) 수준에서 오류 심각도를 수정할 수 없습니다.

오류의 심각도를 수정하려면 다음 명령을 사용합니다.

다음 예를 참조하십시오.

위의 예에서 FPC 3의 오류 ID “/cpu/0/memory/0/memory-uncorrected-error” 심각도를 로 수정했습니다 minor.

오류 비활성화

오류 보고를 중지하도록 시스템을 구성하려면 오류 ID를 식별하고 비활성화합니다. 시스템 로그 메시지에서 오류 ID를 찾을 수 있습니다. 오류를 비활성화하려면 다음 명령을 사용합니다.

다음 예를 참조하십시오.

위의 예에서는 FPC 3에서 오류를 “/cpu/0/memory/0/memory-uncorrected-error” 비활성화했습니다.

패킷 전달 엔진 전원 끄기

실행 중인 시스템에서 패킷 전달 엔진의 전원을 켜거나 끄거나 FPC가 온라인 상태가 될 때 패킷 전달 엔진의 전원을 끈 상태로 유지할 수 있습니다. 다음은 이 기능이 사용되는 몇 가지 시나리오입니다.

패킷 전달 엔진 ASIC가 오작동하는 경우.
배포에 시스템의 전체 용량이 필요하지 않은 경우 전력을 절약합니다.

패킷 전달 엔진의 전원을 끄려면 다음 단계를 사용합니다.

패킷 전달 엔진의 전원을 켜려면 다음 단계를 사용합니다.

참고:

구성을 커밋할 수 있으려면 ASIC의 두 패킷 전달 엔진에 이 구성을 모두 적용해야 합니다.

참고:

MPC10E-15C-MRATE가 장착된 MX 시리즈 라우터에서는 패킷 전달 엔진 2의 전원을 끄거나 켤 수 있습니다. 패킷 전달 엔진 0 및 1은 이 명령을 지원하지 않습니다. MPC10E-15C-MRATE에서 패킷 전달 엔진 2를 작동하려면 패킷 전달 엔진 0과 1이 작동해야 합니다. 명령을 show chassis fpc fpc-lot detail 사용하여 MPC10E-15C-MRATE의 개별 패킷 전달 엔진에 대한 패킷 전달 엔진 전원 ON/OFF 상태 및 대역폭을 볼 수 있습니다.

명령을 사용하여 show chassis fpc fpc-slot detail 패킷 전달 엔진 전원 켜기/끄기 구성 상태를 볼 수 있습니다. 아래 예를 참조하십시오.

온전성 폴링 구성

특정 FPC 또는 FEB 또는 CFEB에 sanity-poll 대한 명령문을 구성하여 해당 FPC 또는 FEB 또는 CFEB에 대한 주기적인 온전성 점검을 시작할 수 있습니다. 주기적인 온전성 검사에는 "레지스터 온전성 문제", "고온", "하드웨어 오류" 등과 같은 오류 조건에 대한 검사가 포함됩니다. 명령문을 sanity-poll 구성하지 않으면 온전성 폴링이 비활성화됩니다.

참고:

현재 주기적인 온전성 검사는 라우팅 칩 레지스터에서만 수행됩니다.

온전성 폴링은 FPC, FEB 또는 CFEB에서 오류 조건을 주기적으로 확인하고 오류 발생 시 적절한 조치를 수행합니다.

T 시리즈 라우터 및 M320 라우터에서 FPC에 대한 온전성 폴링을 구성하려면 계층 수준에서 명령문과 하위 명령문을 [edit chassis fpc slot-number] 포함합니다sanity-poll.

M120 라우터에서 FEB에 대한 온전성 폴링을 구성하려면 계층 수준에서 문과 하위 문을 [edit chassis feb slot-number] 포함합니다sanity-poll.

M7i 및 M10 라우터에서 CFEB에 대한 온전성 폴링을 구성하려면 계층 수준에서 명령문과 하위 명령문을 [edit chassis cfeb slot-number] 포함합니다sanity-poll.

참고:

TX Matrix 또는 TX Matrix Plus 라우터에서는 계층 수준에서 문을 구성할 sanity-poll 수 있습니다 [edit chassis lcc number fpc number] .

명령문은 sanity-poll 다음과 같은 하위 명령문으로 구성됩니다.

문은 retry-count 특정 오류 조건이 발생한 후 수행할 재검사 횟수를 지정합니다. 모든 주기적 검사에서 오류가 존재하는 경우, 온전성 폴링은 오류를 보고하고 적절한 조치(명령문의 옵션으로 on-error 설명됨)를 수행합니다.

예를 들어, 주기적인 온전성 검사가 FPC 또는 FEB 또는 CFEB에서 오류를 감지하고 를 retry count number 15로 구성하는 경우, 온전성 폴링은 오류를 즉시 보고하지 않습니다. 온전성 폴링은 동일한 오류 조건에 대해 15번 확인합니다. 15번의 재검사에서 오류가 지속되면 오류를 보고하고 적절한 조치를 취합니다.

명령문을 구성 retry-count 하지 않으면 기본적으로 sanity-poll 명령문은 오류 조건을 보고하기 전에 감지된 오류를 10회 재검사합니다.
온전성 폴링이 오류 조건을 감지하면 문은 on-error 오류를 제거하기 위한 적절한 작업을 수행합니다.

다음 작업은 모든 종류의 오류 조건에 공통적으로 적용됩니다.
- 섀시 알람을 생성하려면 문을 구성합니다 raise-alarm . 섀시 알람은 섀시의 전면 패널에 표시됩니다.
- 코어 파일을 생성한 후 FPC 또는 FEB 또는 CFEB를 재부팅하려면 문을 구성합니다 power cycle . 이 문은 재부팅 후 제거되는 일시적인 소프트웨어 오류에 유용합니다.
- FPC 또는 FEB 또는 CFEB를 중단하려면 문을 구성합니다 power off . 이 문은 영구적인 하드웨어 오류의 경우에 유용합니다.
  
  주의:
  
  명령문은 power off FPC를 중단합니다. 서비스 중단을 방지하기 위해 다른 FPC 또는 FEB 또는 CFEB를 통한 백업 경로가 있는지 확인합니다.
  
  참고:
  및 문은 power cycle 상호 배타적이므로 오류에 대해 또는 power cycle 작업을 power off 구성할 수 power off 있습니다.
- 코어 파일을 트리거하려면 문을 구성합니다 write-coredump .

지정된 FPC 또는 FEB 또는 CFEB에 대해 여러 작업을 구성할 수 있습니다. 작업을 구성하지 않으면 문은 sanity-poll FPC 또는 FEB 또는 CFEB 시스템 로그 메시지만 생성합니다.

유연한 PIC Concentrator가 오프라인 상태를 유지하도록 Junos OS 구성

기본적으로 FPC(Flexible PIC Concentrator)는 시스템 재부팅 후 다시 시작하도록 구성됩니다. 운영 모드 명령을 사용하여 request chassis fpc FPC를 오프라인으로 전환할 수 있지만, Junos OS에서는 CLI 명령을 입력하면 FPC가 commit 다시 시작하려고 시도합니다. FPC가 오프라인 상태를 유지하고 재시작되지 않도록 구성하려면 계층 수준에서 문을 포함합니다power off.[edit chassis fpc slot-number]

오프라인 상태를 유지하도록 구성된 FPC를 온라인으로 전환하고 온라인 상태를 유지하도록 구성하려면 계층 수준에서 문을 포함합니다power on.[edit chassis fpc slot-number]

오프라인 상태를 유지하도록 SFM 구성

기본적으로 CLI 명령을 사용하여 request chassis sfm SFM(스위칭 및 포워딩 모듈)을 오프라인으로 전환하는 경우 CLI 명령을 입력하면 SFM이 commit 다시 시작하려고 시도합니다. 재시작을 방지하기 위해 SFM이 오프라인 상태를 유지하도록 구성할 수 있습니다. 이 기능은 수리 상황에 유용합니다.

SFM이 오프라인 상태를 유지하도록 구성하려면 계층 수준에서 문을 포함합니다sfm.[edit chassis]

slot number- SFM이 설치된 슬롯 번호입니다.
power off- SFM을 오프라인으로 전환하고 오프라인 상태를 유지하도록 구성합니다.

예를 들어, 다음 문은 슬롯 3의 SFM을 오프라인으로 전환합니다.

show chassis sfm CLI 명령을 사용하여 오프라인 상태를 확인합니다.

SFM을 다시 온라인 상태로 전환하려면 문을 삭제 edit chassis sfm 한 다음 구성을 커밋합니다.

FPC가 온라인 상태가 될 때 FPC 시퀀스 번호를 활성 FPC와 재동기화

M320, T320, T640, T1600, T4000, TX Matrix 및 TX Matrix Plus 라우터에서 FPC(Flexible PIC Concentrator)를 온라인으로 전환하면 FPC의 시퀀스 번호가 라우터의 다른 활성 FPC와 동기화되지 않아 초기 트래픽이 손실될 수 있습니다.

트래픽 손실을 방지하려면 계층 수준에서 문을 [edit chassis] 포함합니다fpc-resync. 이렇게 하면 온라인 상태가 된 FPC의 시퀀스 번호가 라우터의 다른 활성 FPC와 다시 동기화됩니다.

참고:

null 경로 필터링을 fpc-resync 방지하기 위해 단일 LMNR 기반 FPC와 하나 이상의 I-칩 FPC가 동일한 섀시에 존재하는 경우 명령은 효과가 없습니다.

하드 디스크 오류 시 라우팅 엔진 재부팅 활성화

하드 디스크 오류가 발생하면 라우팅 엔진이 로컬 핑에 응답하고 인터페이스가 작동 상태를 유지하지만 다른 프로세스는 응답하지 않는 상태로 들어갈 수 있습니다.

이 상황에서 복구하려면 하드 디스크 오류가 발생할 때 단일 라우팅 엔진이 자동으로 재부팅되도록 구성할 수 있습니다. 이 기능을 사용하려면 계층 수준에서 문을 [edit chassis routing-engine] 포함합니다on-disk-failure reboot.

듀얼 라우팅 엔진 환경의 경우, 기본 라우팅 엔진에서 하드 디스크 오류를 감지하면 백업 라우팅 엔진이 자동으로 기본 역할을 맡도록 구성할 수 있습니다. 이 기능을 사용하려면 계층 수준에서 문을 [edit chassis redundancy failover] 포함합니다on-disk-failure. 이 문에 대한 정보는 Junos OS 고가용성 사용자 가이드를 참조하십시오.

라우팅 엔진에서 하드 디스크에 장애가 발생하면 (재부팅하는 대신) 중단하도록 라우팅 엔진을 구성할 수 있습니다. 이 기능을 구성하려면 계층 수준에서 문을 포함합니다disk-failure-action (halt | reboot).[edit chassis routing-engine on-disk-failure]

halt 옵션을 사용하여 하드 디스크에 장애가 발생할 때 라우팅 엔진이 중단되도록 구성합니다. 재부팅 옵션을 사용하여 하드 디스크에 장애가 발생할 때 라우팅 엔진이 재부팅되도록 구성합니다.

열 상태 확인 및 PSM 워치독을 사용하여 열 상태 이벤트 처리

열 상태 점검 기능을 사용하여 누전과 같은 열 상태 이벤트 감지 시 수행할 작업을 구성할 수 있습니다. 열 검사 기능은 전원 공급 장치 모듈(PSM) 전원 출력 및 FRU 전력 소비를 모니터링하고, PSM 전원 출력이 사용자 정의 임계값만큼 FRU 전력 소비를 초과하는 것을 감지하면 열 상태 이벤트가 있다고 가정하고 사용자 구성에 따라 조치를 취합니다. 자동 종료 또는 열 상태 이벤트 감지 시 시작되는 경보와 같은 작업을 구성할 수 있습니다. 구성의 예는 다음과 같습니다 set chassis thermal-health-check action-onfail auto-shutdown shutdown-timer 10 power-threshold 700. 이 예제 구성을 사용하면 전력 누출이 700W를 초과하는 경우 소프트웨어가 열 상태 이벤트를 감지하고 열 상태 오류가 감지된 후 10초 후에 시스템을 종료할 수 있습니다.

열 상태 점검 기능은 다음과 같은 경우에만 작동합니다.

라우터의 두 슬롯에 고용량 AC 또는 DC PDU(Power Distribution Unit)가 설치되어 있으며, 각 PDU에는 동일한 수의 PSM이 있습니다. AC PSM과 DC PSM이 모두 지원됩니다.

지원되는 PSM 및 PDU는 다음과 같습니다.
- 고용량 AC PSM(모델: PSM2-PTX-AC, 펌웨어: 0210 이상, 하드웨어 개정판: 06 이상)
- 고용량 60A DC PSM(모델: PSM2-PTX-DC, 펌웨어: 0315 이상, 하드웨어 개정판: 09 이상)
- 고용량 60A DC PDU(모델: PDU2-PTX-DC, 펌웨어 버전 0404 이상과 하드웨어 개정판 07 사용, 펌웨어 버전 0503 이상과 하드웨어 개정판 08 사용)
- 고용량 AC 델타 PDU(모델: PDU2-PTX-AC-D, 펌웨어: 0305 이상, 하드웨어 개정판: 04 이상)
- 고용량 AC Wye PDU(모델: PDU2-PTX-AC-W, 펌웨어: 0305 이상, 하드웨어 개정판: 03 이상)
- 고용량 단상 AC PDU(모델: PDU2-PTX-AC-SP, 펌웨어: 0102 이상, 하드웨어 개정판: 03 이상)
각 PDU에는 온라인 상태인 PSM이 3개 이상 있으며, 각 온라인 PSM은 60A 이상의 전류(AC PSM의 경우) 또는 100A 이상의 전류(DC PSM의 경우)를 소비합니다.
FRU(RE, SIB, FPC)가 '현재' 상태가 아닙니다.

라우터의 [edit chassis] 계층에서 PSM 워치독 기능을 구성할 수도 있습니다. 열 상태 이벤트로 인해 Junos가 다운되면 PSM 워치독 기능이 이를 감지하고 라우터를 종료합니다. 워치독 구성에서 워치독 타이머를 초 단위로 지정할 수 있습니다. 지정된 기간이 지나면 워치독이 만료됩니다. 또한 Junos가 워치독 카운터를 재설정하는 빈도(분)를 지정할 수 있습니다. 라우팅 엔진 충돌과 같은 이유로 워치독 카운터가 재설정되지 않으면 PSM은 워치독 타이머 만료 시 출력 전원을 꺼서 라우터를 종료합니다.

구성 예는 다음과 같습니다.

을(를) 사용합니다 set chassis psm watchdog timeout 600 pat-frequency 2. 이 명령은 워치독 타이머가 600초로 설정되고 카운터가 2분마다 재설정되도록 설정된 PSM 워치독을 활성화합니다.
을(를) 사용합니다 set chassis thermal-health-check fet-failure-check action-onfail auto-shutdown shutdown-timer 10.. 이 명령은 열 상태 점검을 활성화하고 FET 오류가 감지된 후 10초 후에 시스템을 종료합니다.

참고:

PSM 워치독 기능은 라우터의 모든 온라인 PSM이 이 기능을 지원하는 경우에만 작동합니다.

간단히 말해, 열 이벤트가 발생할 때 라우팅 엔진 소프트웨어가 실행 중인 경우, 열 상태 점검 기능은 열 이벤트를 감지하고 조치를 취합니다. 그러나 열 건강 이벤트에서 라우팅 엔진 소프트웨어가 다운되면 PSM 워치독 타이머가 이 문제를 감지하고 시스템을 중단합니다.

이 페이지의 내용

FPC 오류 수준 및 작업 구성

예: T 시리즈 코어 라우터에서 FPC 오류 감지 및 자가 치유 구성

요구 사항

개요

구성

CLI 빠른 구성

오류 감지 및 자동 복구 구성

단계별 절차

결과

확인

FPC 오류의 치명적인 심각도와 관련된 구성된 작업 확인

목적

작업

의미

FPC 오류 관리

오류 심각도 수정

오류 비활성화

패킷 전달 엔진 전원 끄기

온전성 폴링 구성

유연한 PIC Concentrator가 오프라인 상태를 유지하도록 Junos OS 구성

오프라인 상태를 유지하도록 SFM 구성

FPC가 온라인 상태가 될 때 FPC 시퀀스 번호를 활성 FPC와 재동기화

하드 디스크 오류 시 라우팅 엔진 재부팅 활성화

열 상태 확인 및 PSM 워치독을 사용하여 열 상태 이벤트 처리

변경 내역 테이블

이 페이지의 내용

오류 관리

FPC 오류 수준 및 작업 구성

예: T 시리즈 코어 라우터에서 FPC 오류 감지 및 자가 치유 구성

요구 사항

개요

구성

CLI 빠른 구성

오류 감지 및 자동 복구 구성

단계별 절차

결과

확인

FPC 오류의 치명적인 심각도와 관련된 구성된 작업 확인

목적

작업

의미

FPC 오류 관리

오류 심각도 수정

오류 비활성화

패킷 전달 엔진 전원 끄기

온전성 폴링 구성

유연한 PIC Concentrator가 오프라인 상태를 유지하도록 Junos OS 구성

오프라인 상태를 유지하도록 SFM 구성

FPC가 온라인 상태가 될 때 FPC 시퀀스 번호를 활성 FPC와 재동기화

하드 디스크 오류 시 라우팅 엔진 재부팅 활성화

열 상태 확인 및 PSM 워치독을 사용하여 열 상태 이벤트 처리

관련 문서

변경 내역 테이블