한 노드는 기본 상태이고 다른 노드는 손실 상태인 SRX 섀시 클러스터 문제 해결
문제
묘사
SRX 섀시 클러스터의 노드는 기본 및 손실 상태입니다.
환경
SRX 섀시 클러스터
조짐
클러스터의 한 노드는 기본 상태이고 다른 노드는 손실 상태입니다. show chassis cluster status
각 노드에서 명령을 실행하여 노드의 상태를 확인합니다. 다음은 샘플 출력입니다.
{primary:node0} root@primary-srx> show chassis cluster status Cluster ID: 1 Node Priority Status Preempt Manual failover Redundancy group: 0 , Failover count: 1 node0 100 primary no no node1 0 lost no no Redundancy group: 1 , Failover count: 1 node0 100 primary no no node1 0 lost no no
진단
손실 상태인 노드의 전원이 켜져 있습니까?
예: 콘솔 포트를 통해 손실 상태인 노드에 액세스할 수 있습니까? 노드에 액세스하기 위해 Telnet 또는 SSH를 사용하지 마십시오.
노드에 액세스할 수 있는 경우 3단계로 진행합니다.
노드에 액세스할 수 없고 디바이스가 원격 위치에 있는 경우 추가 문제 해결을 위해 콘솔을 통해 노드에 액세스합니다. 콘솔에 액세스할 수 있지만 출력이 표시되지 않으면 하드웨어 문제일 수 있습니다. 추가 문제 해결을 위해 기술 지원 담당자에게 케이스를 개설하십시오. 고객 지원을 위한 데이터 수집을 참조하십시오.
아니오: 노드의 전원을 켜고 2단계로 진행하십시오.
-
두 노드의 전원을 모두 켠 후 명령을 다시 실행합니다
show chassis cluster status
. 노드가 여전히 손실 상태입니까?-
예: 콘솔 포트를 통해 손실 상태인 노드에 액세스할 수 있습니까? 노드에 액세스하기 위해 Telnet 또는 SSH를 사용하지 마십시오.
-
노드에 액세스할 수 있는 경우 3단계로 진행합니다.
-
노드에 액세스할 수 없고 노드가 원격 위치에 있는 경우 추가 문제 해결을 위해 콘솔을 통해 노드에 액세스합니다. 콘솔에 액세스할 수 있지만 출력이 표시되지 않으면 하드웨어 문제일 수 있습니다. 추가 문제 해결을 위해 기술 지원 담당자에게 케이스를 개설하십시오. 고객 지원을 위한 데이터 수집을 참조하십시오.
-
-
아니요: 디바이스의 전원을 켜서 문제가 해결되었습니다.
-
-
콘솔을 기본 노드에 연결하고 명령을 실행합니다
show chassis cluster status
. 출력에 이 노드는 기본 노드로, 다른 노드는 손실된 노드로 표시됩니까?-
예: 분할 브레인 시나리오를 나타낼 수 있습니다. 각 노드는 자신을 기본 노드로 표시하고 다른 노드는 손실된 노드로 표시합니다. 다음 명령을 실행하여 어떤 노드가 트래픽을 처리하고 있는지 확인합니다.
-
show security monitoring
-
show security flow session summary
-
monitor interface traffic
트래픽을 처리하지 않는 노드를 격리합니다. 제어 링크와 패브릭 링크를 제외한 모든 케이블을 제거하여 네트워크에서 노드를 분리할 수 있습니다. 4단계로 진행합니다.
-
-
아니오: 4단계로 진행하십시오.
-
-
명령을 실행하여
show chassis fpc pic-status
모든 FPC가 손실 상태에 있는 노드에서 온라인 상태인지 확인합니다. 모든 FPC가 온라인 상태입니까?-
예: 5단계로 진행하십시오.
-
아니오: 추가 문제 해결을 위해 기술 지원 담당자에게 케이스를 개설하십시오. 고객 지원을 위한 데이터 수집을 참조하십시오.
-
-
노드가 스위치를 통해 연결되어 있습니까?
-
예: SRX 섀시 클러스터에서 패브릭 링크 장애 문제 해결 및 SRX 섀시 클러스터에서 제어 링크 장애 문제 해결을 참조하십시오.
-
아니오: 6단계로 진행하십시오.
-
-
현재 기본 노드인 노드에서 구성의 백업을 생성합니다.
{primary:node0}
root@primary-srx# show configuration | save /var/tmp/cfg-bkp.txt
구성을 손실 상태의 노드에 복사하고 구성을 로드합니다.
root@lost-srx# load override <terminal or filename>
메모:옵션을 사용하는
terminal
경우 전체 구성을 창에 붙여넣습니다. 구성이 끝날 때 Ctrl+D 를 사용해야 합니다.옵션을 사용하는
filename
경우 구성 파일의 경로(예: /var/tmp/Primary_saved.conf)를 제공하고 Enter 키를 누릅니다.콘솔을 통해 손실 상태의 노드에 연결하면 상태가 기본 또는 보류/비활성화로 표시될 수 있습니다. 노드가 보류/비활성화 상태인 경우 디바이스가 손실 상태가 되기 전에 패브릭 링크 장애가 발생했을 수 있습니다. 이 문제를 해결하려면 SRX 섀시 클러스터에서 패브릭 링크 장애 해결의 단계를 따르십시오.
구성이 로드된 후 변경 사항을 커밋합니다. 문제가 지속되면 이 디바이스의 기존 제어 및 패브릭 링크를 새 케이블로 교체하고 노드를 재부팅합니다.
{primary:node1}[edit]
root@lost-srx# request system reboot
문제가 해결되었습니까?
-
아니오: 추가 문제 해결을 위해 기술 지원 담당자에게 케이스를 개설하십시오. 고객 지원을 위한 데이터 수집을 참조하십시오.
-