Monitoramento de falhas de cluster do chassi
Você pode usar armadilhas SNMP e mensagens de log do sistema para o monitoramento de falhas dos clusters de chassi da Série SRX.
Armadilhas SNMP
A Tabela 1 lista as armadilhas SNMP suportadas em dispositivos da Série SRX. Observe que apenas o nó primário envia armadilhas SNMP. Para obter mais informações sobre cada armadilha, consulte o Guia de gerenciamento e monitoramento de rede, a referência do MIB para gateways de SRX1400, SRX3400 e SRX3600 serviços e a referência MIB para gateways de serviços de SRX5600 e SRX5800.
Nome da armadilha |
OID de armadilha SNMPv2 |
Categoria |
Plataformas com suporte |
Varbinds |
---|---|---|---|---|
autenticaçãoFailure |
1.3.6.1.6.3.1.1.5.5 |
Autenticação |
Todos os dispositivos Junos OS |
Nenhum |
linkDown |
1.3.6.1.6.3.1.1.5.3 |
Link |
Todos os dispositivos Junos OS |
|
Linkup |
1.3.6.1.6.3.1.1.5.4 |
Link |
Todos os dispositivos Junos OS |
|
pingProbe falhou |
1.3.6.1.2.1.80.0.1 |
Operações remotas |
Todos os dispositivos Junos OS |
|
falha no pingTest |
1.3.6.1.2.1.80.0.2 |
Operações remotas |
Todos os dispositivos Junos OS |
|
pingTestCompletado |
1.3.6.1.2.1.80.0.3 |
Operações remotas |
Todos os dispositivos Junos OS |
|
traceRoutePathChange |
1.3.6.1.2.1.81.0.1 |
Operações remotas |
Todos os dispositivos Junos OS |
|
traceRouteTest falhou |
1.3.6.1.2.1.81.0.2 |
Operações remotas |
Todos os dispositivos Junos OS |
|
traceRouteTestCompletado |
1.3.6.1.2.1.81.0.3 |
Operações remotas |
Todos os dispositivos Junos OS |
|
quedaAlarm |
1.3.6.1.2.1.16.0.1 |
Alarme RMON |
Todos os dispositivos Junos OS |
|
crescenteAlarm |
1.3.6.1.2.1.16.0.2 |
Alarme RMON |
Todos os dispositivos Junos OS |
|
bgpEstablished |
1.3.6.1.2.1.15.7.1 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
bgpBackwardTransition |
1.3.6.1.2.1.15.7.2 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfVirtIfStateChange |
1.3.6.1.2.1.14.16.2.1 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfNbrStateChange |
1.3.6.1.2.1.14.16.2.2 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfVirtNbrStateChange |
1.3.6.1.2.1.14.16.2.3 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfIfConfigError |
1.3.6.1.2.1.14.16.2.4 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfVirtIfConfigEror |
1.3.6.1.2.1.14.16.2.5 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
1: 2: 3: 4: 5: |
ospfIfAuthFailure |
1.3.6.1.2.1.14.16.2.6 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfVirtIfAuthFailure |
1.3.6.1.2.1.14.16.2.7 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfIfRxBadPacket |
1.3.6.1.2.1.14.16.2.8 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfVirtIfRxBadPacket |
1.3.6.1.2.1.14.16.2.9 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfTxRetransmit |
1.3.6.1.2.1.14.16.2.10 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfVirtIfTxRetransmit |
1.3.6.1.2.1.14.16.2.11 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfMaxAgeLsa |
1.3.6.1.2.1.14.16.2.13 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
ospfIfStateChange |
1.3.6.1.2.1.14.16.2.16 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
coldStart |
1.3.6.1.6.3.1.1.5.1 |
Inicialização |
Todos os dispositivos Junos OS |
Nenhum |
warmStart |
1.3.6.1.6.3.1.1.5.2 |
Inicialização |
Todos os dispositivos Junos OS |
Nenhum |
vrrpTrapNewMaster |
1.3.6.1.2.1.68.0.1 |
VRRP |
Todos os dispositivos Junos OS |
vrrpOperMasterIpAddr - .1.3.6.1.2.1.68.1.3.1.7 |
vrrpTrapAuthFailure |
1.3.6.1.2.1.68.0.2 |
VRRP |
Todos os dispositivos Junos OS |
|
mplsTunnelUp |
1.3.6.1.2.1.10.166.3.0.1 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
mplsTunnelDown |
1.3.6.1.2.1.10.166.3.0.2 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
mplsTunnelRerouted |
1.3.6.1.2.1.10.166.3.0.3 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
mplsTunnelReoptimizado |
1.3.6.1.2.1.10.166.3.0.4 |
Roteamento |
M, T, MX, J, EX, Filial SRX |
|
jnxPowerSupplyFailure |
1.3.6.1.4.1.2636.4.1.1 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFanFailure |
1.3.6.1.4.1.2636.4.1.2 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxOverTemperature |
1.3.6.1.4.1.2636.4.1.3 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxRedundancySwitchOver |
1.3.6.1.4.1.2636.4.1.4 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFruRemoval |
1.3.6.1.4.1.2636.4.1.5 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFruInsertion |
1.3.6.1.4.1.2636.4.1.6 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFruPowerOff |
1.3.6.1.4.1.2636.4.1.7 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFruPowerOn |
1.3.6.1.4.1.2636.4.1.8 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFru falhou |
1.3.6.1.4.1.2636.4.1.9 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFruOffline |
1.3.6.1.4.1.2636.4.1.10 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFruOnline |
1.3.6.1.4.1.2636.4.1.11 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFruCheck |
1.3.6.1.4.1.2636.4.1.12 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxFEBSwitchover |
1.3.6.1.4.1.2636.4.1.13 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxHardDisk falhou |
1.3.6.1.4.1.2636.4.1.14 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxHardDiskMissing |
1.3.6.1.4.1.2636.4.1.15 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
jnxPowerSupplyOK |
1.3.6.1.4.1.2636.4.2.1 |
Chassi (condições de alarme limpas) |
Todos os dispositivos Junos OS |
|
jnxFanOK |
1.3.6.1.4.1.2636.4.2.2 |
Chassi (condições de alarme limpas) |
Todos os dispositivos Junos OS |
|
jnxTemperatureOK |
|
Chassi (condições de alarme limpas) |
Todos os dispositivos Junos OS |
|
jnxFRUOK |
1.3.6.1.4.1.2636.4.2.4 |
Chassi (condições de alarme limpas) |
Todos os dispositivos Junos OS |
|
jnxCmCfgChange |
1.3.6.1.4.1.2636.4.5.0.1 |
Configuração |
Todos os dispositivos Junos OS |
|
jnxCmRescueChange |
1.3.6.1.4.1.2636.4.5.0.2 |
Configuração |
Todos os dispositivos Junos OS |
|
jnxPingRttThresholdExceed |
1.3.6.1.4.1.2636.4.9.0.1 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxPingRttStdDevThresholdExceed |
1.3.6.1.4.1.2636.4.9.0.2 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxPingRttJitterThresholdextido |
1.3.6.1.4.1.2636.4.9.0.3 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxPingEgressEstençãoextida |
1.3.6.1.4.1.2636.4.9.0.4 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxPingEgressStdDevExceed |
1.3.6.1.4.1.2636.4.9.0.5 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxPingEgressJitterThresholdExceed |
1.3.6.1.4.1.2636.4.9.0.6 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxPingIngIngresse reterexceed |
1.3.6.1.4.1.2636.4.9.0.7 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxPingIngingressStddevThresholdExceed |
1.3.6.1.4.1.2636.4.9.0.8 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxPingIngingressJitterThresholdExceed |
1.3.6.1.4.1.2636.4.9.0.9 |
Operações remotas |
Todos os dispositivos Junos OS, exceto EX e dispositivos high-end da Série SRX |
|
jnxAccessAuthServiceUp |
1.3.6.1.4.1.2636.3.51.1.0.1 |
Roteamento |
Série J e Série SRX |
Nenhum |
jnxAccessAuthServiceDown |
1.3.6.1.4.1.2636.3.51.1.0.2 |
Roteamento |
Série J e Série SRX |
Nenhum |
jnxAccessAuthServer desativado |
1.3.6.1.4.1.2636.3.51.1.0.3 |
Roteamento |
Série J e Série SRX |
jnxUserAAServerName - .1.3.6.1.4.1.2636.3.51.1.1.3.1.0 |
jnxAccessAuthServerEnabled |
1.3.6.1.4.1.2636.3.51.1.0.4 |
Roteamento |
Série J e Série SRX |
jnxUserAAServerName - .1.3.6.1.4.1.2636.3.51.1.1.3.1.0 |
jnxJsFwAuthFailure |
1.3.6.1.4.1.2636.3.39.1.2.1.0.1 |
Roteamento |
Série J e Série SRX |
|
jnxJsFwAuthServiceUp |
1.3.6.1.4.1.2636.3.39.1.2.1.0.2 |
Roteamento |
Série J e Série SRX |
Nenhum |
jnxJsFwAuthServiceDown |
1.3.6.1.4.1.2636.3.39.1.2.1.0.3 |
Roteamento |
Série J e Série SRX |
Nenhum |
jnxJsFwAuthCapacityExceed |
1.3.6.1.4.1.2636.3.39.1.2.1.0.4 |
Roteamento |
Série J e Série SRX |
Nenhum |
jnxJsScreenAttack |
1.3.6.1.4.1.2636.3.39.1.8.1.0.1 |
Roteamento |
Série J e Série SRX |
|
jnxJsScreenCfgChange |
1.3.6.1.4.1.2636.3.39.1.8.1.0.2 |
Roteamento |
Série J e Série SRX |
|
jnxRmonAlarmGetFailure |
1.3.6.1.4.1.2636.4.3.0.1 |
Alarme RMON |
Todos os dispositivos Junos OS |
|
jnxRmonGetOk |
1.3.6.1.4.1.2636.4.3.0.2 |
Alarme RMON |
Todos os dispositivos Junos OS |
|
jnxSyslogTrap |
.1.3.6.1.4.1.2636.4.12.0.1 |
Serviços |
Todos os dispositivos Junos OS |
|
jnxEventTrap |
.1.3.6.1.4.1.2636.4.13.0.1 |
Serviços |
Todos os dispositivos Junos OS |
|
jnxJsAvPatternUpdateTrap |
.1.3.6.1.4.1.2636.3.39.1.13.1.0.1 |
Configuração |
Série J e Série SRX |
|
jnxJsChassisClusterSwitchover |
.1.3.6.1.4.1.2636.3.39.1.14.1.0.1 |
Chassi (condições de alarme) |
Todos os dispositivos Junos OS |
|
bfdSessUp |
.1.3.6.1.4.1.2636.5.3.1.0.1 |
Roteamento |
Todos os dispositivos Junos OS |
|
bfdSessDown |
.1.3.6.1.4.1.2636.5.3.1.0.2 |
Roteamento |
Todos os dispositivos Junos OS |
|
jnxBfdSessTxIntervalHigh |
.1.3.6.1.4.1.2636.3.45.1.0.1 |
Roteamento |
Todos os dispositivos Junos OS |
|
jnxBfdSessDetectionTimeHigh |
.1.3.6.1.4.1.2636.3.45.1.0.2 |
Roteamento |
Todos os dispositivos Junos OS |
|
jnxBgpM2Established |
.1.3.6.1.4.1.2636.5.1.1.1.0.1 |
Roteamento |
Todos os dispositivos Junos OS |
|
jnxBgpM2BackwardTransition |
.1.3.6.1.4.1.2636.5.1.1.1.0.2 |
Roteamento |
Todos os dispositivos Junos OS |
|
Se a interface do fxp0 falhar no mecanismo de roteamento de backup, ela não enviará nenhuma armadilha. O recurso de registro do sistema (syslog) pode ser usado para monitorar a interface de nó secundário do fxp0 registrando uma mensagem de link para baixo.
Mensagens de log do sistema
O recurso de registro do sistema pode ser enviado pelos nós primários e secundários. Você pode configurar o sistema para enviar mensagens de syslog específicas para os servidores externos de syslog com base em expressões ou gravidade regulares. Para obter mais informações, veja o System Log Explorer.
A amostra a seguir mostra a configuração de armadilha jnxSyslog para um ui_commit_progress
evento (confirmação de configuração em progresso).
Configuração da armadilha do jnxSyslog
event-options { policy syslogtrap { events [ ui_commit ui_commit_progress ]; then { raise-trap; } } }
armadilha do jnxSyslog
Jul 6 13:31:21 snmpd[0] <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< Jul 6 13:31:21 snmpd[0] <<< V2 Trap Jul 6 13:31:21 snmpd[0] <<< Source: 116.197.179.6 Jul 6 13:31:21 snmpd[0] <<< Destination: 116.197.179.5 Jul 6 13:31:21 snmpd[0] <<< Version: SNMPv2 Jul 6 13:31:21 snmpd[0] <<< Community: petblr Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : sysUpTime.0 Jul 6 13:31:21 snmpd[0] <<< type : TimeTicks Jul 6 13:31:21 snmpd[0] <<< value: (284292835) 789:42:08.35 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : snmpTrapOID.0 Jul 6 13:31:21 snmpd[0] <<< type : Object Jul 6 13:31:21 snmpd[0] <<< value: jnxSyslogTrap Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogEventName.83 Jul 6 13:31:21 snmpd[0] <<< type : OctetString Jul 6 13:31:21 snmpd[0] <<< value: "UI_COMMIT_PROGRESS" Jul 6 13:31:21 snmpd[0] <<< HEX : 55 49 5f 43 4f 4d 4d 49 Jul 6 13:31:21 snmpd[0] <<< 54 5f 50 52 4f 47 52 45 Jul 6 13:31:21 snmpd[0] <<< 53 53 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogTimestamp.83 Jul 6 13:31:21 snmpd[0] <<< type : OctetString Jul 6 13:31:21 snmpd[0] <<< HEX : 07 da 07 06 0d 1f 11 00 Jul 6 13:31:21 snmpd[0] <<< 2b 00 00 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogSeverity.83 Jul 6 13:31:21 snmpd[0] <<< type : Number Jul 6 13:31:21 snmpd[0] <<< value: 7 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogFacility.83 Jul 6 13:31:21 snmpd[0] <<< type : Number Jul 6 13:31:21 snmpd[0] <<< value: 24 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogProcessId.83 Jul 6 13:31:21 snmpd[0] <<< type : Gauge Jul 6 13:31:21 snmpd[0] <<< value: 84003 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogProcessName.83 Jul 6 13:31:21 snmpd[0] <<< type : OctetString Jul 6 13:31:21 snmpd[0] <<< value: "mgd" Jul 6 13:31:21 snmpd[0] <<< HEX : 6d 67 64 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogHostName.83 Jul 6 13:31:21 snmpd[0] <<< type : OctetString Jul 6 13:31:21 snmpd[0] <<< HEX : Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogMessage.83 Jul 6 13:31:21 snmpd[0] <<< type : OctetString Jul 6 13:31:21 snmpd[0] <<< value: "UI_COMMIT_PROGRESS: Commit opera Jul 6 13:31:21 snmpd[0] <<< tion in progress: notifying mib Jul 6 13:31:21 snmpd[0] <<< 2d(15)" Jul 6 13:31:21 snmpd[0] <<< HEX : 55 49 5f 43 4f 4d 4d 49 Jul 6 13:31:21 snmpd[0] <<< 54 5f 50 52 4f 47 52 45 Jul 6 13:31:21 snmpd[0] <<< 53 53 3a 20 43 6f 6d 6d Jul 6 13:31:21 snmpd[0] <<< 69 74 20 6f 70 65 72 61 Jul 6 13:31:21 snmpd[0] <<< 74 69 6f 6e 20 69 6e 20 Jul 6 13:31:21 snmpd[0] <<< 70 72 6f 67 72 65 73 73 Jul 6 13:31:21 snmpd[0] <<< 3a 20 20 6e 6f 74 69 66 Jul 6 13:31:21 snmpd[0] <<< 79 69 6e 67 20 6d 69 62 Jul 6 13:31:21 snmpd[0] <<< 32 64 28 31 35 29 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogAvAttribute.83.1 Jul 6 13:31:21 snmpd[0] <<< type : OctetString Jul 6 13:31:21 snmpd[0] <<< value: "message" Jul 6 13:31:21 snmpd[0] <<< HEX : 6d 65 73 73 61 67 65 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : jnxSyslogAvValue.83.1 Jul 6 13:31:21 snmpd[0] <<< type : OctetString Jul 6 13:31:21 snmpd[0] <<< value: " notifying mib2d(15)" Jul 6 13:31:21 snmpd[0] <<< HEX : 20 6e 6f 74 69 66 79 69 Jul 6 13:31:21 snmpd[0] <<< 6e 67 20 6d 69 62 32 64 Jul 6 13:31:21 snmpd[0] <<< 28 31 35 29 Jul 6 13:31:21 snmpd[0] <<< Jul 6 13:31:21 snmpd[0] <<< OID : snmpTrapEnterprise.0 Jul 6 13:31:21 snmpd[0] <<< type : Object Jul 6 13:31:21 snmpd[0] <<< value: jnxProductNameSRX240 Jul 6 13:31:21 snmpd[0] <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
Um switchover pode ser detectado usando uma armadilha de failover, o status do cluster do chassi ou uma armadilha de failover automática.
Armadilha de failover
A mensagem de armadilha pode ajudá-lo a solucionar problemas de failovers. Ela contém as seguintes informações:
ID de cluster e ID de nós
Motivo para o failover
Grupo de redundância que está envolvido no failover
Estado e estado atual do grupo de redundância
O cluster pode estar em qualquer um dos diferentes estados a qualquer momento: hold, primário, secundário, inibilbilizáveis e desativados. As armadilhas são geradas para as seguintes transições de estado (apenas uma transição de um estado de espera não desencadeia uma armadilha):
secundários <-> primários
primário — > porão secundário
porão secundário — > secundário
secundário — > iniligível
iniligível — > desativado
iniligível — > primário
secundário — > desativado
Uma transição pode ser desencadeada devido a eventos como monitoramento de interfaces, monitoramento de SPU, falhas e failovers manuais.
O desencadeamento de eventos é aplicável a todos os grupos de redundância, incluindo RG0, RG1 e assim por diante. Todos os eventos de failover de grupo de redundância desencadeiam a mesma armadilha, e o grupo real pode ser identificado examinando o parâmetro jnxJsChClusterSwitchoverInfoRedundancyGroup no varbind trap.
A armadilha é encaminhada sobre o link de controle se a interface de saída estiver em um nó diferente do nó do mecanismo de roteamento que gera a armadilha. A seguir, armadilhas de amostra para failovers manuais e automáticos. Observe que as armadilhas são geradas pelos dispositivos primários atuais antes que o failover ocorra.
Um failover em qualquer grupo de redundância (RG) que não seja o grupo 0 de redundância não faz do outro nó o nó primário.
No exemplo a seguir, o nó 0 é o nó primário em RG0, enquanto é o nó secundário no RG1. O nó 0 continua a ser o nó principal para o cluster. Somente quando o failover acontece no nó 1 em RG0 o nó 1 se torna o nó principal para o cluster. Assim, mesmo que uma switchover ocorra em outros grupos, o nó primário deve ser questionado para todas as estatísticas e dados, como mencionado anteriormente.
O Junos OS pode ser configurado para enviar um endereço IP desejável como endereço IP de origem das PDUs de armadilha SNMP. Caso contrário, as armadilhas SNMP sempre contêm o endereço IP da interface de saída.
Status do cluster do chassi
user@host> show chassis cluster status Cluster ID: 12 Node Priority Status Preempt Manual failover Redundancy group: 0 , Failover count: 3 node 255 primary no yes node1 1 secondary-hold no yes Redundancy group: 1 , Failover count: 4 node0 100 secondary no yes node1 255 primary no yes
Armadilha de failover manual
Jul 6 05:14:57 snmpd[0] <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< Jul 6 05:14:57 snmpd[0] <<< V2 Trap Jul 6 05:14:57 snmpd[0] <<< Source: 192.168.29.2 Jul 6 05:14:57 snmpd[0] <<< Destination: 10.204.132.188 Jul 6 05:14:57 snmpd[0] <<< Version: SNMPv2 Jul 6 05:14:57 snmpd[0] <<< Community: test Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : sysUpTime.0 Jul 6 05:14:57 snmpd[0] <<< type : TimeTicks Jul 6 05:14:57 snmpd[0] <<< value: (754507) 2:05:45.07 Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : snmpTrapOID.0 Jul 6 05:14:57 snmpd[0] <<< type : Object Jul 6 05:14:57 snmpd[0] <<< value: jnxJsChassisClusterSwitchover Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoRedundancyGroup.0 Jul 6 05:14:57 snmpd[0] <<< type : OctetString Jul 6 05:14:57 snmpd[0] <<< value: "1" Jul 6 05:14:57 snmpd[0] <<< HEX : 31 Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoClusterId.0 Jul 6 05:14:57 snmpd[0] <<< type : OctetString Jul 6 05:14:57 snmpd[0] <<< value: "12" Jul 6 05:14:57 snmpd[0] <<< HEX : 31 32 Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoNodeId.0 Jul 6 05:14:57 snmpd[0] <<< type : OctetString Jul 6 05:14:57 snmpd[0] <<< value: "0" Jul 6 05:14:57 snmpd[0] <<< HEX : 30 Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoPreviousState.0 Jul 6 05:14:57 snmpd[0] <<< type : OctetString Jul 6 05:14:57 snmpd[0] <<< value: "primary" Jul 6 05:14:57 snmpd[0] <<< HEX : 70 72 69 6d 61 72 79 Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoCurrentState.0 Jul 6 05:14:57 snmpd[0] <<< type : OctetString Jul 6 05:14:57 snmpd[0] <<< value: "secondary-hold" Jul 6 05:14:57 snmpd[0] <<< HEX : 73 65 63 6f 6e 64 61 72 Jul 6 05:14:57 snmpd[0] <<< 79 2d 68 6f 6c 64 Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoReason.0 Jul 6 05:14:57 snmpd[0] <<< type : OctetString Jul 6 05:14:57 snmpd[0] <<< value: "manual failover" Jul 6 05:14:57 snmpd[0] <<< HEX : 6d 61 6e 75 61 6c 20 66 Jul 6 05:14:57 snmpd[0] <<< 61 69 6c 6f 76 65 72 Jul 6 05:14:57 snmpd[0] <<< Jul 6 05:14:57 snmpd[0] <<< OID : snmpTrapEnterprise.0 Jul 6 05:14:57 snmpd[0] <<< type : Object Jul 6 05:14:57 snmpd[0] <<< value: jnxProductNameSRX5600 Jul 6 05:14:57 snmpd[0] <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
Armadilha de failover automática
Jul 6 03:12:20 snmpd[0] <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< Jul 6 03:12:20 snmpd[0] <<< V1 Trap Jul 6 03:12:20 snmpd[0] <<< Source: 192.168.29.2 Jul 6 03:12:20 snmpd[0] <<< Destination: 10.204.132.188 Jul 6 03:12:20 snmpd[0] <<< Version: SNMPv1 Jul 6 03:12:20 snmpd[0] <<< Community: test Jul 6 03:12:20 snmpd[0] <<< Agent addr: 10.255.131.37 Jul 6 03:12:20 snmpd[0] <<< sysUpTime: (18763) 0:03:07.63 Jul 6 03:12:20 snmpd[0] <<< Enterprise: jnxJsChassisClusterMIB Jul 6 03:12:20 snmpd[0] <<< Generic trap: 6, Specific trap: 1 Jul 6 03:12:20 snmpd[0] <<< Jul 6 03:12:20 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoRedundancyGroup.0 Jul 6 03:12:20 snmpd[0] <<< type : OctetString Jul 6 03:12:20 snmpd[0] <<< value: "1" Jul 6 03:12:20 snmpd[0] <<< HEX : 31 Jul 6 03:12:20 snmpd[0] <<< Jul 6 03:12:20 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoClusterId.0 Jul 6 03:12:20 snmpd[0] <<< type : OctetString Jul 6 03:12:20 snmpd[0] <<< value: "12" Jul 6 03:12:20 snmpd[0] <<< HEX : 31 32 Jul 6 03:12:20 snmpd[0] <<< Jul 6 03:12:20 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoNodeId.0 Jul 6 03:12:20 snmpd[0] <<< type : OctetString Jul 6 03:12:20 snmpd[0] <<< value: "0" Jul 6 03:12:20 snmpd[0] <<< HEX : 30 Jul 6 03:12:20 snmpd[0] <<< Jul 6 03:12:20 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoPreviousState.0 Jul 6 03:12:20 snmpd[0] <<< type : OctetString Jul 6 03:12:20 snmpd[0] <<< value: "secondary-hold" Jul 6 03:12:20 snmpd[0] <<< HEX : 73 65 63 6f 6e 64 61 72 Jul 6 03:12:20 snmpd[0] <<< 79 2d 68 6f 6c 64 Jul 6 03:12:20 snmpd[0] <<< Jul 6 03:12:20 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoCurrentState.0 Jul 6 03:12:20 snmpd[0] <<< type : OctetString Jul 6 03:12:20 snmpd[0] <<< value: "secondary" Jul 6 03:12:20 snmpd[0] <<< HEX : 73 65 63 6f 6e 64 61 72 Jul 6 03:12:20 snmpd[0] <<< 79 Jul 6 03:12:20 snmpd[0] <<< Jul 6 03:12:20 snmpd[0] <<< OID : jnxJsChClusterSwitchoverInfoReason.0 Jul 6 03:12:20 snmpd[0] <<< type : OctetString Jul 6 03:12:20 snmpd[0] <<< value: "back to back failover interval expired" Jul 6 03:12:20 snmpd[0] <<< HEX : 62 61 63 6b 20 74 6f 20 Jul 6 03:12:20 snmpd[0] <<< 62 61 63 6b 20 66 61 69 Jul 6 03:12:20 snmpd[0] <<< 6c 6f 76 65 72 20 69 6e Jul 6 03:12:20 snmpd[0] <<< 74 65 72 76 61 6c 20 65 Jul 6 03:12:20 snmpd[0] <<< 78 70 69 72 65 64 Jul 6 03:12:20 snmpd[0] <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
Outras indicações para failover
Quando ocorre um failover no grupo de redundância RG0:
Uma armadilha de partida quente SNMP é enviada pelo novo nó primário.
Após um failover, as armadilhas do LinkUp são enviadas para todas as interfaces que surgem no novo nó primário.
As mensagens de syslog são enviadas do novo nó primário.
Gerenciamento e monitoramento de um cluster de chassi usando scripts operacionais e de eventos
Scripts de operação (op) do Junos OS automatizam o gerenciamento e a resolução de problemas de rede e roteadores. Os scripts op podem executar qualquer função disponível por meio das chamadas de procedimento remoto (RPCs) suportadas por qualquer uma das duas interfaces de programação de aplicativos (APIs): a API Junos OS Extensible Markup Language (XML) e a API de protocolo de gerenciamento Junos OS XML. Os scripts são escritos nas linguagens de linguagem de linguagem extensível (XSLT) ou linguagem de linguagem de estilo Syntax (SLAX).
Os scripts de op permitem que você:
Monitore o status geral de uma plataforma de roteamento.
Personalize a saída de comandos de modo operacional.
Reconfigure a plataforma de roteamento para evitar ou contornar problemas conhecidos no software Junos OS.
Altere a configuração do roteador em resposta a um problema.
Os scripts de eventos do Junos OS automatizam o gerenciamento e a solução de problemas de rede e roteador. Estes são scripts operacionais desencadeados por políticas de eventos.
Segue-se um exemplo de uma armadilha de eventos jnx. No exemplo, o script do ev-syslog-trap
evento levanta uma armadilha jnxEvent sempre que um alarme é acionado no dispositivo.
armadilha de eventos jnx
{ events SYSTEM; attributes-match { SYSTEM.message matches "Alarm set"; } then { event-script ev-syslog-trap.slax { arguments { event SYSTEM; message "{$$.message}"; } } } }
A armadilha a seguir é enviada para derrubar um link no dispositivo para definir um alarme.
Apr 16 05:09:43 snmpd[0] <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< Apr 16 05:09:43 snmpd[0] <<< V2 Trap Apr 16 05:09:43 snmpd[0] <<< Source: 116.197.178.12 Apr 16 05:09:43 snmpd[0] <<< Destination: 66.129.237.197 Apr 16 05:09:43 snmpd[0] <<< Version: SNMPv2 Apr 16 05:09:43 snmpd[0] <<< Community: test Apr 16 05:09:43 snmpd[0] <<< Apr 16 05:09:43 snmpd[0] <<< OID : sysUpTime.0 Apr 16 05:09:43 snmpd[0] <<< type : TimeTicks Apr 16 05:09:43 snmpd[0] <<< value: (246317536) 684:12:55.36 Apr 16 05:09:43 snmpd[0] <<< Apr 16 05:09:43 snmpd[0] <<< OID : snmpTrapOID.0 Apr 16 05:09:43 snmpd[0] <<< type : Object Apr 16 05:09:43 snmpd[0] <<< value: jnxEventTrap Apr 16 05:09:43 snmpd[0] <<< Apr 16 05:09:43 snmpd[0] <<< OID : jnxEventTrapDescr.0 Apr 16 05:09:43 snmpd[0] <<< type : OctetString Apr 16 05:09:43 snmpd[0] <<< value: "'Event-Trap'" Apr 16 05:09:43 snmpd[0] <<< HEX : 27 45 76 65 6e 74 2d 54 Apr 16 05:09:43 snmpd[0] <<< 72 61 70 27 Apr 16 05:09:43 snmpd[0] <<< Apr 16 05:09:43 snmpd[0] <<< OID : jnxEventAvAttribute.1 Apr 16 05:09:43 snmpd[0] <<< type : OctetString Apr 16 05:09:43 snmpd[0] <<< value: "'event'" Apr 16 05:09:43 snmpd[0] <<< HEX : 27 65 76 65 6e 74 27 Apr 16 05:09:43 snmpd[0] <<< Apr 16 05:09:43 snmpd[0] <<< OID : jnxEventAvValue.1 Apr 16 05:09:43 snmpd[0] <<< type : OctetString Apr 16 05:09:43 snmpd[0] <<< value: "'SYSTEM'" Apr 16 05:09:43 snmpd[0] <<< HEX : 27 53 59 53 54 45 4d 27 Apr 16 05:09:43 snmpd[0] <<< Apr 16 05:09:43 snmpd[0] <<< OID : jnxEventAvAttribute.2 Apr 16 05:09:43 snmpd[0] <<< type : OctetString Apr 16 05:09:43 snmpd[0] <<< value: "'message'" Apr 16 05:09:43 snmpd[0] <<< HEX : 27 6d 65 73 73 61 67 65 Apr 16 05:09:43 snmpd[0] <<< 27 Apr 16 05:09:43 snmpd[0] <<< Apr 16 05:09:43 snmpd[0] <<< OID : jnxEventAvValue.1 Apr 16 05:09:43 snmpd[0] <<< type : OctetString Apr 16 05:09:43 snmpd[0] <<< value: "' Minor alarm set, ge-1/0/0: Link down'" Apr 16 05:09:43 snmpd[0] <<< HEX : 27 20 4d 69 6e 6f 72 20 Apr 16 05:09:43 snmpd[0] <<< 61 6c 61 72 6d 20 73 65 Apr 16 05:09:43 snmpd[0] <<< 74 2c 20 67 65 2d 31 2f Apr 16 05:09:43 snmpd[0] <<< 30 2f 30 3a 20 4c 69 6e Apr 16 05:09:43 snmpd[0] <<< 6b 20 64 6f 77 6e 27 Apr 16 05:09:43 snmpd[0] <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
Usando o MIB de serviços públicos para monitorar um cluster de chassi
O MIB (jnxUtil) de serviços públicos da Juniper Networks é uma ferramenta poderosa para expor dados do Junos OS usando SNMP. Um MIB de utilidade genérica é definido para manter dados preenchidos por scripts de operações ou scripts de eventos. Há cinco tabelas separadas neste MIB, uma para cada um dos seguintes tipos de dados: contadores de 32 bits, contadores de 64 bits, inteiros assinados, inteiros não assinados e strings de octet. Cada instância de dados é identificada por um nome ASCII arbitrário definido quando os dados são preenchidos. Cada instância de dados também tem um cronograma correspondente identificando quando foi atualizado pela última vez.
Os dados nessas tabelas de MIB podem ser preenchidos usando comandos CLI ocultos, que também são acessíveis a partir de um script de operação usando a API jcs:invocação de chamadas de procedimento remoto (RPC).
Um dos exemplos que usamos para ler energia no dispositivo, que não está disponível usando SNMP, é o jnxUtil MIB. Com um script de evento simples, você pode ler a saída de energia a cada minuto e preencher o jnxUtil MIB. Da mesma forma, você pode escrever scripts de operações ou scripts de eventos que podem preencher uma variedade de dados de diferentes tipos. Para obter mais informações sobre exemplos de MIB de serviços públicos para scripts de amostra e uso do MIB utilitário, veja Exemplos de MIB de utilidades.