Monitoramento de saúde com SNMP
Visão geral do monitoramento de saúde
O monitoramento de saúde é um recurso SNMP que estende a infraestrutura de alarme RMON para fornecer monitoramento para um conjunto predefinido de objetos (como uso de sistema de arquivos, uso de CPU e uso de memória) e para processos do Junos OS.
Você habilita o recurso do monitor de saúde usando a declaração no nível de hierarquia.health-monitor
[edit snmp]
Você também pode configurar parâmetros de monitoramento de saúde, como um limiar em queda, um limiar crescente e um intervalo. Se o valor de um objeto monitorado exceder o limiar de aumento ou queda, um alarme é acionado e um evento pode ser registrado.
O limiar de queda é o limiar mais baixo para a instância de objetos monitorados. O limiar crescente é o limiar superior para a instância de objetos monitorados. Cada limite é expresso como uma porcentagem do valor máximo possível. O intervalo representa o período de tempo, em segundos, sobre o qual a instância do objeto é amostrada e comparada com os limiares crescentes e em queda.
Os eventos só são gerados quando um limiar é cruzado pela primeira vez em qualquer direção, em vez de após cada intervalo de amostra. Por exemplo, se um alarme limiar crescente, juntamente com seu evento correspondente, for levantado, não ocorrerão mais eventos de travessia de limiar até que ocorra um alarme de queda correspondente.
As entradas de log do sistema para eventos de monitor de saúde têm uma tag HEALTHMONITOR correspondente e não uma tag de SNMPD_RMON_EVENTLOG genérica. No entanto, o monitor de saúde envia armadilhas de retenção genéricas de RMON subindoe caindo. Você pode usar o comando operacional para visualizar informações sobre alarmes e logs do health monitor.show snmp health-monitor
Quando você configura o monitor de saúde, as informações de monitoramento para determinadas instâncias de objetos estão disponíveis, conforme mostrado em .Tabela 1
Objeto |
Descrição |
---|---|
jnxHrStoragePercentused.1 |
Monitora o sistema de arquivos no switch./dev/ad0s1a: Este é o sistema de arquivos raiz montado em /. |
jnxHrStoragePercentused.2 |
Monitora o sistema de arquivos no switch./dev/ad0s1e: Este é o sistema de arquivos de configuração montado em ./config |
jnxOperatingCPU (RE0) |
Monitora o uso de CPU pelo Mecanismo de Roteamento (RE0). |
jnxOperatingBuffer (RE0) |
Monitora a quantidade de memória disponível no Mecanismo de Roteamento (RE0). |
sysApplElmtRunCPU |
Monitora o uso de CPU para cada processo de Junos OS (também chamado de daemon). Várias instâncias do mesmo processo são monitoradas e indexadas separadamente. |
sysApplElmtRunMemory |
Monitora o uso de memória para cada processo do Junos OS. Várias instâncias do mesmo processo são monitoradas e indexadas separadamente. |
Consulte também
Configure o monitoramento de saúde em dispositivos que executam o Junos OS
À medida que o número de dispositivos gerenciados por um sistema de gerenciamento de rede (NMS) típico cresce e a complexidade dos próprios dispositivos aumenta, torna-se cada vez mais impraticável para o NMS usar a votação para monitorar os dispositivos. Uma abordagem mais escalável é confiar em dispositivos de rede para notificar o NMS quando algo requer atenção.
Nos roteadores da Juniper Networks, alarmes e eventos RMON fornecem grande parte da infraestrutura necessária para reduzir as despesas gerais de votação do NMS. No entanto, com essa abordagem, você deve configurar o NMS para configurar objetos MIB específicos em alarmes RMON. Isso muitas vezes requer experiência específica do dispositivo e personalização do aplicativo de monitoramento. Além disso, algumas instâncias de objetos MIB que precisam de monitoramento são definidas apenas na inicialização ou mudança no tempo de execução e não podem ser configuradas com antecedência.
Para resolver esses problemas, o monitor de saúde estende a infraestrutura de alarme RMON para fornecer monitoramento predefinido para um conjunto selecionado de instâncias de objetos (para uso de sistema de arquivos, uso de CPU e uso de memória) e inclui suporte para instâncias de objetos desconhecidos ou dinâmicos (como processos do Junos OS).
O monitoramento de saúde foi projetado para minimizar os requisitos de configuração do usuário. Para configurar as entradas de monitoramento de saúde, inclua a declaração no nível de hierarquia:health-monitor
[edit snmp]
[edit snmp] health-monitor { falling-threshold percentage; interval seconds; rising-threshold percentage; idp { falling-threshold percentage; interval seconds; rising-threshold percentage; } }
A configuração de eventos de monitoramento no nível de hierarquia define intervalos de votação para a integridade geral do sistema.[edit snmp health-monitor]
Se você definir essas mesmas opções no nível de hierarquia, um evento SNMP é gerado pelo dispositivo se a porcentagem de memória de dataplane utilizada pelo sistema de detecção e prevenção de intrusões (IDP) subir acima ou ficar abaixo de suas configurações.[edit snmp health-monitor idp]
Você pode usar o comando operacional para visualizar informações sobre alarmes e logs do health monitor.show snmp health-monitor
Este tópico descreve a configuração mínima necessária e discute as seguintes tarefas para configurar o monitor de saúde:
- Objetos monitorados
- Configuração mínima de monitoramento da saúde
- Configure o limite de queda ou o limite crescente
- Configure o intervalo
- Registrar entradas e armadilhas
Objetos monitorados
Quando você configura o monitor de saúde, as informações de monitoramento para determinadas instâncias de objetos estão disponíveis, conforme mostrado em .Tabela 2
Objeto |
Descrição |
---|---|
|
Monitora o seguinte sistema de arquivos no roteador ou switch:
Este é o sistema de arquivos raiz montado em /. |
|
Monitora o seguinte sistema de arquivos no roteador ou switch:
Este é o sistema de arquivos de configuração montado em . |
|
Monitora o uso de CPU para mecanismos de roteamento ( e ). |
|
|
|
Monitora a quantidade de memória disponível nos mecanismos de roteamento ( e ). |
|
|
|
Monitora o uso de CPU para cada processo de Junos OS (também chamado de daemon). Várias instâncias do mesmo processo são monitoradas e indexadas separadamente. |
|
Monitora o uso de memória para cada processo do Junos OS. Várias instâncias do mesmo processo são monitoradas e indexadas separadamente. |
Configuração mínima de monitoramento da saúde
Para permitir o monitoramento de saúde no roteador ou switch, inclua a declaração no nível de hierarquia:health-monitor
[edit snmp]
[edit snmp] health-monitor;
Configure o limite de queda ou o limite crescente
O limiar de queda é o limiar mais baixo (expresso como porcentagem do valor máximo possível) para a variável monitorada. Quando o valor amostrado atual é menor ou igual a esse limiar, e o valor no último intervalo de amostragem é maior do que este limiar, um único evento é gerado. Um único evento também é gerado se a primeira amostra após esta entrada se tornar válida for menor ou igual a esse limite. Após a geração de um evento em queda, outro evento em queda não pode ser gerado até que o valor amostrado suba acima desse limiar e atinja o limite crescente. Você deve especificar o limite de queda como uma porcentagem do valor máximo possível. O padrão é por cento.70
Por padrão, o limite crescente é por cento do valor máximo possível para a instância de objetos monitorados.80
O limiar crescente é o limiar superior para a variável monitorada. Quando o valor amostrado atual é maior ou igual a esse limiar, e o valor no último intervalo de amostragem é menor do que este limiar, um único evento é gerado. Um único evento também é gerado se a primeira amostra após esta entrada se tornar válida for maior ou igual a esse limite. Após a geração de um evento crescente, outro evento crescente não pode ser gerado até que o valor amostrado fique abaixo desse limiar e atinja o limiar de queda. Você deve especificar o limite crescente como uma porcentagem do valor máximo possível para a variável monitorada.
Para configurar o limiar de queda ou o limite crescente, inclua a declaração ou a declaração no nível de hierarquia:falling-threshold
rising-threshold
[edit snmp health-monitor]
[edit snmp health-monitor] falling-threshold percentage; rising-threshold percentage;
pode ser um valor de até .percentage
1
100
Os limiares de queda e aumento se aplicam a todas as instâncias de objetos monitoradas pelo monitor de saúde.
Configure o intervalo
O intervalo representa o período de tempo, em segundos, sobre o qual a instância do objeto é amostrada e comparada com os limiares crescentes e em queda.
Para configurar o intervalo, inclua a declaração e especifique o número de segundos no nível de hierarquia:interval
[edit snmp health-monitor]
[edit snmp health-monitor] interval seconds;
pode ser um valor de até .seconds
1
2147483647
O padrão é segundos (5 minutos).300
Registrar entradas e armadilhas
As entradas de log do sistema geradas para quaisquer eventos de monitor de saúde (limiares cruzados, erros e assim por diante) têm uma tag correspondente em vez de uma tag genérica .HEALTHMONITOR
SNMPD_RMON_EVENTLOG
No entanto, o monitor de saúde envia RMON e armadilhas genéricas.risingThreshold
fallingThreshold
Consulte também
Configure o monitoramento da saúde
Este tópico descreve como configurar o recurso do monitor de saúde para dispositivos da Série QFX.
O recurso do monitor de saúde estende a infraestrutura de alarme SNMP RMON para fornecer monitoramento predefinido para um conjunto selecionado de instâncias de objetos (como uso de sistema de arquivos, uso de CPU e uso de memória) e instâncias dinâmicas de objetos (como processos do Junos OS).
Neste procedimento, o intervalo de amostragem é a cada segundo (10 minutos), o limiar de queda é por cento do valor máximo possível para cada instância de objeto monitorada, e o limiar de aumento é por cento do valor máximo possível para cada instância de objeto monitorado.600
85
75
Para configurar o monitoramento de saúde: