Nesta página

Visão geral do monitoramento de saúde
Configure o monitoramento de saúde em dispositivos que executam o Junos OS
Configure o monitoramento da saúde

Monitoramento de saúde com SNMP

Visão geral do monitoramento de saúde

O monitoramento de saúde é um recurso SNMP que estende a infraestrutura de alarme RMON para fornecer monitoramento para um conjunto predefinido de objetos (como uso de sistema de arquivos, uso de CPU e uso de memória) e para processos do Junos OS.

Você habilita o recurso do monitor de saúde usando a health-monitor declaração no nível de [edit snmp] hierarquia. Você também pode configurar parâmetros de monitoramento de saúde, como um limiar em queda, um limiar crescente e um intervalo. Se o valor de um objeto monitorado exceder o limiar de aumento ou queda, um alarme é acionado e um evento pode ser registrado.

O limiar de queda é o limiar mais baixo para a instância de objetos monitorados. O limiar crescente é o limiar superior para a instância de objetos monitorados. Cada limite é expresso como uma porcentagem do valor máximo possível. O intervalo representa o período de tempo, em segundos, sobre o qual a instância do objeto é amostrada e comparada com os limiares crescentes e em queda.

Os eventos só são gerados quando um limiar é cruzado pela primeira vez em qualquer direção, em vez de após cada intervalo de amostra. Por exemplo, se um alarme limiar crescente, juntamente com seu evento correspondente, for levantado, não ocorrerão mais eventos de travessia de limiar até que ocorra um alarme de queda correspondente.

As entradas de log do sistema para eventos de monitor de saúde têm uma tag HEALTHMONITOR correspondente e não uma tag de SNMPD_RMON_EVENTLOG genérica. No entanto, o monitor de saúde envia armadilhas de retenção genéricas de RMON subindoe caindo. Você pode usar o show snmp health-monitor comando operacional para visualizar informações sobre alarmes e logs do health monitor.

Quando você configura o monitor de saúde, as informações de monitoramento para determinadas instâncias de objetos estão disponíveis, conforme mostrado em Tabela 1.

Tabela 1: Instâncias de objetos monitorados
Objeto	Descrição
jnxHrStoragePercentused.1	Monitora o /dev/ad0s1a: sistema de arquivos no switch. Este é o sistema de arquivos raiz montado em /.
jnxHrStoragePercentused.2	Monitora o /dev/ad0s1e: sistema de arquivos no switch. Este é o sistema de arquivos de configuração montado em /config.
jnxOperatingCPU (RE0)	Monitora o uso de CPU pelo Mecanismo de Roteamento (RE0).
jnxOperatingBuffer (RE0)	Monitora a quantidade de memória disponível no Mecanismo de Roteamento (RE0).
sysApplElmtRunCPU	Monitora o uso de CPU para cada processo de Junos OS (também chamado de daemon). Várias instâncias do mesmo processo são monitoradas e indexadas separadamente.
sysApplElmtRunMemory	Monitora o uso de memória para cada processo do Junos OS. Várias instâncias do mesmo processo são monitoradas e indexadas separadamente.

Configure o monitoramento de saúde em dispositivos que executam o Junos OS

À medida que o número de dispositivos gerenciados por um sistema de gerenciamento de rede (NMS) típico cresce e a complexidade dos próprios dispositivos aumenta, torna-se cada vez mais impraticável para o NMS usar a votação para monitorar os dispositivos. Uma abordagem mais escalável é confiar em dispositivos de rede para notificar o NMS quando algo requer atenção.

Nos roteadores da Juniper Networks, alarmes e eventos RMON fornecem grande parte da infraestrutura necessária para reduzir as despesas gerais de votação do NMS. No entanto, com essa abordagem, você deve configurar o NMS para configurar objetos MIB específicos em alarmes RMON. Isso muitas vezes requer experiência específica do dispositivo e personalização do aplicativo de monitoramento. Além disso, algumas instâncias de objetos MIB que precisam de monitoramento são definidas apenas na inicialização ou mudança no tempo de execução e não podem ser configuradas com antecedência.

Para resolver esses problemas, o monitor de saúde estende a infraestrutura de alarme RMON para fornecer monitoramento predefinido para um conjunto selecionado de instâncias de objetos (para uso de sistema de arquivos, uso de CPU e uso de memória) e inclui suporte para instâncias de objetos desconhecidos ou dinâmicos (como processos do Junos OS).

O monitoramento de saúde foi projetado para minimizar os requisitos de configuração do usuário. Para configurar as entradas de monitoramento de saúde, inclua a health-monitor declaração no nível de [edit snmp] hierarquia:

A configuração de eventos de monitoramento no nível de [edit snmp health-monitor] hierarquia define intervalos de votação para a integridade geral do sistema. Se você definir essas mesmas opções no nível de [edit snmp health-monitor idp] hierarquia, um evento SNMP é gerado pelo dispositivo se a porcentagem de memória de dataplane utilizada pelo sistema de detecção e prevenção de intrusões (IDP) subir acima ou ficar abaixo de suas configurações.

Você pode usar o show snmp health-monitor comando operacional para visualizar informações sobre alarmes e logs do health monitor.

Este tópico descreve a configuração mínima necessária e discute as seguintes tarefas para configurar o monitor de saúde:

Objetos monitorados
Configuração mínima de monitoramento da saúde
Configure o limite de queda ou o limite crescente
Configure o intervalo
Registrar entradas e armadilhas

Objetos monitorados

Quando você configura o monitor de saúde, as informações de monitoramento para determinadas instâncias de objetos estão disponíveis, conforme mostrado em Tabela 2.

Tabela 2: Instâncias de objetos monitorados
Objeto	Descrição
`jnxHrStoragePercentUsed.1`	Monitora o seguinte sistema de arquivos no roteador ou switch: `/dev/ad0s1a:` Este é o sistema de arquivos raiz montado em /.
`jnxHrStoragePercentUsed.2`	Monitora o seguinte sistema de arquivos no roteador ou switch: `/dev/ad0s1e:` Este é o sistema de arquivos de configuração montado em `/config`.
`jnxOperatingCPU (RE0)`	Monitora o uso de CPU para mecanismos de roteamento (`RE0` e `RE1`). Os valores de índice atribuídos aos mecanismos de roteamento dependem se o Chassis MIB usa um esquema de indexação baseado em zero ou baseado em ones. Como o esquema de indexação é configurável, o índice adequado é determinado quando o roteador ou switch é inicializado e quando há uma mudança de configuração. Se o roteador ou switch tiver apenas um mecanismo de roteamento, o monitoramento `RE1` da entrada do alarme será removido após cinco tentativas fracassadas de obter o valor da CPU.
`jnxOperatingCPU (RE1)`
`jnxOperatingBuffer (RE0)`	Monitora a quantidade de memória disponível nos mecanismos de roteamento (`RE0` e `RE1`). Como a indexação deste objeto é idêntica à usada para `jnxOperatingCPU`, os valores do índice são ajustados dependendo do esquema de indexação usado no Chassis MIB. Como acontece, `jnxOperatingCPU`o monitoramento `RE1` de entrada de alarme é removido se o roteador ou switch tiver apenas um mecanismo de roteamento.
`jnxOperatingBuffer (RE1)`
`sysApplElmtRunCPU`	Monitora o uso de CPU para cada processo de Junos OS (também chamado de daemon). Várias instâncias do mesmo processo são monitoradas e indexadas separadamente.
`sysApplElmtRunMemory`	Monitora o uso de memória para cada processo do Junos OS. Várias instâncias do mesmo processo são monitoradas e indexadas separadamente.

Configuração mínima de monitoramento da saúde

Para permitir o monitoramento de saúde no roteador ou switch, inclua a health-monitor declaração no nível de [edit snmp] hierarquia:

Configure o limite de queda ou o limite crescente

O limiar de queda é o limiar mais baixo (expresso como porcentagem do valor máximo possível) para a variável monitorada. Quando o valor amostrado atual é menor ou igual a esse limiar, e o valor no último intervalo de amostragem é maior do que este limiar, um único evento é gerado. Um único evento também é gerado se a primeira amostra após esta entrada se tornar válida for menor ou igual a esse limite. Após a geração de um evento em queda, outro evento em queda não pode ser gerado até que o valor amostrado suba acima desse limiar e atinja o limite crescente. Você deve especificar o limite de queda como uma porcentagem do valor máximo possível. O padrão é 70 por cento.

Por padrão, o limite crescente é 80 por cento do valor máximo possível para a instância de objetos monitorados. O limiar crescente é o limiar superior para a variável monitorada. Quando o valor amostrado atual é maior ou igual a esse limiar, e o valor no último intervalo de amostragem é menor do que este limiar, um único evento é gerado. Um único evento também é gerado se a primeira amostra após esta entrada se tornar válida for maior ou igual a esse limite. Após a geração de um evento crescente, outro evento crescente não pode ser gerado até que o valor amostrado fique abaixo desse limiar e atinja o limiar de queda. Você deve especificar o limite crescente como uma porcentagem do valor máximo possível para a variável monitorada.

Para configurar o limiar de queda ou o limite crescente, inclua a declaração ou rising-threshold a falling-threshold declaração no nível de [edit snmp health-monitor] hierarquia:

percentage pode ser um valor de 1 até 100.

Os limiares de queda e aumento se aplicam a todas as instâncias de objetos monitoradas pelo monitor de saúde.

Configure o intervalo

O intervalo representa o período de tempo, em segundos, sobre o qual a instância do objeto é amostrada e comparada com os limiares crescentes e em queda.

Para configurar o intervalo, inclua a interval declaração e especifique o número de segundos no nível de [edit snmp health-monitor] hierarquia:

seconds pode ser um valor de 1 até 2147483647. O padrão é 300 segundos (5 minutos).

Registrar entradas e armadilhas

As entradas de log do sistema geradas para quaisquer eventos de monitor de saúde (limiares cruzados, erros e assim por diante) têm uma tag correspondente HEALTHMONITOR em vez de uma tag genérica SNMPD_RMON_EVENTLOG . No entanto, o monitor de saúde envia RMON risingThreshold e fallingThreshold armadilhas genéricas.

Configure o monitoramento da saúde

Este tópico descreve como configurar o recurso do monitor de saúde para dispositivos da Série QFX.

O recurso do monitor de saúde estende a infraestrutura de alarme SNMP RMON para fornecer monitoramento predefinido para um conjunto selecionado de instâncias de objetos (como uso de sistema de arquivos, uso de CPU e uso de memória) e instâncias dinâmicas de objetos (como processos do Junos OS).

Neste procedimento, o intervalo de amostragem é a cada 600 segundo (10 minutos), o limiar de queda é 85 por cento do valor máximo possível para cada instância de objeto monitorada, e o limiar de aumento é 75 por cento do valor máximo possível para cada instância de objeto monitorado.

Para configurar o monitoramento de saúde:

Configure o monitor de saúde:

Configure o limiar de queda:

Por exemplo:

Configure o limite crescente:

Por exemplo:

Configure o intervalo:

Por exemplo:

Nesta página

Monitoramento de saúde com SNMP

Visão geral do monitoramento de saúde

Configure o monitoramento de saúde em dispositivos que executam o Junos OS

Objetos monitorados

Configuração mínima de monitoramento da saúde

Configure o limite de queda ou o limite crescente

Configure o intervalo

Registrar entradas e armadilhas

Consulte também

Configure o monitoramento da saúde

Consulte também