Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Monitoramento de saúde com SNMP

Visão geral do monitoramento de saúde

O monitoramento de saúde é um recurso SNMP que estende a infraestrutura de alarme RMON para fornecer monitoramento para um conjunto predefinido de objetos (como uso de sistema de arquivos, uso de CPU e uso de memória) e para processos do Junos OS.

Você habilita o recurso do monitor de saúde usando a declaração no nível de hierarquia.health-monitor[edit snmp] Você também pode configurar parâmetros de monitoramento de saúde, como um limiar em queda, um limiar crescente e um intervalo. Se o valor de um objeto monitorado exceder o limiar de aumento ou queda, um alarme é acionado e um evento pode ser registrado.

O limiar de queda é o limiar mais baixo para a instância de objetos monitorados. O limiar crescente é o limiar superior para a instância de objetos monitorados. Cada limite é expresso como uma porcentagem do valor máximo possível. O intervalo representa o período de tempo, em segundos, sobre o qual a instância do objeto é amostrada e comparada com os limiares crescentes e em queda.

Os eventos só são gerados quando um limiar é cruzado pela primeira vez em qualquer direção, em vez de após cada intervalo de amostra. Por exemplo, se um alarme limiar crescente, juntamente com seu evento correspondente, for levantado, não ocorrerão mais eventos de travessia de limiar até que ocorra um alarme de queda correspondente.

As entradas de log do sistema para eventos de monitor de saúde têm uma tag HEALTHMONITOR correspondente e não uma tag de SNMPD_RMON_EVENTLOG genérica. No entanto, o monitor de saúde envia armadilhas de retenção genéricas de RMON subindoe caindo. Você pode usar o comando operacional para visualizar informações sobre alarmes e logs do health monitor.show snmp health-monitor

Quando você configura o monitor de saúde, as informações de monitoramento para determinadas instâncias de objetos estão disponíveis, conforme mostrado em .Tabela 1

Tabela 1: Instâncias de objetos monitorados

Objeto

Descrição

jnxHrStoragePercentused.1

Monitora o sistema de arquivos no switch./dev/ad0s1a: Este é o sistema de arquivos raiz montado em /.

jnxHrStoragePercentused.2

Monitora o sistema de arquivos no switch./dev/ad0s1e: Este é o sistema de arquivos de configuração montado em ./config

jnxOperatingCPU (RE0)

Monitora o uso de CPU pelo Mecanismo de Roteamento (RE0).

jnxOperatingBuffer (RE0)

Monitora a quantidade de memória disponível no Mecanismo de Roteamento (RE0).

sysApplElmtRunCPU

Monitora o uso de CPU para cada processo de Junos OS (também chamado de daemon). Várias instâncias do mesmo processo são monitoradas e indexadas separadamente.

sysApplElmtRunMemory

Monitora o uso de memória para cada processo do Junos OS. Várias instâncias do mesmo processo são monitoradas e indexadas separadamente.

Configure o monitoramento de saúde em dispositivos que executam o Junos OS

À medida que o número de dispositivos gerenciados por um sistema de gerenciamento de rede (NMS) típico cresce e a complexidade dos próprios dispositivos aumenta, torna-se cada vez mais impraticável para o NMS usar a votação para monitorar os dispositivos. Uma abordagem mais escalável é confiar em dispositivos de rede para notificar o NMS quando algo requer atenção.

Nos roteadores da Juniper Networks, alarmes e eventos RMON fornecem grande parte da infraestrutura necessária para reduzir as despesas gerais de votação do NMS. No entanto, com essa abordagem, você deve configurar o NMS para configurar objetos MIB específicos em alarmes RMON. Isso muitas vezes requer experiência específica do dispositivo e personalização do aplicativo de monitoramento. Além disso, algumas instâncias de objetos MIB que precisam de monitoramento são definidas apenas na inicialização ou mudança no tempo de execução e não podem ser configuradas com antecedência.

Para resolver esses problemas, o monitor de saúde estende a infraestrutura de alarme RMON para fornecer monitoramento predefinido para um conjunto selecionado de instâncias de objetos (para uso de sistema de arquivos, uso de CPU e uso de memória) e inclui suporte para instâncias de objetos desconhecidos ou dinâmicos (como processos do Junos OS).

O monitoramento de saúde foi projetado para minimizar os requisitos de configuração do usuário. Para configurar as entradas de monitoramento de saúde, inclua a declaração no nível de hierarquia:health-monitor[edit snmp]

A configuração de eventos de monitoramento no nível de hierarquia define intervalos de votação para a integridade geral do sistema.[edit snmp health-monitor] Se você definir essas mesmas opções no nível de hierarquia, um evento SNMP é gerado pelo dispositivo se a porcentagem de memória de dataplane utilizada pelo sistema de detecção e prevenção de intrusões (IDP) subir acima ou ficar abaixo de suas configurações.[edit snmp health-monitor idp]

Você pode usar o comando operacional para visualizar informações sobre alarmes e logs do health monitor.show snmp health-monitor

Este tópico descreve a configuração mínima necessária e discute as seguintes tarefas para configurar o monitor de saúde:

Objetos monitorados

Quando você configura o monitor de saúde, as informações de monitoramento para determinadas instâncias de objetos estão disponíveis, conforme mostrado em .Tabela 2

Tabela 2: Instâncias de objetos monitorados

Objeto

Descrição

jnxHrStoragePercentUsed.1

Monitora o seguinte sistema de arquivos no roteador ou switch:

/dev/ad0s1a:

Este é o sistema de arquivos raiz montado em /.

jnxHrStoragePercentUsed.2

Monitora o seguinte sistema de arquivos no roteador ou switch:

/dev/ad0s1e:

Este é o sistema de arquivos de configuração montado em ./config

jnxOperatingCPU (RE0)

Monitora o uso de CPU para mecanismos de roteamento ( e ).RE0RE1 Os valores de índice atribuídos aos mecanismos de roteamento dependem se o Chassis MIB usa um esquema de indexação baseado em zero ou baseado em ones. Como o esquema de indexação é configurável, o índice adequado é determinado quando o roteador ou switch é inicializado e quando há uma mudança de configuração. Se o roteador ou switch tiver apenas um mecanismo de roteamento, o monitoramento da entrada do alarme será removido após cinco tentativas fracassadas de obter o valor da CPU.RE1

jnxOperatingCPU (RE1)

jnxOperatingBuffer (RE0)

Monitora a quantidade de memória disponível nos mecanismos de roteamento ( e ).RE0RE1 Como a indexação deste objeto é idêntica à usada para , os valores do índice são ajustados dependendo do esquema de indexação usado no Chassis MIB.jnxOperatingCPU Como acontece, o monitoramento de entrada de alarme é removido se o roteador ou switch tiver apenas um mecanismo de roteamento.jnxOperatingCPURE1

jnxOperatingBuffer (RE1)

sysApplElmtRunCPU

Monitora o uso de CPU para cada processo de Junos OS (também chamado de daemon). Várias instâncias do mesmo processo são monitoradas e indexadas separadamente.

sysApplElmtRunMemory

Monitora o uso de memória para cada processo do Junos OS. Várias instâncias do mesmo processo são monitoradas e indexadas separadamente.

Configuração mínima de monitoramento da saúde

Para permitir o monitoramento de saúde no roteador ou switch, inclua a declaração no nível de hierarquia:health-monitor[edit snmp]

Configure o limite de queda ou o limite crescente

O limiar de queda é o limiar mais baixo (expresso como porcentagem do valor máximo possível) para a variável monitorada. Quando o valor amostrado atual é menor ou igual a esse limiar, e o valor no último intervalo de amostragem é maior do que este limiar, um único evento é gerado. Um único evento também é gerado se a primeira amostra após esta entrada se tornar válida for menor ou igual a esse limite. Após a geração de um evento em queda, outro evento em queda não pode ser gerado até que o valor amostrado suba acima desse limiar e atinja o limite crescente. Você deve especificar o limite de queda como uma porcentagem do valor máximo possível. O padrão é por cento.70

Por padrão, o limite crescente é por cento do valor máximo possível para a instância de objetos monitorados.80 O limiar crescente é o limiar superior para a variável monitorada. Quando o valor amostrado atual é maior ou igual a esse limiar, e o valor no último intervalo de amostragem é menor do que este limiar, um único evento é gerado. Um único evento também é gerado se a primeira amostra após esta entrada se tornar válida for maior ou igual a esse limite. Após a geração de um evento crescente, outro evento crescente não pode ser gerado até que o valor amostrado fique abaixo desse limiar e atinja o limiar de queda. Você deve especificar o limite crescente como uma porcentagem do valor máximo possível para a variável monitorada.

Para configurar o limiar de queda ou o limite crescente, inclua a declaração ou a declaração no nível de hierarquia:falling-thresholdrising-threshold[edit snmp health-monitor]

pode ser um valor de até .percentage1100

Os limiares de queda e aumento se aplicam a todas as instâncias de objetos monitoradas pelo monitor de saúde.

Configure o intervalo

O intervalo representa o período de tempo, em segundos, sobre o qual a instância do objeto é amostrada e comparada com os limiares crescentes e em queda.

Para configurar o intervalo, inclua a declaração e especifique o número de segundos no nível de hierarquia:interval[edit snmp health-monitor]

pode ser um valor de até .seconds12147483647 O padrão é segundos (5 minutos).300

Registrar entradas e armadilhas

As entradas de log do sistema geradas para quaisquer eventos de monitor de saúde (limiares cruzados, erros e assim por diante) têm uma tag correspondente em vez de uma tag genérica .HEALTHMONITORSNMPD_RMON_EVENTLOG No entanto, o monitor de saúde envia RMON e armadilhas genéricas.risingThresholdfallingThreshold

Configure o monitoramento da saúde

Este tópico descreve como configurar o recurso do monitor de saúde para dispositivos da Série QFX.

O recurso do monitor de saúde estende a infraestrutura de alarme SNMP RMON para fornecer monitoramento predefinido para um conjunto selecionado de instâncias de objetos (como uso de sistema de arquivos, uso de CPU e uso de memória) e instâncias dinâmicas de objetos (como processos do Junos OS).

Neste procedimento, o intervalo de amostragem é a cada segundo (10 minutos), o limiar de queda é por cento do valor máximo possível para cada instância de objeto monitorada, e o limiar de aumento é por cento do valor máximo possível para cada instância de objeto monitorado.6008575

Para configurar o monitoramento de saúde:

  1. Configure o monitor de saúde:
  2. Configure o limiar de queda:

    Por exemplo:

  3. Configure o limite crescente:

    Por exemplo:

  4. Configure o intervalo:

    Por exemplo: