O que é um NRE?

O que é um NRE?

Um engenheiro de confiabilidade de rede (NRE) é uma função de operações de TI que utiliza a engenharia para medir e automatizar a confiabilidade da rede para se alinhar com objetivos, acordos e metas de nível de serviço da organização e negócios de TI. A prática do NRE é chamada de engenharia de confiabilidade de rede.

O que um engenheiro de confiabilidade de rede faz?

A proliferação da tecnologia de automação de redes está abrindo os olhos dos operadores, no entanto, o foco em ferramentas tem levado a fluxos de trabalho automatizados incrementais nas redes. O foco do NRE na engenharia é totalmente oposto à abordagem tradicional. Ele combina as tarefas de um engenheiro de software (construção, teste, implantação e operação) com as de um engenheiro de confiabilidade de site (SRE, na sigla em inglês) (implementando DevOps). Os NREs executam os princípios e comportamentos de DevNetOps para criar um pipeline de rede.

Embora algumas funções de um NRE envolvam tarefas de operações, como realizar atualizações, auditorias, mudanças de solicitações e lidar com incidentes, o seu foco principal é:

  • Construir e implementar a rede em um pipeline DevNetOps
  • Automatizar o manuseio da dinâmica da rede
  • Integrar sistemas
  • Automatizar fluxos de trabalho
  • Eliminar o trabalho pesado
  • Automatizar a solução de problemas com testes proativos
  • Projetar confiabilidade por meio de resposta automatizada
  • Alinhar os orçamentos para erros e os objetivos no nível de serviço

Comportamentos da engenharia de confiabilidade de rede

Comportamento

Descrição

Codificar

Ao começar com a aquisição de software de rede e sistemas de hardware (geralmente chamados de dia 0), um NRE codifica os artefatos de software, segredos e configurações da rede em repositórios de código-fonte, como um desenvolvedor de software.

Automatizar

Através de um pipeline DevNetOps, um NRE automatiza a integração de testes e versões reproduzíveis de implantações. Além da primeira implantação e atualização, um NRE também usa esse pipeline para projetar confiabilidade na produção, escala, otimizações de eficiência, provisionamento dinâmico de recursos de rede para seus consumidores e integração de sistemas.

Testar

Por meio de automação, preparação, testes de estresse e engenharia de caos, um NRE garante que as entregas sejam confiáveis o suficiente para atender os objetivos e acordos de nível de serviço.

Monitorar

Um NRE monitora indicadores de nível de serviço, tanto de maneira manual como automática, com análises que desencadeiam respostas automáticas e alertas para eventos anômalos e estatisticamente significativos. Os registros e telemetria são coletados e analisados para obter insights de eficiência, planejar necessidades de capacidade e automatizar a capacidade na infraestrutura de rede de nuvem elástica.

Mensurar

Por fim, a cultura NRE valoriza a verdade e a transparência, e usa indicadores para medir a eficácia em atender metas de confiabilidade, como MTBF (Mean Time Between Failures, sigla para tempo médio entre falhas) e MTTR (Mean Time To Repair, sigla para tempo médio para reparo).

Benefícios da engenharia de confiabilidade de rede

A confiabilidade é o valor mais importante do NRE! Embora a velocidade de avanço da tecnologia e a velocidade dos negócios sejam economias importantes, elas são inúteis sem uma base confiável. Como os princípios do DevNetOps valorizam a evolução e a velocidade por pequenas mudanças incrementais, a velocidade e a agilidade de uma arquitetura evolutiva são muitas vezes subprodutos bem-vindos.

Os NREs ganham uma compreensão completa de como a rede se degrada e quebra sob pressão, o que fornece oportunidades de automatizar e documentar respostas a incidentes. Isto encoraja uma abordagem proativa para prevenir interrupções de produção.

Em um nível de recursos individuais, os NREs relatam menor ansiedade de implementação e maior satisfação no trabalho.

Em geral, os NREs estabelecem simplicidade em operações e gerenciamento. Em operações de rede, existem muitas variáveis para controlar, proteger e auditar, resultando em uma complexidade enorme. Os NREs resolvem a complexidade com uma fonte de verdade bem codificada e resposta automática, que leva a uma rede autônoma.

Qual é a relação entre NRE, SDN e NFV?

Você pode aplicar a engenharia de confiabilidade de rede igualmente aos sistemas de hardware e software de rede. Aplicar NRE em uma rede definida por software (SDN) pura (tanto virtualização de funções de rede (NFV)ou SDN na nuvem) é mais fácil de simular e testar, já que nenhum laboratório de hardware de rede ou laboratório virtual é necessário. O controle SDN de hardware também é mais fácil de ser implementado pelos NREs, porque os sistemas SDN automatizam e abstraem o controle e configuração de redes de arquiteturas inteiras em seu determinado domínio, permitindo que os NREs evitem 'reinventar a roda' de sistemas SDN que possam existir.

Como não existem sistemas sem erros, o trabalho de um NRE nunca termina. Semelhante à cultura SRE e DevOps, o NRE e a cultura DevNetOps valorizam um espaço para falhas, resultando em correções rápidas e lições aprendidas. A melhoria contínua, ou kaizen (uma palavra em japonês para "boa mudança"), não significa estar em equilíbrio, significa recuperá-lo. E não é possível se recuperar se não for permitido falhar em primeiro lugar.  1Pesquisas em diversos campos mostram que essa abordagem leva a melhores resultados. Assim, os NREs visam a evolução, não a perfeição. Ao dividir o tempo entre a engenharia e a operação, os NREs são bem informados sobre falhas, registram lições e incorporam melhorias continuamente às ferramentas e processos automatizados.