Qu'est-ce qu'un NRE ?

Qu'est-ce qu'un NRE ?

Un ingénieur en fiabilité du réseau (NRE) est un employé du service informatique qui applique une approche d'ingénierie pour mesurer et automatiser la fiabilité du réseau afin de respecter les objectifs et accords de niveau de service ainsi que les objectifs du service informatique et de l'entreprise. Les NRE pratiquent l'ingénierie de fiabilité du réseau.

Que fait un ingénieur de fiabilité du réseau ?

La prolifération de technologies d'automatisation du réseau ouvre les yeux des opérateurs de réseau. Cependant, les recherches sur les outils ont principalement conduit à une hausse des flux de travail automatisés sur les réseaux. L'approche sur l'ingénierie des NRE est le contraire de l'approche traditionnelle. Elle combine les tâches d'un ingénieur logiciel (création, test, déploiement et exploitation) avec celles d'un ingénieur de fiabilité du site (SRE) (mise en œuvre de DevOps). Les NRE mettent en œuvre les principes et comportements de DevNetOps pour bâtir un pipeline de réseau.

Bien qu'une partie du travail d'un NRE implique des opérations courantes, comme les mises à niveau, les audits, les demandes de modification et la gestion des incidents, leurs principales tâches consistent à :

  • Construire et déployer le réseau sur un pipeline DevNetOps
  • Automatiser la gestion de la dynamique du réseau
  • Intégrer des systèmes
  • Automatiser les flux de travail
  • Supprimer les tâches complexes
  • Automatiser le dépannage grâce à des tests proactifs
  • Créer une fiabilité grâce à une réponse automatisée
  • Respecter les budgets alloués aux erreurs et les objectifs de niveau de service

Comportements d'ingénierie de fiabilité du réseau

Comportement

Description

Codifier

À partir de l'acquisition des systèmes matériels et logiciels d'un réseau (communément appelée Jour 0), le NRE codifie les artefacts logiciels, les secrets et la configuration du réseau dans des dépôts de code source semblables à ceux d'un développeur de logiciels.

Automatisation

Grâce à un pipeline DevNetOps, le NRE automatise l'exécution de déploiements de test, reproductibles et versionnés. Au delà du premier déploiement et des mises à jour, le NRE utilise également ce pipeline durant l'exploitation pour optimiser la fiabilité, l'évolutivité, et l'efficacité, mais aussi l'intégration de systèmes et l'approvisionnement dynamique des ressources pour les utilisateurs.

Test

Grâce à l'automatisation, à la planification, aux tests de performances et à l'ingénierie du chaos, le NRE garantit que les applications soient assez fiables pour répondre aux objectifs et accords de niveau de service.

Surveiller

Le NRE surveille les indicateurs de niveau de service, manuellement et automatiquement, avec des analyses qui déclenchent des alertes et une réponse automatiques en cas d'événement anormal statistiquement significatif. Les journaux et les éléments de télémétrie sont recueillis et analysés pour mesurer l'efficacité, planifier les besoins de capacité et automatiser cette dernière sur une infrastructure réseau cloud élastique.

Mesurer

Enfin, les NRE se distinguent par leur recherche de vérité et de transparence et ils utilisent des indicateurs pour mesurer leur efficacité par rapport à des objectifs de fiabilité, comme le MTBF et le MTTR.

Avantages de l'ingénierie de la fiabilité du réseau

La fiabilité est la première valeur du NRE ! Bien que la rapidité de l'évolution technologique et le rythme des affaires soient des facteurs majeurs, ils ne sont rien sans une base fiable. Les principes DevNetOps valorisent l'évolution et la rapidité qu'apportent les petits changements incrémentaux. C'est pourquoi la vitesse et la flexibilité d'une architecture évolutive sont les bienvenues.

Les NRE obtiennent une compréhension approfondie de la façon dont le réseau se dégrade et casse sous la pression, ce qui permet d'automatiser et de documenter la réponse à l'incident. Cela encourage une approche proactive pour empêcher les interruptions de production.

D'un point de vue personnel, les NRE s'estiment moins inquiets vis-à-vis des déploiements et rapportent une plus grande satisfaction au travail.

Dans l'ensemble, les NRE facilitent les opérations et la gestion. Pendant les opérations réseau, de nombreuses variables doivent être contrôlées, sécurisées et auditées, ce qui ajoute une grande complexité. Les NRE résolvent cette complexité avec une source bien codifiée de vérité et une réponse automatique qui autonomisent le réseau​.

Quel est le lien entre le NRE, le SDN et la NFV ?

Vous pouvez appliquer l'ingénierie de fiabilité du réseau aux systèmes matériels et logiciels de mise en réseau. Il est plus facile de simuler et tester l'utilisation du NRE avec un SDN pur (virtualisation des fonctions réseau (NFV) ou SDN sur le cloud), car aucun laboratoire matériel ou virtuel de réseau n'est nécessaire. Le contrôle SDN du matériel est également plus facile à mettre en œuvre par les NRE, car les systèmes SDN automatisent et extraient le contrôle et la configuration de l'ensemble des architectures réseau de leur domaine, permettant ainsi d'éviter aux NRE de « réinventer la roue » des systèmes SDN qui peuvent exister.

Comme il n'existe aucun système sans bug, le travail des NRE n'est jamais terminé. Comme c'est le cas pour la culture SRE et DevOps, la culture NRE et DevNetOps valorise la tolérance des échecs qui permettent d'obtenir des correctifs rapides et d'apprendre. L'amélioration continue, ou kaizen (mot japonais pour « bon changement ») n'est pas synonyme d'équilibre, mais consiste à retrouver son équilibre. Il est impossible de récupérer s'il est interdit d'échouer en premier lieu. 1Des recherches dans de nombreux domaines montrent que cette approche conduit à de meilleurs résultats. Par conséquent, l'objectif des NRE est l'évolution, pas la perfection. En partageant leur temps entre l'ingénierie et l'exploitation, les NRE connaissent bien les échecs, tirent des enseignements et intègrent en permanence les améliorations aux outils et processus automatisés.