Wat is een NRE?

Wat is een NRE?

Een network reliability engineer (NRE) is een operationele functie in de IT-sector die een benadering van engineering toepast op het meten en automatiseren van de betrouwbaarheid van het netwerk. Dit kan dan worden afgestemd met de doelstellingen, afspraken en doelen op servicelevel van de IT-organisatie en het bedrijf. Het werk van een NRE wordt network reliability engineering genoemd.

Wat doet een Network Reliability Engineer?

De proliferatie van automatiseringstechnologie van netwerken opent de ogen van netwerkoperators, maar de focus op tooling heeft voornamelijk geleid tot langzaam toenemende geautomatiseerde workflows in netwerken. De focus van NRE op engineering is volledig in contrast met de traditionele benadering. Het combineert de taken van een software engineer (bouwen, testen, implementeren en besturen) met de taken van een site reliability engineer (SRE) (implementeren van DevOps). NRE's implementeren de principes en gedragingen van DevNetOps om een netwerk-pipeline te bouwen.

Hoewel een deel van het werk van een NRE operationele taken omvat, zoals het uitvoeren van upgrades, audits, wijzigingsverzoeken en het verwerken van incidenten, is hun belangrijkste focus:

  • Bouwen en implementeren van het netwerk op een DevNetOps-pipeline.
  • Automatiseren van het beheer van netwerkdynamiek.
  • Integratie van systemen.
  • Automatiseren van workflows.
  • Het wegnemen van werkdruk.
  • Automatiseren van probleemoplossing met proactief testen.
  • Betrouwbaarheid van engineering door geautomatiseerde reactie.
  • Afstemmen van error budgets en servicelevel doelstellingen.

Gedragingen van network reliability engineering

Gedragingen

Beschrijving

Codificeren

Beginnend met de aankoop van netwerksoftware en hardwaresystemen (doorgaans dag 0 genoemd), codeert een NRE de artefacten, geheimen en configuratie van de netwerksoftware in broncode-opslagplaatsen, vergelijkbaar met die van een softwareontwikkelaar.

Automatiseren

Met behulp van een DevNetOps-pipeline automatiseert een NRE de integratie van testen en reproduceerbare, versie-gestuurde implementaties. Naast de eerste implementatie en update, gebruikt een NRE deze pipeline ook om tijdens de productie het volgende te bewerkstelligen: betrouwbaarheid, schaal, efficiëntie optimalisaties, dynamische provisioning van netwerkbronnen voor zijn consumenten en systeemintegratie.

Test

Door automatisering, staging, stresstests en chaos-engineering zorgt een NRE ervoor dat de leveringen betrouwbaar genoeg zijn om aan de doelstellingen en afspraken op servicelevel te voldoen.

Controle

Een NRE controleert indicatoren op servicelevel, zowel handmatig als automatisch, door gebruik te maken van analyses die automatische reacties en meldingen in gang zetten voor afwijkende en statistisch belangrijke gebeurtenissen. Logboeken en telemetrie worden verzameld en geanalyseerd om inzichten in efficiëntie af te leiden, capaciteitsbehoeften te plannen en capaciteit te automatiseren in de elastische cloud netwerkinfrastructuur.

Metingen

Ten slotte hecht de NRE-cultuur waarde aan waarheid en transparantie, en gebruikt daarom indicatoren om hun doeltreffendheid te meten bij het bereiken van betrouwbaarheidsdoelstellingen, zoals MTBF en MTTR.

Voordelen van network reliability engineering

Betrouwbaarheid is de belangrijkste waarde van NRE! Hoewel de snelheid van technologische vooruitgang en de snelheid van zakendoen belangrijke economieën zijn, zijn zij nutteloos zonder een betrouwbare basis. Omdat de DevNetOps-principes waarde hechten aan evolutie en snelheid door kleine toenemende veranderingen, zijn snelheid en wendbaarheid van een evolutionaire architectuur vaak welkome bijproducten.

NRE's krijgen een diepgaand inzicht in hoe het netwerk onder druk verslechtert, wat mogelijkheden biedt om de reactie op incidenten te automatiseren en te documenteren. Dit bevordert een proactieve aanpak om productieonderbrekingen te voorkomen.

Op individueel niveau melden NRE's minder angst voor implementatie en een hogere arbeidstevredenheid.

Over het algemeen zorgen NRE's voor eenvoud in operations en management. Bij netwerkoperaties zijn er veel variabelen te beheersen, te beveiligen en te controleren, wat leidt tot een enorme complexiteit. NRE's lossen deze complexiteit op met een goed gecodeerde bron van waarheid en automatische reacties die leidt tot een zelfsturend netwerk.

Wat is de relatie tussen NRE, SDN en NFV?

Network reliability engineering kan zowel worden toegepast op netwerkhardware als op softwaresystemen. NRE alleen toepassen op software- defined netwerken (SDN)(hetzij Network Functions Virtualization (NFV)of SDN in de cloud) is gemakkelijker te simuleren en te testen. Er is namelijk geen netwerkhardware-lab of virtueel lab nodig. De SDN-controle van hardware is voor NRE's ook gemakkelijker te implementeren, omdat SDN-systemen de controle en configuratie van volledige netwerkarchitecturen in hun gegeven domein automatiseren en abstraheren. Hierdoor kunnen NRE's voorkomen dat ze het wiel van eventueel bestaande SDN-systemen opnieuw moeten uitvinden.

Omdat er geen foutloze systemen bestaan, is het werk van een NRE nooit gedaan. Net als bij de SRE- en DevOps-cultuur, hechten de NRE en DevNetOps waarde aan elementen die de ruimte krijgen om fout te gaan. Dit leidt tot snelle oplossingen en opgedane ervaringen. Continuous improvement (voortdurende verbetering), of kaizen (het Japanse woord voor 'goede verandering') gaat niet over het in balans zijn, maar over het herstellen van evenwicht. En men kan niet herstellen als men in eerste instantie al niet mag falen. 1Onderzoek op vele gebieden toont aan dat deze aanpak tot betere resultaten leidt. Daarom streven NRE's naar evolutie, niet naar perfectie. Door hun tijd te verdelen tussen engineering en operating zijn NRE's goed op de hoogte van fouten, leggen zij lessen vast en brengen zij voortdurend verbeteringen aan in tooling en geautomatiseerde processen.