Che cos'è un NRE?

Che cos'è un NRE?

Un ingegnere dell'affidabilità della rete (NRE) è un ruolo IT operativo che applica un approccio ingegneristico per misurare e automatizzare l'affidabilità della rete per l'allineamento con gli obiettivi del livello di servizio, i contratti e gli obiettivi dell'organizzazione e dell’azienda IT. Il ruolo dell'NRE rientra nella cosiddetta ingegneria dell'affidabilità della rete.

Che cosa fa un ingegnere dell'affidabilità della rete?

La proliferazione della tecnologia di automazione di rete ha aumentato la consapevolezza degli operatori di rete, tuttavia l'attenzione per gli strumenti ha determinato per lo più flussi di lavoro automatizzati incrementali nelle reti. L'interesse ingegneristico dell'NRE è completamente opposto all'approccio tradizionale. Riunisce i compiti di un ingegnere del software (creare, testare, distribuire ed eseguire) con quelli di un ingegnere dell'affidabilità del sito (SRE) (implementare DevOps). Gli NRE implementano i principi e i comportamenti DevNetOps per costruire una pipeline di rete.

Anche se parte del lavoro di un NRE riguarda compiti operativi, come l'esecuzione di aggiornamenti, controlli, richieste di modifiche e la gestione degli incidenti, il suo obiettivo principale è:

  • Creare e distribuire la rete su una pipeline DevNetOps.
  • Automatizzare la gestione della dinamica della rete.
  • Integrare i sistemi.
  • Automatizzare i flussi di lavoro.
  • Eliminare l'inefficienza.
  • Automatizzare la risoluzione dei problemi con test proattivi.
  • Implementare l'affidabilità ingegneristica attraverso una risposta automatica.
  • Allineare i bilanci in errore e gli
    obiettivi a livello di servizi

Comportamenti dell'ingegnere dell'affidabilità della rete

Comportamento

Descrizione

Codificare

A partire dall'acquisizione del software di rete e dei sistemi hardware (comunemente chiamato "giorno zero"), un NRE codifica gli artefatti del software di rete, i segreti e la configurazione in repository di codice sorgente simili a quelli di uno sviluppatore software.

Automatizzare

Utilizzando una pipeline DevNetOps, un NRE automatizza l'integrazione di test e deployment riproducibili e con versione. Oltre al primo deployment e aggiornamento, un NRE usa questa pipeline anche per progettare l'affidabilità in produzione, la scalabilità, le ottimizzazioni dell'efficienza, il provisioning dinamico delle risorse di rete per i suoi consumatori e l'integrazione dei sistemi.

Testare

Attraverso l'automazione, la gestione temporanea, gli stress test e l'ingegneria del caos, un NRE fa in modo che i suoi prodotti siano sufficientemente affidabili da soddisfare gli obiettivi e i contratti a livello di servizio.

Monitorare

Un NRE controlla gli indicatori del livello di servizio, sia manualmente che automaticamente, con analisi che generano risposte automatiche e avvisi per eventi anomali e statisticamente significativi. I registri e la telemetria vengono raccolti e analizzati per ricavare informazioni sull'efficienza, pianificare le esigenze di capacità e automatizzare la capacità sull'infrastruttura di rete cloud elastica.

Misurare

Infine, la cultura NRE apprezza la verità e la trasparenza e utilizza indicatori per misurare la loro efficacia nel raggiungimento degli obiettivi di affidabilità, come MTBF e MTTR.

Vantaggi dell'ingegneria dell'affidabilità della rete

L'affidabilità è il valore più importante di un NRE. Se la rapidità dei progressi tecnologici e la velocità delle attività aziendali sono fattori importanti, sono inutili senza un fondamento affidabile. Siccome i principi DevNetOps valorizzano l'evoluzione e la velocità attraverso piccoli cambiamenti incrementali, la velocità e l'agilità di un'architettura evolutiva sono spesso effetti secondari graditi.

Gli NRE acquisiscono una comprensione approfondita della riduzione delle prestazioni della rete e di come essa cede sotto pressione, il che fornisce delle opportunità per automatizzare e documentare la risposta agli incidenti. Questo stimola un approccio proattivo per evitare le interruzioni della produzione.

A livello di risorse individuali, gli NRE riferiscono una minore ansia da deployment e una maggiore soddisfazione sul lavoro.

Nel complesso, gli NRE affermano la semplicità nelle operazioni e nella gestione. Nelle operazioni di rete, ci sono molte variabili da controllare, proteggere e revisionare, con conseguenti enormi complessità. Gli NRE risolvono questa complessità con un'unica fonte di verità ben codificata e una risposta automatica che conduce verso la realizzazione di una rete in grado di auto-amministrarsi (self-driving network).

Qual è il rapporto tra NRE, SDN e NFV?

È possibile applicare l'ingegneria dell'affidabilità di rete in ugual misura ai sistemi hardware e software di rete. L'applicazione dell'NRE all'SDN (Software-Defined Networking), o virtualizzazione delle funzioni di rete (NFV) o SDN nel cloud, è più facile da simulare e testare, non è necessario alcun laboratorio hardware di rete o laboratorio virtuale. Il controllo SDN dell'hardware è anche più facile da implementare per gli NRE perché i sistemi SDN automatizzano e astraggono il controllo e la configurazione di intere architetture di rete nel loro determinato dominio, consentendo così agli NRE di evitare di "reinventare la ruota" dei sistemi SDN esistenti.

Siccome non esistono sistemi esenti da problemi, il lavoro di un NRE non è mai finito. Simile alla cultura SRE e DevOps, la cultura NRE e DevNetOps tiene in considerazione la tolleranza degli errori che porta a risoluzioni rapide e all'apprendimento di insegnamenti. Il miglioramento continuo, o kaizen (un termine giapponese che significa "cambiamento positivo"), non riguarda l'essere in equilibrio, ma ritrovare l'equilibrio. E non è possibile ritrovarlo se non è concesso commettere innanzitutto degli errori. 1La ricerca in molti settori dimostra che questo approccio produce risultati migliori. Di conseguenza, gli NRE aspirano all'evoluzione, non alla perfezione. Dividendo il loro tempo tra ingegneria e operatività, gli NRE sono ben consci degli errori, tengono a mente le lezioni che hanno appreso e integrano continuamente il miglioramento negli strumenti e nei processi automatizzati.