NRE란?

NRE란?

NRE(Network Reliability Engineer)는 서비스 레벨 목표, 계약, IT 조직과 비즈니스의 목표에 맞춰 네트워크 안정성을 측정하고 자동화하는 데 엔지니어링 접근 방식을 적용하는 IT 운영 역할을 합니다. NRE는 실제로 네트워크 안정성 엔지니어링이라 불립니다.

NRE(Network Reliability Engineer)의 역할은 무엇인가요?

네트워크 자동화 기술이 널리 보급되면서 네트워크 운영자의 시야가 넓어졌지만, 툴링에 대한 관심은 대부분 네트워크 내 워크플로우의 점진적 자동화로 이어졌습니다. 엔지니어링에 대한 NRE의 관심은 기존의 접근 방식과 완전히 상반됩니다. 소프트웨어 엔지니어의 작업(개발, 테스트, 구축, 운영)을 SRE(Site Reliability Engineer)의 작업(DevOps 구현)과 결합합니다. NRE는 DevNetOps의 원칙과 동작을 구현해 네트워크 파이프라인을 개발합니다.

NRE의 업무 중 일부는 업그레이드 실행, 감사, 변경 요청, 인시던트 처리 등의 운영 작업과 관련이 있지만 주요 관심사는 다음과 같습니다.

  • DevNetOps 파이프라인에 네트워크를 개발 및 구축
  • 네트워크 역학의 처리를 자동화
  • 시스템 통합
  • 워크플로우 자동화
  • 번거로운 작업 제거
  • 사전 테스트로 문제 해결을 자동화
  • 자동화된 대응을 통한 엔지니어링 안정성
  • 오류 예산과 서비스 수준 목표를 연계

NRE 작업

동작

설명

코드화

NRE는 네트워크 소프트웨어 및 하드웨어 시스템 확보(개시일)와 함께 네트워크 소프트웨어 아티팩트와 기밀, 구성을 코드화하여 소프트웨어 개발자와 유사한 소스코드 저장소에 보관합니다.

자동화

NRE는 DevNetOps 파이프라인을 이용해 테스트 및 복제 가능한, 버전화된 구축의 통합을 자동화합니다. 또한 NRE는 최초 구축 및 업데이트뿐만 아니라 이 파이프라인을 이용해 프로덕션의 안정성, 확장, 효율 최적화, 네트워킹 리소스의 동적 프로비저닝을 소비자와 시스템 통합에 맞춰 엔지니어링합니다.

테스트

NRE는 자동화, 스테이징, 스트레스 테스트, 카오스 엔지니어링을 통해 결과물이 서비스 수준 목표와 계약을 충족할 만큼 안정적인지 확인합니다.

모니터링

NRE는 변칙적이고 통계적으로 유의미한 이벤트에 대한 자동 응답과 알림을 트리거하는 분석을 통해 서비스 수준 지표를 수동 및 자동으로 모니터링합니다. 로그와 텔레메트리를 수집 및 분석하여 효율성 인사이트를 파악하고 필요한 용량을 계획하며 탄력적인 클라우드 네트워크 인프라에 맞춰 용량을 자동화합니다.

측정

마지막으로 NRE 문화는 진실과 투명성을 중시하며 지표를 이용해 MTBF와 MTTR 등의 안정성 목표를 얼마나 효과적으로 충족했는지 측정합니다.

네트워크 안정성 엔지니어링의 장점

안정성은 NRE의 가장 중요한 가치입니다! 기술 발전의 속도와 비즈니스의 속도는 중요한 경제 지표이지만, 안정적인 기반 없이는 무용지물입니다. DevNetOps 원칙은 점진적 변화를 통한 혁신과 속도를 중시하므로 혁신적인 아키텍처의 속도와 민첩성은 환영받는 부산물입니다.

NRE는 네트워크의 품질이 압박을 받으면 어떻게 저하되고 파손되는지 철저히 파악하여 사고 대응을 자동화하고 문서화할 수 있는 기회를 제공합니다. 이는 생산 중단을 방지하기 위한 사전 예방적 접근 방식에 도움을 줍니다.

개별 리소스 차원에서 NRE는 구축에 대한 걱정을 줄여주고 직무 만족도를 높여줍니다.

NRE는 전체적으로 운영 및 관리 작업을 단순화하는 효과가 있습니다. 네트워크를 운영하려면 수많은 변수를 제어, 보호, 감사해야 하므로 복잡성이 크게 증가합니다. NRE는 Self-Driving Network를 지향하는 코드화된 데이터 소스와 자동 응답으로 이러한 복잡성을 해결해줍니다.

NRE와 SDN, NFV의 관계는?

네트워크 안정성 엔지니어링은 네트워킹 하드웨어와 소프트웨어 시스템에 동일하게 적용할 수 있습니다. NRE를 순수한 SDN(Software-Defined Networking)(클라우드의 NFV(Network Functions Virtualization) 또는 SDN)에 적용하면 시뮬레이션과 테스트가 더욱 용이해지며 네트워크 하드웨어 랩 또는 가상 랩이 필요하지 않습니다. SDN 하드웨어 컨트롤은 또한 SDN 시스템이 제공된 도메인 안에서 전체 네트워크 아키텍처의 제어와 구성을 자동화 및 추상화하여 NRE가 SDN 시스템의 기존 솔루션을 다시 만들 필요가 없게 함으로써 NRE의 구현을 손쉽게 만들어줍니다.

버그 없는 시스템은 없으므로 NRE의 작업은 끝이 없습니다. NRE 및 DevNetOps 문화는 SRE 및 DevOps 문화와 마찬가지로 실패를 허용하되 빠르게 수정하고 실패로부터 교훈을 얻는 것을 중요시합니다. 지속적인 개선 또는 카이젠(‘긍정적 변화’라는 뜻의 일본어)은 균형을 유지하는 것이 아니라 균형을 복구하는 것입니다. 애초에 실패가 허용되지 않는다면 복구할 수도 없을 것입니다. 1여러 분야의 연구에 따르면 이러한 접근 방식이 더 나은 성과로 이어지는 것으로 나타납니다. 따라서 NRE는 완벽이 아닌 발전을 추구합니다. 엔지니어링과 운영 간의 시간을 분할하는 NRE는 실패 발생 시 교훈을 기록하고 툴링 및 자동화된 프로세스에 개선 사항을 지속적으로 통합하는 것으로 잘 알려져 있습니다.