NREとは

NREとは

ネットワーク信頼性エンジニア(NRE)とは、エンジニアリングアプローチをネットワークの信頼性の測定と自動化に応用して、IT組織とビジネスのサービスレベルの目的、契約、目標に合わせて調整する、IT運用の職務のことです。NREのプラクティスは、「ネットワーク信頼性エンジニアリング」と呼ばれています。

ネットワーク信頼性エンジニアの作業内容

ネットワーク自動化技術の急増に通信事業者は目を見張っています。ただし、ツールに専念しても、ほとんどの場合はネットワークのワークフローが段階的に自動化するだけです。NREが対象にしているエンジニアリングは、従来のアプローチとは正反対です。NREでは、ソフトウェアエンジニアのタスク(構築、テスト、導入、運用)とサイト信頼性エンジニア(SRE)のタスク(DevOpsの実装)を組み合わせます。NREではDevNetOpsの原則を導入し、行動を実施して、ネットワークパイプラインを構築します。

NREの作業の一部には、アップグレードの実施、監査、変更要求、インシデント処理などの運用タスクが含まれますが、主な作業は次のとおりです。

  • DevNetOpsパイプライン上にネットワークを構築して導入
  • ネットワークの動的な性質に自動的に対処
  • システムを統合
  • ワークフローの自動化
  • 苦しい仕事を削減
  • プロアクティブなテストでトラブルシューティングを自動化
  • 自動化された対処で信頼性を設計
  • エラー予算とサービスレベルの目
    標の調整

ネットワーク信頼性エンジニアリングの行動

行動

説明

コード化

ネットワークソフトウェアとハードウェアシステムの取得から始まり(これを一般に「デイゼロ」(0 日目)と呼びます)、NREでは、ネットワークソフトウェアのアーティファクト、シークレット、設定をコード化し、ソフトウェア開発者と同じようにソースコードリポジトリにします。

自動化

NREでは、DevNetOpsパイプラインを使用して、テストと再現可能なバージョン化された導入の統合を自動化します。このパイプラインは、初期導入と更新以外にも、本番稼働の信頼性、拡張性、効率性の最適化、コンシューマ向けネットワークリソースの動的なプロビジョニング、システム統合の設計にも使用します。

テスト

NREでは、自動化、ステージング、ストレステスト、カオスエンジニアリングを通して、成果物がサービスレベル目標と契約を十分に満たす信頼性を備えていることを確認します。

監視

NREでは、分析によってサービスレベルの指標を手動と自動の両方で監視します。分析では、異常なイベントや統計的に意味のあるイベントに対して、自動的にレスポンスしてアラートをトリガーします。ログとテレメトリを収集および分析し、柔軟なクラウドネットワークインフラストラクチャに関して、効率に関するインサイトを導き出し、必要な容量の計画を作り、容量を自動的に調整します。

測定

NREは、真実性と透明性を重視しており、MTBFやMTTRのような信頼性の目標を満たすかどうかについて、指標を使用して測定します。

ネットワーク信頼性エンジニアリングのメリット

NREは信頼性を何よりも重要視しています。技術が進歩するスピードとビジネスのスピードは経済性の点で重要ですが、信頼性という基盤がなければ役に立ちません。DevNetOpsの原則では、小さな段階的な変更による進化とスピードを重視しています。そのため、多くの場合、進化型アーキテクチャから得られるスピードと俊敏性は、歓迎される副産物として得られます。

NREは、負荷がかかった場合にネットワークがどのように機能低下して途切れるのかを徹底的に理解し、インシデント対応を自動化して文書化する機会を得ます。これにより本番システムの停止を防止するためのプロアクティブなアプローチが確立します。

NREでは個々のリソースに対して、導入の懸念が減少し、作業に対する満足度が向上すると報告されています。

全体的には、シンプルな運用と管理が確立します。ネットワーク運用は、制御、保護、監査に対する多くの変動要素が存在するため、非常に複雑になります。NREでは、信頼できる情報のコード化と自動対応でこの複雑性を解決して、Self-Driving Network を目指します。

NRE、SDN、NFVの関係性とは

ネットワークのハードウェアシステムとソフトウェアシステムに対して、ネットワーク信頼性エンジニアリングを等しく適用できます。NREを完全なSoftware-Defined Networking(SDN)に適用することは、ネットワーク機能の仮想化(NFV)であれ、クラウド上のSDNであれ、シミュレーションやテストよりも簡単です。これは、ネットワークハードウェアのラボや仮想ラボが必要ないためです。SDN のハードウェア制御の実装も NRE のほうが簡単です。SDN システムは、特定のドメイン内のネットワーク アーキテクチャ全体の制御と設定を自動化して抽象化するためです。したがって、NRE では、存在するかもしれない SDN システムをもう一度作り直すことを回避できます。

バグのないシステムは存在しないため、NRE の仕事に終わりはありません。SRE や DevOps と同様、NRE と DevNetOps でも、失敗の許容を重視する傾向があり、その結果、修復が迅速に行われ、教訓を得ています。継続的な向上、すなわち改善(「改良」を表す日本語)はバランスが取れていることではなく、バランスを回復することです。最初に失敗を許容されなければ、回復することはできません。 1さまざまな分野の調査によると、このアプローチはより良い結果をもたらしています。このように、NRE が目指しているのは完璧ではなく、進化です。NRE では、エンジニアリングと運用の期間を分けて、失敗の評価、教訓の記録、継続的な改善を、ツールと自動化プロセスに継続的に組み込みます。