Что такое NRE?

Что такое NRE?

Инженер по надежности сети (NRE) — это роль в сфере ИТ-операций, которая использует инженерный подход  к измерению и автоматизации надежности сети для приведения ее в соответствие с целями уровня обслуживания, соглашениями и целями ИТ-организации и бизнеса. Деятельность NRE — это проектирование надежности сети.

Что делает инженер по надежности сети?

Распространение технологии автоматизации сетей открыло новые перспективы для сетевых операторов, однако акцент на использовании инструментов в основном привел к возрастанию количества автоматизированных рабочих процессов в сетях. Взгляд NRE на проектирование совершенно противоположен традиционному подходу. Эта должность сочетает в себе задачи инженера ПО (создание, тестирование, развертывание и эксплуатацию) с задачами инженера по надежности объекта (SRE) (реализация DevOps). NRE-инженеры реализуют принципы и методы поведения DevNetOps для создания сетевого конвейера.

Хотя некоторые из рабочих задач NRE связаны с операционной деятельностью, например выполнение обновлений, проверки, запросы о внесении изменений и устранение инцидентов, их главное внимание уделяется следующему.

  • Создание и развертывание сети на конвейере DevNetOps
  • Автоматизация обработки динамики сети
  • Интеграция систем
  • Автоматизация рабочих процессов
  • Устранение необходимости тяжелого труда
  • Автоматизация процесса устранения неполадок с помощью упреждающего тестирования
  • Обеспечение надежности проектирования с помощью автоматизированного реагирования
  • Адаптация суммарных погрешностей и целей уровня обслуживания

Действия при проектировании надежности сети

Действие

Описание

Упорядочивание

Начиная с приобретения сетевого программного обеспечения и аппаратных систем, что обычно называют днем 0, NRE упорядочивает артефакты, секреты и конфигурацию сетевого программного обеспечения в репозитории на базе исходного кода аналогично разработчику программного обеспечения.

Автоматизация

Используя конвейер DevNetOps, NRE автоматизирует интеграцию тестирования и воспроизводимых развертываний с контролем версий. Помимо первого развертывания и обновления, NRE применяет этот конвейер для проектирования производственной надежности, возможностей масштабирования, оптимизации эффективности, динамической инициализации сетевых ресурсов для своих потребителей и процесса интеграции систем.

Тестирование

Посредством автоматизации, промежуточного хранения, выполнения нагрузочных испытаний и инженерии хаоса NRE следит за тем, чтобы доставки были достаточно надежными и удовлетворяли требованиям и целям договоров об уровне обслуживания.

Мониторинг

NRE отслеживает показатели уровня обслуживания как вручную, так и автоматически с помощью аналитики, которая предупреждает об аномальных или статистически значимых событиях и обеспечивает автоматическое реагирование на них. Журналы и данные телеметрии собираются и анализируются для получения аналитики об эффективности, планирования потребностей в расширенных возможностях, а также автоматизации производительности в гибкой облачной сетевой инфраструктуре.

Измерение

Наконец, в культуре поведения NRE ценятся открытость и прозрачность. Они используют индикаторы для измерения своей эффективности в плане достижения целей надежности, таких как среднее время наработки до отказа и среднее время наработки до ремонта.

Преимущества проектирования надежности сети

Надежность — это главная ценность данного вида проектирования. Несмотря на то что скорость развития технологий и бизнеса являются важными экономическими факторами, они бесполезны, если отсутствует надежная основа. В принципах DevNetOps ценятся эволюция и скорость, достигаемые посредством небольших планомерных изменений, а темпы улучшения и адаптивность эволюционной архитектуры обычно являются сопутствующими достижениями.

NRE получают полное представление о том, как работа сети замедляется и останавливается под нагрузкой, что обеспечивает возможность автоматизации и документирования ответных мер на возникающие инциденты. Это стимулирует упреждающий подход к предотвращению сбоев в производстве.

Что касается индивидуальных черт, NRE в меньшей степени подвержены тревожности при развертывании и демонстрируют более высокий уровень удовлетворенности рабочим процессом.

В целом, NRE обеспечивают простоту эксплуатации и управления. При эксплуатации сетей нужно контролировать, защищать и проверять множество переменных, что является очень трудной задачей. NRE решают такие задачи с помощью хорошо упорядоченного источника истины и автоматического реагирования, что позволяет создать автономную сеть.

Какова взаимосвязь NRE, SDN и NFV?

Проектирование надежности сети можно в равной степени использовать в сетевых аппаратных и программных системах. При использовании проектирования надежности сети исключительно для программно-определяемых сетей (SDN) (либо виртуализации сетевых функций (NFV), либо SDN в облаке) проще выполнять моделирование и тестирование, так как аппаратные или виртуальные лаборатории не требуются. Также NRE проще реализовать управление аппаратным обеспечением с помощью программно-определяемых сетей, так как системы SDN автоматизируют и абстрагируют управление всей сетевой архитектурой и ее конфигурацию в определенном домене. Таким образом, это избавляет NRE от выполнения ненужных действий в существующих системах SDN.

Поскольку нет систем, свободных от ошибок, то работа NRE никогда не заканчивается. Как и в случае с SRE и DevOps, в культуре NRE и DevNetOps ценятся допустимость совершения ошибок с последующим быстрым их исправлением и извлечением соответствующих уроков из них. Непрерывное совершенствование, или кайдзен (что в японском языке означает «изменение к лучшему»), — это способность не соблюдать баланс, а восстанавливать его. А без совершения ошибок восстановиться невозможно. 1Согласно исследованию, проведенному во многих сферах деятельности, такой подход позволяет получить более эффективные результаты. Таким образом, работа NRE направлена на развитие, а не совершенство. Попеременно выполняя задачи по проектированию и эксплуатации, NRE получают обширные знания о сбоях, извлекают уроки из ошибок и постоянно совершенствуют инструменты и автоматизированные процессы.