Что такое NRE?
Что такое NRE?
Инженер по надежности сети (NRE) — это роль в сфере ИТ-операций, которая использует инженерный подход к измерению и автоматизации надежности сети для приведения ее в соответствие с целями уровня обслуживания, соглашениями и целями ИТ-организации и бизнеса. Деятельность NRE — это проектирование надежности сети.
Что делает инженер по надежности сети?
Распространение технологии автоматизации сетей открыло новые перспективы для сетевых операторов, однако акцент на использовании инструментов в основном привел к возрастанию количества автоматизированных рабочих процессов в сетях. Взгляд NRE на проектирование совершенно противоположен традиционному подходу. Эта должность сочетает в себе задачи инженера ПО (создание, тестирование, развертывание и эксплуатацию) с задачами инженера по надежности объекта (SRE) (реализация DevOps). NRE-инженеры реализуют принципы и методы поведения DevNetOps для создания сетевого конвейера.
Хотя некоторые из рабочих задач NRE связаны с операционной деятельностью, например выполнение обновлений, проверки, запросы о внесении изменений и устранение инцидентов, их главное внимание уделяется следующему.
- Создание и развертывание сети на конвейере DevNetOps
- Автоматизация обработки динамики сети
- Интеграция систем
- Автоматизация рабочих процессов
- Устранение необходимости тяжелого труда
- Автоматизация процесса устранения неполадок с помощью упреждающего тестирования
- Обеспечение надежности проектирования с помощью автоматизированного реагирования
- Согласование величины ошибок и задач уровня обслуживания
Действия при проектировании надежности сети
|
Действие |
Описание |
|
Упорядочивание |
Начиная с приобретения сетевого программного обеспечения и аппаратных систем, что обычно называют днем 0, NRE упорядочивает артефакты, секреты и конфигурацию сетевого программного обеспечения в репозитории на базе исходного кода аналогично разработчику программного обеспечения. |
|
Автоматизация |
Используя конвейер DevNetOps, NRE автоматизирует интеграцию тестирования и воспроизводимых развертываний с контролем версий. Помимо первого развертывания и обновления, NRE применяет этот конвейер для проектирования производственной надежности, возможностей масштабирования, оптимизации эффективности, динамической инициализации сетевых ресурсов для своих потребителей и процесса интеграции систем. |
|
Тестирование |
Посредством автоматизации, промежуточного хранения, выполнения нагрузочных испытаний и инженерии хаоса NRE следит за тем, чтобы доставки были достаточно надежными и удовлетворяли требованиям и целям договоров об уровне обслуживания. |
|
Мониторинг |
NRE отслеживает показатели уровня обслуживания как вручную, так и автоматически с помощью аналитики, которая предупреждает об аномальных или статистически значимых событиях и обеспечивает автоматическое реагирование на них. Журналы и данные телеметрии собираются и анализируются для получения аналитики об эффективности, планирования потребностей в расширенных возможностях, а также автоматизации производительности в гибкой облачной сетевой инфраструктуре. |
|
Измерение |
Наконец, в культуре поведения NRE ценятся открытость и прозрачность. Они используют индикаторы для измерения своей эффективности в плане достижения целей надежности, таких как среднее время наработки до отказа и среднее время наработки до ремонта. |
Преимущества проектирования надежности сети
Надежность — это главная ценность данного вида проектирования. Несмотря на то что скорость развития технологий и бизнеса являются важными экономическими факторами, они бесполезны, если отсутствует надежная основа. В принципах DevNetOps ценятся эволюция и скорость, достигаемые посредством небольших планомерных изменений, а темпы улучшения и адаптивность эволюционной архитектуры обычно являются сопутствующими достижениями.
NRE получают полное представление о том, как работа сети замедляется и останавливается под нагрузкой, что обеспечивает возможность автоматизации и документирования ответных мер на возникающие инциденты. Это стимулирует упреждающий подход к предотвращению сбоев в производстве.
Что касается индивидуальных черт, NRE в меньшей степени подвержены тревожности при развертывании и демонстрируют более высокий уровень удовлетворенности рабочим процессом.
В целом, NRE обеспечивают простоту эксплуатации и управления. При эксплуатации сетей нужно контролировать, защищать и проверять множество переменных, что является очень трудной задачей. NRE решают такие задачи с помощью хорошо упорядоченного источника истины и автоматического реагирования, что позволяет создать автономную сеть.
Какова взаимосвязь NRE, SDN и NFV?
Проектирование надежности сети можно в равной степени использовать в сетевых аппаратных и программных системах. При использовании проектирования надежности сети исключительно для программно-определяемых сетей (SDN) (либо виртуализации сетевых функций (NFV), либо SDN в облаке) проще выполнять моделирование и тестирование, так как аппаратные или виртуальные лаборатории не требуются. Также NRE проще реализовать управление аппаратным обеспечением с помощью программно-определяемых сетей, так как системы SDN автоматизируют и абстрагируют управление всей сетевой архитектурой и ее конфигурацию в определенном домене. Таким образом, это избавляет NRE от выполнения ненужных действий в существующих системах SDN.
Поскольку нет систем, свободных от ошибок, то работа NRE никогда не заканчивается. Как и в случае с SRE и DevOps, в культуре NRE и DevNetOps ценятся допустимость совершения ошибок с последующим быстрым их исправлением и извлечением соответствующих уроков из них. Непрерывное совершенствование, или кайдзен (что в японском языке означает «изменение к лучшему»), — это способность не соблюдать баланс, а восстанавливать его. А без совершения ошибок восстановиться невозможно. 1Согласно исследованию, проведенному во многих сферах деятельности, такой подход позволяет получить более эффективные результаты. Таким образом, работа NRE направлена на развитие, а не совершенство. Попеременно выполняя задачи по проектированию и эксплуатации, NRE получают обширные знания о сбоях, извлекают уроки из ошибок и постоянно совершенствуют инструменты и автоматизированные процессы.
