Descripción de las funciones de alta disponibilidad en los enrutadores de Juniper Networks
Para las plataformas de enrutamiento de Juniper Networks que ejecutan el sistema operativo Junos (Junos OS), la alta disponibilidad se refiere a los componentes de hardware y software que proporcionan redundancia y confiabilidad para las comunicaciones basadas en paquetes. En este tema se proporciona una breve descripción general de las siguientes características de alta disponibilidad:
Redundancia del motor de enrutamiento
Los motores de enrutamiento redundantes son dos motores de enrutamiento que se instalan en la misma plataforma de enrutamiento. Uno funciona como el principal, mientras que el otro se mantiene como una copia de seguridad en caso de que el motor de enrutamiento primario falle. En las plataformas de enrutamiento con motores de enrutamiento duales, la reconvergencia de la red tiene lugar más rápidamente que en las plataformas de enrutamiento con un solo motor de enrutamiento.
Cambio agraciado del motor de enrutamiento
El cambio correcto del motor de enrutamiento (GRES) permite que una plataforma de enrutamiento con motores de enrutamiento redundantes continúe reenviando paquetes, incluso si falla un motor de enrutamiento. El cambio correcto del motor de enrutamiento conserva la información de la interfaz y del kernel. El tráfico no se interrumpe. Sin embargo, el cambio correcto del motor de enrutamiento no conserva el plano de control. Los enrutadores vecinos detectan que el enrutador ha experimentado un reinicio y reaccionan al evento de la manera prescrita por las especificaciones de protocolo de enrutamiento individuales.
Para conservar el enrutamiento durante un cambio, el cambio correcto del motor de enrutamiento debe combinarse con extensiones de protocolo de reinicio correcto o enrutamiento activo sin interrupciones. Para obtener más información, consulte Descripción del cambio correcto del motor de enrutamiento y Conceptos de enrutamiento activo sin interrupciones.
En los enrutadores de la serie T, los enrutadores de matriz de transmisión y los enrutadores de matriz de transmisión Plus, el plano de control se conserva en el caso de GRES con NSR, y el 75% del tráfico de velocidad de línea por motor de reenvío de paquetes permanece ininterrumpido durante GRES.
Puente sin parar
El puente sin interrupciones permite que una plataforma de enrutamiento universal 5G de la serie MX con motores de enrutamiento redundantes cambie de un motor de enrutamiento primario a un motor de enrutamiento de respaldo sin perder la información del protocolo de control de capa 2 (L2CP). El puente sin interrupciones usa la misma infraestructura que el cambio elegante del motor de enrutamiento para conservar la información de la interfaz y del kernel. Sin embargo, el puente sin interrupciones también ahorra información L2CP al ejecutar el proceso del Protocolo de control de capa 2 (l2cpd) en el motor de enrutamiento de reserva.
Para usar puentes sin interrupciones, primero debe habilitar el cambio correcto del motor de enrutamiento.
El puente sin interrupción es compatible con los siguientes protocolos de control de capa 2:
Protocolo de árbol de expansión (STP)
Protocolo de árbol de expansión rápida (RSTP)
Protocolo de árbol de expansión múltiple (MSTP)
Protocolo de árbol de expansión de VLAN (VSTP)
Para obtener más información, vea Conceptos de puente sin parar.
Enrutamiento activo sin interrupciones
El enrutamiento activo sin paradas (NSR) permite que una plataforma de enrutamiento con motores de enrutamiento redundantes cambie de un motor de enrutamiento primario a un motor de enrutamiento de respaldo sin alertar a los nodos pares de que se ha producido un cambio. El enrutamiento activo sin interrupciones utiliza la misma infraestructura que el cambio elegante del motor de enrutamiento para conservar la información de la interfaz y del kernel. Sin embargo, el enrutamiento activo sin interrupciones también conserva la información de enrutamiento y las sesiones de protocolo al ejecutar el proceso de protocolo de enrutamiento (rpd) en ambos motores de enrutamiento. Además, el enrutamiento activo sin interrupciones conserva las conexiones TCP mantenidas en el kernel.
Para usar un enrutamiento activo sin interrupciones, también debe configurar un cambio correcto del motor de enrutamiento.
Para obtener una lista de los protocolos y características compatibles con el enrutamiento activo sin interrupciones, consulte Compatibilidad con el protocolo de enrutamiento activo sin interrupciones y las características.
Para obtener más información acerca del enrutamiento activo sin parada, consulte Conceptos de enrutamiento activo sin parada.
Reinicio agraciado
Con los protocolos de enrutamiento, cualquier interrupción del servicio requiere que un enrutador afectado vuelva a calcular las adyacencias con enrutadores vecinos, restaure las entradas de la tabla de enrutamiento y actualice otra información específica del protocolo. Un reinicio desprotegido de un enrutador puede provocar retrasos en el reenvío, aleteo de rutas, tiempos de espera derivados de la reconvergencia del protocolo e incluso paquetes perdidos. Para aliviar esta situación, el reinicio correcto proporciona extensiones a los protocolos de enrutamiento. Estas extensiones de protocolo definen dos funciones para un enrutador: reinicio y ayuda. Las extensiones indican a los enrutadores vecinos que un enrutador está experimentando un reinicio y evitan que los vecinos propaguen el cambio de estado a la red durante un intervalo de espera de reinicio elegante. Los principales beneficios de un reinicio correcto son el reenvío ininterrumpido de paquetes y la supresión temporal de todas las actualizaciones del protocolo de enrutamiento. El reinicio correcto permite que un enrutador pase a través de estados de convergencia intermedios que están ocultos para el resto de la red.
Cuando un enrutador está ejecutando un reinicio correcto y el enrutador deja de enviar y responder a los mensajes de vida del protocolo (hola), las adyacencias asumen un reinicio correcto y comienzan a ejecutar un temporizador para monitorear el enrutador que se reinicia. Durante este intervalo, los enrutadores auxiliares no procesan un cambio de adyacencia para el enrutador que suponen que se está reiniciando, sino que continúan el enrutamiento activo con el resto de la red. Los enrutadores auxiliares asumen que el enrutador puede continuar con el reenvío de estado según el último estado de enrutamiento conservado durante el reinicio.
Si el enrutador se estaba reiniciando y ha vuelto a funcionar antes de que expire el período de temporizador correcto en todos los enrutadores auxiliares, los enrutadores auxiliares proporcionan al enrutador la tabla de enrutamiento, la tabla de topología o la tabla de etiquetas (según el protocolo), salen del período correcto y vuelven al enrutamiento normal de red.
Si el enrutador no completa su negociación con los enrutadores auxiliares antes de que expire el período de temporizador correcto en todos los enrutadores auxiliares, los enrutadores auxiliares procesan el cambio de estado del enrutador y envían actualizaciones de enrutamiento, de modo que se produzca una convergencia en toda la red. Si un enrutador auxiliar detecta un error de vínculo del enrutador, el cambio de topología hace que el enrutador auxiliar salga del período de espera correcto y envíe actualizaciones de enrutamiento, de modo que se produzca la convergencia de red.
Para permitir que un enrutador se reinicie correctamente, debe incluir la graceful-restart
instrucción a nivel global [edit routing-options]
o [edit routing-instances instance-name routing-options]
jerárquico. Opcionalmente, puede modificar la configuración global a nivel de protocolo individual. Cuando se inicia una sesión de enrutamiento, un enrutador que está configurado con un reinicio correcto debe negociar con sus vecinos para que lo admitan cuando se somete a un reinicio correcto. Un enrutador vecino aceptará la negociación y admitirá el modo auxiliar sin necesidad de configurar un reinicio correcto en el enrutador vecino.
Un evento de cambio de motor de enrutamiento en un enrutador auxiliar que está en estado de espera correcta hace que el enrutador abandone el estado de espera y propague el cambio de estado de la adyacencia a la red.
El reinicio correcto es compatible con los siguientes protocolos y aplicaciones:
BGP
ES-IS
IS-IS
OSPF/OSPFv3
Modo disperso de PIM
RIP/RIPng
Protocolos relacionados con MPLS, incluidos:
Protocolo de distribución de etiquetas (LDP)
Protocolo de reserva de recursos (RSVP)
Conexión cruzada de circuitos (CCC)
Conexión cruzada de traducción (TCC)
Redes privadas virtuales (VPN) de capa 2 y capa 3
Para obtener más información, consulte Conceptos de reinicio correcto.
Enrutamiento activo sin interrupciones versus reinicio agraciado
El enrutamiento activo sin interrupciones y el reinicio correcto son dos métodos diferentes para mantener una alta disponibilidad. Un reinicio correcto requiere un reinicio del enrutador. Un enrutador que se somete a un reinicio correcto depende de sus vecinos (o ayudantes) para restaurar la información de su protocolo de enrutamiento. El reinicio es el mecanismo mediante el cual se indica a los ayudantes que salgan del intervalo de espera y comiencen a proporcionar información de enrutamiento al enrutador de reinicio. Para obtener más información, consulte Conceptos de reinicio correcto.
Por el contrario, el enrutamiento activo sin interrupciones no implica un reinicio del enrutador. Tanto el motor de enrutamiento principal como el de respaldo ejecutan el proceso de protocolo de enrutamiento (rpd) e intercambian actualizaciones con los vecinos. Cuando un motor de enrutamiento falla, el enrutador simplemente cambia al motor de enrutamiento activo para intercambiar información de enrutamiento con los vecinos. Debido a estas diferencias de características, el enrutamiento sin interrupciones y el reinicio correcto son mutuamente excluyentes. El enrutamiento activo sin interrupciones no se puede habilitar cuando el enrutador está configurado como un enrutador de reinicio correcto. Si incluye la graceful-restart
instrucción en cualquier nivel de jerarquía y la nonstop-routing
instrucción en el nivel de [edit routing-options]
jerarquía e intenta confirmar la configuración, se producirá un error en la solicitud de confirmación. Para obtener más información, consulte Conceptos de enrutamiento activo sin interrupciones.
Efectos de un cambio de motor de enrutamiento
Efectos de un cambio de motor de enrutamiento describe los efectos de un cambio de motor de enrutamiento cuando no hay funciones de alta disponibilidad habilitadas y cuando las funciones de cambio de motor de enrutamiento, reinicio correcto y enrutamiento activo sin detención están habilitadas.
VRRP
El Protocolo de redundancia de enrutador virtual (VRRP) permite a los hosts en una LAN hacer uso de plataformas de enrutamiento redundantes (pares primario y de respaldo) en la LAN, lo que requiere solo la configuración estática de una única ruta predeterminada en los hosts.
Los pares de la plataforma de enrutamiento VRRP comparten la dirección IP correspondiente a la ruta predeterminada configurada en los hosts. En cualquier momento, una de las plataformas de enrutamiento VRRP es la principal (activa) y las otras son copias de seguridad. Si se produce un error en el primario, uno de los enrutadores o conmutadores de reserva se convierte en el nuevo enrutador principal.
VRRP tiene ventajas en cuanto a facilidad de administración y rendimiento y confiabilidad de la red:
Proporciona una plataforma de enrutamiento virtual predeterminada.
Permite que el tráfico en la LAN se enrute sin un solo punto de falla.
Un enrutador de respaldo virtual puede hacerse cargo de un enrutador predeterminado fallido:
En pocos segundos.
Con un mínimo de tráfico VRRP.
Sin ninguna interacción con los anfitriones.
Los dispositivos que ejecutan VRRP eligen dinámicamente enrutadores primarios y de respaldo. También puede forzar la asignación de enrutadores primarios y de respaldo utilizando prioridades del 1 al 255, siendo 255 la prioridad más alta.
En la operación VRRP, el enrutador primario predeterminado envía anuncios a los enrutadores de respaldo a intervalos regulares (predeterminado 1 segundo). Si un enrutador de respaldo no recibe un anuncio durante un período determinado, el enrutador de respaldo con la siguiente prioridad más alta toma el control como primario y comienza a reenviar paquetes.
A partir de Junos OS versión 13.2, el enrutamiento activo sin paradas (NSR) VRRP solo se habilita cuando se configura la nonstop-routing
instrucción en el nivel de [edit routing-options]
jerarquía or [edit logical system logical-system-name routing-options]
.
Para obtener más información, consulte Descripción del VRRP.
ISSU unificada
Una actualización de software en servicio unificada (ISSU unificada) le permite actualizar entre dos versiones diferentes de Junos OS sin interrupciones en el plano de control y con una interrupción mínima del tráfico. La ISSU unificada solo es compatible con plataformas de motor de enrutamiento duales. Además, el cambio de motor de enrutamiento (GRES) y el enrutamiento activo sin paradas (NSR) deben estar habilitados.
Con una ISSU unificada, puede eliminar el tiempo de inactividad de la red, reducir los costos operativos y ofrecer niveles de servicio más altos. Para obtener más información, consulte Introducción a la actualización unificada de software en servicio.
Redundancia entre chasis para enrutadores de la serie MX que usan chasis virtual
La redundancia entre chasis es una característica de alta disponibilidad que puede abarcar equipos ubicados en múltiples geografías para evitar interrupciones de la red y proteger los enrutadores contra fallas de enlaces de acceso, fallas de enlace ascendente y fallas de chasis al por mayor sin interrumpir visiblemente a los suscriptores conectados ni aumentar la carga de administración de red para los proveedores de servicios. A medida que se transporta más tráfico de voz y video de alta prioridad en la red, la redundancia entre chasis se ha convertido en un requisito para proporcionar redundancia de estado en equipos de administración de suscriptores de banda ancha, como enrutadores de servicios de banda ancha, puertas de enlace de red de banda ancha y servidores de acceso remoto de banda ancha. La compatibilidad con redundancia entre chasis permite a los proveedores de servicios cumplir con estrictos acuerdos de nivel de servicio (SLA) y evitar interrupciones no planificadas de la red para satisfacer mejor las necesidades de sus clientes.
Para proporcionar una solución de redundancia entre chasis con estado para las plataformas de enrutamiento universal 5G de la serie MX, puede configurar un chasis virtual. Una configuración de Virtual Chassis interconecta dos enrutadores de la serie MX en un sistema lógico que puede administrar como un único elemento de red. Los enrutadores miembro en un Virtual Chassis se designan como el enrutador principal (también conocido como el protocolo primario) y el enrutador de respaldo (también conocido como el protocolo de respaldo). Los enrutadores miembro están interconectados por medio de puertos de chasis virtual dedicados que se configuran en las interfaces de concentrador de puerto modular Trio/tarjeta de interfaz modular (MPC/MIC).
Un Virtual Chassis serie MX es administrado por el Virtual Chassis Control Protocol (VCCP), que es un protocolo de control dedicado basado en IS-IS. VCCP se ejecuta en las interfaces de puerto de Virtual Chassis y es responsable de crear la topología de Virtual Chassis, elegir el enrutador principal de Virtual Chassis y establecer la tabla de enrutamiento entre chasis para enrutar el tráfico dentro del Virtual Chassis.
A partir de Junos OS versión 11.2, las configuraciones de Virtual Chassis son compatibles con las plataformas de enrutamiento universal MX240, MX480 y MX960 con interfaces Trio MPC/MIC y motores de enrutamiento duales. Además, el cambio de motor de enrutamiento (GRES) y el enrutamiento activo sin interrupciones (NSR) deben estar habilitados en ambos enrutadores miembro del chasis virtual.
Comportamiento de alta disponibilidad específico de la plataforma en ACX7000 serie
La arquitectura de hardware de ACX7000 serie de dispositivos difiere de la de los dispositivos de las series PTX y MX. En los dispositivos de las series PTX y MX, FPC aloja tanto el PFE de la ruta de datos como los puertos orientados hacia la WAN (PIC/MIC). En los dispositivos de las series PTX y MX, cada FPC está diseñado para incluir el recurso informático de la CPU para administrar los componentes de FPC.
En ACX7000 serie de dispositivos, la FRU de la placa del motor de reenvío (FEB) contiene solo el complejo PFE y el motor de enrutamiento contiene el complejo de cómputo de la CPU. La FRU del motor de enrutamiento ejecuta tanto el motor de enrutamiento como las aplicaciones de tarjeta de línea.
En la tabla siguiente se muestran los atributos y características de alta disponibilidad admitidos en ACX7000 serie de dispositivos:
Atributos y características de alta disponibilidad |
ACX7509 |
ACX7348 |
---|---|---|
Redundancia del plano de control (RE) |
Sí |
Sí |
Redundancia del plano de datos (PFE) |
Sí |
No |
GRES+GR |
Sí |
Sí |
GRES+NSR |
Sí |
Sí |
En ACX7348, si modifica el flujo actual o introduce un nuevo flujo durante el cambio del motor de enrutamiento, la convergencia no tendrá lugar hasta que se complete el cambio. Los cambios de topología durante el cambio solo se aplican después del cambio. Se espera una pérdida de tráfico y una pérdida menor de estadísticas durante el cambio.
GRES está habilitado de forma predeterminada en el sistema operativo Junos Evolved y no se puede deshabilitar
Para conservar el enrutamiento durante un cambio, GRES debe combinarse con:
- Extensiones de protocolo de reinicio correcto (GR)
- Enrutamiento activo sin escalas (NSR) y puente sin paradas (NSB)
En ACX7348 dispositivo, si se detecta una configuración que pertenece a funciones como la puerta de enlace de red de banda ancha (BNG), VXLAN, sFlow, J-Flow y la duplicación de puertos durante el cambio de motor de enrutamiento, la ruta de datos se restablece y se ve la reconvergencia del tráfico.
Antes de emitir cualquier comando de conmutación desde el motor de enrutamiento principal, compruebe el estado del motor de enrutamiento de reserva mediante el comando mostrar cambio del sistema en el motor de enrutamiento de reserva. Si el estado de conmutación está listo, emita el comando de conmutación.
El comando de conmutación se puede emitir incluso si el motor de enrutamiento de reserva no está listo. En este caso, el motor de enrutamiento cambiará al motor de enrutamiento principal (aunque la copia de seguridad no esté lista) y el comportamiento del sistema sea indeterminado.
El cambio de motor de enrutamiento da como resultado una pérdida de contabilidad de estadísticas durante el tiempo de conmutación.
ACX7509 admite la redundancia del motor de enrutamiento, como se menciona en la tabla siguiente:
Configuración del sistema |
Redundancia |
---|---|
RE único / FEB único |
No aplica. El sistema funciona en modo no redundante |
Dual RE / dual FEB |
Soportado |
Dual RE / FEB simple |
No es compatible. El sistema funciona en modo no redundante |
RE simple / FEB dual |
No es compatible. El sistema funciona en modo no redundante |
Los protocolos de temporización no admiten alta disponibilidad. Por lo tanto, las aplicaciones de temporización solo se ejecutarán en el motor de enrutamiento principal activo y no se ejecutarán en el motor de enrutamiento de reserva. Las aplicaciones de temporización se reinician al cambiar de motor de enrutamiento. Durante el cambio de motor de enrutamiento, el cambio de RE elegante o no elegante, PTP, GM y SYNCE perderán el bloqueo y la caja pasará al estado FREERUN. La ruta del paquete PTP dentro del hardware se romperá. Todos los dispositivos descendentes cambiarán a un dispositivo primario alternativo en la red. Si no hay ningún primario alternativo presente, todos los dispositivos descendentes pasarán a un estado HOLDOVER.
En ACX7348 dispositivo, si presiona el botón En línea / sin conexión del motor de enrutamiento principal, el cambio al motor de enrutamiento de respaldo ocurre correctamente. Puede extraer la tarjeta del motor de enrutamiento de forma segura después de apagar los LED del motor de enrutamiento. Presionar el botón Online/Offline en el motor de enrutamiento de copia de seguridad no tiene ningún efecto en el motor de enrutamiento principal.