管理机箱群集的最佳实践
以下是 SRX 系列设备的机箱群集的一些最佳实践。
使用双控制链路
在双控制链路中,集群中的每个设备之间连接两对控制链路接口。SRX5000 和 SRX3000 线路支持双控制链路。具有两个控制链路有助于避免可能的单点故障。对于 SRX5000 线路,此功能需要将第二个路由引擎以及第二个交换机控制板 (SCB) 用于容纳路由引擎,这些设备需要安装在群集中的每个设备上。第二个路由引擎仅用于初始化 SCB 上的交换机。第二个路由引擎仅安装在SRX5000系列设备上,不提供备份功能。对于SRX3000 系列,此功能要求在群集中的每个设备上安装 SRX 群集模块 (SCM)。尽管 SCM 适合路由引擎插槽,但它不是路由引擎。SRX3000 系列设备不支持第二个路由引擎。SCM 的目的是初始化第二个控制链路。SRX 系列分支设备不支持双控制链路。
使用双数据链路
您可以在集群中的每台设备之间连接两个结构链路,从而在集群成员之间提供冗余结构链路。拥有两个结构链路有助于避免可能的单点故障。使用双交换矩阵链路时,运行时对象 (RTO) 和探测在一个链路上发送,结构转发和流前向数据包在另一个链路上发送。如果一个结构链路发生故障,另一个交换矩阵链路将处理 RTO 和探测以及数据转发。系统为每个节点上的 RTO 和探测选择插槽、PIC 或端口号最低的物理接口。
使用 BFD
双向转发检测 (BFD) 协议是一种检测网络中故障的简单呼叫机制。Hello 数据包按指定的定期间隔发送。当路由器在指定间隔后停止接收回复时,将检测到邻居故障。BFD 适用于各种网络环境和拓扑结构。BFD 故障检测时间比 RIP 检测时间短,对网络中各种故障的反应时间更快。这些计时器也是自适应的。例如,如果邻接失败,计时器可以适应更高的值,或者邻居可以为计时器协商比配置的计时器更高的值。因此,可以使用本地接口(而不是每个节点上的 fxp0 IP 地址)在 SRX 系列机箱群集的两个节点之间配置 BFD 实时性。这样,BFD 可以持续监控集群两个节点之间的状态。当节点之间出现任何网络问题时,将发送 BFD 会话关闭的 SNMP 陷阱,这表示节点之间存在问题。
使用 IP 监控
IP 监控是一个自动化脚本,使您能够在 SRX 系列平台上使用此关键功能。它允许使用互联网控制消息协议 (ICMP) 通过现有网络基础架构进行路径和下一跃点验证。检测到故障后,脚本会执行到其他节点的故障转移,以防止停机。
使用接口监控
实施的其他 SRX 系列机箱群集功能称为接口监控。要使冗余组自动故障转移到另一个节点,必须监控其接口。配置冗余组时,您可以指定一组接口,冗余组要监控这些接口的状态或运行状况,以确定接口是打开还是关闭。受监控接口可以是其任何冗余以太网 (reth) 接口的子接口。为要监控的冗余组配置接口时,需要为其分配权重。每个冗余组的阈值容差值最初设置为 255。当冗余组监控的接口不可用时,将从冗余组的阈值中减去其权重。当冗余组的阈值达到 0 时,它会故障转移到另一个节点。例如,如果冗余组 1 在节点 0 上是主组,则在阈值交叉事件中,冗余组 1 将成为节点 1 上的主组。在这种情况下,冗余组 1 的 reth 接口的所有子接口都将开始处理流量。发生冗余组故障切换的原因是冗余组的受监控接口的累积权重已将其阈值变为 0。当两个节点上冗余组的受监控接口同时达到其阈值时,冗余组在节点 ID 较低的节点(在本例中为节点 0)上为主冗余组。
不建议对冗余组 0 进行接口监控。
chassis { cluster { reth-count 6; redundancy-group 0 { node 0 priority 129; node 1 priority 128; } redundancy-group 1 { node 0 priority 129; node 1 priority 128; interface-monitor { ge-0/0/0 weight 255; ge-8/0/0 weight 255; } ip-monitoring { global-weight 255; global-threshold 0; family { inet { 128.249.34.1 { weight 10; interface reth0.34 secondary-ip-address 128.249.34.202; } } } } } } }
使用平稳重启
使用路由协议时,任何服务中断都需要受影响的路由器重新计算与相邻路由器的邻接关系、恢复路由表条目以及更新其他特定于协议的信息。路由器在不受保护的情况下重启可能会导致转发延迟、路由抖动、协议重新融合导致的等待时间,甚至丢包。平稳重启的主要优点是不间断的数据包转发和暂时抑制所有路由协议更新。平稳重启使路由器能够通过对网络其余部分隐藏的中间收敛状态。
瞻博网络路由平台提供三种主要类型的平稳重启:
聚合和静态路由以及路由协议的平稳重启 — 为聚合和静态路由以及 BGP、终端系统到中间系统 (ES-IS)、IS-IS、OSPF、RIP、新一代 RIP (RIPng) 和协议无关组播 (PIM) 稀疏模式路由协议提供保护。
MPLS 相关协议的平稳重启 — 为 LDP、RSVP、电路交叉连接 (CCC) 和平移交叉连接 (TCC) 提供保护。
虚拟专用网络 (VPN) 的平稳重启 — 为第 2 层和第 3 层 VPN 提供保护。