在此页面上
弹性和高可用性
Contrail SD-WAN 解决方案在所有层都具有弹性和高可用性。因此,网络可以在故障中无缝工作,并尽可能减少停机时间。以下各节讨论每一层的高可用性。
网络控制平面
控制平面本身是 Contrail SD-WAN 解决方案中的分布式实体。控制平面使用 vRR 启用,vRR 与本地设备对等,并根据来自路由管理器和策略/SLA 管理器微服务的信息动态设置路由。
路由反射器以分层结构部署。本地设备与其最近的区域路由反射器对等,后者本身与其他路由反射器对等。
无头转发
如果本地设备失去与 SD-WAN 控制器中的路由反射器的连接,设备仍可继续转发流量。这称为无头操作。这种情况将是次优的,因为控制器无法监控和建议新路由,但路径仍然存在,并且将以最大努力的方式转发流量。
在无外设模式下,不会对设备进行新配置或策略更改,也不会从设备报告新数据。连接恢复后,设备会与控制器签入,以确保其具有最新的路由和配置信息。
数据平面
CSO 3.3 及更高版本支持本地设备冗余。站点可以包含两个节点的群集,分别充当主节点和辅助节点,以防止设备和链路故障。如果主节点发生故障,或者指向主节点的链接断开,流量将流经辅助节点。
分支冗余
分支站点可以通过互连两台 CPE 设备以创建单个逻辑安全路由器来包含冗余。可以使用 NFX 系列或 SRX 系列设备。
使用 NFX 系列设备
图 1 显示了使用 NFX 系列设备的分支冗余设置,每台设备都安装了 vSRX 虚拟防火墙。两个 CPE 设备通过创建 SRX 机箱群集相互连接,形成单个逻辑节点。群集使用冗余以太网 (reth) 接口连接到 Junos 控制平面 (JCP) 组件,该组件充当交换机,提供进出设备的连接。

使用 SRX 系列设备
图 2 显示了使用 SRX 系列设备的分支冗余设置。两台 CPE 设备使用机箱群集互连,形成单个逻辑节点。

同样,设备两端的多个连接可提供链路冗余,LAN 端使用主动/备用链路,这些链路捆绑为 SRX 群集上的 reth 接口。WAN 端使用分布在两台设备上的所有四个活动 WAN 链路。
故障转移方案
表 x 描述了分支冗余设置将如何应对各种故障情况。
场景 |
NFX 行为 |
SRX 行为 |
---|---|---|
设备故障 |
vSRX 群集的节点故障切换 |
SRX 机箱群集的节点故障切换 |
GWR vSRX 虚拟机故障 |
vSRX 群集的节点故障切换 |
不适用 |
LAN 端链路故障 |
JCP - 针对单个链路故障的基于 LAG 的保护 vSRX - 如果指向某个节点的所有 LAN 链路都失败,则将其故障切换至其他群集节点 |
针对单个链路故障的基于 LAG 的保护 如果到某个节点的所有 LAN 链路都失败,则故障转移到另一个群集节点 |
WAN 端链路故障 |
与单 CPE 相同 - ECMP 跨剩余链路,直到从 SD-WAN 控制器实施 SLA |
|
互连物理链路故障 |
JCP - 基于 LAG 的保护 |
没有内置;可以使用节点之间的两个互连交换机添加基于 LAG 的保护 |
Usage Notes
您必须使用与 NFX 系列或 SRX 系列设备相同的设备型号,并且设备(主设备和辅助设备)必须安装相同版本的 Junos OS。
使用分支冗余时,不支持以下 SD-WAN 功能:
LTE WAN 备份链路
服务链支持
有关分支冗余的更多信息,请参阅 CSO 用户指南中的 设备冗余支持概述 。
集线器冗余(CPE 多宿主)
对于中心辐射型拓扑,还可以通过在主动/备份设置中部署两个中心设备,在中心端提供冗余。如果主中枢出现故障,或者到主中枢的所有叠加隧道都发生故障,流量将切换到辅助中枢。当主集线器再次启动并建立隧道时,流量将移回主集线器。
双集线器模式也可用于主/辅助模式。例如,中心可能是一半辐射的主辐射,而另一半轮是辅助轮辐。这样,负载以主动/主动方式分布在所有集线器设备对上。请注意,此模式需要对集线器设备进行网格划分,以保持整个网络的流量对称性。
设计选项
有几种方法可以在中心辐射型设备之间实现冗余,具体取决于设计要求:
Single Spoke Device Multihomed to Dual Hub Devices; Single Access
图 3 显示了如何将单分支设备多宿主到具有单访问的双中心设备。
图 3:一个分支设备,一条通往每个集线器的隧道
在此方案中,中心设备处于活动/备份配置中,分支站点前缀路由到活动中心。
Single Spoke Device Multihomed to Dual Hub Devices; Multiple Access
图 4 显示了如何将单分支设备多宿主到具有多访问的双中心设备。
图 4:一个分支设备,到每个集线器的两个隧道
与前面的方案一样,中心设备处于活动/备份配置中,分支站点前缀路由到活动中心。此外,分支站点具有通过每个接入网络到每个中心的叠加链接。APBR 通过所有可能的叠加将流量从 CPE 设备路由到活动中枢。
Clustered Spoke Devices Multihomed to Dual Hub Devices; Multiple Access
图 5 显示了如何将双 CPE 设备多宿主到双集线器设备,并从每个 CPE 设备进行多次访问。
图 5:分支群集,每个中心对应一条隧道
与前面的方案一样,中心设备处于活动/备份配置中,分支站点前缀路由到活动中心,APBR 通过所有可能的叠加将流量从活动 CPE 设备路由到活动中心。在此方案中,CPE 设备也处于主动/被动配置中。
分支站点有八个叠加隧道:
活动 CPE 到活动集线器 - 两个活动链路
到备份中心的活动 CPE - 两个备份链路
将 CPE 备份到活动集线器 - 两个活动链路
将 CPE 备份到备份中心 - 两个备份链路
注意:CPE 设备多宿主到的两个集线器必须是相同类型的设备。
注意:如果使用 NAT,则当 NAT 行为会根据更改进行调整时,由于主集线器故障而导致的中心切换可能会导致站点到 Internet 和站点到云的应用程序会话发生抖动。站点到站点会话将继续完成切换。