上行链路故障检测
了解上行链路接口上的故障以及将此信息传输到下行接口的情况。本主题还包括如何为上行链路故障配置接口。
以下主题讨论上行链路故障检测的功能以及配置和验证其工作的步骤。
上行链路故障检测概述
上行链路故障检测允许交换机检测上行链路接口上的链路故障,并将此信息传播到下行链路接口,以便连接到这些下行链路的服务器可以切换到辅助接口。
上行链路故障检测支持网络适配器分组并提供网络冗余。在网络适配器组合中,所有服务器 NIC 共享相同的 IP 地址。NIC 以主关系或辅助关系配置。当主链路中断时,服务器会透明地将连接转移到辅助链路。通过上行链路故障检测,交换机可以监控上行链路接口是否存在链路故障。检测到故障时,会禁用下行链路接口。当服务器检测到禁用的下行链路接口时,它会切换到辅助链路,以帮助确保故障链路的流量不会被丢弃。
本主题将介绍如下内容:
上行链路故障检测配置
上行链路故障检测允许交换机监控上行链路接口,以发现链路故障。当交换机检测到链路故障时,它会自动禁用绑定到上行链路接口的下行链路接口。连接到禁用的下行链路接口的服务器会触发到辅助链路的网络适配器故障切换,以避免任何流量丢失。
图 1 展示了上行链路故障检测的典型设置。
对于上行链路故障检测,请指定要监控的一组上行链路接口。您还可以指定在上行链路出现故障时要关闭的下行链路接口。下行链路接口绑定到组内的上行链路接口。如果组中的所有上行链路接口均中断,则交换机将关闭该组内的所有下行链路接口。如果任何上行链路接口恢复正常运行,则交换机会使该组中的所有下行链路接口恢复正常运行。
交换机可以监控物理接口链路和 逻辑接口 链路是否存在上行链路故障,但您必须将这两种类型的接口分别归入不同的组中。
对于逻辑接口,服务器必须在交换机和服务器之间发送激活,以检测逻辑链路故障。
故障检测对
上行链路故障检测要求您在组中创建上行链路和下行链路接口对。每对包括以下各一个:
链路到监控器接口 — 链路到监控器接口指定交换机监控的上行链路。最多可以将 48 个上行链路接口配置为组的链路到监控接口。
链路到禁用接口 — 链路到禁用接口指定交换机检测到上行链路故障时禁用的下行链路。您最多可以配置 48 个下行链路以在组中禁用。
链路到禁用接口绑定到组内的链路到监视器接口。当链路到监控器接口恢复服务时,交换机会自动启用组中的所有链路到禁用接口。
去抖动间隔
去抖动间隔是在上行链路接口发生相应状态更改后,下行链路接口开机之前经过的时间量(以秒为单位)。您可以为上行链路故障检测组配置去抖频间隔。如果不进行去抖回间隔配置,则在上行链路状态更改后,下行链路接口将立即激活。此操作可能会导致不必要的下行链路状态更改和服务器故障切换。
如果上行链路接口在去抖频间隔内中断,则当上行链路接口恢复时,去抖计时器将启动。如果上行链路接口在去抖频间隔到期之前关闭,则当上行链路接口恢复时,去抖动计时器将重新启动。
您对去抖动间隔所做的任何更改都会立即生效。如果您在去抖动计时器生效时更改去抖动间隔,则如果新的到期时间在将来,则将进行更改。如果没有,计时器会立即停止。
如果上行链路故障检测在去抖频间隔内重新启动,则去抖动计时器将重置,并且上行链路故障检测重新启动之前经过的时间将丢失。链路至禁用接口在不等待去抖动间隔过去的情况下启动。
如果链路到禁用接口在去抖动计时器到期后未激活,则计时器到期和接口激活之间可能会出现延迟。
配置用于上行链路故障检测的接口
您可以配置上行链路故障检测,以帮助确保流量的平衡。使用此功能,交换机可以监控和检测上行链路接口上的链路故障,并将故障信息传播到下行链路接口,以便连接到这些下行链路的服务器可以切换到辅助接口。
请遵循以下配置准则:
仅在一个组中配置接口。
为每台交换机配置最多 48 组。
每个组中最多配置 48 个要监控的上行链路和最多 48 个要禁用的下行链路。
在单独的组中配置物理链路和逻辑链路。
要在交换机上配置上行链路故障检测:
配置上行链路故障检测组后,使用命令 show uplink-failure-detection group (Uplink Failure Detection) group-name 验证组中的所有接口是否均已开启。如果接口出现故障,则上行链路故障检测不起作用。
示例:配置用于上行链路故障检测的接口
上行链路故障检测允许交换机检测上行链路接口上的链路故障,并将故障信息传播到下行链路接口。服务器上的所有网络接口卡 (NIC) 都配置为主链路或辅助链路,并共享同一个 IP 地址。当主链路中断时,服务器会透明地将连接转移到辅助链路,以确保故障链路上的流量不会被丢弃。
此示例将介绍如下内容:
要求
此示例使用以下软件和硬件组件:
适用于 QFX 系列的 Junos OS 19.2R1 或更高版本
两台 QFX5100、QFX5110、QFX5120、QFX5200 或 QFX5210 交换机
两台聚合交换机
一台双宿主服务器
概述和拓扑
此示例中的拓扑结构说明了如何在交换机 1 和交换机 B 上配置上行链路故障检测。交换机 1 和交换机 2 均配置了链路到监控接口(到聚合交换机的上行链路接口)和链路到禁用接口(到服务器的下行链路接口)。为简单起见,每台交换机仅配置一组链路到监控器接口和链路到禁用接口。服务器与交换机 1 和交换机 2 双宿主机。在此场景中,如果禁用到交换机 1 的链路到监控接口,则服务器将改用到交换机 2 的链路到监控接口。
此示例不介绍如何配置双宿主服务器或聚合交换机。有关更多信息,请参阅每个设备的文档。
图 2 展示了上行链路故障检测的典型设置。
表 1 列出了每台 QFX3500 交换机的上行链路故障设置。
拓扑结构
| 交换机 1 | 开关 2 |
|---|---|
|
|
在两个交换机上配置上行链路故障检测
要在两个交换机上配置上行链路故障检测,请执行以下任务。
过程
CLI 快速配置
要在交换机 1 和交换机 2 上快速配置上行链路故障保护,请将以下命令复制粘贴到交换机终端窗口中:
[edit protocols] set uplink-failure-detection group group1 set uplink-failure-detection group group2 set uplink-failure-detection group group1 link-to-monitor xe-0/0/0 set uplink-failure-detection group group1 debounce-interval 20 set uplink-failure-detection group group2 link-to-monitor xe-0/0/0 set uplink-failure-detection group group2 debounce-interval 20 set uplink-failure-detection group group1 link-to-disable xe-0/0/1 set uplink-failure-detection group group2 link-to-disable xe-0/0/1
分步程序
要在两台交换机上配置上行链路故障保护:
为交换机 1 上的上行链路故障检测组指定名称:
[edit protocols] user@switch# set uplink-failure-detection group group1
在交换机 1 上将上行链路接口添加到组:
[edit protocols] user@switch# set uplink-failure-detection group group1 link-to-monitor xe-0/0/0
将下行链路接口添加到交换机 1 上的组:
[edit protocols] user@switch# set uplink-failure-detection group group1 link-to-disable xe-0/0/1
在交换机 1 上配置组 1 的去抖动间隔:
[edit protocols] user@switch# set uplink-failure-detection group group1 debounce-interval 20
为交换机 2 上的上行链路故障检测组指定名称:
[edit protocols] user@switch# set uplink-failure-detection group group2
将上行链路接口添加到交换机 2 上的组:
[edit protocols] user@switch# set uplink-failure-detection group group2 link-to-monitor xe-0/0/0
在交换机 1 上配置组 2 的去抖动间隔:
[edit protocols] user@switch# set uplink-failure-detection group group2 debounce-interval 20
将下行链路接口添加到交换机 2 上的组:
[edit protocols] user@switch# set uplink-failure-detection group group2 link-to-disable xe-0/0/1
结果
显示配置结果:
uplink-failure-detection {
group {
group1 {
debounce-interval 20;
link-to-monitor {
xe-0/0/0;
}
link-to-disable {
xe-0/0/1;
}
}
group2 {
debounce-interval 20;
link-to-monitor {
xe-0/0/0;
}
link-to-disable {
xe-0/0/1;
}
}
}
}
验证
要验证上行链路故障检测是否正常工作,请在交换机 1 和交换机 2 上执行以下任务:
验证上行链路故障检测是否工作正常
目的
验证交换机在检测到上行链路故障时是否禁用下行链路接口。
行动
查看当前上行链路故障检测状态:
user@switch> show uplink-failure-detection Group : group1 Uplink : xe-0/0/0* Downlink : xe-0/0/1* Failure Action : Inactive Debounce Interval : 20
星号 (*) 表示链路已开启。
禁用上行链路接口:
[edit] user@switch# set interface xe-0/0/0 disable
在交换机上保存配置。
查看当前上行链路故障检测状态:
user@switch> show uplink-failure-detection Group : group1 Uplink : xe-0/0/0 Downlink : xe-0/0/1 Failure Action : Active Debounce Interval : 20
意义
步骤 1 中的输出显示上行链路接口已开启,因此下行链路接口也已开启,并且 “故障操作 ”的状态为 “非活动”。
步骤 4 中的输出显示上行链路和下行链路接口均已关闭(接口名称后没有星号),并且 “故障操作 ”的状态更改为 “活动”。此输出显示上行链路故障检测正在正常工作。