排查QFX5220
QFX5220故障排除资源概述
要排查QFX5220问题,您可以使用:
Junos OS CLI
CLI 是控制硬件、Junos OS、路由协议和网络连接并对其进行故障排除的主要工具。CLI 命令显示来自路由表的信息、特定于路由协议的信息以及有关从 ping 和跟踪路由实用程序派生的网络连接的信息。有关使用 CLI 对 Junos OS 进行故障排除的信息,请参阅相应的 Junos OS 配置指南。
网络端口、管理面板和组件上的警报和 LED
当路由引擎检测到报警情况时,它会根据需要点亮管理面板上的红色或黄色报警 LED。此外,您还可以使用组件 LED 和网络端口 LED 对QFX5220进行故障排除。有关详细信息,请参阅 QFX5220管理面板。
JTAC
如果在故障排除过程中需要帮助,可以使用 Web 或电话联系瞻博网络技术援助中心 (JTAC)。如果遇到软件问题或此处未讨论的硬件组件问题,请联系 JTAC。
知识库文章 – 知识库。
QFX5220报警消息概述
当 QFX5220 交换机检测到报警情况时,它会根据需要点亮管理面板上的红色或黄色报警 LED。要查看告警原因的更详细说明,请发出 show system alarms
操作 CLI 命令。
user@host> show system alarms 2 alarms currently active Alarm time Class Description 2019-01-22 16:32:54 PST Major PEM 1 Absent 2019-01-22 16:31:04 PST Minor Host 0 Disk 2 Labelled incorrectly
对于散热问题, show chassis temperature-thresholds
CLI 命令显示每个报警级别的截止温度:
user@host> show chassis temperature-thresholds Fan speed Yellow alarm Red alarm Fire Shutdown (degrees C) (degrees C) (degrees C) (degrees C) Item Normal High Normal Bad fan Normal Bad fan Normal Routing Engine 0 CPU Temperature 75 79 90 90 95 95 101 FPC 0 Sensor TopMiddle 51 56 67 67 77 77 87 FPC 0 Sensor TopFrontLeft 46 51 62 62 72 72 82 FPC 0 Sensor TopBack 54 59 70 70 80 80 90 FPC 0 Sensor BottomBack 51 56 67 67 77 77 87 FPC 0 Sensor CPUTopLeft 46 51 62 62 72 72 82 FPC 0 Sensor CPUBottomMiddle 54 59 70 70 80 80 90 FPC 0 Sensor CPUTopBackRight 46 51 62 62 72 72 82 FPC 0 Sensor TH3 Max Reading 87 94 107 107 110 110 122
计算风扇 RPM 或 占空比的百分比也很有帮助,请在 root 中使用以下命令:
root@re0.~#i2cget -y -f 13 0x66 0x11 0x07
在此示例中,系统返回了十六进制值 0x07
。将该值转换为十进制,在本例中为 7。然后使用此公式获取占空比:
Duty cycle = (value returned + 1)*6.25%
在本例中,占空比 = (7 +1)*6.25 = 50%
机箱报警消息
机箱报警指示设备或其某个组件出现故障。机箱报警是预设的,无法修改。
QFX5220设备上的机箱报警有两个严重性级别:
主要(红色)— 表示设备上由 表 1 中所述情况之一导致的严重情况。红色报警情况需要立即采取行动。
次要(黄色)- 表示设备上的非严重情况,如果未选中,可能会导致服务中断或性能下降。黄色报警情况需要监控或维护。
表 1 介绍了 QFX5220 上的机箱报警消息。
Junos OS 演化版系统(如 QFX5220)基于新的报警基础设施,并非所有电源和风扇报警都受支持。 表 1 显示了这些报警。
元件 |
报警类型 |
CLI 消息 |
建议的操作 |
---|---|---|---|
球迷 |
红色(大调) |
|
将风扇模块安装在没有风扇模块的插槽中。 |
|
卸下并检查风扇模块是否有障碍物。重新插入风扇模块。如果问题仍然存在,请更换风扇模块。 |
||
sensor-location 温度传感器太热 |
检查其他设备上的环境条件和警报。确保环境因素(如设备周围吹动的热空气)不会影响温度传感器。如果情况仍然存在,设备可能会关闭。 |
||
黄色(次要) |
|
卸下并检查风扇模块是否有障碍物。重新插入风扇模块。如果问题仍然存在,请检查系统日志中是否有与传感器相关的消息,并将该消息报告给客户服务。 |
|
sensor-location 温度传感器太热 |
检查其他设备上的环境条件和警报。确保环境因素(如设备周围吹动的热空气)不会影响温度传感器。 |
||
电源 |
红色(大调) |
|
将电源安装到空插槽中,并确保电源已通电。 |
温度传感器 |
主要(红色) |
|
检查其他设备上的环境条件和警报。确保环境因素(如设备周围吹动的热空气)不会影响温度传感器。如果这种情况仍然存在,设备可能会关闭。 |
次要(黄色) |
|
检查其他设备上的环境条件和警报。确保环境因素(如设备周围吹动的热空气)不会影响温度传感器。 |
|
|
检查系统日志中是否有以下错误消息,并将该消息报告给客户支持: |
||
路由引擎 |
主要(红色) |
|
文件存储已满负荷。将不必要的文件减少到可用空间。 |
次要(黄色) |
|
文件存储即将达到容量。将不必要的文件减少到可用空间。 |
|
管理以太网接口 |
主要(红色) |
|
检查电缆是否连接到管理以太网接口,或者电缆是否有故障。如果需要,请更换电缆。 |
配置更改导致意外QFX5220行为
端口和通道化配置过程因版本而异,可能是导致 QFX5220 交换机上出现意外端口或交换机行为的原因。确保为版本使用正确的配置和通道化过程。参见 表 2。
型 |
Junos OS 演化版 |
行为 |
---|---|---|
QFX5220-32C |
19.1R1-EVO 至 20.1R1-EVO |
如果单个端口配置错误,则只有配置错误的端口不会链接。 |
20.1R1-EVO 及更高版本 |
如果单个端口配置错误,则所有端口都将返回到 PIC 的默认模式。对于 QFX5220-32C,端口 0 到 31 默认为 400 GbE,端口 32 和 33 默认为 10 GbE。例如,假设您有多个装有 QSFP28 光纤的端口,在端口 0-31 中手动配置为 100 GbE。之后,您也将 SFP+ 端口 33 也配置为 100 GbE。该软件将允许提交配置,但使用 QSFP28 光纤的端口将默认为 400 GbE ,链路将关闭,SFP+ 端口将默认为 10 Gbps 速度,链路也将关闭。 |
|
QFX5220-128C |
19.2R1-EVO 至 20.1R1-EVO |
如果单个端口配置错误,则只有配置错误的端口不会链接。 |
20.1R1-EVO 及更高版本 |
如果单个端口配置错误,则所有端口都将返回到 PIC 的默认模式。对于 QFX5220-128C,端口 0 到 127 默认为 100 GbE,端口 128 和 129 默认为 10 GbE。例如,假设您有几个带有 QSFP+ 光纤的偶数编号端口,这些端口在端口 0-31 中手动配置为 100 GbE。之后,您也将 SFP+ 端口 33 也配置为 40 GbE。该软件将允许提交配置,但使用 QSFP+ 光纤的端口将默认为 100 GbE,链路将关闭,SFP+ 端口将默认为 10 Gbps 速度,链路也将关闭。 |
|
QFX5220-128C |
19.2R1-EVO 至 20.2R1-EVO |
您可以将任何偶数 QSFP28 端口配置为 40 Gbps 速度。系统将下一个(奇数)端口配置为未使用。 |
20.2R1-EVO 及更高版本 |
您可以将所有 128 个 QSFP28 端口配置为 40 Gbps 速度。 |
如何解决 QFX5220-128C 端口配置问题
问题
描述
对于最高 20.2R1 的 Junos OS 演化版,如果尝试将偶数端口配置为 40 Gbps,或者未按顺序执行过程中的步骤,则不会显示链接。如果您在 /var/log/messages 中看到以下错误消息,则错误可能是由于配置错误造成的:
June 4 08:50:59 re0 evo-pfemand[5127]: [Error] BrcmPlusIf: In RTM mode only one 40G port is allowed 8 cable Type 125
您可以按照以下步骤更正配置:
如何解决 QFX5220-128C 信道化问题
问题
描述
如果尝试将不符合条件的端口配置为通道化端口,或者未按顺序执行过程中的步骤,则不会显示链路,或者只会创建一个子端口接口。例如,在下面的 show chassis interfaces
输出中,在 et-0/0/20 上只创建了一个子端口:
... et-0/0/20:0 up down. # Only channel 0 is created. Channels 1-3 are not created. et-0/0/21 up up et-0/0/22 up up et-0/0/23 up down ...
可以按照以下步骤更正配置:
将错误配置的通道化端口后面的三个端口阻止为未使用,如果在原始配置期间未执行此步骤,则提交配置。
# set chassis fpc 0 pic 0 port port-number+1 unused # set chassis fpc 0 pic 0 port port-number+2 unused # set chassis fpc 0 pic 0 port port-number+3 unused # commit
删除通道化配置并提交配置:
# delete chassis fpc 0 pic 0 port port-number speed port-speed number-of-sub-ports 4 # commit
从通道化端口的三个端口中删除未使用的端口配置,然后提交配置:
# delete chassis fpc 0 pic 0 port port-number+1 unused # delete chassis fpc 0 pic 0 port port-number+2 unused # delete chassis fpc 0 pic 0 port port-number+3 unused # commit
验证所需端口是否可以配置为通道化端口,请参阅 表 1 并执行 4 x 25 Gbps 端口通道化中所述的步骤。