QFX5240交换机故障排除
QFX5240故障排除资源概述
要解决QFX5240问题,您可以使用:
-
Junos Evolved OS CLI
CLI 是用于控制硬件、Junos OS 演化版、路由协议和网络连接并对其进行故障排除的主要工具。CLI 命令显示路由表中的信息、特定于路由协议的信息以及派生自 ping 和 traceroute 实用程序的网络连接信息。有关使用 CLI 对 Junos OS 演化版进行故障排除的信息,请参阅相应的 Junos OS 演化版配置指南。
-
网络端口、管理面板和组件上的报警和 LED 指示灯
当路由引擎检测到报警情况时,它会根据需要点亮管理面板上的红色或黄色报警 LED。此外,您还可以使用组件 LED 和网络端口 LED 对 QFX5240 交换机进行故障排除。有关详细信息,请参阅 QFX5240管理面板。
-
JTAC 认证
如果您在故障排除过程中需要帮助,可以使用 Web 或电话联系瞻博网络技术援助中心 (JTAC)。如果您遇到软件问题或此处未讨论的硬件组件问题,请联系 JTAC。
-
知识库文章 - 知识库。
QFX5240报警消息概述
当QFX5240交换机检测到报警情况时,它会根据需要点亮管理面板上的红色或黄色报警 LED。要查看报警原因的更详细描述,请发出 show system alarms
作 CLI 命令。
user@host> show system alarms 2 alarms currently active Alarm time Class Description 2019-01-22 16:32:54 PST Major PEM 1 Absent 2019-01-22 16:31:04 PST Minor Host 0 Disk 2 Labelled incorrectly
对于散热问题, show chassis temperature-thresholds
CLI 命令显示每个报警级别的截止温度:
user@host> show chassis temperature-thresholds Fan speed Yellow alarm Red alarm Fire Shutdown (degrees C) (degrees C) (degrees C) (degrees C) Item Normal High Normal Bad fan Normal Bad fan Normal Routing Engine 0 CPU Temperature 65 70 95 92 97 94 100 Routing Engine 0 Ch-0 DIMM-0 Temp 55 62 80 77 82 79 85 Routing Engine 0 Ch-1 DIMM-0 Temp 55 62 80 77 82 79 85 FPC 0 Sensor TH5 Max Reading 75 80 100 97 105 102 110 FPC 0 et-0/0/0 53 60 73 73 76 76 77 FPC 0 et-0/0/4 53 60 73 73 76 76 77 FPC 0 MB Middle Right Rear 45 50 80 77 85 82 90 FPC 0 MB Middle Left Rear 45 50 80 77 85 82 90 FPC 0 MB Left Rear 45 50 80 77 85 82 90 FPC 0 MB Left Front 45 50 80 77 85 82 90 FPC 0 MB Right Rear 45 50 80 77 85 82 90 FPC 0 MB Right Front 45 50 80 77 85 82 90 FPC 0 MB OSFP_GRP1_3V3 75 80 115 112 120 117 125 FPC 0 MB OSFP_GRP2_3V3 75 80 115 112 120 117 125 FPC 0 MB OSFP_GRP3_3V3 75 80 115 112 120 117 125 FPC 0 MB VDD_0P75 75 80 115 112 120 117 125 FPC 0 MB TRVDD1_0V9_0V75 75 80 115 112 120 117 125 FPC 0 MB TRVDD0_0V9_0V75 75 80 115 112 120 117 125 FPC 0 FB Exhaust Left 40 45 65 62 70 67 75 FPC 0 FB Exhaust Right 40 45 65 62 70 67 75
您还可以计算风扇 RPM 或 占空比的百分比。将以下命令用作 root
:
root@re0.~#i2cget -y -f 13 0x66 0x11 0x07
在此示例中,系统返回十六进制值 0x07
。如果将该值转换为十进制,则得到 7。然后使用以下公式计算占空比:
Duty cycle = (value returned + 1)*6.25%
在此示例中,占空比 = (7 +1)*6.25 = 50%
机箱报警消息
机箱报警表示设备或其某个组件出现故障。机箱报警是预设的,无法修改。
QFX5240交换机上的机箱警报有两个严重级别:
-
主要(红色) — 表示设备上出现由 表 1 中描述的情况之一引起的危急情况。红色报警情况需要立即采取行动。
-
次要(黄色) — 表示设备上的非关键情况,如果不选中该情况,可能会导致服务中断或性能下降。黄色报警情况需要监控或维护。
表 1 介绍了QFX5240上的机箱报警消息。
Junos OS 演化版系统(如 QFX5240)基于新的告警基础架构,不支持所有电源和风扇报警。 表 1 显示了这些警报。
元件 |
报警类型 |
CLI 消息 |
建议的作 |
---|---|---|---|
球迷 |
红色(大调) |
|
将风扇模块安装在没有风扇模块的插槽中。 |
|
拆下并检查风扇模块是否有障碍物。重新插入风扇模块。如果问题仍然存在,请更换风扇模块。 |
||
sensor-location 温度传感器过热 |
检查其他设备上的环境条件和警报。确保环境因素(例如设备周围吹来的热空气)不会影响温度传感器。如果这种情况持续存在,设备可能会关闭。 |
||
黄色(次要) |
|
拆下并检查风扇模块是否有障碍物。重新插入风扇模块。如果问题仍然存在,请检查系统日志中是否存在与传感器相关的消息,并将该消息报告给客户服务。 |
|
sensor-location 温度传感器温度过高 |
检查其他设备上的环境条件和警报。确保环境因素(例如设备周围吹来的热空气)不会影响温度传感器。 |
||
电源 |
红色(大调) |
|
将电源安装到空插槽中,并确保电源通电。 |
温度传感器 |
主要(红色) |
|
检查其他设备上的环境条件和警报。确保环境因素(例如设备周围吹来的热空气)不会影响温度传感器。如果这种情况持续存在,设备可能会关闭。 |
次要(黄色) |
|
检查其他设备上的环境条件和警报。确保环境因素(例如设备周围吹来的热空气)不会影响温度传感器。 |
|
|
检查系统日志中是否存在以下错误消息,并将该消息报告给客户支持: |
||
路由引擎 |
主要(红色) |
|
文件存储已满。将不必要的文件减少到可用空间。 |
次要(黄色) |
|
文件存储即将达到容量。将不必要的文件减少到可用空间。 |
|
管理以太网接口 |
主要(红色) |
|
检查电缆是否连接到管理以太网接口,或者电缆是否有缺陷。如果需要,请更换电缆。 |