QFX5130交换机故障排除
QFX5130故障排除资源概述
要排查QFX5130问题,您可以使用:
Junos Evolved OS CLI
CLI 是控制硬件、Junos OS、路由协议和网络连接并对其进行故障排除的主要工具。CLI 命令显示来自路由表的信息、特定于路由协议的信息以及有关从 ping 和跟踪路由实用程序派生的网络连接的信息。有关使用 CLI 对 Junos OS 进行故障排除的信息,请参阅相应的 Junos OS 配置指南。
网络端口、管理面板和组件上的警报和 LED
当路由引擎检测到报警情况时,它会根据需要点亮管理面板上的红色或黄色报警 LED。此外,您还可以使用组件 LED 和网络端口 LED 对QFX5130交换机进行故障排除。有关详细信息,请参阅 QFX5130管理面板。
JTAC
如果在故障排除过程中需要帮助,可以使用 Web 或电话联系瞻博网络技术援助中心 (JTAC)。如果遇到软件问题或此处未讨论的硬件组件问题,请联系 JTAC。
知识库文章 – 知识库。
QFX5130报警消息概述
当 QFX5130 交换机检测到报警情况时,它会根据需要点亮管理面板上的红色或黄色报警 LED。要查看告警原因的更详细说明,请发出 show system alarms
操作 CLI 命令。
user@host> show system alarms 2 alarms currently active Alarm time Class Description 2019-01-22 16:32:54 PST Major PEM 1 Absent 2019-01-22 16:31:04 PST Minor Host 0 Disk 2 Labelled incorrectly
对于散热问题, show chassis temperature-thresholds
CLI 命令显示每个报警级别的截止温度:
user@host> show chassis temperature-thresholds Fan speed Yellow alarm Red alarm Fire Shutdown (degrees C) (degrees C) (degrees C) (degrees C) Item Normal High Normal Bad fan Normal Bad fan Normal Routing Engine 0 CPU Temperature 75 79 90 90 95 95 101 FPC 0 Sensor TopMiddle 51 56 67 67 77 77 87 FPC 0 Sensor TopFrontLeft 46 51 62 62 72 72 82 FPC 0 Sensor TopBack 54 59 70 70 80 80 90 FPC 0 Sensor BottomBack 51 56 67 67 77 77 87 FPC 0 Sensor CPUTopLeft 46 51 62 62 72 72 82 FPC 0 Sensor CPUBottomMiddle 54 59 70 70 80 80 90 FPC 0 Sensor CPUTopBackRight 46 51 62 62 72 72 82 FPC 0 Sensor TD4 Max Reading 82 89 102 102 105 105 110
计算风扇实时性能监控 (RPM) 或 占空比的百分比也很有帮助,请在 root 中使用以下命令:
root@re0.~#i2cget -y -f 13 0x66 0x11 0x07
在此示例中,系统返回了十六进制值 0x07
。将该值转换为十进制,在本例中为 7。然后使用此公式获取占空比:
Duty cycle = (value returned + 1)*6.25%
在本例中,占空比 = (7 +1)*6.25 = 50%
机箱报警消息
机箱报警指示交换机或其某个组件出现故障。机箱报警是预设的,无法修改。
QFX5130交换机上的机箱报警具有两个严重性级别:
主要(红色)— 表示交换机上出现由 表 1 中所述情况之一导致的严重情况。红色报警情况需要立即采取行动。
次要(黄色)— 表示交换机上的非严重情况,如果不加以选中,可能会导致服务中断或性能下降。黄色报警情况需要监控或维护。
表 1 介绍了 QFX5130 交换机上的机箱报警消息。
Junos OS 演化版系统(如 QFX5130-32CD/QFX5130E-32CD 和 QFX5130-48C)基于新的报警基础设施,并非所有电源和风扇报警都受支持。 表 1 显示了这些报警。
元件 |
报警类型 |
CLI 消息 |
建议的操作 |
---|---|---|---|
球迷 |
红色(大调) |
|
将风扇模块安装在没有风扇模块的插槽中。 |
|
卸下并检查风扇模块是否有障碍物。重新插入风扇模块。如果问题仍然存在,请更换风扇模块。 |
||
sensor-location 温度传感器太热 |
检查其他设备上的环境条件和警报。确保环境因素(如设备周围吹来的热空气)不会影响温度传感器。如果情况仍然存在,设备可能会关闭。 |
||
黄色(次要) |
|
卸下并检查风扇模块是否有障碍物。重新插入风扇模块。如果问题仍然存在,请检查系统日志中是否有与传感器相关的消息,并将该消息报告给客户服务。 |
|
sensor-location 温度传感器太热 |
检查其他设备上的环境条件和警报。确保环境因素(如设备周围吹动的热空气)不会影响温度传感器。 |
||
电源 |
红色(大调) |
|
将电源安装到空插槽中,并确保电源已通电。 |
温度传感器 |
主要(红色) |
|
检查其他设备上的环境条件和警报。确保环境因素(如设备周围吹动的热空气)不会影响温度传感器。如果情况仍然存在,设备可能会关闭。 |
次要(黄色) |
|
检查其他设备上的环境条件和警报。确保环境因素(如设备周围吹动的热空气)不会影响温度传感器。 |
|
|
检查系统日志中是否有以下错误消息,并将该消息报告给客户支持: |
||
路由引擎 |
主要(红色) |
|
文件存储已满负荷。减少不必要的文件以释放空间。 |
次要(黄色) |
|
文件存储即将达到容量。减少不必要的文件以释放空间。 |
|
管理以太网接口 |
主要(红色) |
|
检查电缆是否连接到管理以太网接口,或者电缆是否有故障。如果需要,请更换电缆。 |