如何排查错误情况
阅读以下部分,了解如何使用告警消息和组件指示器诊断路由器上的问题。
这是从哪里开始
您可以通过 Junos OS 报警消息和 LED 指示灯获得故障排除资源。您可以使用这些链接来发现发生错误时这些警报和指示器的含义。
要对路由器进行故障排除,请使用 Junos OS CLI、网络端口上的报警和 LED、路由控制板 (RCB) 的管理面板和组件。
-
LED — 当路由引擎检测到报警情况时,它会根据需要点亮管理面板上的红色或黄色报警 LED。此外,您可以使用组件 LED 和网络端口 LED 对路由器进行故障排除。
-
CLI — CLI 是用于对硬件、Junos OS、路由协议和网络连接进行流动和故障排除的主要工具。CLI 命令显示来自路由表的信息、特定于路由协议的信息以及有关从 ping 和跟踪路由实用程序派生的网络连接的信息。有关使用 CLI 对 Junos OS 进行故障排除的信息,请参阅相应的 Junos OS 配置指南。
-
JTAC—如果在故障排除过程中需要帮助,可以使用 Web 或电话联系瞻博网络技术支持中心 (JTAC)。如果遇到软件问题或此处未讨论的硬件组件问题,请联系 JTAC。
-
知识库文章 - 知识库。
报警消息概述
当路由引擎检测到报警情况时,它会根据需要点亮 RCB 管理面板上的红色或黄色报警 LED。要查看报警原因的更详细说明,请发出 show system alarms
CLI 命令,该命令指示系统上的主要和次要报警。
在此示例中,插槽 4 中发生风扇托盘错误。
user@host> show system alarms 6 alarms currently active Alarm time Class Description 2020-07-21 09:33:09 PDT Minor PSM 0 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 1 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 2 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:08 PDT Major PSM 0 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 1 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 2 Input2 Failed
您还可以使用命令的 show system errors
变体来查找有关错误的关键信息。
-
show system errors active
- 显示系统中当前的活动错误 -
show system errors active fpc
— 显示线卡的活动错误 -
show system errors count
—显示系统范围内的错误和电流计数 -
show system errors fru detail
- 显示特定于 FRU 的详细错误 -
show system errors fru detail fpc
- 显示有关基于 FRU 检测到的错误的信息
此示例不仅显示当前错误,还显示已清除的错误。
user@host> show system errors count Level Occurred Cleared Action-Taken ------------------------------------------- Minor 35 32 39 Major 3 0 6 Fatal 0 0 0
机箱报警消息
机箱报警指示设备或其某个组件出现故障。机箱报警是预设的,无法修改。
路由器上的机箱报警有两个严重性级别:
-
主要(红色)— 表示设备上由 表 1 中所述情况之一导致的严重情况。红色报警情况需要立即采取行动。
-
次要(黄色或琥珀色)- 表示设备上的非严重情况,如果未选中,可能会导致服务中断或性能下降。黄色报警情况需要监控或维护。
表 1 介绍了路由器上的机箱报警消息。
机箱组件 |
报警情况 |
报警严重性 |
补救 |
---|---|---|---|
路由控制板 | RCB 出现故障。 |
主要(红色) |
更换出现故障的 RCB。 |
已删除 RCB。 |
次要(黄色) |
在空插槽中安装 RCB。 |
|
线卡 | 线卡处于脱机状态。 |
次要(黄色) |
检查线卡。卸下并重新安装线卡。如果此操作失败,请更换故障卡。 |
线卡出现故障。 |
主要(红色) |
更换故障线卡。 |
|
已删除线卡。 |
主要(红色) |
在空插槽中安装线卡。 |
|
风扇托架 | 已从机箱卸下风扇托架。 |
主要(红色) |
安装缺少的风扇托架。 |
机箱中的一个风扇不旋转或旋转低于所需速度。 |
主要(红色) |
更换风扇托架。 |
|
风扇未从风扇托架控制器接收电源。 |
主要(红色) |
如果需要,检查并更换出现故障的风扇托架控制器。 |
|
风扇托架控制器 | 风扇托架控制器出现故障。 |
次要(黄色) |
如果需要,检查并更换出现故障的风扇托架控制器。 |
机箱中的某个风扇托架控制器未获得足够的电源。 |
主要(红色) |
检查电源。 |
|
交换机接口板 (SIB) | 其中一个 SIB 出现故障。 |
次要(黄色) |
检查以下内容:
|
以太网 | RCB 上的以太网管理接口已关闭。 |
次要(黄色) |
|
热插拔 | 发生过多的热插拔中断。 |
主要(红色) |
更换故障组件。 |
电源 | 已从机箱卸下电源。 |
次要(黄色) |
在空插槽中安装电源。 |
电源具有高温。 |
主要(红色) |
更换故障电源。 |
|
电源输入出现故障。 |
主要(红色) |
检查电源输入连接和电源线。 |
|
电源输出出现故障。 |
主要(红色) |
检查电源输出连接。 |
|
电源出现故障。 |
主要(红色) |
更换故障电源。 |
|
已安装交流和直流电源。 |
主要(红色) |
请勿混用交流和直流电源。 |
|
电源数量不足。 |
主要(红色) |
安装额外的电源。 |
|
温度 | 机箱温度已超过 104° F (40° C),风扇已全速打开,并且一个或多个风扇出现故障。 |
次要(黄色) |
|
机箱温度已超过 149° F (65° C),风扇已全速打开。 |
次要(黄色) |
|
|
机箱温度超过 149° F (65° C),并且风扇出现故障。如果这种情况持续超过 90 秒,路由器将关闭。 |
主要(红色) |
|
|
机箱温度已超过 167° F (75° C)。如果这种情况持续超过 90 秒,路由器将关闭。 |
主要(红色) |
|
|
温度传感器出现故障。 |
主要(红色) |
使用案例管理器链接 https://www.juniper.net/support/ 或致电1-888-314-5822(免费电话,美国和加拿大)或1-408-745-9500(美国境外)打开支持案例。 |