如何排解错误情况
阅读以下部分,了解如何使用报警消息和组件指示器诊断路由器上的问题。
从这里开始
您可以通过 Junos OS 报警消息和 LED 指示灯获得故障排除资源。您可以使用这些链接来了解发生错误时这些告警和指示器的含义。
要对路由器进行故障排除,请使用 Junos OS CLI、网络端口、路由控制板 (RCB) 管理面板和组件上的警报和 LED。
-
LED — 当路由引擎检测到告警情况时,会根据需要点亮管理面板上的红色或黄色报警 LED。此外,您可以使用组件 LED 和网络端口 LED 对路由器进行故障排除。
-
CLI — CLI 是用于对硬件、Junos OS、路由协议和网络连接进行流程处理和故障排除的主要工具。CLI 命令显示来自路由表的信息、特定于路由协议的信息以及有关从 ping 和 traceroute 实用程序派生的网络连接的信息。有关使用 CLI 对 Junos OS 进行故障排除的信息,请参阅相应的 Junos OS 配置指南。
-
JTAC — 如果在故障排除过程中需要帮助,可以通过 Web 或电话联系瞻博网络技术援助中心 (JTAC)。如果遇到软件问题或此处未讨论的硬件组件问题,请联系 JTAC。
-
知识库文章 - 知识库。
报警消息概述
当路由引擎检测到告警情况时,会根据需要点亮 RCB 管理面板上的红色或黄色告警 LED。要查看告警原因的更详细说明,请发出 show system alarms CLI 命令,该命令指示系统上的主要告警和次要告警。
在此示例中,插槽 4 中发生风扇托架错误。
user@host> show system alarms 6 alarms currently active Alarm time Class Description 2020-07-21 09:33:09 PDT Minor PSM 0 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 1 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 2 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:08 PDT Major PSM 0 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 1 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 2 Input2 Failed
您还可以使用命令的 show system errors 变体来查找有关错误的关键信息。
-
show system errors active- 显示系统中的当前活动错误 -
show system errors active fpc— 显示线卡的活动错误 -
show system errors count—显示系统范围的错误和当前计数 -
show system errors fru detail—显示详细的 FRU 特定错误 -
show system errors fru detail fpc—显示有关基于 FRU 检测到的错误的信息
此示例不仅显示当前错误,还显示已清除的错误。
user@host> show system errors count Level Occurred Cleared Action-Taken ------------------------------------------- Minor 35 32 39 Major 3 0 6 Fatal 0 0 0
机箱报警消息
机箱报警表示设备或其某个组件出现故障。机箱警报是预设的,无法修改。
路由器上的机箱报警有两个严重级别:
-
主要(红色) — 表示设备上由 表 1 中所述的条件之一引起的严重情况。红色报警情况需要立即采取行动。
-
轻微(黄色或琥珀色) — 表示设备上的非严重状况,如果不选中,可能会导致服务中断或性能下降。黄色报警情况需要监控或维护。
表 1 介绍了路由器上的机箱报警消息。
| 机箱组件 |
报警情况 |
报警严重性 |
补救措施 |
|---|---|---|---|
| 路由控制板 | RCB 出现故障。 |
主要(红色) |
更换出现故障的 RCB。 |
| RCB 已被删除。 |
次要(黄色) |
在空插槽中安装 RCB。 |
|
| 线卡 | 线卡脱机。 |
次要(黄色) |
检查线卡。卸下并重新安装线卡。如果失败,请更换出现故障的卡。 |
| 线卡出现故障。 |
主要(红色) |
更换出现故障的线卡。 |
|
| 线卡已移除。 |
主要(红色) |
在空插槽中安装线卡。 |
|
| 风扇托架 | 风扇托架已从机箱中卸下。 |
主要(红色) |
安装丢失的风扇托架。 |
| 机箱中的一个风扇未旋转或旋转速度低于所需速度。 |
主要(红色) |
更换风扇托架。 |
|
| 风扇未从风扇托架控制器接收电源。 |
主要(红色) |
检查并更换出现故障的风扇托架控制器(如果需要)。 |
|
| 风扇托架控制器 | 风扇托架控制器出现故障。 |
次要(黄色) |
检查并更换出现故障的风扇托架控制器(如果需要)。 |
| 机箱中的一个风扇托架控制器未获得足够的电力。 |
主要(红色) |
检查电源。 |
|
| 交换机接口板 (SIB) | 其中一个 SIB 出现故障。 |
次要(黄色) |
请检查以下内容:
|
| 以太网 | RCB 上的以太网管理接口已关闭。 |
次要(黄色) |
|
| 热插拔 | 发生过多热插拔中断。 |
主要(红色) |
更换出现故障的组件。 |
| 电源 | 电源已从机箱上拔下。 |
次要(黄色) |
在空插槽中安装电源。 |
| 电源的温度较高。 |
主要(红色) |
更换出现故障的电源。 |
|
| 电源输入出现故障。 |
主要(红色) |
检查电源输入连接和电源线。 |
|
| 电源输出出现故障。 |
主要(红色) |
检查电源输出连接。 |
|
| 电源出现故障。 |
主要(红色) |
更换出现故障的电源。 |
|
| 已安装交流和直流电源。 |
主要(红色) |
请勿混用交流和直流电源。 |
|
| 电源数量不足。 |
主要(红色) |
安装附加电源。 |
|
| 当前共享失败 | 主要(红色) | 在当前共享故障期间,PSM 状态保持联机状态。当配备第三代电源的设备上发生均流故障时,系统不会在 LED 上指示故障或将 PSM 状态更改为故障。相反,系统会使 PSM 状态保持联机并引发告警。 无需执行任何作。 |
|
| mcu_access_failure |
主要(红色) | 如果显示mcu_access_failure但未将状态显示为故障,并且 PSM 正在提供输出电源,则提示 PSM 存在环境故障。 如果已启用 PSM 看门狗,则作为弹性作,PSM 将被关闭。 |
|
| PSM I2C SCL 故障 | 主要(红色) | 在 8 插槽机箱中,如果 I2C 的 SCL(串行时钟线)引脚由于 PSM0 上的时钟拉伸而短路到父/主 PSM0 中的 GND(接地)引脚,则会影响所有子/次 PSM 上的事务。由于“hwdre”故障,您将无法查看 PSM 的状态。在这种情况下,通过迭代删除和识别有故障的 PSM 来隔离有故障的 PSM,并更换有故障的 PSM。如果我们交换PSM,但所有PSM上仍然存在故障,则机箱/中板可能存在故障;然后,您可以为此提出 RMA。 示例:如果在 PSM0 及其后续 PSM(PSM1 到 PSM3)上看到故障,则故障可能出在 PSM0 中。您需要将 PSM0 与同一主服务器(PSM1、PSM2 或 PSM3)中的任何其他 PSM 交换,并检查是否已整流。 如果在 PSM4 及其后续子/辅助 PSM (PSM5) 上看到故障,则故障可能出在 PSM4 中。您需要将 PSM4 与 PSM5 交换(因为 PSM4 是主 PSM)并检查是否已整流。 |
|
| 短引脚故障 | 主要(红色) | 短引脚故障允许电源检测它是否正确连接到中板。检测到电源模块 (PSM) 时,打开输出。由于此问题发生在 PSM 外部,因此不被视为 PSM 故障。因此,故障 LED 不会变为红色。 尝试重新插入,如果错误仍然存在,请返回PSM(RMA),因为没有中板连接。 |
|
| 单通道 pfc 故障 | 主要(红色) | 如果单个通道上发生 PFC 故障,故障 LED 不会变为红色,并且 PSM 将保持联机状态,因为 PSM 输出仍处于打开状态。但是,如果所有四个通道都出现故障,故障 LED 将变为红色,PSM 将进入故障状态。 无需执行任何作。 |
|
| 温度 | 机箱温度已超过 104° F (40° C),风扇已全速开启,并且一个或多个风扇出现故障。 |
次要(黄色) |
|
| 机箱温度已超过 149° F (65° C),风扇已全速开启。 |
次要(黄色) |
|
|
| 机箱温度已超过 149° F (65° C),并且风扇出现故障。如果这种情况持续超过 90 秒,路由器将关闭。 |
主要(红色) |
|
|
| 机箱温度已超过 167° F (75° C)。如果这种情况持续超过 90 秒,路由器将关闭。 |
主要(红色) |
|
|
| 温度传感器出现故障。 |
主要(红色) |
使用 https://www.juniper.net/support/ 的案例管理器链接创建支持案例,或致电 1-888-314-5822(免费电话,美国和加拿大)或 1-408-745-9500(来自美国境外)。 |