Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

如何排解错误情况

阅读以下部分,了解如何使用报警消息和组件指示器诊断路由器上的问题。

从这里开始

您可以通过 Junos OS 报警消息和 LED 指示灯获得故障排除资源。您可以使用这些链接来了解发生错误时这些告警和指示器的含义。

要对路由器进行故障排除,请使用 Junos OS CLI、网络端口、路由控制板 (RCB) 管理面板和组件上的警报和 LED。

  • LED — 当路由引擎检测到告警情况时,会根据需要点亮管理面板上的红色或黄色报警 LED。此外,您可以使用组件 LED 和网络端口 LED 对路由器进行故障排除。

  • CLI — CLI 是用于对硬件、Junos OS、路由协议和网络连接进行流程处理和故障排除的主要工具。CLI 命令显示来自路由表的信息、特定于路由协议的信息以及有关从 ping 和 traceroute 实用程序派生的网络连接的信息。有关使用 CLI 对 Junos OS 进行故障排除的信息,请参阅相应的 Junos OS 配置指南。

  • JTAC — 如果在故障排除过程中需要帮助,可以通过 Web 或电话联系瞻博网络技术援助中心 (JTAC)。如果遇到软件问题或此处未讨论的硬件组件问题,请联系 JTAC。

  • 知识库文章 - 知识库

报警消息概述

当路由引擎检测到告警情况时,会根据需要点亮 RCB 管理面板上的红色或黄色告警 LED。要查看告警原因的更详细说明,请发出 show system alarms CLI 命令,该命令指示系统上的主要告警和次要告警。

在此示例中,插槽 4 中发生风扇托架错误。

您还可以使用命令的 show system errors 变体来查找有关错误的关键信息。

  • show system errors active- 显示系统中的当前活动错误

  • show system errors active fpc— 显示线卡的活动错误

  • show system errors count—显示系统范围的错误和当前计数

  • show system errors fru detail—显示详细的 FRU 特定错误

  • show system errors fru detail fpc—显示有关基于 FRU 检测到的错误的信息

此示例不仅显示当前错误,还显示已清除的错误。

机箱报警消息

机箱报警表示设备或其某个组件出现故障。机箱警报是预设的,无法修改。

路由器上的机箱报警有两个严重级别:

  • 主要(红色) — 表示设备上由 表 1 中所述的条件之一引起的严重情况。红色报警情况需要立即采取行动。

  • 轻微(黄色或琥珀色) — 表示设备上的非严重状况,如果不选中,可能会导致服务中断或性能下降。黄色报警情况需要监控或维护。

表 1 介绍了路由器上的机箱报警消息。

表 1:机箱组件报警条件

机箱组件

报警情况

报警严重性

补救措施

路由控制板

RCB 出现故障。

主要(红色)

更换出现故障的 RCB。

RCB 已被删除。

次要(黄色)

在空插槽中安装 RCB。

线卡

线卡脱机。

次要(黄色)

检查线卡。卸下并重新安装线卡。如果失败,请更换出现故障的卡。

线卡出现故障。

主要(红色)

更换出现故障的线卡。

线卡已移除。

主要(红色)

在空插槽中安装线卡。

风扇托架

风扇托架已从机箱中卸下。

主要(红色)

安装丢失的风扇托架。

机箱中的一个风扇未旋转或旋转速度低于所需速度。

主要(红色)

更换风扇托架。

风扇未从风扇托架控制器接收电源。

主要(红色)

检查并更换出现故障的风扇托架控制器(如果需要)。

风扇托架控制器

风扇托架控制器出现故障。

次要(黄色)

检查并更换出现故障的风扇托架控制器(如果需要)。

机箱中的一个风扇托架控制器未获得足够的电力。

主要(红色)

检查电源。

交换机接口板 (SIB)

其中一个 SIB 出现故障。

次要(黄色)

请检查以下内容:

  • SIB 未通电。

  • 风扇托架控制器出现电源问题。

以太网

RCB 上的以太网管理接口已关闭。

次要(黄色)

  • 检查接口电缆连接。

  • 重新启动系统。

  • 如果警报再次出现,请使用 https://www.juniper.net/support/ 的案例管理器链接创建支持案例,或致电 1-888-314-5822(免费电话,美国和加拿大)或 1-408-745-9500(从美国境外)。

热插拔

发生过多热插拔中断。

主要(红色)

更换出现故障的组件。

电源

电源已从机箱上拔下。

次要(黄色)

在空插槽中安装电源。

电源的温度较高。

主要(红色)

更换出现故障的电源。

电源输入出现故障。

主要(红色)

检查电源输入连接和电源线。

电源输出出现故障。

主要(红色)

检查电源输出连接。

电源出现故障。

主要(红色)

更换出现故障的电源。

已安装交流和直流电源。

主要(红色)

请勿混用交流和直流电源。

电源数量不足。

主要(红色)

安装附加电源。

当前共享失败 主要(红色) 在当前共享故障期间,PSM 状态保持联机状态。当配备第三代电源的设备上发生均流故障时,系统不会在 LED 上指示故障或将 PSM 状态更改为故障。相反,系统会使 PSM 状态保持联机并引发告警。

无需执行任何作。

mcu_access_failure

主要(红色)

如果显示mcu_access_failure但未将状态显示为故障,并且 PSM 正在提供输出电源,则提示 PSM 存在环境故障。

如果已启用 PSM 看门狗,则作为弹性作,PSM 将被关闭。

PSM I2C SCL 故障 主要(红色) 在 8 插槽机箱中,如果 I2C 的 SCL(串行时钟线)引脚由于 PSM0 上的时钟拉伸而短路到父/主 PSM0 中的 GND(接地)引脚,则会影响所有子/次 PSM 上的事务。由于“hwdre”故障,您将无法查看 PSM 的状态。在这种情况下,通过迭代删除和识别有故障的 PSM 来隔离有故障的 PSM,并更换有故障的 PSM。如果我们交换PSM,但所有PSM上仍然存在故障,则机箱/中板可能存在故障;然后,您可以为此提出 RMA。

示例:如果在 PSM0 及其后续 PSM(PSM1 到 PSM3)上看到故障,则故障可能出在 PSM0 中。您需要将 PSM0 与同一主服务器(PSM1、PSM2 或 PSM3)中的任何其他 PSM 交换,并检查是否已整流。

如果在 PSM4 及其后续子/辅助 PSM (PSM5) 上看到故障,则故障可能出在 PSM4 中。您需要将 PSM4 与 PSM5 交换(因为 PSM4 是主 PSM)并检查是否已整流。

短引脚故障 主要(红色) 短引脚故障允许电源检测它是否正确连接到中板。检测到电源模块 (PSM) 时,打开输出。由于此问题发生在 PSM 外部,因此不被视为 PSM 故障。因此,故障 LED 不会变为红色。

尝试重新插入,如果错误仍然存在,请返回PSM(RMA),因为没有中板连接。

单通道 pfc 故障 主要(红色) 如果单个通道上发生 PFC 故障,故障 LED 不会变为红色,并且 PSM 将保持联机状态,因为 PSM 输出仍处于打开状态。但是,如果所有四个通道都出现故障,故障 LED 将变为红色,PSM 将进入故障状态。

无需执行任何作。

温度

机箱温度已超过 104° F (40° C),风扇已全速开启,并且一个或多个风扇出现故障。

次要(黄色)

  • 检查室温。

  • 检查气流。

  • 更换风扇托架。

机箱温度已超过 149° F (65° C),风扇已全速开启。

次要(黄色)

  • 检查室温。

  • 检查气流。

  • 检查风扇。

机箱温度已超过 149° F (65° C),并且风扇出现故障。如果这种情况持续超过 90 秒,路由器将关闭。

主要(红色)

  • 检查室温。

  • 检查气流。

  • 检查风扇。

机箱温度已超过 167° F (75° C)。如果这种情况持续超过 90 秒,路由器将关闭。

主要(红色)

  • 检查室温。

  • 检查气流。

  • 检查风扇。

温度传感器出现故障。

主要(红色)

使用 https://www.juniper.net/support/ 的案例管理器链接创建支持案例,或致电 1-888-314-5822(免费电话,美国和加拿大)或 1-408-745-9500(来自美国境外)。