报警概述
本节介绍接口告警及其配置方法。
警报会提醒您网络接口、设备机箱或系统软件中可能阻止设备正常运行的情况。您可以设置在接口上触发告警的条件。机箱和系统报警条件已预设。
活动报警点亮 ALARM 设备前面板上的 LED。您可以从 J-Web 用户界面或 CLI 监控活动警报。当报警条件触发报警时,设备会亮起前面板上的黄色(琥珀色) ALARM LED。纠正条件后,灯熄灭。
报警类型
该设备支持三种类型的警报:
接口报警指示固定或已安装的物理接口模块 (PIM) 上的物理链路状态存在问题。要启用接口报警,您必须对其进行配置。
机箱报警指示设备或其某个组件出现故障。机箱报警是预设的,无法修改。
系统报警指示缺少有效的救援配置或软件许可证。系统警报是预设的,无法修改,但您可以将它们配置为自动显示在 J-Web 用户界面或 CLI 中。
从 Junos OS 15.1X49-D60 版和 Junos OS 17.3R1 版开始,引入了新的系统告警,指示 PIC(I/O 卡或 SPC)在系统启动时间内未能联机。
从 Junos OS 版本 12.3X48-D85、15.1X49-D180 和 19.2R1 开始,当网络安全进程 (NSD) 由于一个或多个 NSD 子组件故障而无法重新启动时,将触发系统告警。有关 NSD 的报警日志保存在消息日志中。当NSD成功重启时,告警会自动清除。show chassis alarms
和show system alarms
命令将更新,以便在 NSD 无法重新启动时显示以下输出 - NSD fails to restart because subcomponents fail
。
当 CLI 提示符指示已引发警报时,运行以下命令:
show system alarms
show chassis alarms
show chassis fpc pic-status
报警严重性
警报有两个严重性级别:
主要(红色)— 表示设备上由以下情况之一导致的严重情况。红色报警情况需要立即采取行动。
一个或多个硬件组件出现故障。
一个或多个硬件组件已超过温度阈值。
接口上配置的报警条件触发了严重警告。
次要(黄色)- 表示设备上的非严重情况,如果未选中,可能会导致服务中断或性能下降。黄色报警情况需要监控或维护。
缺少救援配置或软件许可证会生成黄色系统告警。
报警条件
要在设备接口上启用警报,必须选择警报条件和警报严重性。相比之下,机箱报警和系统报警预先配置了报警条件和严重性。
有关设备的机箱报警信息,请参阅设备的硬件指南。
本节包含以下主题:
接口报警条件
表 1 列出了可为告警配置的接口条件(按接口类型排序)。您可以将每个报警条件配置为触发主要(红色)警报或次要(黄色)警报。包括相应的配置选项。
对于在设备内内部自适应服务模块上运行的服务状态防火墙过滤器(NAT、IDP 和 IPsec),您可以在集成服务和服务接口上配置告警条件。
接口 |
报警情况 |
Description |
配置选项 |
---|---|---|---|
DS1 (T1) |
报警指示信号 (AIS) |
正常的 T1 交通信号灯存在缺陷,已被 AIS 取代。在远程端点或远程端点的上游发生传输中断。传输这种全一信号是为了防止随之而来的下游故障或报警。 |
ais |
黄色警报 |
远程端点处于黄色警报失败状态。这种情况也称为远端警报故障。 |
ylw |
|
以太网 |
链路已关闭 |
物理链路不可用。 |
link-down |
综合服务 |
硬件或软件故障 |
在自适应服务模块上,与模块关联的硬件或驱动模块的软件出现故障。 |
failure |
串行 |
无清除发送 (CTS) 信号 |
串行链路的远程端点未传输 CTS 信号。CTS 信号必须存在,然后才能通过串行链路传输数据。 |
cts-absent |
数据载波检测 (DCD) 信号缺失 |
串行链路的远程端点未传输 DCD 信号。由于 DCD 信号传输设备的状态,因此没有信号可能表示串行链路的远程端点不可用。 |
dcd-absent |
|
数据集就绪 (DSR) 信号缺失 |
串行链路的远程端点未传输 DSR 信号。DSR 信号指示远程端点已准备好通过串行链路接收和传输数据。 |
dsr-absent |
|
接收时钟丢失 |
来自远程端点的时钟信号不存在。串行连接要求时钟信号从一个端点传输,并由链路的另一个端点接收。 |
loss-of-rx-clock |
|
传输时钟丢失 |
本地时钟信号不存在。串行连接要求时钟信号从一个端点传输,并由链路的另一个端点接收。 |
loss-of-tx-clock |
|
服务 |
服务模块硬件关闭 |
设备的服务模块出现硬件问题。此错误通常表示模块上的一个或多个 CPU 出现故障。 |
hw-down |
服务链接关闭 |
设备与其服务模块之间的链接不可用。 |
linkdown |
|
服务模块在重置中保持 |
设备的服务模块停滞在重置模式。如果服务模块连续五次或更多次启动失败,则服务模块将保持复位模式。当从 CPU 释放到 CPU 停止的时间少于 300 秒时,启动失败。 |
pic-hold-reset |
|
服务模块重置 |
设备的服务模块正在重置。模块在崩溃或从 CLI 重置后,或者启动时间超过 60 秒时重置。 |
pic-reset |
|
服务模块软件关闭 |
设备的服务模块出现软件问题。 |
sw-down |
|
E3 |
报警指示信号 (AIS) |
正常的 E3 交通信号灯包含缺陷状况,已被 AIS 取代。在远程端点或远程端点的上游发生传输中断。传输这种全一信号是为了防止随之而来的下游故障或报警。 |
ais |
信号丢失 (LOS) |
E3 接口未收到远程 E3 信号。 |
los |
|
帧外 (OOF) |
OOF 条件已存在 10 秒。此告警仅适用于在帧模式下配置的 E3 接口。当 20 秒内未发生 OOF 或 LOS 缺陷时,将清除 OOF 故障。 |
oof |
|
远程缺陷指示 |
存在 AIS、LOS 或 OOF 条件。此告警仅适用于在帧模式下配置的 E3 接口。 |
rdi |
|
T3 (DS3) |
报警指示信号 |
正常的 T3 交通信号灯存在缺陷,已被 AIS 取代。在远程端点或远程端点的上游发生传输中断。传输这种全一信号是为了防止随之而来的下游故障或报警。 |
ais |
零数过多 |
从上游主机接收的比特流的连续零数多于 T3 帧中允许的零数。 |
exz |
|
远端接收失败 (FERF) |
连接的远程终结点失败。FERF 与黄色警报不同,因为故障可以是任何故障,而不仅仅是 OOF 或 LOS 故障。 |
ferf |
|
怠速报警 |
正在从远程端点接收空闲信号。 |
idle |
|
行代码违规 |
T3 链路上的线路编码已损坏,或者 T3 连接的本地和远程端点的编码不匹配。 |
lcv |
|
帧丢失 (LOF) |
OOF 或信号丢失 LOS 情况已存在 10 秒。当 20 秒内未发生 OOF 或 LOS 缺陷时,将清除 LOF 故障。LOF 故障也称为红色故障。 |
lof |
|
信号丢失 (LOS) |
T3 接口未收到远程 T3 信号。 |
los |
|
锁相环失锁 |
本地和远程端点的时钟信号不再同步运行。 |
pll |
|
黄色警报 |
远程端点处于黄色警报失败状态。这种情况也称为远端警报故障。 |
ylw |
系统报警条件
表 2 列出两个预设的系统警报、触发每个警报的条件以及为更正条件而采取的措施。
报警类型 |
报警情况 |
纠正措施 |
---|---|---|
配置 |
未设置救援配置。 |
设置救援配置。 |
许可证 |
您已配置至少一个需要功能许可证的软件功能,但当前未安装该功能的有效许可证。 注:
此警报表示您违反了软件许可协议。您必须安装有效的许可证密钥才能符合所有协议。 |
安装有效的许可证密钥。 |
变更历史表
是否支持某项功能取决于您使用的平台和版本。 使用 Feature Explorer 查看您使用的平台是否支持某项功能。
show chassis alarms
和show system alarms
命令将更新,以便在 NSD 无法重新启动时显示以下输出 - NSD fails to restart because subcomponents fail
。