警报和警报概述
您可以在告警(监控>告警和告警>告警)页面上查看已引发的告警。警报指示设备上可能阻止设备正常运行的情况。设备的报警条件是预定义的,并根据设备上执行的故障监控和性能监控 (FMPM) 引发。例如,硬件问题、吞吐量下降和数据延迟、温度变化和容量优化问题等情况会自动触发警报。
您可以查看瞻博网络和思科 IOS-XR 设备上发出的告警。在瞻博网络设备上,您可以查看以下情况下的警报:
-
接口关闭
-
机箱报警
-
高产出利用率
-
高输入利用率
-
CPU 利用率高
-
高内存利用率
-
高存储利用率
-
风扇故障
-
高温
对于运行 IOS XR 版本 7.1.5 及更高版本的 Cisco IOS XR 设备,您可以查看在 OpenConfig 报警模型中定义的报警。
对于 Cisco IOS XR 设备,您必须将默认 NETCONF 端口设置为 22,否则无法查看告警。
您可以在 Paragon Automation 仪表板上查看警报统计信息。仪表板显示不同警报类型的严重性以及前一小时、一天、一周、一个月和一年的警报历史记录。
您可以在警报(监控>警报和警报>警报)页面上查看 Paragon Automation 生成的警报。Paragon Automation 会针对设备组或网络组中的异常生成警报。您必须在设备组和网络组上部署操作指南,以监控特定的关键性能指标 (KPI) 并检测异常情况。异常包括系统错误、协议错误、接口错误、机箱错误和其他自定义可配置 KPI。Paragon Automation 还会自动将多个警报组合在一个主警报(称为智能警报)下,从而识别这些组合错误和异常的根本原因。这些警报称为 智能警报。配置通知配置文件并在设备组和网络组设置中启用通知配置文件时,您可以收到重大事件的警报通知。有关详细信息 ,请参阅配置通知配置文件 。您可以在“警报”页上查看次要、主要和正常警报。还可以从“网络运行状况”页上的时间线视图、磁贴视图和表视图中跟踪与警报关联的 KPI。
告警和告警的生命周期如表1所示。
警报 | 警报 |
---|---|
引发 - 当满足遥测管理器中定义的条件时,将引发警报。Paragon Automation 会存储警报,您可以在“警报”页面上查看它们。 |
引发 - 当在设备组或网络组上检测到异常(例如,KPI 超过预设阈值)或状态更改(例如,链路断开)时,将引发警报。 |
分配 - 分配用户以检查警报引发的问题。 |
确认 - 用户查看并确认警报。用户采取措施修正生成警报的设备中的条件。确认表示正在进行纠正错误或异常的工作。 |
确认 - 如果用户已查看和/或对警报指示的问题进行故障排除,则使用已确认状态标记警报。 |
搁置— — 您可以将警报的状态设置为搁置。搁置会降低警报的优先级,并在您配置的时间内暂停警报。您还可以重新打开已关闭或搁置的警报。 或 关闭 - 解决警报引发的问题后,您可以将警报的状态设置为关闭。您还可以重新打开已关闭的警报。 |
清除 — Paragon Automation 会在引发告警的条件正常化后自动清除告警。 | 删除 - 要从提醒页面移除提醒,您可以删除提醒。 |