Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

分析网络、设备和服务问题的根本原因

您可以使用 Paragon Automation 来确定与网络、设备或服务运行状况相关的问题的根本原因。问题被记录为错误事件,然后在 Paragon Automation GUI 中显示为警报。Paragon Automation 会执行根本原因分析 (RCA),并将这些警报结合起来,确定问题的原始原因。原始原因与生成的相关警报一起显示在智能警报中。

智能警报可让您专注于问题的核心原因,而不必经历多个警报即可找到根本原因。确定根本原因后,您可以根据需要修复问题。有关根本原因分析的详细信息,请参阅 了解根本原因分析

注意:

在执行 RCA 之前,请确保您已载入设备、创建了设备组并配置了拓扑采集,以便 Paragon Automation 可以获取网络拓扑。有关详细信息,请参阅 获取和查看网络拓扑

要分析网络、设备或服务问题的根本原因,您必须:
  1. 创建一个或多个规则。
    规则定义如何收集和分析有关网络的遥测数据,并在发生异常时生成通知。您可以创建规则来监控网络、设备和服务运行状况、网络资源关键性能指标 (KPI)、各种系统参数等。有关更多信息,请参阅 在 Paragon Automation GUI 中配置自定义规则
  2. 创建并运行剧本实例。
    Playbook 是用于解决特定用例并在设备或网络组上运行的规则集合。必须将步骤 1 中添加的规则包含在 playbook 中,才能将其部署到网络设备。警报是根据配置的剧本和规则生成的。有关更多信息,请参阅 使用 Paragon Insights GUI 创建行动指南
  3. 添加一个或多个资源。
    资源包括网络元素,例如设备、接口、协议、标签交换路径 (LSP)、IPSec 隧道等。确定网络的根本原因。设备或服务问题,必须跨规则映射资源。有关更多信息,请参阅 添加用于根本原因分析的资源
  4. 配置资源之间的依赖关系。
    仅当资源之间配置了依赖关系时,才能将不同资源上的多个警报追溯到原始问题。配置资源之间的依赖关系时,Paragon Automation 可以组合这些资源上的一组错误事件,并确定错误的根本原因。有关详细信息,请参阅 配置资源之间的依赖关系
  5. 查看智能告警和根本原因。
    如果发生网络、设备或服务问题,将根据网络和网络设备上运行的剧本生成警报。当 KPI 超过预定义阈值,导致多个 KPI 异常时,将生成多个警报。
    Paragon Automation 将所有关联的警报分类到称为智能警报的组中,并确定错误序列的根本原因。警报以可折叠的树结构显示,警报的根本原因显示在树的顶部。警报按警报发生的顺序列在根本原因下方,从而显示由根本原因触发的不同问题。您可以在警报页面( 监控>警报和警报>警报)上查看智能警报。有关详细信息,请参阅 关于警报页面

分析智能告警后,您可以根据需要修复问题。