Paragon Insights 概述

Paragon Insights（前身为 HealthBot）是一款高度自动化和可编程的设备级诊断和网络分析工具，可在多个网络部署中提供一致且一致的运营智能。Paragon Insights 集成了多种数据收集方法（如 Junos 遥测接口（JTI）、NETCONF、syslog 和 SNMP），以聚合和关联大量时间敏感型遥测数据，从而提供多维度和预测性的网络视图。此外，Paragon Insights 将故障排除、维护和实时分析转化为直观的用户体验，为网络运营商提供有关单个设备和整个网络运行状况的可行见解。

Paragon Insights 的主要组成部分

Paragon Insights 由两个主要组件组成：

运行状况监控，用于查看设备和网络级运行状况的抽象分层表示，并通过可自定义的关键性能指标（KPI）、规则和操作指南定义关键网络元素的运行状况参数。剧本是规则的集合。您可以创建操作指南并将该操作指南应用于设备组或网络组。有关规则和操作指南的更多信息，请参阅 Paragon Insights 规则和操作指南。
根本原因分析，可帮助您在 Paragon Insights 检测到网络元素问题时找到设备或网络级问题的根本原因。

Paragon Insights 运行状况监控
Paragon Insights 根本原因分析

Paragon Insights 运行状况监控

挑战

随着云原生应用和新兴技术产生的数据流量不断增加，服务提供商和企业需要一个网络分析解决方案来分析大量的遥测数据，提供对整体网络运行状况的洞察，并生成可操作的情报。尽管基于遥测的技术已经存在多年，但来自不同网络设备的协议、数据格式和 KPI 数量不断增加，这使得数据分析变得复杂且成本高昂。传统的基于 CLI 的接口需要专业技能才能从遥测数据中提取业务价值，从而为网络分析设置了进入壁垒

Paragon Insights 运行状况监控如何提供帮助

通过聚合和关联来自多个来源的原始遥测数据，Paragon Insights 运行状况监控组件提供了网络运行状况的多维视图，用于报告当前状态以及对网络基础架构及其工作负载的预期威胁。

运行状况确定与 Paragon Insights RCA 组件紧密集成，该组件可以利用从网络及其设备接收的系统日志数据。Paragon Insights 运行状况监控提供状态指示器，可在网络资源当前在用户定义的性能策略之外运行时提醒您。Paragon Insights 运行状况监视使用历史趋势进行风险分析，并预测资源将来是否可能不正常。Paragon Insights 运行状况监控不仅可以提供网络元素当前运行状况的完全可自定义视图，还可以根据预定义的服务级别协议（SLA）自动启动补救措施。

定义网络元素（如宽带网络网关（BNG）、提供商边缘（PE）、核心和叶脊）的运行状况高度依赖于上下文。每个元素在网络中扮演不同的角色，需要监控独特的 KPI。鉴于所有用例的网络运行状况没有单一的定义，Paragon Insights 提供了一个高度可定制的框架，允许您定义自己的运行状况配置文件。

Paragon Insights 根本原因分析

挑战

对于某些网络问题，网络运营商可能很难找出导致网络设备停止正常工作的原因。在这种情况下，操作员必须求助专家（具有多年经验积累的知识）来解决问题并找到根本原因。

Paragon Insights RCA 如何提供帮助

Paragon Insights RCA 组件简化了查找网络问题根本原因的过程。Paragon Insights 的 RCA 捕获专家的故障排除知识，并拥有 Paragon Insights 规则形式的知识库。这些规则可以由特定触发器按需评估，也可以在后台定期评估，以确定设备上网络组件（如路由协议、系统、接口或机箱）的运行状况。

为了说明 Paragon Insights RCA 的优势，让我们考虑一下 OSPF 摆动的问题。图 1 突出显示了调试 OSPF 摆动所涉及的工作流程序列。解决此问题的网络运营商需要对工作流序列的每个磁贴（步骤）执行手动调试步骤，以找到 OSPF 抖动的根本原因。另一方面，Paragon Insights RCA 应用程序使用 RCA 机器人自动解决问题。RCA 机器人跟踪 Paragon Insights 收集的所有遥测数据，并将这些信息转换为图形状态指示器（显示在 Paragon Insights Web GUI 中），这些指示器与图 1 所示工作流序列的不同部分相关联。

图 1：调试 OSPF 摆动 High-level workflow to debug OSPF-flapping

的高级工作流程

配置 Paragon Insights 时，工作流序列的每个磁贴（如图 1 所示）都可以由一个或多个规则定义。例如，RPD-OSPF 磁贴可以定义为两个规则条件：一个用于检查“hello-transmited”计数器是否在递增，另一个用于检查“hello-received”计数器是否在递增。基于这些用户定义的规则，Paragon Insights 提供状态指示器、告警通知和告警管理工具，以通知和提醒您可能导致 OSPF 抖动的特定网络状况。

通过在工作流程中隔离问题区域，Paragon Insights RCA 会主动指导您确定要采取的适当纠正措施，以修复未决问题或避免潜在问题。

闭环自动化

Paragon Insights 提供闭环自动化。自动化工作流程可分为七个主要步骤（参见图 2）：

定义 — 用户使用 Paragon Insights 提供的工具，通过可自定义的关键性能指标（KPI）、规则和操作指南来定义关键网络元素的运行状况参数。
收集 — Paragon Insights 使用为不同网络设备指定的收集方法，从多个设备收集基于规则的遥测数据。
存储 — Paragon Insights 将时间敏感型遥测数据存储在时间序列数据库（TSDB）中。这允许用户在初始存储后的几天甚至几周内查询、执行操作并将新数据写回数据库。
分析 — Paragon Insights 根据指定的 KPI、规则和操作指南分析遥测数据。
可视化 — Paragon Insights 为您提供多种方式，通过其基于 Web 的 GUI 可视化聚合遥测数据，从而获得有关设备和整个网络运行状况的可操作和预测性见解。
通知 — 当检测到单个设备或网络中的问题时，Paragon Insights 会通过 GUI 和通知警报通知您。

Act	Paragon Insights 执行用户定义的操作来帮助解决和主动预防网络问题。

图 2：Paragon Insights 闭环自动化工作流程 Paragon Insights Closed-Loop Automation Workflow

Paragon Insights 的优势

自定义 — 提供用于定义和自定义运行状况配置文件的框架，从而为受监控的特定设备或网络提供真正可行的见解。
自动化 — 自动执行根本原因分析和日志文件分析，简化诊断工作流程，并提供自我修复和补救功能。
更高的网络可见性 — 提供跨网络元素的高级多维分析，让您更清楚地了解网络行为，从而建立运营基准、改进资源规划并最大限度地减少服务停机时间。
直观的 GUI — 提供基于 Web 的直观 GUI，用于策略管理和轻松使用数据。
开放式集成 - 通过提供开源数据管道、通知功能和第三方设备支持，降低遥测和分析的门槛。
多种数据收集方法 — 包括对 JTI、OpenConfig、NETCONF、CLI、Syslog、NetFlow 和 SNMP 的支持。

在此页面上