J-Insight 设备监视器概述
随着网络变得越来越复杂,采用可简化监控、维护和改善网络设备整体运行状况过程的功能对于以更可预测和更易于管理的方式提供服务的需求变得越来越重要。
J-Insight 是一款数据驱动的设备监控解决方案,可提供对正在运行的系统运行状况的可见性和洞察。从 Junos OS 18.2R1 版开始,J-Insight 框架有助于实时监控 FPC FRU 的系统资源。它还与现有的连接错误管理基础架构集成,以规范错误检测、监控和报告。 图 1 描述了 J-Insight 设备监视器架构设计的长期目标。
J-Insight 是一款本地系统应用程序,它使用 Junos 遥测接口持续收集反映被监控设备组件当前状态和运行状况的数据。
了解 J-Insight 运行状况监控的工作原理
从 Junos OS 18.2R1 版开始,J-Insight 为 MX 系列路由器上的 FPC FRU 提供运行状况监控功能。作为此初始版本的一部分,J-Insight 运行状况监视器支持以下流程(参见 图 1):
使用预定义的静态运行状况配置文件。用户无法通过 Junos OS CLI 配置运行状况配置文件。
使用 Junos 遥测接口 (JTI) 框架,订阅默认运行状况配置文件中指定的运行状况 KPI。J-Insight 运行状况监视器使用标准接口订阅 JTI 传感器。默认情况下,运行状况监视器订阅和报告处于禁用状态,可通过 Junos OS CLI 启用。从 Junos OS 18.2R1 版开始,基于 MX 的 FPC 支持以下运行状况 KPI:
CPU 利用率
温度传感器
PFE 内存利用率
交换矩阵可达性
整理从各个子系统收集的 JTI 数据流。
根据配置的阈值评估运行状况数据并报告运行状况。
了解 J-Insight 故障监控的工作原理
从 Junos OS 18.2R1 版开始,J-Insight 利用连接错误管理基础架构来规范错误检测、监控和报告。通过此基础架构,J-Insight 还提供了定义数据驱动型故障策略的功能。每个模块都可以通过读取 DST/功能文件来定义错误属性。故障监控功能在 Junos OS 中默认可用,无法通过 CLI 启用或禁用。
每个错误都由以下属性定义:
URI- 错误标识符。每个错误都使用表示为统一资源标识符 (URI) 的错误 ID 进行唯一标识。
Error- 错误名称。
Scope- 错误范围。错误范围提供高于错误类别的分类级别。误差范围值的示例包括:pfe 和电路板。
Category—错误类别。错误类别将错误分类为特定错误范围级别下的各个子组。错误类别值的示例包括:内存、处理和存储。
Details- 错误描述。
Count- 错误实例发生的次数。
Clear count- 已清除错误实例的次数。
Support- 错误类型的支持详细信息。