部署为 WAN 边缘的 Session Smart 路由器的服务级别预期
开始使用服务级别预期 (SLE) 和根本原因分析,以找出影响设备运行状况、链路运行状况和应用运行状况的问题。
熟悉部署为 WAN 边缘设备的瞻博网络® Session Smart™ 路由器的服务级别预期 (SLE),并在Juniper Mist™门户中了解使用 SLE 见解监控 WAN 边缘设备的更有效方法。
WAN 边缘 SLE
瞻博网络 SD-WAN (Driven by Mist AI WAN 保证) 解决方案简化了您监控 WAN 边缘的方式。Session Smart™ 和 SRX 系列 WAN 边缘设备具有独特的实施方式,用于跟踪 WAN 边缘运行状况、WAN 链路运行状况和应用运行状况等指标,从而得出百分比评级(瞻博网络称之为用户分钟数)。用户分钟指标是Mist监控和瞻博网络服务级别体验 (SLE) 的基础。SRX 系列和 Session Smart WAN 边缘设备使用有关应用响应时间、WAN 链路状态、网关运行状况和其他网络状况的关键指标,可以深入了解这些指标如何影响最终用户体验,并使用它们来识别任何服务降级的根本原因。您可以在此处找到所有Mist SLE 的概述:服务级别预期 (SLE)。
在配置指南的故障排除部分中,您将了解特定于 WAN 边缘的 SLE。
Session Smart WAN 边缘 SLE
阅读 Session Smart WAN 边缘 SLE 指南,了解如何在初始部署阶段之后使用 Juniper Mist 仪表板有效地诊断设备和 WAN 连接问题。让我们首先关注 WAN 边缘服务级别预期 (SLE)。
从 Juniper Mist 仪表板开始,导航到监控>服务级别。
从Juniper Mist仪表板中选择 监控>服务级别 。
- 从站点列表中,选择要检查其 SLE 的 WAN Edge。在此示例中,选择“Dallas-Fullstack”。
单击 WAN 选项卡,然后选择要调查的 WAN 边缘。例如,lab1-dallas。
注意:WAN SLE 的指标不会立即填充。SLE 需要数据集来提取边缘运行状况、链路运行状况和应用运行状况指标的信息。如果您刚刚入网设备, 则“监视器”屏幕可能不会显示任何内容。在生产环境中利用 SLE 之前,需要一周的信息。对于您的环境,请尝试将站点下拉菜单旁边的时间更改为较短的时间段(例如,过去 60 分钟),但它可能仍然不表示任何数据。WAN SLE 页面上的第一个信息图显示了这种关系。
单击工具箱图标,从显示系统更改的菜单中进行选择。
WAN 边缘 SLE 将显示在 SLE 成功率默认视图中。
选择要检查的站点,然后选择您正在调查的 WAN 边缘 。在本示例中,我们查看 lab1-dallas WAN 边缘WAN SLE 页面上的第一个信息图显示了在某个时间点收集的客户端与在同一窗口内发生的系统事件之间的关系。SLE 成功率默认视图位于 WAN SLE 页面上客户端洞见的正下方。
您还可以将视图切换为 “值” ,以数字方式显示 SLE 指标。熟悉 “设置 ”按钮非常重要。
注意:对于 Session Smart 路由器上的 设置 ,此对话框几乎没有自定义。安全向量路由协议根据交换的元数据自动测量这些值。需要在 SRX 系列设备上设置 SLE 应用程序探测。
WAN 边缘 SLE
对于这些 SLE,请注意,系统会减少管理员监视异常的需要。相反,瞻博网络 Mist WAN 保证会定义阈值级别,超过该阈值级别后,管理员才会收到通知。这种方法与传统模型形成鲜明对比,在传统模型中,系统管理员将根据观察到的曲线或模式来定义这些值。
我们的第一个 WAN SLE 是 WAN 边缘运行状况
WAN 边缘运行状况
WAN 边缘运行状况 SLE 提供的平台指标构成了服务级别指标的根本原因分析,其中包括功率、 CPU 和内存利用率、WAN 边缘断开连接以及平台温度。
WAN 链路运行状况
使用 WAN 链路运行状况 SLE 详细了解接口以及它们连接的位置或设备。
下一个 WAN SLE 是 WAN 链路运行状况。现在,我们查看有关您的接口及其连接位置的信息。这些指标构成了 WAN 链路运行状况指标的根本原因分析。WAN 链路运行状况的数据来自以下分类器:
- 网络
- Session Smart WAN 边缘通过安全向量路由监控抖动、丢包、延迟和 Session Smart 对等路径关闭状态。
- 接口
- 接口类别用于监控您的 LTE 信号 强度、 电缆问题和 拥塞情况。
- ISP 可达性
- ISP 可达性包括 ARP 和 DHCP 的成功。
应用运行状况
最后一个 WAN SLE 是 应用运行状况。这就是它变得有趣的地方。在此实验室环境中, 应用运行状况 的评分为 79%,这意味着应用在 79% 的时间内达到服务预期。与其他值一样,您可以使用以下分类器深入了解 根本原因分析 中的指标在何处以及为什么包含特定的 应用程序运行状况 分数:
- 影响根本原因分析分数的抖动量。
- 计入根本原因分析分数的损失量。
- 影响根本原因分析分数的延迟量。
- 失败的应用程序运行状况会影响应用程序服务根本原因分析分数。
利用 SLE 洞察对 Session Smart WAN 边缘进行故障排除
要使用 SLE 见解对 Session Smart WAN 边缘进行故障排除,请从 Juniper Mist 仪表板中选择监控>服务级别,然后选择 监控>服务级别。
让我们了解如何调查 WAN 边缘 SLE。我们将在本故障排除指南中深入了解应用程序运行状况监控,以获取详细指标。但每个 SLE 菜单(WAN Edge 运行状况、 WAN 链路运行状况和 应用运行状况)都会显示与 SLE 相关的类似表格和选项卡。在进行故障排除时,您会经常查看应用运行状况。
请记住,您不需要像在 SRX 系列设备上那样在 Session Smart WAN 边缘上为应用 SLE 定义应用探测。但是,您将需要可以对流量进行采样并报告给Juniper Mist云。Juniper Mist像任何基于人工智能的系统一样,人工智能需要数据来提供建议和决策。 最佳做法 是收集一整周的结果。但是,您将在 24 小时后获得第一个数据。
应用运行状况 91% 的普遍成功率对您的网络意味着什么? “应用程序运行状况 ”窗格显示由“根本原因分析”组成的百分比,该分析包括前面提到的所有分类器(延迟、抖动、丢失和应用程序故障)的总体百分比。当您深入研究下面的菜单时,您会发现一些选项卡,可让您更深入地了解未达到预期的分类器。
- “应用程序运行状况”窗格上的 “统计信息 ”选项卡显示所有分类器的广义百分比。
- “ 时间轴 ”选项卡按时间顺序显示包含分类器的事件,列出分类器的故障、连接的客户端和系统更改。时间范围受页面顶部的值影响,有 “今天”、“ 昨天”、“本周 T ”或 “自定义范围”选项。在时间轴上,您可以选择特定时间、放大详细信息或选择范围。将鼠标悬停在某个时间点上将勾勒出未能满足服务预期的分类器。
- “分布”选项卡按属性分析服务级别故障,并按最具破坏性的属性进行排序。您可以深入了解流量类、对等路径(Session Smart 路由器之间的 Session Smart 连接)、物理接口、WAN 边缘和区域的类别。请注意,具有 Session Smart WAN 保证边缘设备的 WAN 保证部署会利用对等路径信息,而 SRX 系列 WAN 边缘会利用目标区域在分布选项卡中获得更深入的见解。
- “受影响的项目”选项卡对未能满足服务级别目标的特定项目进行分类。在这里,您可以找到出现故障的应用、接口、客户端、WAN 边缘或类别的数值。