Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
本页内容
 

有线 SLE

使用有线服务级别体验 (SLE) 仪表板评估服务级别是否存在影响用户的因素,例如吞吐量、连接性和交换机运行状况。

概述

瞻博网络 Mist™ 云会持续收集网络遥测数据,并使用机器学习 (ML) 来分析最终用户体验。这项服务可高效收集和分析整个网络的数据,无论您有数百个还是数千个端口。

您可以通过瞻博网络 Mist 有线服务级别预期 (SLE) 仪表板访问这些信息,该仪表板可以帮助您评估网络的用户体验并主动解决任何问题。这不仅仅是设备或链路的正常或故障问题,还关乎客户端体验的质量。

对于有线网络来说,两个紧迫的问题是:

  • 客户端能否连接?

  • 客户端连接后能否传递流量?

有线 SLE 仪表板显示有线客户端在任何给定时间点的网络用户体验。您可以使用这些交互式仪表板主动测量和管理网络,在用户痛点成为棘手问题之前及时发现。

查找有线 SLE 仪表板

要查找有线 SLE 仪表板,请从左侧菜单 中选择监控 > 服务级别 ,然后单击有 线 按钮。

Wired Button on the Monitor Page

注意:

仅当您拥有所需的订阅时,才会显示这些按钮。有关这些要求的信息,请参阅 瞻博网络 Mist AI 原生运维指南

有线成功连接 SLE 的根本原因分析

单击 SLE 块中的分类器后,您将看到根本原因分析页面。单击分类器和子分类器可在屏幕下半部分查看时间线和范围信息。

注意:

屏幕下半部分的信息取决于您在顶部选择的内容。

屏幕下半部分的有用选项卡是:

  • 时间线 — 查看问题发生的确切时间。

  • 分布 — 查看哪些 VLAN 受到了影响。

  • 受影响项目 — 查看哪些接口和客户端受到了影响,以及每个接口和客户端对总体影响的影响程度。另请查看每个接口或客户端的单独故障率。

让我们看一个成功连接 SLE 的示例。通过单击页面顶部的选项,可以从 SLE 向下钻取到分类器和子分类器。页面的下半部分显示与这些选择相关的信息。

通过选择 “受影响的项目” 选项卡,然后单击左侧的 “接口 ”选项,我们可以看到由于凭据不正确而无法连接的接口。

Affected Items - Interfaces

通过单击左侧的 “客户端” 选项卡,我们现在可以看到受影响的客户端。

Affected Items - Clients
提示:
  • 总体影响 是指客户端或接口导致所选子分类器 的所有 问题的百分比。例如,它可以显示客户是否占问题的 20% 或 90%。

  • 失败率是 此问题对此接口或客户端的影响。例如,它可以显示接口在 20% 还是 90% 的连接尝试中不成功。

  • 要查看更多详细信息,请单击表中的超链接以转到 Insights 页面,您可以在其中查看所有客户端和交换机事件。

Wired Assurance:第 2 天 - 有线 SLE 视频概述

One of the coolest features of Wired Assurance is the Service Level Expectations, or SLEs. SLEs were first introduced with Wi-Fi Assurance to help you understand the client experience. Now the SLE framework has been extended to Juniper EX switches.

You can see what the performance and experience for wired devices is, categorized into throughput, successful connect, and switch health. In the throughput SLE, there are classifiers, congestion, interface anomalies, storm control, etc. This is where you can drill down to get an accurate sense of what is going on in the network.

The distribution table breaks it down by clients, VLANs, interfaces, and switches. You can also sort by failure rate or biggest overall impact. Double-click into affected items by switches, VLANs, interfaces, and clients.

Going over to the switch health SLE, we immediately see there are CPU issues. The EX4300 shows the overall impact at 74%. The screen shows CPU utilization spiking over 100%, mapped to a time graph to help you narrow in on the issue.

Wired SLEs measure wired experience with pre and post-connection performance metrics to help you understand how the network experience is for your users, wired devices, and IoT endpoints.

有线 SLE 模块

如以下示例所示,每个 SLE 块都提供了有价值的信息。

  • 在左侧,您可以看到此 SLE 的成功率为 89%。

    时间线在中心显示时间段内的变化。您可以将鼠标指针悬停在任何点上以查看确切的时间和 SLE 结果。

    右侧的分类器显示可归因于每个根本原因的问题百分比。在本例中,100% 的问题归因于网络。

Switch Health dashboard showing 89 percent overall success rate in green. Line graph highlights a 90 percent success rate over time. Metrics breakdown: Switch Unreachable 0 percent, Capacity 0 percent, Network 100 percent, System 0 percent.

如果单击分类器,您将在根本原因分析页面上看到详细信息。大多数分类器都有子分类器,以便更好地了解问题的确切原因。

下表提供了有关有线 SLE 和分类器的详细信息。

表 1:有线 SLE 说明
SLE SLE 说明 分类器 分类器说明
成功连接

瞻博网络 Mist 会监控客户端连接尝试并识别故障。数据源是交换机上的 802.1X 事件。此 SLE 可帮助您评估这些故障的影响,并确定要解决的根本原因。

如果您在有线网络上使用 802.1X 对客户端进行身份验证,或者配置了 DHCP 侦听,则此 SLE 可用。

您无法为此 SLE 设置阈值。假设您希望 100% 成功的连接,并将任何不成功的连接视为要跟踪的关键问题。

DHCP

无法在一分钟内达到绑定状态的客户端连接。

仅当在端口配置文件中启用了 DHCP 侦听时,此分类器才可用。

DHCP 侦听可能并不总是适用于具有静态 IP 的端点。

认证

客户端身份验证失败时发生的事件。

子分类器:

  • RADIUS 服务器拒绝 VLAN — 无法对指定的 VLAN 进行身份验证。

  • 凭据错误 — 凭据无效。

  • RADIUS 服务器无法访问 — RADIUS 服务器已关闭。

接入端口安全性

接入端口安全问题导致客户端连接失败。

根据端口配置文件中配置的安全功能,系统会在发生安全事件时触发此分类器。

子分类器:

  • BPDU-Guard—检测由于交换机端口上的 BPDU 保护配置而导致的连接失败。此功能对于防止环路很重要,就像当交换机连接到交换机时一样。要启用此功能,请转至端口配置文件,然后启用 STP Edge。
  • MAC 限制 — 检测客户端超过交换机端口上配置的 MAC 限制时报告的连接故障。例如,如果您有室外安全摄像头或公共广播系统,并且希望阻止其他设备连接到该端口,则可以将端口配置文件配置为 MAC 限制为 2。如果有人拔下您的相机并尝试连接自己的设备,则将达到 MAC 限制,并且此事件将由 MAC 限制分类器反映。
  • 动态 ARP 检查 — 当端口丢弃无效动态 ARP 检查数据包时,识别客户端连接失败。这一安全功能可防止他人窥探他人的 ARP 地址而获得访问权限。需要在端口配置文件的 DHCP 侦听部分启用 ARP 检查。
  • 非法 DHCP 服务器 — 识别由非法 DHCP 服务器事件引起的客户端连接故障。这可能是不受信任的端口丢弃来自 DHCP 服务器的流量以阻止未经授权的服务器的事件。启用此功能可以防止恶意设备连接。此分类器显示发生的任何此类尝试。需要在端口配置文件中启用 DHCP 侦听。
吞吐量

此 SLE 表示有线用户无阻抗传递流量的能力。

您无法为此 SLE 设置阈值。假设您希望 100% 的流量在无阻抗的情况下通过,并将任何阻抗视为需要跟踪的关键问题。

风暴控制

超过风暴控制级别且数据包被丢弃的事件。

仅当在端口配置文件中启用风暴控制时才可用(推荐)。

接口异常

设备已开机但无法传递流量时发生的事件。

子分类器:

  • 电缆问题 — 此子分类器显示受网络中电缆故障影响的用户分钟数。电缆问题可能会导致接口或客户端设备上的故障率过高。

  • 协商失败 — 此子分类器可识别由协商不完整、双工冲突和延迟等问题引起的用户分钟数不满。

  • MTU 不匹配 — 此子分类器可识别数据包路径上某处 MTU 大小不匹配的问题(路径上的任何 MTU 不匹配都会导致数据包被丢弃或分段)。此 SLE 的信息来自交换机;每个输入错误或 MTU 错误都会导致此子分类器下的用户分钟数不佳。

交换机带宽

瞻博网络 Mist™ 会根据每个配置队列的排队数据包和丢弃的数据包来衡量网络上的可用带宽。

成功率低的模式可能表明需要更多的有线带宽。

您可以单击“ 设置 ”按钮以设置要用作此 SLE 成功阈值的百分比。此百分比表示total_DropppedPackets占total_QueuedPackets的一部分。

拥塞

当输入队列(缓冲区)已满时,严重拥塞会导致丢包 (TxDrops)。通过考虑以下比率触发:

  • TxDrops to TxPackets — 丢弃的传输字节总数与传输的数据包总数。

  • Txbps 到链路速度 — 每秒传输到链路速度的总字节数。

  • RxSpeed to Link speed — 每秒接收的总字节数到链路速度。

拥塞上行链路

具有以下上行链路端口特征的上行链路上的高度拥塞:

  • 将交换机或路由器作为 LLDP 邻接方

  • 是生成树协议 (STP) 根端口

  • 与其他端口相比,传输和接收的数据包数量更多

  • 由于聚合以太网链路和模块端口而出现拥塞

带宽余量

高带宽使用。

交换机运行状况

瞻博网络 Mist™ 可监控交换机的工作温度、功耗、CPU 和内存使用情况。监控交换机运行状况至关重要,因为 CPU 使用率过高等问题可能会直接影响连接的客户端。例如,如果 CPU 利用率飙升至 100%,连接的接入点可能会断开连接,从而影响客户端体验。

交换机无法访问

交换机到云端连接较差。交换机可能已关闭,或者连接可能已切断。

能力

使用率超过 80%。高使用率可能表明交换机正在处理更多它可以以最佳方式处理的请求。

子分类器表示使用量超过相关表容量的 90%:

  • ARP 表
  • 路由表
  • MAC 表
网络

由于上行链路容量限制,吞吐量低于预期。

基于从交换机发送到 Mist 云的数据包的往返时间 (RTT) 值。

子分类器:

  • WAN 延迟 — 基于一段时间内 RTT 的平均值。

  • WAN 抖动 — 通过比较 RTT 在短时间段内的标准偏差与 RTT 在较长时间内的总体偏差来计算。

系统

交换机上可能影响用户体验的问题

子分类器:

  • CPU — 利用率超过 90%

  • 内存 - 利用率超过 80%

  • 温度 — 高于或低于指定工作范围的温度

  • 功耗 — 消耗超过可用功率的 90%