Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

订阅者管理和服务的资源监控

订阅者管理和服务资源监控概述

Junos OS 支持使用 CLI 和 SNMP MIB 查询进行资源监控功能。您可以利用这种实用程序来配置足够的空间(应用程序或虚拟路由器的内存空间限制),以确保系统稳定性,特别是 MX 系列路由器上基于 I 芯片的线卡和基于 Trio 的 FPC 的运行状况和运维效率。

当内存利用率(ukernel 内存或 ASIC 内存)达到某个阈值时,系统操作会影响线卡的运行状况和流量处理稳定性。这种对系统性能的权衡可能会对支持实时流量和协议造成不利影响。

除了配置阈值以在资源超过特定阈值时引发错误日志的能力之外,您还可以使用 SNMP MIB 查询来监控阈值和资源利用率。

以下部分介绍了 Junos OS 提供的资源监控类型:

使用水印进行线卡资源监控

您可以为线卡资源(如 ukern 内存(堆)、下一跃点 (NH) 内存以及防火墙或过滤器内存)配置水印或检查点值,以便为基于 Trio 的线卡和基于 I-芯片的线卡提供统一。NH 内存水印仅适用于封装内存(输出 WAN 静态 RAM 内存)。封装内存特定于 I 芯片,不适用于基于 Trio 的芯片。当超过配置的水线时,将触发错误日志。如果资源使用的阈值超过某个阈值,将生成警告系统日志消息,以通知已超过阈值。然后,您可以根据网络需求确定是否要终止任何现有订阅者和服务,以防止系统过载并导致故障。

此功能收集每个线卡的输入,并使用众所周知的内部端口将此统计细节传输到路由引擎进程。此信息由例行引擎上的守护程序扫描,并使用会话数据库中内置的共享内存空间,针对超过阈值的情况生成警告消息。

MX80、MX104 路由器以及 MX240、MX480、MX960、MX2010 和 MX2020 路由器上的以下线卡支持配置资源监控功能:

  • MX-MPC1-3D

  • MX-MPC1-3D-Q

  • MX-MPC2-3D

  • MX-MPC2-3D-Q

  • MX-MPC2-3D-EQ

  • MPC-3D-16XGE-SFPP

  • MPC3E

  • MPC3E-3D-NG

  • MPC4E-3D-2CGE-8XGE

  • MPC4E-3D-32XGE

  • MPC5EQ-40G10G

  • MPC5EQ-100G10G

  • MPC5E-100G10G

  • MPC5E-40G10G

  • MPC10E-10C-MRATE

  • MPC10E-15C-MRATE

  • MX2K-MPC6E

  • MX2K-MPC11E

  • DPCE

  • MS-DPC

  • MX 系列灵活 PIC 集中器(MX-FPC)

  • NG-MPC3E

您可以在层级配置以下参数 [edit system services] ,以指定所有内存空间或区域通用的高阈值,以及 DPC 和 MPC 上不同内存块的水印值:

  • 使用 resource-monitor high-threshold value 语句,高阈值,超过生成警告或错误日志的所有内存区域,例如堆或 ukernel、下一跃点和封装以及防火墙过滤器内存。

  • 使用 resource-monitor free-nh-memory-watermark percentage 语句使用水印值监控下一跃点使用的可用内存空间百分比。

  • 使用 resource-monitor free-heap-memory-watermark percentage 语句使用水印值监控用于 Ukernel 或堆内存的可用内存空间百分比。

  • 使用 resource-monitor free-fw-memory-watermark percentage 语句使用水印值监控防火墙和过滤器内存的可用内存空间百分比。此功能默认启用,无法手动禁用。可用下一跃点内存百分比的水印值默认值和配置值同样适用于封装内存。

可用 Ukernel 或堆内存、下一跃点内存和防火墙过滤器内存百分比的默认水位线值如下所示:

  • free-heap-memory-水印 — 20

  • free-nh-memory-watermark — 20

  • free-fw-memory-水印 — 20

根据 CoS 资源容量限制订阅者负载

从 Junos OS 17.4R1 版开始,服务等级 (CoS) 标准会整合到订阅者访问的节流决策中。从线卡收集有关 CoS 资源可用性(即队列容量)的信息。订阅者登录时,假设订阅者需要 CoS 资源,线卡将 CoS 队列利用率报告为绑定到计划层次结构且不自由绑定到新计划层次结构的资源百分比。 high-cos-queue-threshold 层级的 [edit system services] 语句可以设置为 0% 到 90% 的范围内,为每个 FPC 插槽单独设置。当给定 FPC 上的 CoS 队列利用率达到 FPC 配置的阈值级别时,不允许该 FPC 上的订阅者进一步登录。这种资源监控机制提供了可调的安全限度,可主动避免完全耗尽每个 FPC 的可用 CoS 队列资源。请参阅 high-cos-queue-threshold

注意:

仅当启用订阅者管理时,此功能才可用。有关启用订阅者管理的更多信息,请参阅 配置 Junos OS 增强型订阅者管理

注意:

从 Junos OS 19.4R1 版开始,您可以将值指定为 0,以防止任何订阅者受到基于队列的节流限制。

此 CoS 资源监控功能仅基于队列做出准入决策。其他 CoS 资源则不在此标准中。对于到达伪线、逻辑隧道或冗余逻辑隧道设备的订阅者,此功能不支持限制。以下硬件支持此功能:

  • MX240、MX480 和 MX960 路由器

  • MPC2E 传统、MPC2E-NG、MPC3E-NG、MPC5E 和 MPC7E 线卡

使用 show 命令检查内存资源区域的利用率

您可以使用 show system resource-monitor fpc 命令监控 FPC 数据包转发引擎上的内存资源的利用率。过滤器内存表示用于防火墙过滤器计数器的过滤器计数器内存。在每个内存区域旁边显示的星号 (*) 表示当前超过配置的阈值的区域。资源监控命令显示要监控的不同线卡应用程序的内存的配置水印值。显示的统计指标基于对个别线卡当前内存利用率的计算。ukern 内存在不同类型的线卡上是通用的,表示堆内存缓冲区。由于特定插槽中的线卡或 FPC 可能包含多个数据包转发引擎复合体,因此在特定于应用的集成电路 (ASIC) 上使用的内存特定于特定的 PFE 复合体。由于支持不同线卡变体的架构模型,ASIC 专用内存(下一跃点和防火墙或过滤器内存)的利用率百分比可以有不同的解释。

减少处理延迟的负载限制

从 Junos OS 17.3R1 版开始,路由引擎可以使用资源监控来评估和减少线卡数据包转发引擎上的处理负载。路由引擎可以以高于数据包转发引擎处理速率发送工作。这有时称为过度驱动线卡或数据包转发引擎。当数据包转发引擎的工作量过高时,可能会导致数据包处理出现明显的延迟。

通过资源监控,路由引擎可以通过评估发送到数据包转发引擎的数据包的往返延迟来评估负载。往返时间较长表示负载较高,因此处理数据包转发引擎上延迟的机会更大。在适当的情况下,路由引擎会减少允许完成的订阅者会话(客户端和服务)的百分比。

此功能称为负载节流或往返时间负载节流。节流可防止路由引擎过度驱动线卡,使操作员和后台系统可以看到处理延迟的情况。它的工作原理是这样的:

  1. 为了监控延迟,路由引擎每秒都会向线卡上的数据包转发引擎发送回显请求消息。回显请求既包括发送时的时间戳,也包括运行序列号。消息优先级是尽力而为,以模拟线卡上最坏情况下的处理延迟。

  2. 数据包转发引擎处理回显请求,并通过回显回复进行响应。当路由引擎处理返回的数据包时,消息优先级较高,可最大程度地减少抖动。

  3. 当路由引擎收到回显回复时,它会将往返时间计算为回显请求时间戳与接收特定序列号的回显回复之间的时差。

  4. 路由引擎将往返延迟时间与默认的往返阈值(1 秒)进行比较。如果测得的延迟长于三次连续的阈值,则路由引擎将拒绝一定百分比的新订阅者登录,从而减少已建立的新客户端和服务会话数。这种缩减称为节流。

    内部算法根据阈值和往返时间推导出节流百分比。此百分比因该时间点的往返延迟而异。

    对于连续三次均超过阈值的延迟测量,路由引擎会增加限制—拒绝更多订阅者登录。

  5. 当测得的延迟小于连续三次的阈值时,路由引擎将移除油门。这样订阅者就可以自由登录。

注意:

RTT 负载节流适用于以太网接口 (ge, xe) 和伪线接口 (ps) 的每线卡,如下所示:

  • 对于聚合以太网接口,它适用于与聚合以太网捆绑包关联的一组线卡。

  • 对于具有冗余逻辑隧道 (RLT) 的伪线接口,它适用于与锚点关联的一组线卡。

在这两种情况下,路由引擎都会将确定节流为集中所有线卡中最长往返延迟的延迟值。

表 1 显示了当往返延迟大于内部阈值时,在 12 秒内,线卡上的订阅者会话是如何被限制的。此示例具有以下假设:

  • 内部延迟阈值为 1 秒。

  • 每秒都会进行延迟测量。

  • 连续 3 次往返延迟测量超过往返延迟阈值后,会话创建率降低 10%。只要超过阈值,每 3 次测量一次节流。

  • 如果连续 3 次往返延迟测量的测量延迟下降并始终低于阈值,则会话速率将返回 100%。

注意:

此示例得到了简化。请记住,确切的节流百分比是动态确定的,可以每秒变化。

表 1:由于往返延迟时间而导致的负载节流示例

时间

往返延迟(毫秒)

超过阈值

允许的会话百分比

1

850

100

2

900

100

3

995

100

4

1021

是的

阈值超过计数 #1

100

5

1130

是的

阈值超过计数 #2

100

6

1158

是的

阈值超过计数 #3

90

会话速率降低 10%

7

1127

是的

阈值超过计数 #1

90

会话速率降低 10%

8

1135

是的

阈值超过计数 #2

90

9

1126

是的

阈值超过计数 #3

80

会话速率降低 10%

10

1000

阈值未超过计数 #1

80

11

991

阈值未超过计数 #2

80

12

998

阈值未超过计数 #3

100

已移除限制

默认情况下,资源负载监控和往返时间限制处于启用状态。您可以使用以下任一语句来禁用此功能:

  • no-load-throttle层级[edit system services resource-monitor]

  • no-throttle层级[edit system services resource-monitor]

如果禁用该功能,而数据包转发引擎变得太忙,新订阅者可以登录并激活,但一段时间内没有流量流动。流量处理中的这种延迟可能会变得明显。

您可以使用以下命令确认负载限制功能是否已启用,并查看功能在各方面的运行情况。粗体字段特别有用。

使用资源监控器限制订阅者

从 Junos OS 17.3R1 版开始,您还可以使用资源监控直接限制每个硬件元素支持的订阅者数量。您可以指定每个机箱、线卡 (MPC)、MIC 或端口可登录的最大订阅者数。您可以为一种客户端类型(DHCP、L2TP 或 PPPoE)或任意客户端类型的订阅者设置限制。

此功能可确保每个硬件元素登录的订阅者数量不会超过您的网络能够以所需的服务带宽稳定提供服务的数量。当某个硬件元素达到限制时,将拒绝该元素上的新订阅者登录,直到订阅者数量降至配置的限制以下。超过限制的新订阅者可以连接到同一广播域中的另一个硬件元素。在聚合以太网接口的一个或多个腿上配置限制时,如果订阅者计数超过任何一条腿上的值,则登录将被拒绝。

以这种方式限制订阅者在硬件元素之间分配负载,但不提供任何形式的负载平衡。此功能还可以帮助您映射网络中的容量,并确定扩展该容量所需的硬件资源。例如,如果您提供的服务需要特定数量的内存,并且知道可以使用给定硬件集为多少订阅者提供服务,则可以确定需要多少内存。或者,如果您希望为每个订阅者添加具有更多内存的服务,则可以计算所需的额外数量,将其与可用内存进行比较,并确定是否需要配置新端口、MIC、MPC 或路由器来处理新服务。

通过资源监控按客户端类型和硬件元素限制订阅者

除了使用资源监控来监控和管理系统内存使用情况,您还可以使用它来直接限制每个硬件元素支持的订阅者数量:机箱、线卡 (MPC)、MIC 和端口。您可以指定可登录到每个元素的最大订阅者数。您只能将此限制应用于一种客户端类型(DHCP、L2TP 或 PPPoE)的订阅者,或者任意一种客户端类型的订阅者。在后一种情况下,此限制适用于所有三种客户端类型的会话总和。

订阅者限制可以确保每个硬件元素登录的订阅者数量不会超过网络在所需服务带宽下可以稳定提供服务的数量。当某个硬件元素达到限制时,将拒绝该元素上的新订阅者登录,直到订阅者数量降至配置的限制以下。超出限制的新订阅者会连接到同一广播域中的另一个硬件元素。在聚合以太网接口的一个或多个腿上配置限制时,如果订阅者计数超过任何一条腿上的值,则登录将被拒绝。

以这种方式限制订阅者在硬件元素之间分配负载,但不提供任何形式的负载平衡。此功能还可以帮助您映射网络中的容量,并确定扩展该容量所需的硬件资源。例如,如果您以特定带宽提供服务,并且知道可以使用给定硬件集为多少订阅者提供服务,则可以确定需要多少带宽。或者,如果您希望为每个订阅者添加更多带宽的服务,则可以计算所需的额外带宽,将其与您的可用带宽进行比较,并确定是否需要配置新端口、MIC、MPC 或路由器来处理新服务。

注意:

CLI 使用术语 fpcpic。对于此功能, fpc 对应于 MPC 和 pic MIC。

要限制硬件元素允许的最大订阅者数:

  1. 为订阅者配置客户端类型。
  2. (可选)在机箱上配置订阅者限制。
  3. (可选)在 MPC 上配置订阅者限制。
  4. (可选)配置 MIC 上的订阅者限制。
  5. (可选)在端口上配置订阅者限制。

例如,以下配置集 PPPoE 订阅者的机箱和 MPC 限制:

版本历史记录表
释放
描述
17.4R1
从 Junos OS 17.4R1 版开始,服务等级 (CoS) 标准会整合到订阅者访问的节流决策中。
17.3R1
从 Junos OS 17.3R1 版开始,您还可以使用资源监控直接限制每个硬件元素支持的订阅者数量。