Monitoring and Troubleshooting
本节介绍 Junos OS 的网络监控和故障排除功能。
Ping 主机
目的
使用 CLI ping
命令验证是否可以通过网络访问主机。此命令可用于诊断主机和网络连接问题。设备向指定主机发送一系列互联网控制消息协议 (ICMP) 回显 (ping) 请求,并接收 ICMP 回显响应。
操作
ping
要使用命令向 host3 发送四个请求(ping 计数),请执行以下操作:
ping host count number
示例输出
命令名称
ping host3 count 4 user@switch> ping host3 count 4 PING host3.site.net (192.0.2.111): 56 data bytes 64 bytes from 192.0.2.111: icmp_seq=0 ttl=122 time=0.661 ms 64 bytes from 192.0.2.111: icmp_seq=1 ttl=122 time=0.619 ms 64 bytes from 192.0.2.111: icmp_seq=2 ttl=122 time=0.621 ms 64 bytes from 192.0.2.111: icmp_seq=3 ttl=122 time=0.634 ms --- host3.site.net ping statistics --- 4 packets transmitted, 4 packets received, 0% packet loss round-trip min/avg/max/stddev = 0.619/0.634/0.661/0.017 ms
意义
结果
ping
显示以下信息:ping 响应数据包的大小(以字节为单位)。
从中发送响应的主机的 IP 地址。
ping 响应数据包的序列号。您可以使用此值将 ping 响应与相应的 ping 请求进行匹配。
ping 响应数据包的生存时间 (ttl) 跃点计数值。
发送 ping 请求数据包和接收 ping 响应数据包之间的总时间(以毫秒为单位)。此值也称为往返时间。
发送到主机的 ping 请求(探测)数。
从主机收到的 ping 响应数。
丢包百分比。
往返时间统计:往返时间的最小值、平均值、最大值和标准偏差。
监控通过路由器或交换机的流量
要诊断问题,请显示有关通过路由器或交换机上物理接口的流量的实时统计信息。
要显示有关物理接口的实时统计信息,请执行以下操作:
显示有关路由器或交换机上所有接口的实时统计信息
目的
显示有关通过路由器或交换机上所有接口的流量的实时统计信息。
操作
要显示有关通过路由器或交换机上所有接口的流量的实时统计信息,请执行以下操作:
user@host> monitor interface traffic
示例输出
命令名称
user@host> monitor interface traffic host name Seconds: 15 Time: 12:31:09 Interface Link Input packets (pps) Output packets (pps) so-1/0/0 Down 0 (0) 0 (0) so-1/1/0 Down 0 (0) 0 (0) so-1/1/1 Down 0 (0) 0 (0) so-1/1/2 Down 0 (0) 0 (0) so-1/1/3 Down 0 (0) 0 (0) t3-1/2/0 Down 0 (0) 0 (0) t3-1/2/1 Down 0 (0) 0 (0) t3-1/2/2 Down 0 (0) 0 (0) t3-1/2/3 Down 0 (0) 0 (0) so-2/0/0 Up 211035 (1) 36778 (0) so-2/0/1 Up 192753 (1) 36782 (0) so-2/0/2 Up 211020 (1) 36779 (0) so-2/0/3 Up 211029 (1) 36776 (0) so-2/1/0 Up 189378 (1) 36349 (0) so-2/1/1 Down 0 (0) 18747 (0) so-2/1/2 Down 0 (0) 16078 (0) so-2/1/3 Up 0 (0) 80338 (0) at-2/3/0 Up 0 (0) 0 (0) at-2/3/1 Down 0 (0) 0 (0) Bytes=b, Clear=c, Delta=d, Packets=p, Quit=q or ESC, Rate=r, Up=^U, Down=^D
意义
示例输出显示活动接口的流量数据,以及自命令启动或使用密钥清除 C
计数器以来每个字段发生更改的数量。在此示例中, monitor interface
自发出命令或计数器上次返回零以来,命令已运行 15 秒。
显示有关路由器或交换机上某个接口的实时统计信息
目的
显示有关通过路由器或交换机上的接口的流量的实时统计信息。
操作
要显示通过路由器或交换机上某个接口的流量,请使用以下 Junos OS CLI 操作模式命令:
user@host> monitor interface interface-name
示例输出
命令名称
user@host> monitor interface so-0/0/1 Next='n', Quit='q' or ESC, Freeze='f', Thaw='t', Clear='c', Interface='i' R1 Interface: so-0/0/1, Enabled, Link is Up Encapsulation: PPP, Keepalives, Speed: OC3 Traffic statistics: Input bytes: 5856541 (88 bps) Output bytes: 6271468 (96 bps) Input packets: 157629 (0 pps) Output packets: 157024 (0 pps) Encapsulation statistics: Input keepalives: 42353 Output keepalives: 42320 LCP state: Opened Error statistics: Input errors: 0 Input drops: 0 Input framing errors: 0 Input runts: 0 Input giants: 0 Policed discards: 0 L3 incompletes: 0 L2 channel errors: 0 L2 mismatch timeouts: 0 Carrier transitions: 1 Output errors: 0 Output drops: 0 Aged packets: 0 Active alarms : None Active defects: None SONET error counts/seconds: LOS count 1 LOF count 1 SEF count 1 ES-S 77 SES-S 77 SONET statistics: BIP-B1 0 BIP-B2 0 REI-L 0 BIP-B3 0 REI-P 0 Received SONET overhead: F1 : 0x00 J0 : 0xZ
意义
示例输出显示特定 SONET 接口的输入和输出数据包 (so-0/0/1
)。这些信息可能包括常见的接口故障,如 SONET/SDH 和 T3 报警、检测到的环路以及成帧错误增加。有关详细信息,请参阅 跟踪错误条件的清单。
要在命令运行时控制命令的输出,请使用 中 表 1所示的键。
操作 |
图例标示 |
---|---|
显示有关下一个接口的信息。该命令按 |
|
显示有关其他接口的信息。该命令会提示您输入特定接口的名称。 |
|
冻结显示,停止显示更新的统计信息。 |
|
解冻显示,恢复显示更新的统计信息。 |
|
清除(零)自启动以来 |
|
停止命令 |
|
有关将匹配条件与monitor traffic
命令配合使用的详细信息,请参阅 CLI 资源管理器。
动态三元内容可寻址存储器概述
在 ACX 系列路由器中,三元内容寻址存储器 (TCAM) 用于防火墙、连接故障管理、PTPoE、RFC 2544 等各种应用。ACX 系列路由器中的数据包转发引擎 (PFE) 使用具有已定义 TCAM 空间限制的 TCAM。各种过滤器应用的TCAM资源分配是静态分布的。当所有筛选器应用程序可能不会同时使用此 TCAM 资源时,这种静态分配会导致 TCAM 资源的低效利用。
ACX 路由器中 TCAM 空间的动态分配有效地为各种过滤器应用分配了可用的 TCAM 资源。在动态TCAM模型中,各种过滤器应用(如inet防火墙,桥接防火墙,cfm过滤器等)可以在需要时最佳地利用可用的TCAM资源。动态 TCAM 资源分配是使用驱动的,并根据需要为过滤器应用动态分配。当筛选器应用程序不再使用 TCAM 空间时,资源将被释放并可供其他应用程序使用。这种动态 TCAM 模型可根据应用需求满足更高规模的 TCAM 资源利用率。
- 使用动态 TCAM 基础架构的应用
- 使用 TCAM 资源的功能
- 监控 TCAM 资源使用情况
- 示例:监控 TCAM 资源并对其进行故障排除
- 监控 ACX 系列路由器中的 TCAM 资源并对其进行故障排除
- ACX5048路由器和ACX5096路由器上的服务扩展
使用动态 TCAM 基础架构的应用
以下过滤器应用程序类别使用动态 TCAM 基础结构:
防火墙过滤器 - 所有防火墙配置
隐式过滤器 — 路由引擎 (RE) 恶魔使用过滤器实现其功能。例如,连接故障管理、IP MAC 验证等。
动态过滤器 - 使用过滤器实现 PFE 级别功能的应用程序。例如,逻辑接口级固定分类器、RFC 2544 等。RE 恶魔不会知道这些过滤器。
系统初始化过滤器 — 需要系统级别条目或路由器引导顺序需要固定条目集的过滤器。例如,第 2 层和第 3 层控制协议陷阱、默认 ARP 监管器等。
注:具有第 2 层和第 3 层控制协议陷阱应用程序的 System-init 过滤器对于整体系统功能至关重要。该控制组中的应用从整个TCAM空间中消耗固定且最小的TCAM空间。系统初始化过滤器不会使用动态 TCAM 基础架构,而是在引导序列期间初始化路由器时创建。
使用 TCAM 资源的功能
使用 TCAM 资源的应用程序在本文档中称为 tcam-app。例如,inet防火墙、网桥防火墙、连接故障管理、链路故障管理等都是不同的 tcam-app。
表 2 介绍了使用 TCAM 资源的 TCAM 应用列表。
TCAM 应用程序/TCAM 用户 |
特性/功能 |
中风阶段 |
---|---|---|
bd-dtag-validate |
桥接域双标记验证 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
出口 |
bd-tpid-swap |
具有交换 tpid 操作的桥接域 VLAN 映射 |
出口 |
cfm-bd-filter |
连接故障管理隐式桥接域过滤器 |
入口 |
cfm-filter |
连接故障管理隐式过滤器 |
入口 |
cfm-vpls-filter |
连接故障管理隐式 vpls 筛选器 注:
此功能仅在 ACX5048 和 ACX5096 路由器上受支持。 |
入口 |
cfm-vpls-ifl-filter |
连接故障管理隐式 vpls 逻辑接口过滤器 注:
此功能仅在 ACX5048 和 ACX5096 路由器上受支持。 |
入口 |
cos-fc |
逻辑接口级固定分类器 |
预入口 |
fw-ccc-in |
电路交叉连接家族入口防火墙 |
入口 |
fw-family-out |
系列级出口防火墙 |
出口 |
fw-fbf |
基于防火墙过滤器的转发 |
预入口 |
fw-fbf-inet6 |
inet6 系列基于防火墙过滤器的转发 |
预入口 |
fw-ifl-in |
逻辑接口级入口防火墙 |
入口 |
fw-ifl-out |
逻辑接口级出口防火墙 |
出口 |
fw-inet-ftf |
转发表上的 Inet 系列入口防火墙 |
入口 |
fw-inet6-ftf |
转发表上的 Inet6 系列入口防火墙 |
入口 |
fw-inet-in |
Inet 家族入口防火墙 |
入口 |
fw-inet-rpf |
RPF 上的 Inet 系列入口防火墙失败检查 |
入口 |
fw-inet6-in |
Inet6 系列入口防火墙 |
入口 |
fw-inet6-family-out |
Inet6 系列级出口防火墙 |
出口 |
fw-inet6-rpf |
RPF 上的 Inet6 系列入口防火墙故障检查 |
入口 |
fw-inet-pm |
具有端口镜像操作的 Inet 系列防火墙 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
入口 |
fw-l2-in |
第 2 层接口上的桥接家族入口防火墙 |
入口 |
fw-mpls-in |
MPLS 系列入口防火墙 |
入口 |
fw-semantics |
CLI 配置的防火墙的防火墙共享语义 |
预入口 |
fw-vpls-in |
VPLS 接口上的 VPLS 系列入口防火墙 |
入口 |
ifd-src-mac-fil |
物理接口级别源 MAC 过滤器 |
预入口 |
ifl-statistics-in |
入口处的逻辑级接口统计信息 |
入口 |
ifl-statistics-out |
出口处的逻辑级接口统计信息 |
出口 |
ing-out-iff |
代表出口家族过滤器的入口应用程序,用于日志和系统日志 |
入口 |
ip-mac-val |
IP MAC 验证 |
预入口 |
ip-mac-val-bcast |
广播的 IP MAC 验证 |
预入口 |
ipsec-reverse-fil |
IPsec 服务的反向筛选器 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
入口 |
irb-cos-rw |
IRB CoS 重写 |
出口 |
lfm-802.3ah-in |
入口处的链路故障管理 (IEEE 802.3ah) 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
入口 |
lfm-802.3ah-out |
出口链路故障管理 (IEEE 802.3ah) |
出口 |
lo0-inet-fil |
Looback 接口 inet filter |
入口 |
lo0-inet6-fil |
回路接口 inet6 过滤器 |
入口 |
mac-drop-cnt |
MAC 验证和源 MAC 过滤器的丢弃统计信息 |
入口 |
mrouter-port-in |
用于侦听的组播路由器端口 |
入口 |
napt-reverse-fil |
用于网络地址端口转换 (NAPT) 服务的反向筛选器 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
入口 |
no-local-switching |
桥接非本地交换 |
入口 |
ptpoe |
以太网点对点陷阱 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
入口 |
ptpoe-cos-rw |
针对 PTPoE 的 CoS 重写 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
出口 |
rfc2544-layer2-in |
入口处第 2 层服务的RFC2544 |
预入口 |
rfc2544-layer2-out |
出口处第 2 层服务的RFC2544 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
出口 |
service-filter-in |
入口处的服务过滤器 注:
ACX5048 和 ACX5096 路由器不支持此功能。 |
入口 |
监控 TCAM 资源使用情况
您可以使用 show 和 clear 命令来监控动态 TCAM 资源使用情况并对其进行故障排除。
表 3 汇总了可用于监控动态 TCAM 资源使用情况并对其进行故障排除的命令行界面 (CLI) 命令。
任务 |
命令 |
---|---|
显示特定应用程序的共享应用程序和相关应用程序 |
|
显示应用程序和阶段(出口、入口和前入口)的 TCAM 资源使用情况 |
(ACX5448) 显示 PFE 过滤器硬件摘要 |
显示应用程序和阶段(出口、入口和前入口)的 TCAM 资源使用错误 |
|
清除应用程序和阶段(出口、入口和前入口)的 TCAM 资源使用错误统计信息 |
示例:监控 TCAM 资源并对其进行故障排除
本节介绍一个用例,在该用例中,您可以使用 show 命令监控 TCAM 资源并对其进行故障排除。在此用例场景中,您已配置第 2 层服务,并且第 2 层服务相关应用程序正在使用 TCAM 资源。如本例所示,动态方法为您提供了根据需要管理 TCAM 资源的完全灵活性。
服务要求如下:
每个桥接域都有一个 UNI 接口和一个 NNI 接口
每个 UNI 接口都具有:
一个逻辑接口级监管器,用于以 10 Mbps 的速度监管流量。
具有四个术语的多域分类器,用于分配转发类和丢失优先级。
每个 UNI 接口在级别 4 配置 CFM UP MEP。
每个 NNI 接口在级别 2 配置 CFM DOWN MEP
让我们考虑一个场景,其中路由器上配置了 100 个服务。使用此规模,已成功配置所有应用程序,并且状态显示 OK 状态。
-
查看所有阶段的 TCAM 资源使用情况。
要查看所有阶段(出口、入口和入口前)的 TCAM 资源使用情况,请使用
show pfe tcam usage all-tcam-stages detail
命令。在ACX5448路由器上,使用命令查看show pfe filter hw summary
TCAM 资源 usgae。user@host> show pfe tcam usage all-tcam-stages detail Slot 0 Tcam Resource Stage: Pre-Ingress -------------------------------- Free [hw-grps: 3 out of 3] No dynamic tcam usage Tcam Resource Stage: Ingress ---------------------------- Free [hw-grps: 2 out of 8] Group: 11, Mode: SINGLE, Hw grps used: 3, Tcam apps: 2 Used Allocated Available Errors Tcam-Entries 800 1024 224 0 Counters 800 1024 224 0 Policers 0 1024 1024 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- cfm-filter 500 500 0 3 OK cfm-bd-filter 300 300 0 2 OK Group: 8, Mode: DOUBLE, Hw grps used: 2, Tcam apps: 1 Used Allocated Available Errors Tcam-Entries 500 512 12 0 Counters 500 1024 524 0 Policers 0 1024 1024 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- fw-l2-in 500 500 0 2 OK fw-semantics 0 X X 1 OK Group: 14, Mode: SINGLE, Hw grps used: 1, Tcam apps: 1 Used Allocated Available Errors Tcam-Entries 200 512 312 0 Counters 200 512 312 0 Policers 100 512 412 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- fw-ifl-in 200 200 100 1 OK Tcam Resource Stage: Egress --------------------------- Free [hw-grps: 3 out of 3] No dynamic tcam usage
在路由器上配置其他第 2 层服务。
例如,在路由器上再添加 20 个服务,从而将服务总数增加到 120 个。添加更多服务后,您可以通过使用命令
show log messages
验证 syslog 消息或运行show pfe tcam errors
命令来检查配置的状态。以下是系统日志消息输出示例,显示了运行 CLI 命令导致
show log messages
较新配置的以太网交换系列过滤器的 TCAM 资源短缺情况。[Sat Jul 11 16:10:33.794 LOG: Err] ACX Error (dfw):acx_dfw_check_phy_slice_availability :Insufficient phy slices to accomodate grp:13/IN_IFF_BRIDGE mode:1/DOUBLE [Sat Jul 11 16:10:33.794 LOG: Err] ACX Error (dfw):acx_dfw_check_resource_availability :Could not write filter: f-bridge-ge-0/0/0.103-i, insufficient TCAM resources [Sat Jul 11 16:10:33.794 LOG: Err] ACX Error (dfw):acx_dfw_update_filter_in_hw :acx_dfw_check_resource_availability failed for filter:f-bridge-ge-0/0/0.103-i [Sat Jul 11 16:10:33.794 LOG: Err] ACX Error (dfw):acx_dfw_create_hw_instance :Status:1005 Could not program dfw(f-bridge-ge-0/0/0.103-i) type(IN_IFF_BRIDGE)! [1005] [Sat Jul 11 16:10:33.794 LOG: Err] ACX Error (dfw):acx_dfw_bind_shim :[1005] Could not create dfw(f-bridge-ge-0/0/0.103-i) type(IN_IFF_BRIDGE) [Sat Jul 11 16:10:33.794 LOG: Err] ACX Error (dfw):acx_dfw_bind :[1000] bind failed for filter f-bridge-ge-0/0/0.103-i
show pfe tcam errors all-tcam-stages detail
如果使用 CLI 命令验证配置的状态,则输出将如下所示:user@host> show pfe tcam errors all-tcam-stages detail Slot 0 Tcam Resource Stage: Pre-Ingress -------------------------------- Free [hw-grps: 3 out of 3] No dynamic tcam usage Tcam Resource Stage: Ingress ---------------------------- Free [hw-grps: 2 out of 8] Group: 11, Mode: SINGLE, Hw grps used: 3, Tcam apps: 2 Used Allocated Available Errors Tcam-Entries 960 1024 64 0 Counters 960 1024 64 0 Policers 0 1024 1024 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- cfm-filter 600 600 0 3 OK cfm-bd-filter 360 360 0 2 OK Group: 8, Mode: DOUBLE, Hw grps used: 2, Tcam apps: 1 Used Allocated Available Errors Tcam-Entries 510 512 2 18 Counters 510 1024 514 0 Policers 0 1024 1024 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- fw-l2-in 510 510 0 2 FAILED fw-semantics 0 X X 1 OK App error statistics: ---------------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- fw-l2-in 18 0 0 2 FAILED fw-semantics 0 X X 1 OK Group: 14, Mode: SINGLE, Hw grps used: 1, Tcam apps: 1 Used Allocated Available Errors Tcam-Entries 240 512 272 0 Counters 240 512 272 0 Policers 120 512 392 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- fw-ifl-in 240 240 120 1 OK Tcam Resource Stage: Egress --------------------------- Free [hw-grps: 3 out of 3] No dynamic tcam usage
输出指示 fw-l2-in 应用程序正在耗尽 TCAM 资源并进入失败状态。尽管入口阶段有两个 TCAM 切片可用,但由于 fw-l2-in 其模式 (DOUBLE),应用程序无法使用可用的 TCAM 空间,从而导致资源短缺故障。
-
修复由于 TCAM 资源短缺而失败的应用程序。
fw-l2-in由于在路由器上添加了更多数量的服务,导致 TCAM 资源不足,应用程序失败。尽管其他应用程序似乎工作正常,但建议停用或删除新添加的服务,以便 fw-l2-in 应用程序移动到 OK 状态。删除或停用新添加的服务后,需要运行
show pfe tcam usage
和show pfe tcam error
命令来验证是否不再有应用程序处于失败状态。要查看所有阶段(出口、入口和入口前)的 TCAM 资源使用情况,请使用
show pfe tcam usage all-tcam-stages detail
命令。对于ACX5448路由器,请使用show pfe filter hw summary
命令查看 TCAM 资源使用情况。user@host> show pfe tcam usage all-tcam-stages detail Slot 0 Tcam Resource Stage: Pre-Ingress -------------------------------- Free [hw-grps: 3 out of 3] No dynamic tcam usage Tcam Resource Stage: Ingress ---------------------------- Free [hw-grps: 2 out of 8] Group: 11, Mode: SINGLE, Hw grps used: 3, Tcam apps: 2 Used Allocated Available Errors Tcam-Entries 800 1024 224 0 Counters 800 1024 224 0 Policers 0 1024 1024 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- cfm-filter 500 500 0 3 OK cfm-bd-filter 300 300 0 2 OK Group: 8, Mode: DOUBLE, Hw grps used: 2, Tcam apps: 1 Used Allocated Available Errors Tcam-Entries 500 512 12 18 Counters 500 1024 524 0 Policers 0 1024 1024 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- fw-l2-in 500 500 0 2 OK fw-semantics 0 X X 1 OK Group: 14, Mode: SINGLE, Hw grps used: 1, Tcam apps: 1 Used Allocated Available Errors Tcam-Entries 200 512 312 0 Counters 200 512 312 0 Policers 100 512 412 0 App tcam usage: ---------------- App-Name Entries Counters Policers Precedence State Related-App-Name .. ----------------------------------------------------------------- fw-ifl-in 200 200 100 1 OK Tcam Resource Stage: Egress --------------------------- Free [hw-grps: 3 out of 3] No dynamic tcam usage
要查看所有阶段(出口、入口和入口前)的 TCAM 资源使用错误,请使用命令
show pfe tcam errors all-tcam-stages
。user@host> show pfe tcam errors all-tcam-stages detail Slot 0 Tcam Resource Stage: Pre-Ingress -------------------------------- No tcam usage Tcam Resource Stage: Ingress ---------------------------- Group: 11, Mode: SINGLE, Hw grps used: 3, Tcam apps: 2 Errors Resource-Shortage Tcam-Entries 0 0 Counters 0 0 Policers 0 0 Group: 8, Mode: DOUBLE, Hw grps used: 2, Tcam apps: 1 Errors Resource-Shortage Tcam-Entries 18 0 Counters 0 0 Policers 0 0 Group: 14, Mode: SINGLE, Hw grps used: 1, Tcam apps: 1 Errors Resource-Shortage Tcam-Entries 0 0 Counters 0 0 Policers 0 0 Tcam Resource Stage: Egress --------------------------- No tcam usage
您可以看到,所有使用 TCAM 资源的应用程序都处于 OK 状态,并指示硬件已成功配置。
如示例中所示,您需要在每个步骤中运行 show pfe tcam errors
和 show pfe tcam usage
命令,以确保您的配置有效,并且使用 TCAM 资源的应用程序处于正常状态。对于ACX5448路由器,请使用 show pfe filter hw summary
命令查看 TCAM 资源使用情况。
监控 ACX 系列路由器中的 TCAM 资源并对其进行故障排除
ACX 系列中三元内容寻址存储器 (TCAM) 空间的动态分配有效地为各种滤波器应用分配了可用的 TCAM 资源。在动态TCAM模型中,各种过滤器应用(如inet防火墙,桥接防火墙,cfm过滤器等)可以在需要时最佳地利用可用的TCAM资源。动态 TCAM 资源分配是使用驱动的,并根据需要为过滤器应用动态分配。当筛选器应用程序不再使用 TCAM 空间时,资源将被释放并可供其他应用程序使用。这种动态 TCAM 模型可根据应用需求满足更高规模的 TCAM 资源利用率。您可以使用 show 和 clear 命令监控 ACX 系列路由器中的动态 TCAM 资源使用情况并对其进行故障排除。
使用 TCAM 资源的应用程序在本文档中称为 tcam-app。
动态三元内容可寻址存储器概述 显示了监控 ACX 系列路由器中的 TCAM 资源并对其进行故障排除的任务和命令
如何 |
命令 |
---|---|
查看特定应用程序的共享应用程序和相关应用程序。 |
|
查看所有 TCAM 阶段的申请数量。 |
|
查看在指定阶段使用 TCAM 资源的应用程序数。 |
|
详细查看应用程序使用的 TCAM 资源。 |
|
查看应用在指定阶段使用的 TCAM 资源。 |
|
了解 tcam 应用程序消耗的 TCAM 资源数量 |
|
查看所有阶段的 TCAM 资源使用错误。 |
|
查看阶段的 TCAM 资源使用错误 |
|
查看应用程序的 TCAM 资源使用错误。 |
|
查看应用程序及其其他共享应用程序的 TCAM 资源使用错误。 |
|
清除所有阶段的 TCAM 资源使用情况错误统计信息。 |
|
清除指定阶段的 TCAM 资源使用情况错误统计信息 |
|
清除应用程序的 TCAM 资源使用情况错误统计信息。 |
|
要了解有关 ACX 系列中动态 TCAM 的更多信息,请参阅 动态三元内容可寻址内存概述。
ACX5048路由器和ACX5096路由器上的服务扩展
在ACX5048和ACX5096路由器上,部署的典型服务(如 ELINE、ELAN 和 IP VPN)可能需要使用动态 TCAM 基础架构的应用程序(如监管器、防火墙过滤器、连接故障管理 IEEE 802.1ag、RFC2544)。
使用 TCAM 资源的服务应用程序受 TCAM 资源可用性的限制。因此,服务的规模取决于此类应用程序对 TCAM 资源的消耗。
有关监控 ACX5048 和 ACX5096 路由器中服务规模并对其进行故障排除的示例用例,请参阅 动态三元内容可寻址内存概述 部分。
逻辑系统安全策略中的 DNS 名称解析疑难解答(仅限主管理员)
问题
Description
安全策略中使用的通讯簿条目中的主机名地址可能无法正确解析。
原因
通常,包含动态主机名的通讯簿条目会自动刷新 SRX 系列防火墙。与 DNS 条目关联的 TTL 字段指示应在策略缓存中刷新条目的时间。TTL 值过期后,SRX 系列防火墙会自动刷新通讯簿条目的 DNS 条目。
但是,如果 SRX 系列防火墙无法从 DNS 服务器获取响应(例如,DNS 请求或响应数据包在网络中丢失,或者 DNS 服务器无法发送响应),则通讯簿条目中的主机名地址可能无法正确解析。这可能会导致流量丢弃,因为未找到安全策略或会话匹配项。
解决方案
主管理员可以使用该 show security dns-cache
命令在 SRX 系列防火墙上显示 DNS 缓存信息。如果需要刷新 DNS 缓存信息,主管理员可以使用该 clear security dns-cache
命令。
这些命令仅供为逻辑系统配置的设备上的主管理员使用。此命令在用户逻辑系统或未为逻辑系统配置的设备上不可用。
另请参阅
链路服务接口故障排除
要解决链路服务接口上的配置问题,请执行以下操作:
确定将哪些 CoS 组件应用于组成链路
问题
Description
您正在配置多链路捆绑包,但也有没有 MLPPP 封装的流量通过该多链路捆绑包的组成链路。您是否将所有 CoS 组件应用于组成链路,或者将它们应用于多链路束是否足够?
解决方案
您可以将调度程序图应用于多链路捆绑包及其组成链路。尽管您可以将多个 CoS 组件与调度器图一起应用,但请仅配置所需的组件。我们建议您保持组成链路上的配置简单,以避免不必要的传输延迟。
表 5 显示了要应用于多链路束及其组成链路的 CoS 组件。
Cos 组件 |
多链路束 |
组成链接 |
解释 |
---|---|---|---|
分类 |
是 |
否 |
CoS 分类发生在接口的传入端,而不是在发送端,因此组成链路上不需要分类器。 |
转发类 |
是 |
否 |
转发类与队列相关联,队列通过调度器图应用于接口。队列分配是在构成链路上预先确定的。来自多链路束 Q2 的所有数据包将分配给构成链路的 Q2,来自所有其他队列的数据包将排队到构成链路的 Q0。 |
调度器映射 |
是 |
是 |
在多链路束和组成链路上应用时间表图,如下所示:
|
每单元调度程序或接口级调度器的整形速率 |
否 |
是 |
由于每单元调度仅在端点应用,因此请仅将此整形速率应用于构成链路。之前应用的任何配置都会被组成链路配置覆盖。 |
传输速率精确或队列级整形 |
是 |
否 |
应用于构成链路的接口级整形将覆盖队列上的任何整形。因此,仅在多链路束上应用传输速率精确整形。 |
重写规则 |
是 |
否 |
在分片期间,重写位会自动从数据包复制到分片中。因此,您在多链路束上配置的内容将通过分段传送到组成链路。 |
虚拟通道组 |
是 |
否 |
虚拟通道组通过防火墙过滤器规则进行标识,这些规则仅在多链路捆绑包之前应用于数据包。因此,您无需将虚拟通道组配置应用于构成链路。 |
另请参阅
确定导致多链路束抖动和延迟的原因
确定 LFI 和负载平衡是否正常工作
问题
Description
在这种情况下,您有一个支持多种服务的网络。网络传输数据和对延迟敏感的语音流量。配置 MLPPP 和 LFI 后,请确保语音数据包在网络中传输时延迟和抖动非常小。如何确定语音数据包是否被视为 LFI 数据包,以及是否正确执行了负载平衡?
解决方案
启用 LFI 后,数据(非 LFI)数据包将使用 MLPPP 标头封装,并分段为指定大小的数据包。延迟敏感型语音 (LFI) 数据包采用 PPP 封装,并在数据包片段之间交错。对于 LFI 数据包和非 LFI 数据包,排队和负载平衡的执行方式不同。
要验证是否正确执行了 LFI,请确定数据包是否按配置进行分段和封装。知道数据包是被视为 LFI 数据包还是非 LFI 数据包后,可以确认是否正确执行了负载平衡。
Solution Scenario
—假设两台瞻博网络设备 R0 和 R1 通过聚合两条串行链路的多链路束 lsq-0/0/0.0
连接, se-1/0/0
并且 se-1/0/1
. 在 R0 和 R1 上,链路服务接口上启用了 MLPPP 和 LFI,分段阈值设置为 128 字节。
在此示例中,我们使用数据包生成器来生成语音和数据流。您可以使用数据包捕获功能捕获和分析传入接口上的数据包。
在多链路束上发送了以下两个数据流:
100 个 200 字节的数据包(大于分段阈值)
500 个 60 字节的数据包(小于分段阈值)
在多链路捆绑包上发送了以下两个语音流:
来自源端口 100 的 100 个 200 字节语音数据包
来自源端口 200 的 300 个 200 字节语音数据包
要确认 LFI 和负载平衡已正确执行,请执行以下操作:
此示例仅显示和描述命令输出的重要部分。
验证数据包分段。在操作模式下,输入命令以
show interfaces lsq-0/0/0
检查大数据包是否正确分段。user@R0#> show interfaces lsq-0/0/0 Physical interface: lsq-0/0/0, Enabled, Physical link is Up Interface index: 136, SNMP ifIndex: 29 Link-level type: LinkService, MTU: 1504 Device flags : Present Running Interface flags: Point-To-Point SNMP-Traps Last flapped : 2006-08-01 10:45:13 PDT (2w0d 06:06 ago) Input rate : 0 bps (0 pps) Output rate : 0 bps (0 pps) Logical interface lsq-0/0/0.0 (Index 69) (SNMP ifIndex 42) Flags: Point-To-Point SNMP-Traps 0x4000 Encapsulation: Multilink-PPP Bandwidth: 16mbps Statistics Frames fps Bytes bps Bundle: Fragments: Input : 0 0 0 0 Output: 1100 0 118800 0 Packets: Input : 0 0 0 0 Output: 1000 0 112000 0 ... Protocol inet, MTU: 1500 Flags: None Addresses, Flags: Is-Preferred Is-Primary Destination: 9.9.9/24, Local: 9.9.9.10
Meaning
— 输出显示在多链路束上传输设备的数据包摘要。验证多链路捆绑包上的以下信息:中转数据包总数 = 1000
传输片段总数 = 1100
分段的数据包数 =100
多链路束上发送的数据包总数 (600 + 400) 与传输数据包数 (1000) 匹配,表示未丢弃任何数据包。
传输分片数比中转数据包数多 100,表示正确分片了 100 个大型数据包。
Corrective Action
— 如果数据包未正确分段,请检查分段阈值配置。小于指定分段阈值的数据包不会分段。验证数据包封装。要确定数据包是被视为 LFI 数据包还是非 LFI 数据包,请确定其封装类型。LFI 数据包使用 PPP 封装,非 LFI 数据包使用 PPP 和 MLPPP 封装。PPP 和 MLPPP 封装具有不同的开销,从而产生不同大小的数据包。您可以比较数据包大小以确定封装类型。
未分段的小型数据包包含一个 PPP 报头和一个 MLPPP 报头。在大型分段数据包中,第一个分段包含一个 PPP 报头和一个 MLPPP 报头,但连续分片仅包含一个 MLPPP 报头。
PPP 和 MLPPP 封装向数据包添加以下字节数:
PPP 封装增加 7 个字节:
4 字节的标头 + 2 字节的帧校验序列 (FCS)+ 1 个空闲或包含标志的字节
MLPPP 封装会增加 6 到 8 个字节:
4 字节 PPP 报头 + 2 到 4 字节多链路报头
图 1 显示添加到 PPP 和 MLPPP 标头的开销。
图 1: PPP 和 MLPPP 标头对于 CRTP 数据包,封装开销和数据包大小甚至小于 LFI 数据包。更多信息,请参见 示例:配置压缩实时传输协议。
表 6 显示了数据包和语音数据包各 70 字节的封装开销。封装后,数据包的大小大于语音数据包的大小。
表 6: PPP 和 MLPPP 封装开销 数据包类型
封装
初始数据包大小
封装开销
封装后的数据包大小
语音数据包 (LFI)
PPP
70 字节
4 + 2 + 1 = 7 字节
77 字节
具有短序列的数据片段(非 LFI)
MLPPP
70 字节
4 + 2 + 1 + 4 + 2 = 13 字节
83 字节
具有长序列的数据片段(非 LFI)
MLPPP
70 字节
4 + 2 + 1 + 4 + 4 = 15 字节
85 字节
在操作模式下,输入
show interfaces queue
命令以显示每个队列上传输的数据包的大小。将传输的字节数除以数据包数,得到数据包的大小并确定封装类型。验证负载平衡。在操作模式下,在多链路束及其组成链路上输入
show interfaces queue
命令,以确认是否对数据包执行相应的负载平衡。user@R0> show interfaces queue lsq-0/0/0 Physical interface: lsq-0/0/0, Enabled, Physical link is Up Interface index: 136, SNMP ifIndex: 29 Forwarding classes: 8 supported, 8 in use Egress queues: 8 supported, 8 in use Queue: 0, Forwarding classes: DATA Queued: Packets : 600 0 pps Bytes : 44800 0 bps Transmitted: Packets : 600 0 pps Bytes : 44800 0 bps Tail-dropped packets : 0 0 pps RED-dropped packets : 0 0 pps … Queue: 1, Forwarding classes: expedited-forwarding Queued: Packets : 0 0 pps Bytes : 0 0 bps … Queue: 2, Forwarding classes: VOICE Queued: Packets : 400 0 pps Bytes : 61344 0 bps Transmitted: Packets : 400 0 pps Bytes : 61344 0 bps … Queue: 3, Forwarding classes: NC Queued: Packets : 0 0 pps Bytes : 0 0 bps …
user@R0> show interfaces queue se-1/0/0 Physical interface: se-1/0/0, Enabled, Physical link is Up Interface index: 141, SNMP ifIndex: 35 Forwarding classes: 8 supported, 8 in use Egress queues: 8 supported, 8 in use Queue: 0, Forwarding classes: DATA Queued: Packets : 350 0 pps Bytes : 24350 0 bps Transmitted: Packets : 350 0 pps Bytes : 24350 0 bps ... Queue: 1, Forwarding classes: expedited-forwarding Queued: Packets : 0 0 pps Bytes : 0 0 bps … Queue: 2, Forwarding classes: VOICE Queued: Packets : 100 0 pps Bytes : 15272 0 bps Transmitted: Packets : 100 0 pps Bytes : 15272 0 bps … Queue: 3, Forwarding classes: NC Queued: Packets : 19 0 pps Bytes : 247 0 bps Transmitted: Packets : 19 0 pps Bytes : 247 0 bps …
user@R0> show interfaces queue se-1/0/1 Physical interface: se-1/0/1, Enabled, Physical link is Up Interface index: 142, SNMP ifIndex: 38 Forwarding classes: 8 supported, 8 in use Egress queues: 8 supported, 8 in use Queue: 0, Forwarding classes: DATA Queued: Packets : 350 0 pps Bytes : 24350 0 bps Transmitted: Packets : 350 0 pps Bytes : 24350 0 bps … Queue: 1, Forwarding classes: expedited-forwarding Queued: Packets : 0 0 pps Bytes : 0 0 bps … Queue: 2, Forwarding classes: VOICE Queued: Packets : 300 0 pps Bytes : 45672 0 bps Transmitted: Packets : 300 0 pps Bytes : 45672 0 bps … Queue: 3, Forwarding classes: NC Queued: Packets : 18 0 pps Bytes : 234 0 bps Transmitted: Packets : 18 0 pps Bytes : 234 0 bps
Meaning
— 这些命令的输出显示在链路服务接口及其组成链路的每个队列上传输和排队的数据包。 表 7 显示这些值的摘要。(由于传输的数据包数等于所有链路上排队的数据包数,因此此表仅显示排队的数据包。表 7: 队列上传输的数据包数 排队的数据包
捆绑包 lsq-0/0/0.0
组成链接 se-1/0/0
组成链接 se-1/0/1
解释
Q0 上的数据包
600 次
350
350
通过组成链路的数据包总数 (350+350 = 700) 超过了在多链路束上排队的数据包数 (600)。
第 2 季度的数据包
400
100
300
通过组成链路的数据包总数等于捆绑包上的数据包数。
第 3 季度的数据包
0
19
18
通过构成链路的 Q3 的数据包用于在构成链路之间交换的连接消息。因此,没有数据包被计入捆绑包的第 3 季度。
在多链路束上,验证以下内容:
排队的数据包数与传输的数量匹配。如果数字匹配,则不会丢弃任何数据包。如果排队的数据包多于传输的数据包,则会因为缓冲区太小而被丢弃数据包。组成链路上的缓冲区大小控制输出级的拥塞。若要更正此问题,请增加构成链路上的缓冲区大小。
通过 Q0 (600) 的数据包数与多链路束上接收的大数据包数和小数据包数 (100+500) 相匹配。如果数字匹配,则所有数据包都正确传输了 Q0。
在多链路束 (400) 上通过 Q2 的数据包数与在多链路束上接收的语音数据包数相匹配。如果数字匹配,则所有语音 LFI 数据包都正确传输了第 2 季度。
在构成链路上,验证以下内容:
通过 Q0 的数据包总数 (350+350) 与数据包和数据分片的数量 (500+200) 相匹配。如果数字匹配,则分段后的所有数据包都正确传输了构成链路的 Q0。
数据包传输了两个组成链路,表明在非 LFI 数据包上正确执行了负载平衡。
组成链路上通过 Q2 的数据包总数 (300+100) 与多链路束上接收的语音数据包数 (400) 相匹配。如果数字匹配,则所有语音 LFI 数据包都正确传输了第 2 季度。
已
se-1/0/0
传输来自源端口100
的 LFI 数据包,以及来自源端口200
se-1/0/1
的 LFI 数据包。因此,所有 LFI (Q2) 数据包都根据源端口进行哈希处理,并正确传输了两个组成链路。
Corrective Action
— 如果数据包仅传输一个链路,请执行以下步骤来解决问题:确定物理链路是(
up
运行)还是down
(不可用)。不可用链路表示 PIM、接口端口或物理连接存在问题(链路层错误)。如果链路正常运行,请转到下一步。验证是否已为非 LFI 数据包正确定义分类器。确保非 LFI 数据包未配置为排队到 Q2。排队到 Q2 的所有数据包都被视为 LFI 数据包。
验证 LFI 数据包中的以下值中至少有一个不同:源地址、目标地址、IP 协议、源端口或目标端口。如果为所有 LFI 数据包配置了相同的值,则所有数据包都将散列到同一流并传输相同的链路。
使用结果验证负载平衡。
安全策略故障排除
在路由引擎和数据包转发引擎之间同步策略
问题
Description
安全策略存储在路由引擎和数据包转发引擎中。提交配置时,安全策略将从路由引擎推送到数据包转发引擎。如果路由引擎上的安全策略与数据包转发引擎不同步,则提交配置将失败。如果反复尝试提交,可能会生成核心转储文件。不同步可能是由于:
从路由引擎到数据包转发引擎的策略消息在传输过程中丢失。
路由引擎错误,例如重复使用的策略 UID。
环境
路由引擎和数据包转发引擎中的策略必须同步才能提交配置。但是,在某些情况下,路由引擎和数据包转发引擎中的策略可能不同步,从而导致提交失败。
症状
修改策略配置且策略不同步时,将显示以下错误消息 - error: Warning: policy might be out of sync between RE and PFE <SPU-name(s)> Please request security policies check/resync.
解决方案
show security policies checksum
如果安全策略不同步,请使用命令显示安全策略校验和值,并使用request security policies resync
命令同步路由引擎和数据包转发引擎中的安全策略配置。
另请参阅
检查安全策略提交失败
验证安全策略提交
问题
Description
执行策略配置提交后,如果您发现系统行为不正确,请使用以下步骤解决此问题:
解决方案
操作 show 命令 - 执行安全策略的操作命令,并验证输出中显示的信息是否与预期一致。否则,需要相应地更改配置。
跟踪选项 - 在策略配置中设置
traceoptions
命令。可以根据用户对命令输出的分析show
选择此层次结构下的标志。如果无法确定要使用的标志,则可以使用 flag 选项all
捕获所有跟踪日志。user@host#
set security policies traceoptions <flag all>
您还可以配置可选文件名来捕获日志。
user@host# set security policies traceoptions <filename>
如果在跟踪选项中指定了文件名,则可以在 /var/log/<filename> 中查找日志文件,以确定文件中是否报告了任何错误。(如果未指定文件名,则默认文件名为事件。错误消息指示故障位置和适当的原因。
配置跟踪选项后,必须重新提交导致不正确系统行为的配置更改。
变更历史表
是否支持某项功能取决于您使用的平台和版本。 使用 Feature Explorer 查看您使用的平台是否支持某项功能。