Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

已知行为

本部分列出了此版本的已知限制。

Contrail 网络 21.4.L4.2 版中的已知行为

控制器

  • CEM-32513 在 ISSU 升级期间,观察到控制节点在计算升级后仍处于初始化状态。此问题被确定为控制配置问题,导致 BGP 路由器的 vnc-api 注册失败。

    解决办法:重新启动 contrail-provisioner1 容器。

配置

  • CEM-32496 cassandra-reaper 在 IPU 从 R21.4.L3.1-9 到 R21.4.L4.69 期间RHOSP16所有 contrail 控制器上连续重启。在 R21.4.L4.75 及更高版本中不会出现此问题,因此如果此问题再次出现,请按照下面分享的解决方法进行作。

    解决办法:停止收割者,丢弃reaper_db,然后重新启动收割者。

Contrail 网络版本 21.4.L4.1 中的已知行为

vRouter(内核、DPDK)、vRouter 代理

  • CEM-31818 默认数据包大小为 1500 及以上的 UDP 流量被丢弃,因为 TCP 和 Ping 工作正常。

  • CEM-31836 要观察 DPDK 计算上 TCP IPv6 流量的 IF 丢弃,请在 compute1 节点上启用 VM1,在 compute2 节点上启用 VM2,然后以 1MBps 的速率通过 iperf 发送 IPv6 流量。

部署

  • CEM-32157 将每个计算批次升级到 RHEL9 后,登录到每个目标主机并确保升级成功。验证 contrail status 是否将 vrouter 和 node manager 显示为活动状态,并确保 vhost0 已启动。如果由于任何原因 vhost0 不可见,请执行 ifup vhost0 并重复 contrail 状态验证。

Contrail 网络版本 21.4.L4 中的已知行为

OpenStack

  • CEM-17991 在使用Kolla和OpenStack Rocky调配的OpenStack HA设置中,如果同时关闭所有服务器并稍后启动它们,Galera集群将失败。要恢复Galera集群,请按照下列步骤作:

    1. 编辑 /etc/kolla/mariadb/galera.cnf 文件以删除 wsrep 其中一个控制器上的地址,如下所示。

      注意:

      如果托管方案中的所有控制器同时关闭,则必须选择最后关闭的控制器。

    2. Docker 在编辑文件的控制器上启动 mariadb。

    3. 等待几分钟,确保 mariadb 容器没有重新启动,然后 Docker 在剩余的控制器上启动 mariadb。

    4. 还原 /etc/kolla/mariadb/galera.cnf 文件更改,并在先前选择的控制器上重新启动 mariadb 容器。

配置

  • CEM-31838 在以下情况下,DPDK 节点之间的 Rhosp17 虚拟机实时迁移失败:

    • 将其他虚拟机保留在目标计算节点中

    • 在目标计算节点中关闭其他虚拟机

vRouter(内核、DPDK)、vRouter 代理

  • CEM-31818 默认数据包大小为 1500 及以上的 UDP 流量被丢弃,因为 TCP 和 Ping 工作正常。

  • CEM-31836 要观察 DPDK 计算上 TCP IPv6 流量的 IF 丢弃,请在 compute1 节点上启用 VM1,在 compute2 节点上启用 VM2,然后以 1MBps 的速率通过 iperf 发送 IPv6 流量。

DPDK 和 SR-IOV

  • CEM-21547 SR-IOV 配置自动化不适用于多宿主服务器。

  • JCB-177787 在 SNAT 和 LBaaS 等需要网络的 DPDK vRouter 用例中,无法设置巨型 MTU。允许的最大 MTU:<=1500。

常规路由

  • CEM-27502 要在英特尔 XXV710 NIC 上启用 QOS,您必须首先在计算节点上执行以下过程:

    1. 重新启动计算节点。

    2. 输入 systemctl start lldpad 命令。

    3. 输入 systemctl status lldpaddcbtool sc ens1f0 dcb on 命令。

      您应该知道能够在 NIC 上启用 QoS。

      如果在执行步骤 3 后无法在 NIC 上启用 QoS,请继续执行步骤 4。

    4. 输入 dcbtool sc dcbx v:force-cee 命令。

Kubernetes

  • JCB-187287 不支持 Kubernetes Master 的高可用性预配。

Contrail 交换矩阵管理

  • 不支持跨 TOR 的 CEM-3959 BMS 移动。要在 TOR 之间移动 BMS,需要移动整个 VPG。这意味着,如果有多个 BMS 关联到一个 VPG,并且需要移动其中一个 BMS,则需要根据新的关联删除并重新配置整个 VPG。

  • CEM-4358 在 Contrail 交换矩阵部署中,无法将QFX5110配置为主干 (CRB-Gateway)。

  • 不支持 CEM-8149 不支持结构设置为 enterprise_style=True 的 BMS LCM。默认情况下,enterprise_style设置为 False。如果结构对象载入 BMS LCM 实例,请避免使用 enterprise_style=True。

  • CEM-20693 “交换矩阵>端口”下的 BGP 路由小组件> Leaf network device 仅考虑来自 inet.0 表的路由。

  • CEM-20794 在使用 ML2 插件进行 Contrail 交换矩阵管理时,无法在与 SRIOV VF 关联的虚拟机中配置 LAG。

  • CEM-20829 在使用 ML2 插件进行 Contrail 交换矩阵管理时,用于 sFlow 的telemetry_in_band_interface必须是物理接口。不支持 VLAN 接口。

Contrail 网络 21.4.L3 版中的已知行为

OpenStack

  • CEM-30003 在 Openstack 中重命名包含资源的项目时,该项目的新名称不会在 Contrail 网络 21.4.L2 版中更新。因此,Openstack 中的项目名称与 Contrail 网络 21.4.L2 版不同。但是,如果项目没有任何资源,则当在相应项目中创建任何资源时,Contrail 网络 21.4.L2 版中的项目名称和资源名称与 Openstack 中的项目名称和资源名称相同。

  • CEM-29229 IPU 从 Contrail 网络 21.4 版升级到 Contrail 网络 R21.4.L1 版可能会失败,并显示 rabbitmq 容器删除状态。

    解决办法:完成以下过程:

    1. 在所有 OpenStack 节点上输入 pcs resource cleanup 命令,并确保所有资源都已启动。

    2. 通过运行 pcs resource op defaults update timeout=600s 命令将超时增加到 600 秒。

    3. 输入包含所有参数的命令 openstack overcloud update converge

    4. 更新融合完成后,可能需要清理一些融合失败。

      重新输入 openstack overcloud update converge 包含所有参数的命令以清理这些收敛故障。

  • CEM-29059 不支持从 Contrail 网络版本 1912 快进升级 (FFU) 到 Contrail 网络版本 21.4.L1。升级控制器时,升级尝试失败。

  • CEM-26599 在使用远程计算的部署中,在远程站点上创建虚拟机 (VM) 可能需要较长时间。VM 创建时间可能需要 6 分钟以上。

  • CEM-27083 在部署过程中,Contrail 收集器服务有时会出现核心错误。遇到此问题时,Contrail 收集器服务会自动重新启动,并且不会对任何功能造成影响。

  • CEM-20280 在 Kubernetes 和 OpenStack 联合设置中,vrouter-agent 重启有时会导致未经授权的作错误。要解决此问题,请再次重新启动 vrouter-agent。

  • CEM-17991 在使用Kolla和OpenStack Rocky调配的OpenStack HA设置中,如果同时关闭所有服务器并稍后启动它们,Galera集群将失败。要恢复Galera集群,请按照下列步骤作:

    1. 编辑 /etc/kolla/mariadb/galera.cnf 文件以删除 wsrep 其中一个控制器上的地址,如下所示。

      注意:

      如果托管方案中的所有控制器同时关闭,则必须选择最后关闭的控制器。

    2. Docker 在编辑文件的控制器上启动 mariadb。

    3. 等待几分钟,确保 mariadb 容器没有重新启动,然后 Docker 在剩余的控制器上启动 mariadb。

    4. 还原 /etc/kolla/mariadb/galera.cnf 文件更改,并在先前选择的控制器上重新启动 mariadb 容器。

  • CEM-15764 在 Octavia Load Balancer 中,发往负载均衡器 VM 浮动 IP 的流量不会定向到后端 VM。

  • CEM-9979 在 RHOSP 环境中升级使用 OOO 热模板部署的 DPDK 计算期间,观察到 vRouter 核心转储。这是由于服务在升级期间启动的顺序所致,不会影响群集作。

部署

  • CEM-31309 部署 Contrail 网络后,无法访问 Contrail 命令用户界面。如果 Contrail 网络的防火墙服务已停止,则只能访问 Contrail 命令用户界面。

    解决办法:从 Contrail 网络 21.4.L3 版开始,执行以下步骤以访问 Contrail 命令用户界面。

    1. 部署 Contrail 命令之前,先在节点上安装 sshpass。

    2. 部署 Contrail 命令后,请在已安装 Contrail 命令的节点上手动禁用防火墙以访问其用户界面。

  • CEM-30799 在执行零影响升级 (ZIU) 程序时,控制器在运行 ZIU playbook 后升级,并且 contrail-controller-config-schema 和 contrail-controller-config-svcmonitor 不断重新启动。当基石关闭时,Contrail 配置 API 仍处于初始化状态。

    解决办法:在 Contrail 网络 21.4.L3 版中,在执行任何升级(ZIU 或 ISSU)之前,请通过容器串行安装 Docker。但是,可以通过脚本将计算并行升级到 Docker。升级每个 docker 主机后,验证 contrail 和服务的状态。在 contrail 状态报告的所有服务都正常运行之前,不要在下一个主机上继续升级。

    使用以下脚本停止正在运行的容器,升级 docker,并将容器带回:

  • CEM-28044 将 Contrail 网络 2011.L3 版升级到 21.4.L1 版后,配置 API 服务器停留在初始化状态。

    解决办法:要确保配置 API 服务器不会卡住,请执行以下过程。

    1. https://support.juniper.net/support/downloads/?p=contrail#sw 下载 commandutil 二进制文件。

    2. 将权限分配给 /tmp 文件夹。

    3. 复制 /tmp 文件夹。

    4. 运行实用程序 (commandutil_21.4L2) 并将其转换为数据库文件 (db.yml) 格式。

    5. 创建一个文件夹并将数据库文件移动到此文件夹。

配置

  • CEM-30772 Contrail 网络 21.4.L2 版的 ansible 部署程序在 /var/log/contrail Contrail 配置节点的目录中引入了链路环路。每次启动 Contrail 网络 21.4.L2 版 Ansible 部署程序时,都会发生这种情况。由于提到的递归,重新运行 ansible deployer playbook 失败。Contrail 网络 21.4.L3 版已解决该问题。但是,对于 Contrail 网络 21.4.L2 版,需要手动干预才能遵循给定的解决方法。

    解决办法:从所有 Contrail 配置节点中手动移除不正确的符号链接:

  • CEM-31301 在运行 Cassandra 服务的 Contrail 节点中,以相同的速度安装磁盘。Cassandra 服务对时序很敏感,并且必须使服务的所有实例彼此保持同步。将磁盘保持不同的速度可能会使 Cassandra 不同步。

vRouter(内核、DPDK)、vRouter 代理

  • CEM-31080 限制虚拟机 MTU 小于 VHOST MTU 必须从 Contrail 网络的配置节点完成。但是,在当前的 Contrail 网络架构设计中,配置节点不知道虚拟主机 MTU,因此 Contrail 网络不支持此选项。

DPDK 和 SR-IOV

  • CEM-22835 在启用了 DPDK 的同一计算节点中运行的虚拟机 (VM) 之间进行高吞吐量数据传输期间,会观察到间歇性性能下降以及校验和错误。功能不受影响。

  • CEM-21547 SR-IOV 配置自动化不适用于多宿主服务器。

  • CEM-18922 在 DPDK 计算上,VM 的内存仅映射到一个 numa。如果 VM 是以 hw:mem_page_size='any' flavor 启动的,则在该 numa 中的巨大页面耗尽后,VM 创建将失败。解决方法,请改用该 hw:mem_page_size='large' 特定情调来避免此问题。

  • CEM-26008 创建绑定接口时,虽然接口名称可以是任何单词,但建议使用“绑定”。

  • CEM-18163 在 DPDK 计算上,如果 contrail-vrouter-agent 崩溃,或者在具有许多子接口的扩展设置中重新启动 contrail-vrouter-agent,则所有子接口及其父接口都可能变为非活动状态。解决方法是停止/启动接口已关闭的实例。

  • CEM-15561 使用 Mellanox NIC 卡卸载的 vRouter 不起作用。但是,支持不卸载的 Mellanox NIC 上的 DPDK。

  • CEM-13685 DPDK vRouter with MLNX CX5 大约需要 10 分钟,并且还可以看到 lcore 崩溃。这在初始安装期间发生一次。

  • JCB-177787 在 SNAT 和 LBaaS 等需要网络的 DPDK vRouter 用例中,无法设置巨型 MTU。允许的最大 MTU:<=1500。

SmartNIC

  • Fortville X710 NIC 中的 CEM-11163:使用 TX 和 RX 缓冲器时,当 mbufs 耗尽时,性能会下降。

常规路由

  • CEM-30058 在将托管物理网络功能 (PNF) 设备与 SRX 设备搭配使用的环境中,PNF 服务链不会将配置推送到 SRX 设备。因此,PNF 服务链不起作用。

    解决办法:在使用托管 PNF 设备的环境中没有已知的解决方法。在使用非托管 PNF 设备的环境中不会遇到此问题。

  • CEM-30023 在使用 BGP 的远程计算环境中,不会为控制节点以及 BGP 主对等方和辅助对等方填充路由。

  • CEM-30002 Contrail 收集器意外出现故障。

    解决办法:没有已知的解决办法。发生故障后,Contrail 收集器服务将重新启动并自动恢复联机。此问题不会影响流量转发性能。

  • CEM-29723 在使用 Ansible 部署的环境中,Contrail 收集器会意外出现故障。

    解决办法:没有已知的解决办法。发生故障后,Contrail 收集器服务将重新启动并自动恢复联机。此问题不会影响流量转发性能。

  • CEM-28889 由于 BGPaaS 会话翻动,BGP 即服务 (BGPaaS) 无法跨同一虚拟机中的多个 Pod 运行。

    解决办法:始终将 BGPaaS 配置为在单个虚拟机中使用单个 Pod 进行部署。

  • CEM-29152 配置路由策略时,逻辑路由器互连的配置推送失败。

  • CEM-28914 Contrail vRouter 将数据包从虚拟机 (VM) 丢弃到扩展至瞻博网络 MX 系列路由器的外部网络上的裸机服务器 (BMS)。

    解决办法:禁用反向路径转发 (RPF)。

  • CEM-27502 要在英特尔 XXV710 NIC 上启用 QOS,您必须首先在计算节点上执行以下过程:

    1. 重新启动计算节点。

    2. 输入 systemctl start lldpad 命令。

    3. 输入 systemctl status lldpaddcbtool sc ens1f0 dcb on 命令。

      您应该知道能够在 NIC 上启用 QoS。

      如果在执行步骤 3 后无法在 NIC 上启用 QoS,请继续执行步骤 4。

    4. 输入 dcbtool sc dcbx v:force-cee 命令。

  • CEM-25388 更新与 VN 关联的 DNS 服务器属性不起作用。要更新、添加或移除 VN 中的 DNS 服务器详细信息,用户可以使用所需的 DNS 服务器详细信息删除并重新创建 VN。

  • CEM-20477 在 EVPN 服务链的情况下,带有透明防火墙的服务链不会在左右 VN 之间建立连接。

  • CEM-21835 如果裸机服务器 (BMS) 路由(VXLAN 路由)在 AAP CIDR 中,则不得使用允许的小于 /32 的地址对 (AAP)。

  • CEM-7262 不得将双向转发检测 (BFD) 协议附加到 BGPaaS 对象。您可以将 BFD 连接到 VMI。

  • CEM-21570 AS_PATH保留不适用于启用了 4 字节自治系统编号 (ASN) 的群集。

  • CEM-20421 在 Contrail 网络中,启用了瞻博网络标头时,逻辑路由器 (LR) 不支持动态下一跃点端口镜像。端口镜像不支持瞻博网络标头,因为在这种情况下,VXLAN 不是用于动态下一跃点的隧道类型。

  • CEM-20419 当在 VN 中启用 MAC/IP 并与 BFD 运行状况检查(目标 ip 设置为“全部”)相关联时,代理重新启动后,BFD 会话需要更长的时间才能恢复。

  • LR 上的 CEM-5043 VNI 更新不会更新路由表。解决方法是删除 LogicalRouter 并使用新 VNI 创建新的 LogicalRouter。

  • CEM-3245 vRouter 会复制源自 6 类无法正常工作的 QFX 设备的组播流量。

  • CEM-22632 使用 MX 系列路由器充当数据中心网关,并且如果在控制器和 MX 之间使用 MPLSoUDP,则浮动 IP 用例不起作用。请改用 MPLSoGRE 或 VXLAN。

Contrail 交换矩阵管理

  • CEM-29418 无中断软件升级尝试失败,并显示“MODULE FAILURE\nSee stdout/stderr for the exact error”(模块故障\n参见 stdout/stderr 了解确切错误)。

    解决办法:可以通过登录设备控制台来手动升级 QFX 系列交换机。您可以通过将作为升级目标的 QFX 系列交换机置于维护模式来实现无中断升级。

  • CEM-29154 由于 IP 地址未分配给 FXP 接口,全自动部署 (ZTP) 流程无法将 MX 系列路由器上线。

  • CEM-28971 尝试使用全自动部署 (ZTP) 将交换矩阵上线未完成。控制和收集器进程处于 初始化状态,并且 RabbitMQ 过程在一个控制节点上不断重新启动。

  • CEM-28941 配置不会被推送到交换矩阵设备。

    解决办法:重新启动 RabbitMQ 和 DM 容器。

  • CEM-23931 安装 swift-client 时,使用 Ansible 部署器配置 Contrail Fabric Manager 间歇性失败。如果出现这种情况,请在控制器上预安装 swift-client,然后重新运行预配。

  • CEM-20829 在使用 ML2 插件进行 Contrail 交换矩阵管理时,用于 sFlow 的telemetry_in_band_interface必须是物理接口。不支持 VLAN 接口。

  • CEM-18381 QFX5120不能用作 CRB 角色的 SP 样式中的边界叶角色。

  • CEM-15809 不支持更新企业样式交换矩阵中 VPG 上的 VLAN-ID。解决方法是删除并重新创建交换矩阵。

  • CEM-14679 在交换矩阵非托管 PNF 用例中,在 CRB 网关的情况下,DM 会在主干上的 LR VRF 下推送一些虚假的静态路由。

    解决方法是更改 device_manager docker 中 dummy_ip 变量的值。以下行号基于 2008 年版本代码库。

    https://github.com/Juniper/contrail-controller/blob/R2008/src/config/fabric-ansible/ansible-playbooks/filter_plugins/fabric.py#L2594

    将值更改为所需子网并保存文件后,重新启动 DM docker 以反映更改。请注意,此步骤应在交换矩阵上线之前开始执行。

  • CEM-14264 在版本 2003 中,“虚拟端口组创建”工作流不会使用使用给定虚拟网络的第一个 VPG 定义的现有值预填充 VLAN-ID。与以前的版本不同,该字段是可编辑的。如果交换矩阵在配置时启用了 交换矩阵范围的 VLAN-ID 重要性 复选框,则会出现此问题。

  • CEM-13767 虽然 Contrail 交换矩阵管理器能够让用户为交换矩阵设备使用自定义映像名称,但对于在基于 vmhost 的平台上运行的 QFX10000-60C 等平台,在将映像上传到 CFM 时,应以 junos-vmhost-install-x.tgz 格式选择映像名称。

  • CEM-8701 在 SP 样式交换矩阵上并行载入多个 BMS 不起作用。在使用生命周期管理工作流启动 BMS 时,有时在速度更快的服务器上,重新映像不会通过,实例也不会从具有讽刺意味的 vn 移动到租户 vn。这是因为,如果在 BMS 端口和 Contrail 节点中运行的 TFTP 服务之间的路由融合之前发送来自 BMS 的 PXE 引导请求。解决方法是,可以重新启动服务器,或者将服务器中的 BIOS 配置为具有延迟启动。

  • 不支持 CEM-8149 不支持结构设置为 enterprise_style=True 的 BMS LCM。默认情况下,enterprise_style设置为 False。如果结构对象载入 BMS LCM 实例,请避免使用 enterprise_style=True。

  • CEM-4358 在 Contrail 交换矩阵部署中,无法将QFX5110配置为主干 (CRB-Gateway)。

  • 不支持跨 TOR 的 CEM-3959 BMS 移动。要在 TOR 之间移动 BMS,需要移动整个 VPG。这意味着,如果有多个 BMS 关联到一个 VPG,并且需要移动其中一个 BMS,则需要根据新的关联删除并重新配置整个 VPG。

  • CEM-20794 在使用 ML2 插件进行 Contrail 交换矩阵管理时,无法在与 SRIOV VF 关联的虚拟机中配置 LAG。

  • CEM-20693 “交换矩阵>端口”下的 BGP 路由小组件> Leaf network device 仅考虑来自 inet.0 表的路由。

  • CEM-20272 在 L2 DCI 模式下,如果所选交换矩阵具有相同的叠加 ASN 编号,则在 L2 DCI 模式下,将在交换矩阵设备之间使用叠加 iBGP。在这种情况下,标记为 DCI 网关 RB 角色(路由和桥接)的边界设备(物理路由器)也必须分配 RR(路由反射器)RB 角色。如果没有 RR RB 角色,叠加 IBGP 会话不会跨交换矩阵的叶设备扩展第 2 层租户虚拟网络。因此,我们建议对于 L2 DCI 模式,确保将物理路由器设备标记为 DCI 网关 RB 角色和 RR 角色。

  • CEM-19802 安全组不能在 QFX10K 接口上使用。

Kubernetes

  • CEM-29109 在使用 Tungsten Fabric 运算符 (tf-operator) 的 Kubernetes 环境中,Contrail 查询引擎在部署时会意外宕机。

    解决办法:没有已知的解决办法。查询引擎会自动重新启动。

  • CEM-29067 在使用 tf-operator 部署的 Kubernetes 环境中,Contrail 收集器进程在升级期间会失败。发生故障后,Contrail 收集器服务会重新启动并自动重新联机。

  • JCB-187287 不支持 Kubernetes Master 的高可用性预配。

常规

  • CEM-30854 在基于 Ansible 的部署中,要升级群集,请勿使用 contrail 命令来触发升级。相反,请直接使用 ansible作指南进行升级。

  • CEM-30961 如果将非基于 Linux 的虚拟机(如 vSRX)用作工作负载,则非默认 MTU 功能将不起作用。

  • CEM-31060 如果在扩展环境中同时重启多个config_api实例,则由于数据库不同步,可能会发生 API 连接错误。

    解决办法:如果重新启动作是用户预期的,则在重新启动其中一个config_api_1容器后,请等待此 API 服务器完成数据库重新同步,然后重新启动另一个config_api_1容器。如果系统由于 config_api 实例的并行重启而进入错误状态,则:

    1. 修复配置 Cassandra 数据库。

    2. 从 zookeeper 中删除整个文件夹 /vnc_api_server_locks。

    3. 首先config_api_1容器重新启动并运行 curl 命令,直到它返回有效数据。config_api_1 的其余部分也是如此。

    4. 重新启动收集器。

  • CEM-31080 在虚拟网络上配置非默认 MTU 时,建议不要配置比 vhost0 接口的 MTU 更大的 MTU。

  • CEM-31084 - 如果在 VMI 和 VN 级别指定了 MTU,则 VMI MTU 应优先。但是,如果 VMI 启用了 DHCP 选项 26,则 VMI MTU 不会优先。

  • CEM-31095 非默认 MTU 功能不适用于子接口。

Contrail 网络 21.4.L2 版中的已知行为

OpenStack

  • CEM-30003 在 Openstack 中重命名包含资源的项目时,该项目的新名称不会在 Contrail 网络 21.4.L2 版中更新。因此,Openstack 中的项目名称与 Contrail 网络 21.4.L2 版不同。但是,如果项目没有任何资源,则当在相应项目中创建任何资源时,Contrail 网络 21.4.L2 版中的项目名称和资源名称与 Openstack 中的项目名称和资源名称相同。

  • CEM-29229 IPU 从 Contrail 网络 21.4 版升级到 Contrail 网络 R21.4.L1 版可能会失败,并显示 rabbitmq 容器删除状态。

    解决办法:完成以下过程:

    1. 在所有 OpenStack 节点上输入 pcs resource cleanup 命令,并确保所有资源都已启动。

    2. 通过运行 pcs resource op defaults update timeout=600s 命令将超时增加到 600 秒。

    3. 输入包含所有参数的命令 openstack overcloud update converge

    4. 更新融合完成后,可能需要清理一些融合失败。

      重新输入 openstack overcloud update converge 包含所有参数的命令以清理这些收敛故障。

  • CEM-29059 不支持从 Contrail 网络版本 1912 快进升级 (FFU) 到 Contrail 网络版本 21.4.L1。升级控制器时,升级尝试失败。

  • CEM-26599 在使用远程计算的部署中,在远程站点上创建虚拟机 (VM) 可能需要较长时间。VM 创建时间可能需要 6 分钟以上。

  • CEM-27083 在部署过程中,Contrail 收集器服务有时会出现核心错误。遇到此问题时,Contrail 收集器服务会自动重新启动,并且不会对任何功能造成影响。

  • CEM-20280 在 Kubernetes 和 OpenStack 联合设置中,vrouter-agent 重启有时会导致未经授权的作错误。要解决此问题,请再次重新启动 vrouter-agent。

  • CEM-17991 在使用Kolla和OpenStack Rocky调配的OpenStack HA设置中,如果同时关闭所有服务器并稍后启动它们,Galera集群将失败。要恢复Galera集群,请按照下列步骤作:

    1. 编辑 /etc/kolla/mariadb/galera.cnf 文件以删除 wsrep 其中一个控制器上的地址,如下所示。

      注意:

      如果托管方案中的所有控制器同时关闭,则必须选择最后关闭的控制器。

    2. Docker 在编辑文件的控制器上启动 mariadb。

    3. 等待几分钟,确保 mariadb 容器没有重新启动,然后 Docker 在剩余的控制器上启动 mariadb。

    4. 还原 /etc/kolla/mariadb/galera.cnf 文件更改,并在先前选择的控制器上重新启动 mariadb 容器。

  • CEM-15764 在 Octavia Load Balancer 中,发往负载均衡器 VM 浮动 IP 的流量不会定向到后端 VM。

  • CEM-9979 在 RHOSP 环境中升级使用 OOO 热模板部署的 DPDK 计算期间,观察到 vRouter 核心转储。这是由于服务在升级期间启动的顺序所致,不会影响群集作。

DPDK 和 SR-IOV

  • CEM-29841 在使用 DPDK 的环境中,由于数据包流中的下一跳编程错误,BGP 会话无法启动。

  • CEM-22835 在启用了 DPDK 的同一计算节点中运行的虚拟机 (VM) 之间进行高吞吐量数据传输期间,会观察到间歇性性能下降以及校验和错误。功能不受影响。

  • CEM-21547 SR-IOV 配置自动化不适用于多宿主服务器。

  • CEM-18922 在 DPDK 计算上,VM 的内存仅映射到一个 numa。如果 VM 是以 hw:mem_page_size='any' flavor 启动的,则在该 numa 中的巨大页面耗尽后,VM 创建将失败。解决方法,请改用该 hw:mem_page_size='large' 特定情调来避免此问题。

  • CEM-18408 与 X710 网卡DPDK1911,如果配置了 txd 和 rxd,则由于 mbuf 泄漏,性能会下降。英特尔建议在 Fortville NIC 上配置至少 1K tx 和 rx 描述符以获得更好和一致的性能,但它们似乎对 X710 NIC 有降级影响。

  • CEM-18163 在 DPDK 计算上,如果 contrail-vrouter-agent 崩溃,或者在具有许多子接口的扩展设置中重新启动 contrail-vrouter-agent,则所有子接口及其父接口都可能变为非活动状态。解决方法是停止/启动接口已关闭的实例。

  • CEM-17883 VLAN 标记不适用于带有 DPDK 19.11 的 Mellanox CX5 卡。

  • CEM-15561 使用 Mellanox NIC 卡卸载的 vRouter 不起作用。但是,支持不卸载的 Mellanox NIC 上的 DPDK。

  • CEM-13685 DPDK vRouter with MLNX CX5 大约需要 10 分钟,并且还可以看到 lcore 崩溃。这在初始安装期间发生一次。

  • JCB-177787 在 SNAT 和 LBaaS 等需要网络的 DPDK vRouter 用例中,无法设置巨型 MTU。允许的最大 MTU:<=1500。

SmartNIC

  • CEM-29739 在使用 Ansible 部署的部署中,XMPP 可能会由于 vDNS 服务器扩展问题而中断。

    解决办法:配置少于 200 个 vDNS 服务器。

  • CEM-28861 在使用英特尔 3000 smartNIC 的计算节点上,部署有时会由于与启动 NIC 相关的问题而失败。日志显示一系列 mbuf 错误。

    解决办法:在故障节点上重新启动 contrail-vrouter-dpdk 容器,然后重新运行部署。您还可以删除有问题的计算节点并重新部署群集。

  • Fortville X710 NIC 中的 CEM-11163:使用 TX 和 RX 缓冲器时,当 mbufs 耗尽时,性能会下降。

常规路由

  • CEM-30058 在将托管物理网络功能 (PNF) 设备与 SRX 设备搭配使用的环境中,PNF 服务链不会将配置推送到 SRX 设备。因此,PNF 服务链不起作用。

    解决办法:在使用托管 PNF 设备的环境中没有已知的解决方法。在使用非托管 PNF 设备的环境中不会遇到此问题。

  • CEM-30023 在使用 BGP 的远程计算环境中,不会为控制节点以及 BGP 主对等方和辅助对等方填充路由。

  • CEM-30002 Contrail 收集器意外出现故障。

    解决办法:没有已知的解决办法。发生故障后,Contrail 收集器服务将重新启动并自动恢复联机。此问题不会影响流量转发性能。

  • CEM-29723 在使用 Ansible 部署的环境中,Contrail 收集器会意外出现故障。

    解决办法:没有已知的解决办法。发生故障后,Contrail 收集器服务将重新启动并自动恢复联机。此问题不会影响流量转发性能。

  • CEM-28889 由于 BGPaaS 会话翻动,BGP 即服务 (BGPaaS) 无法跨同一虚拟机中的多个 Pod 运行。

    解决办法:始终将 BGPaaS 配置为在单个虚拟机中使用单个 Pod 进行部署。

  • CEM-29152 配置路由策略时,逻辑路由器互连的配置推送失败。

  • CEM-28914 Contrail vRouter 将数据包从虚拟机 (VM) 丢弃到扩展至瞻博网络 MX 系列路由器的外部网络上的裸机服务器 (BMS)。

    解决办法:禁用反向路径转发 (RPF)。

  • CEM-27502 要在英特尔 XXV710 NIC 上启用 QOS,您必须首先在计算节点上执行以下过程:

    1. 重新启动计算节点。

    2. 输入 systemctl start lldpad 命令。

    3. 输入 systemctl status lldpaddcbtool sc ens1f0 dcb on 命令。

      您应该知道能够在 NIC 上启用 QoS。

      如果在执行步骤 3 后无法在 NIC 上启用 QoS,请继续执行步骤 4。

    4. 输入 dcbtool sc dcbx v:force-cee 命令。

  • CEM-25388 更新与 VN 关联的 DNS 服务器属性不起作用。要更新、添加或移除 VN 中的 DNS 服务器详细信息,用户可以使用所需的 DNS 服务器详细信息删除并重新创建 VN。

  • CEM-20477 在 EVPN 服务链的情况下,带有透明防火墙的服务链不会在左右 VN 之间建立连接。

  • CEM-21835 如果裸机服务器 (BMS) 路由(VXLAN 路由)在 AAP CIDR 中,则不得使用允许的小于 /32 的地址对 (AAP)。

  • CEM-7262 不得将双向转发检测 (BFD) 协议附加到 BGPaaS 对象。您可以将 BFD 连接到 VMI。

  • CEM-21570 AS_PATH保留不适用于启用了 4 字节自治系统编号 (ASN) 的群集。

  • CEM-20421 在 Contrail 网络中,启用了瞻博网络标头时,逻辑路由器 (LR) 不支持动态下一跃点端口镜像。端口镜像不支持瞻博网络标头,因为在这种情况下,VXLAN 不是用于动态下一跃点的隧道类型。

  • CEM-20419 当在 VN 中启用 MAC/IP 并与 BFD 运行状况检查(目标 ip 设置为“全部”)相关联时,代理重新启动后,BFD 会话需要更长的时间才能恢复。

  • LR 上的 CEM-5043 VNI 更新不会更新路由表。解决方法是删除 LogicalRouter 并使用新 VNI 创建新的 LogicalRouter。

  • CEM-3245 vRouter 会复制源自 6 类无法正常工作的 QFX 设备的组播流量。

  • CEM-22632 使用 MX 系列路由器充当数据中心网关,并且如果在控制器和 MX 之间使用 MPLSoUDP,则浮动 IP 用例不起作用。请改用 MPLSoGRE 或 VXLAN。

Contrail 交换矩阵管理

  • CEM-29418 无中断软件升级尝试失败,并显示“MODULE FAILURE\nSee stdout/stderr for the exact error”(模块故障\n参见 stdout/stderr 了解确切错误)。

    解决办法:可以通过登录设备控制台来手动升级 QFX 系列交换机。您可以通过将作为升级目标的 QFX 系列交换机置于维护模式来实现无中断升级。

  • CEM-29154 由于 IP 地址未分配给 FXP 接口,全自动部署 (ZTP) 流程无法将 MX 系列路由器上线。

  • CEM-28971 尝试使用全自动部署 (ZTP) 将交换矩阵上线未完成。控制和收集器进程处于 初始化状态,并且 RabbitMQ 过程在一个控制节点上不断重新启动。

  • CEM-28941 配置不会被推送到交换矩阵设备。

    解决办法:重新启动 RabbitMQ 和 DM 容器。

  • CEM-23931 安装 swift-client 时,使用 Ansible 部署器配置 Contrail Fabric Manager 间歇性失败。如果出现这种情况,请在控制器上预安装 swift-client,然后重新运行预配。

  • CEM-20829 在使用 ML2 插件进行 Contrail 交换矩阵管理时,用于 sFlow 的telemetry_in_band_interface必须是物理接口。不支持 VLAN 接口。

  • CEM-18381 QFX5120不能用作 CRB 角色的 SP 样式中的边界叶角色。

  • CEM-15809 不支持更新企业样式交换矩阵中 VPG 上的 VLAN-ID。解决方法是删除并重新创建交换矩阵。

  • CEM-14679 在交换矩阵非托管 PNF 用例中,在 CRB 网关的情况下,DM 会在主干上的 LR VRF 下推送一些虚假的静态路由。

    解决方法是更改 device_manager docker 中 dummy_ip 变量的值。以下行号基于 2008 年版本代码库。

    https://github.com/Juniper/contrail-controller/blob/R2008/src/config/fabric-ansible/ansible-playbooks/filter_plugins/fabric.py#L2594

    将值更改为所需子网并保存文件后,重新启动 DM docker 以反映更改。请注意,此步骤应在交换矩阵上线之前开始执行。

  • CEM-14264 在版本 2003 中,“虚拟端口组创建”工作流不会使用使用给定虚拟网络的第一个 VPG 定义的现有值预填充 VLAN-ID。与以前的版本不同,该字段是可编辑的。如果交换矩阵在配置时启用了 交换矩阵范围的 VLAN-ID 重要性 复选框,则会出现此问题。

  • CEM-13767 虽然 Contrail 交换矩阵管理器能够让用户为交换矩阵设备使用自定义映像名称,但对于在基于 vmhost 的平台上运行的 QFX10000-60C 等平台,在将映像上传到 CFM 时,应以 junos-vmhost-install-x.tgz 格式选择映像名称。

  • CEM-8701 在 SP 样式交换矩阵上并行载入多个 BMS 不起作用。在使用生命周期管理工作流启动 BMS 时,有时在速度更快的服务器上,重新映像不会通过,实例也不会从具有讽刺意味的 vn 移动到租户 vn。这是因为,如果在 BMS 端口和 Contrail 节点中运行的 TFTP 服务之间的路由融合之前发送来自 BMS 的 PXE 引导请求。解决方法是,可以重新启动服务器,或者将服务器中的 BIOS 配置为具有延迟启动。

  • 不支持 CEM-8149 不支持结构设置为 enterprise_style=True 的 BMS LCM。默认情况下,enterprise_style设置为 False。如果结构对象载入 BMS LCM 实例,请避免使用 enterprise_style=True。

  • CEM-4358 在 Contrail 交换矩阵部署中,无法将QFX5110配置为主干 (CRB-Gateway)。

  • 不支持跨 TOR 的 CEM-3959 BMS 移动。要在 TOR 之间移动 BMS,需要移动整个 VPG。这意味着,如果有多个 BMS 关联到一个 VPG,并且需要移动其中一个 BMS,则需要根据新的关联删除并重新配置整个 VPG。

  • CEM-20794 在使用 ML2 插件进行 Contrail 交换矩阵管理时,无法在与 SRIOV VF 关联的虚拟机中配置 LAG。

  • CEM-20693 “交换矩阵>端口”下的 BGP 路由小组件> Leaf network device 仅考虑来自 inet.0 表的路由。

  • CEM-20272 在 L2 DCI 模式下,如果所选交换矩阵具有相同的叠加 ASN 编号,则在 L2 DCI 模式下,将在交换矩阵设备之间使用叠加 iBGP。在这种情况下,标记为 DCI 网关 RB 角色(路由和桥接)的边界设备(物理路由器)也必须分配 RR(路由反射器)RB 角色。如果没有 RR RB 角色,叠加 IBGP 会话不会跨交换矩阵的叶设备扩展第 2 层租户虚拟网络。因此,我们建议对于 L2 DCI 模式,确保将物理路由器设备标记为 DCI 网关 RB 角色和 RR 角色。

  • CEM-19802 安全组不能在 QFX10K 接口上使用。

Kubernetes

  • CEM-29109 在使用 Tungsten Fabric 运算符 (tf-operator) 的 Kubernetes 环境中,Contrail 查询引擎在部署时会意外宕机。

    解决办法:没有已知的解决办法。查询引擎会自动重新启动。

  • CEM-29067 在使用 tf-operator 部署的 Kubernetes 环境中,Contrail 收集器进程在升级期间会失败。发生故障后,Contrail 收集器服务会重新启动并自动重新联机。

  • JCB-187287 不支持 Kubernetes Master 的高可用性预配。

常规

  • CEM-30015 在从 Contrail 网络 1912.L4 版快进升级到 21.4.L2 期间,内核计算节点上可能会观察到 RHOSP-upgrade-Kernel 崩溃。

  • CEM-29197 删除虚拟机接口 (VMI) 后,无法删除虚拟端口组 (VPG)。解决办法:删除 VMI,而不是从 VPG 中删除 VMI 引用。

  • CEM-29163 在远程计算环境中,Contrail 代理有时会在云外负载创建过程中出现故障。代理会自动恢复并重新启动。

  • CEM-28044 Contrail 网络升级过程可能会以错误的顺序备份 Config DB 节点。

    解决办法:改用更新的实用程序备份数据。或者,手动检查备份文件,创建 contrail_config_database_node 个 UUID 的有序列表(按正确的顺序)。在还原期间将这些传递给 commandutil。

    创建Config DB节点有序列表的步骤如下:

    1. https://webdownload.juniper.net/swdl/dl/secure/site/1/record/165079.html 下载 commandutil 二进制文件。

    2. 将 commandutil 复制到 /tmp 文件夹。

      • chmod u+x /tmp/commandutil

      • docker cp /tmp/commandutil contrail_command:/usr/bin/commandutil_21.4.L2

      • docker exec contrail_command commandutil_21.4.L2 convert --intype rdbms --outtype yaml --out /etc/contrail/db.yml -c /etc/contrail/command-app-server.yml; mkdir -p ~/backups; mv /etc/contrail/db.yml ~/backups/

  • CEM-27916 在使用 Juju Charms 部署并使用 Contrail 网络和 LXD 的环境中,使用 LXD 的节点在重新启动 Contrail 控制器后不会重新启动。重新启动会触发 Contrail 网络无法解决的 IP 表问题。此 IP 表问题在 Charmhub 话语页面上的无法从 lxd 容器访问主机网关一文中进行了描述。

    解决办法:输入 sudo iptables -P FORWARD ACCEPT 命令,在使用 LXD 的节点上启用正向接受。

  • CEM-25524 在使用一个控制器和一个计算进行 K8s 部署的实验室场景中,虽然启用了命名空间间流量,但很少观察到 Contrail 控制器核心,并且系统在核心之后自行恢复。此方案未在 HA 环境中发生,这是建议的生产部署。

  • CEM-25331 在扩展环境中,重新启动控制器节点可能会使架构转换器服务重新启动几次。

  • CEM-25109 在 UI 的 VPG 页面中,不会为内部 SRIOV VPG 反映 VLAN 信息。这只是一种间歇性行为。

  • JCB-184776 当 vRouter 收到 ICMPv6 数据包的磁头分段时,磁头分段会立即加入汇编程序的队列。该流被创建为保留流,然后被困在代理中。如果与此磁头片段对应的片段已存在于汇编程序中,或者如果新片段紧随磁头片段之后到达,则汇编器会将它们释放到流模块中。如果在汇编程序将分段释放到流模块时代理未写入流作,则分段将进入保留队列。一次最多有三个片段在保留队列中排队。剩余的片段将从汇编程序中删除到流模块。

    解决方法是,只有在代理写入流作后,头片段才会排队到汇编程序。如果流已处于非保留状态,则会立即将其排队到汇编程序。

  • CEM-4370 不能将其他链接追加到用于创建 PNF 服务链的服务模板。如果需要添加其他链接,则需要删除服务模板并重新添加。

  • CEM-18398 Contrail WebUI 不适用于系统/节点状态监控。解决方法,请检查在相关节点上使用 CLI 进行检查。这不会影响功能。

  • CEM-20414 在容器重启期间Contrail 命令每个contrail_cluster对象触发一个部署作业,并导致重启问题。解决方法是通过 commandcli 修改 contrail-cluster 或 openstack-cluster 对象,而不是直接通过 UI 修改/创建端点。

  • CEM-17648 在 BMS 到 BMS EVPN“透明”服务链的情况下,从透明服务实例发送到 QFX 的隧道数据包具有 vlan-id,因此从左 bms 到右 bms 的流量会被丢弃,因为隧道数据包的内部标头具有 vRouter 内部的 vlan-id 信息,而 QFX 不知道 vlan-id,因此数据包会被交换机丢弃。

  • CEM-17562 在“安全组”下,可以忽略与 __no_rule__ 一起显示的条目。

  • CEM-16855 IPv6 ipam 子网选项“enable_dhcp”始终被忽略。

遥测和分析

  • CEM-30038 对于某些 QFX 设备,Contrail Web 应用不显示 BFD 邻居信息和 Appformix。

    解决办法:从 Appformix 监控命令列表中除去 show system core-dumps 命令。

  • CEM-21526 将 Contrail 网络从 R2011 之前的版本升级到 Contrail 网络 R2011.138 版本时,在分析节点上运行的 Kafka 容器可能会报告连接问题。

    解决办法:执行以下步骤:

    1. 在所有分析节点上停止 Kafka。

      docker stop analytics_alarm_kafka_1

    2. 在单个 Contrail 控制器上,执行 Zookeeper 清理。

      docker exec -it config_database_zookeeper_1 bash

      bin/zkCli.sh -server <IP>:2181

      deleteall /brokers

      deleteall /consumers

    3. 在所有分析节点上启动 Kafka。

      docker start analytics_alarm_kafka_1

  • CEM-20846 在极少数情况下,初始化 kafka 容器时 sFlow 节点配置会失败。如果在预配期间发生这种情况,则重新部署将显示 sFlow 节点。

  • 不支持 Junos EVO 设备的 CEM-20781 遥测 KPI 显示。

  • CEM-18999 在拥有大约 128 个机架和 4000 个 VN、256k VMI 的大规模数据中心中,如果重新启动 Contrail 见解 OpeSstack 适配器,可能需要大约 4 小时才能与 API 服务器重新同步。

  • CEM-13380 对于交换矩阵上的多宿主设备,AppFormix 流不显示

Contrail 网络版本 21.4.L1 中的已知行为

OpenStack

  • CEM-30003 在 Openstack 中重命名包含资源的项目时,该项目的新名称不会在 Contrail 网络 21.4.L1 版中更新。因此,Openstack 中的项目名称与 Contrail 网络 21.4.L1 版不同。但是,如果项目没有任何资源,则在相应项目中创建任何资源时,项目名称和资源名称在 Contrail 网络 21.4.L1 版中与 Openstack 中的相同。

  • CEM-29229 IPU 从 Contrail 网络 21.4 版升级到 Contrail 网络 R21.4.L1 版可能会失败,并显示 rabbitmq 容器删除状态。

    解决办法:完成以下过程:

    1. 在所有 OpenStack 节点上输入 pcs resource cleanup 命令,并确保所有资源都已启动。

    2. 通过运行 pcs resource op defaults update timeout=600s 命令将超时增加到 600 秒。

    3. 输入包含所有参数的命令 openstack overcloud update converge

    4. 更新融合完成后,可能需要清理一些融合失败。

      重新输入 openstack overcloud update converge 包含所有参数的命令以清理这些收敛故障。

  • CEM-29059 不支持从 Contrail 网络版本 1912 快进升级 (FFU) 到 Contrail 网络版本 21.4.L1。升级控制器时,升级尝试失败。

  • CEM-26599 在使用远程计算的部署中,在远程站点上创建虚拟机 (VM) 可能需要较长时间。VM 创建时间可能需要 6 分钟以上。

  • CEM-27083 在部署过程中,Contrail 收集器服务有时会出现核心错误。遇到此问题时,Contrail 收集器服务会自动重新启动,并且不会对任何功能造成影响。

  • CEM-20280 在 Kubernetes 和 OpenStack 联合设置中,vrouter-agent 重启有时会导致未经授权的作错误。要解决此问题,请再次重新启动 vrouter-agent。

  • CEM-17991 在使用Kolla和OpenStack Rocky调配的OpenStack HA设置中,如果同时关闭所有服务器并稍后启动它们,Galera集群将失败。要恢复Galera集群,请按照下列步骤作:

    1. 编辑 /etc/kolla/mariadb/galera.cnf 文件以删除 wsrep 其中一个控制器上的地址,如下所示。

      注意:

      如果托管方案中的所有控制器同时关闭,则必须选择最后关闭的控制器。

    2. Docker 在编辑文件的控制器上启动 mariadb。

    3. 等待几分钟,确保 mariadb 容器没有重新启动,然后 Docker 在剩余的控制器上启动 mariadb。

    4. 还原 /etc/kolla/mariadb/galera.cnf 文件更改,并在先前选择的控制器上重新启动 mariadb 容器。

  • CEM-15764 在 Octavia Load Balancer 中,发往负载均衡器 VM 浮动 IP 的流量不会定向到后端 VM。

  • CEM-9979 在 RHOSP 环境中升级使用 OOO 热模板部署的 DPDK 计算期间,观察到 vRouter 核心转储。这是由于服务在升级期间启动的顺序所致,不会影响群集作。

DPDK 和 SR-IOV

  • CEM-22835 在启用了 DPDK 的同一计算节点中运行的虚拟机 (VM) 之间进行高吞吐量数据传输期间,会观察到间歇性性能下降以及校验和错误。功能不受影响。

  • CEM-21547 SR-IOV 配置自动化不适用于多宿主服务器。

  • CEM-18922 在 DPDK 计算上,VM 的内存仅映射到一个 numa。如果 VM 是以 hw:mem_page_size='any' flavor 启动的,则在该 numa 中的巨大页面耗尽后,VM 创建将失败。解决方法,请改用该 hw:mem_page_size='large' 特定情调来避免此问题。

  • CEM-18408 与 X710 网卡DPDK1911,如果配置了 txd 和 rxd,则由于 mbuf 泄漏,性能会下降。英特尔建议在 Fortville NIC 上配置至少 1K tx 和 rx 描述符以获得更好和一致的性能,但它们似乎对 X710 NIC 有降级影响。

  • CEM-18163 在 DPDK 计算上,如果 contrail-vrouter-agent 崩溃,或者在具有许多子接口的扩展设置中重新启动 contrail-vrouter-agent,则所有子接口及其父接口都可能变为非活动状态。解决方法是停止/启动接口已关闭的实例。

  • CEM-17883 VLAN 标记不适用于带有 DPDK 19.11 的 Mellanox CX5 卡。

  • CEM-15561 使用 Mellanox NIC 卡卸载的 vRouter 不起作用。但是,支持不卸载的 Mellanox NIC 上的 DPDK。

  • CEM-13685 DPDK vRouter with MLNX CX5 大约需要 10 分钟,并且还可以看到 lcore 崩溃。这在初始安装期间发生一次。

  • JCB-177787 在 SNAT 和 LBaaS 等需要网络的 DPDK vRouter 用例中,无法设置巨型 MTU。允许的最大 MTU:<=1500。

SmartNIC

  • CEM-28861 在使用英特尔 3000 smartNIC 的计算节点上,部署有时会由于与启动 NIC 相关的问题而失败。日志显示一系列 mbuf 错误。

    解决办法:在故障节点上重新启动 contrail-vrouter-dpdk 容器,然后重新运行部署。您还可以删除有问题的计算节点并重新部署群集。

  • Fortville X710 NIC 中的 CEM-11163:使用 TX 和 RX 缓冲器时,当 mbufs 耗尽时,性能会下降。

常规路由

  • CEM-28889 由于 BGPaaS 会话翻动,BGP 即服务 (BGPaaS) 无法跨同一虚拟机中的多个 Pod 运行。

    解决办法:始终将 BGPaaS 配置为在单个虚拟机中使用单个 Pod 进行部署。

  • CEM-29152 配置路由策略时,逻辑路由器互连的配置推送失败。

  • CEM-28914 在拓扑中启用反向路径转发 (RPF) 时,如果计算节点上的虚拟机 (VM) 通过扩展至 MX 系列路由器的外部网络向裸机服务器 (BMS) 发送数据包,则 Contrail vRouter 中会丢弃回复数据包。错误消息指示 RPF 查找失败。

    解决办法:禁用 RPF。

  • CEM-27502 要在英特尔 XXV710 NIC 上启用 QOS,您必须首先在计算节点上执行以下过程:

    1. 重新启动计算节点。

    2. 输入 systemctl start lldpad 命令。

    3. 输入 systemctl status lldpaddcbtool sc ens1f0 dcb on 命令。

      您应该知道能够在 NIC 上启用 QoS。

      如果在执行步骤 3 后无法在 NIC 上启用 QoS,请继续执行步骤 4。

    4. 输入 dcbtool sc dcbx v:force-cee 命令。

  • CEM-25388 更新与 VN 关联的 DNS 服务器属性不起作用。要更新、添加或移除 VN 中的 DNS 服务器详细信息,用户可以使用所需的 DNS 服务器详细信息删除并重新创建 VN。

  • CEM-20477 在 EVPN 服务链的情况下,带有透明防火墙的服务链不会在左右 VN 之间建立连接。

  • CEM-21835 如果裸机服务器 (BMS) 路由(VXLAN 路由)在 AAP CIDR 中,则不得使用允许的小于 /32 的地址对 (AAP)。

  • CEM-7262 不得将双向转发检测 (BFD) 协议附加到 BGPaaS 对象。您可以将 BFD 连接到 VMI。

  • CEM-21570 AS_PATH保留不适用于启用了 4 字节自治系统编号 (ASN) 的群集。

  • CEM-20421 在 Contrail 网络中,启用了瞻博网络标头时,逻辑路由器 (LR) 不支持动态下一跃点端口镜像。端口镜像不支持瞻博网络标头,因为在这种情况下,VXLAN 不是用于动态下一跃点的隧道类型。

  • CEM-20419 当在 VN 中启用 MAC/IP 并与 BFD 运行状况检查(目标 ip 设置为“全部”)相关联时,代理重新启动后,BFD 会话需要更长的时间才能恢复。

  • LR 上的 CEM-5043 VNI 更新不会更新路由表。解决方法是删除 LogicalRouter 并使用新 VNI 创建新的 LogicalRouter。

  • CEM-3245 vRouter 会复制源自 6 类无法正常工作的 QFX 设备的组播流量。

  • CEM-22632 使用 MX 系列路由器充当数据中心网关,并且如果在控制器和 MX 之间使用 MPLSoUDP,则浮动 IP 用例不起作用。请改用 MPLSoGRE 或 VXLAN。

Contrail 交换矩阵管理

  • CEM-29418 无中断软件升级尝试失败,并显示“MODULE FAILURE\nSee stdout/stderr for the exact error”(模块故障\n参见 stdout/stderr 了解确切错误)。

    解决办法:可以通过登录设备控制台来手动升级 QFX 系列交换机。您可以通过将作为升级目标的 QFX 系列交换机置于维护模式来实现无中断升级。

  • CEM-29154 由于 IP 地址未分配给 FXP 接口,全自动部署 (ZTP) 流程无法将 MX 系列路由器上线。

  • CEM-28971 尝试使用全自动部署 (ZTP) 将交换矩阵上线未完成。控制和收集器进程处于 初始化状态,并且 RabbitMQ 过程在一个控制节点上不断重新启动。

  • CEM-28941 配置不会被推送到交换矩阵设备。

    解决办法:重新启动 RabbitMQ 和 DM 容器。

  • CEM-23931 安装 swift-client 时,使用 Ansible 部署器配置 Contrail Fabric Manager 间歇性失败。如果出现这种情况,请在控制器上预安装 swift-client,然后重新运行预配。

  • CEM-20829 在使用 ML2 插件进行 Contrail 交换矩阵管理时,用于 sFlow 的telemetry_in_band_interface必须是物理接口。不支持 VLAN 接口。

  • CEM-18381 QFX5120不能用作 CRB 角色的 SP 样式中的边界叶角色。

  • CEM-15809 不支持更新企业样式交换矩阵中 VPG 上的 VLAN-ID。解决方法是删除并重新创建交换矩阵。

  • CEM-14679 在交换矩阵非托管 PNF 用例中,在 CRB 网关的情况下,DM 会在主干上的 LR VRF 下推送一些虚假的静态路由。

    解决方法是更改 device_manager docker 中 dummy_ip 变量的值。以下行号基于 2008 年版本代码库。

    https://github.com/Juniper/contrail-controller/blob/R2008/src/config/fabric-ansible/ansible-playbooks/filter_plugins/fabric.py#L2594

    将值更改为所需子网并保存文件后,重新启动 DM docker 以反映更改。请注意,此步骤应在交换矩阵上线之前开始执行。

  • CEM-14264 在版本 2003 中,“虚拟端口组创建”工作流不会使用使用给定虚拟网络的第一个 VPG 定义的现有值预填充 VLAN-ID。与以前的版本不同,该字段是可编辑的。如果交换矩阵在配置时启用了 交换矩阵范围的 VLAN-ID 重要性 复选框,则会出现此问题。

  • CEM-13767 虽然 Contrail 交换矩阵管理器能够让用户为交换矩阵设备使用自定义映像名称,但对于在基于 vmhost 的平台上运行的 QFX10000-60C 等平台,在将映像上传到 CFM 时,应以 junos-vmhost-install-x.tgz 格式选择映像名称。

  • CEM-8701 在 SP 样式交换矩阵上并行载入多个 BMS 不起作用。在使用生命周期管理工作流启动 BMS 时,有时在速度更快的服务器上,重新映像不会通过,实例也不会从具有讽刺意味的 vn 移动到租户 vn。这是因为,如果在 BMS 端口和 Contrail 节点中运行的 TFTP 服务之间的路由融合之前发送来自 BMS 的 PXE 引导请求。解决方法是,可以重新启动服务器,或者将服务器中的 BIOS 配置为具有延迟启动。

  • 不支持 CEM-8149 不支持结构设置为 enterprise_style=True 的 BMS LCM。默认情况下,enterprise_style设置为 False。如果结构对象载入 BMS LCM 实例,请避免使用 enterprise_style=True。

  • CEM-4358 在 Contrail 交换矩阵部署中,无法将QFX5110配置为主干 (CRB-Gateway)。

  • 不支持跨 TOR 的 CEM-3959 BMS 移动。要在 TOR 之间移动 BMS,需要移动整个 VPG。这意味着,如果有多个 BMS 关联到一个 VPG,并且需要移动其中一个 BMS,则需要根据新的关联删除并重新配置整个 VPG。

  • CEM-20794 在使用 ML2 插件进行 Contrail 交换矩阵管理时,无法在与 SRIOV VF 关联的虚拟机中配置 LAG。

  • CEM-20693 “交换矩阵>端口”下的 BGP 路由小组件> Leaf network device 仅考虑来自 inet.0 表的路由。

  • CEM-20272 在 L2 DCI 模式下,如果所选交换矩阵具有相同的叠加 ASN 编号,则在 L2 DCI 模式下,将在交换矩阵设备之间使用叠加 iBGP。在这种情况下,标记为 DCI 网关 RB 角色(路由和桥接)的边界设备(物理路由器)也必须分配 RR(路由反射器)RB 角色。如果没有 RR RB 角色,叠加 IBGP 会话不会跨交换矩阵的叶设备扩展第 2 层租户虚拟网络。因此,我们建议对于 L2 DCI 模式,确保将物理路由器设备标记为 DCI 网关 RB 角色和 RR 角色。

  • CEM-19802 安全组不能在 QFX10K 接口上使用。

Kubernetes

  • CEM-29067 在使用 tf-operator 部署的 Kubernetes 环境中,Contrail 收集器进程在升级期间会失败。发生故障后,Contrail 收集器服务会重新启动并自动重新联机。

  • JCB-187287 不支持 Kubernetes Master 的高可用性预配。

常规

  • CEM-29197 删除虚拟机接口 (VMI) 后,无法删除虚拟端口组 (VPG)。解决办法:删除 VMI,而不是从 VPG 中删除 VMI 引用。

  • CEM-29163 在远程计算环境中,Contrail 代理有时会在云外负载创建过程中出现故障。代理会自动恢复并重新启动。

  • CEM-28044 Contrail 网络升级过程可能会以错误的顺序备份 Config DB 节点。

    解决办法:改用更新的实用程序备份数据。或者,手动检查备份文件,创建 contrail_config_database_node 个 UUID 的有序列表(按正确的顺序)。在还原期间将这些传递给 commandutil。

    创建Config DB节点有序列表的步骤如下:

    1. https://webdownload.juniper.net/swdl/dl/secure/site/1/record/165079.html 下载 commandutil 二进制文件。

    2. 将 commandutil 复制到 /tmp 文件夹。

      • chmod u+x /tmp/commandutil

      • docker cp /tmp/commandutil contrail_command:/usr/bin/commandutil_21.4.L2

      • docker exec contrail_command commandutil_21.4.L2 convert --intype rdbms --outtype yaml --out /etc/contrail/db.yml -c /etc/contrail/command-app-server.yml; mkdir -p ~/backups; mv /etc/contrail/db.yml ~/backups/

  • CEM-27916 在使用 Juju Charms 部署并使用 Contrail 网络和 LXD 的环境中,使用 LXD 的节点在重新启动 Contrail 控制器后不会重新启动。重新启动会触发 Contrail 网络无法解决的 IP 表问题。此 IP 表问题在 Charmhub 话语页面上的无法从 lxd 容器访问主机网关一文中进行了描述。

    解决办法:输入 sudo iptables -P FORWARD ACCEPT 命令,在使用 LXD 的节点上启用正向接受。

  • CEM-25524 在使用一个控制器和一个计算进行 K8s 部署的实验室场景中,虽然启用了命名空间间流量,但很少观察到 Contrail 控制器核心,并且系统在核心之后自行恢复。此方案未在 HA 环境中发生,这是建议的生产部署。

  • CEM-25331 在扩展环境中,重新启动控制器节点可能会使架构转换器服务重新启动几次。

  • CEM-25109 在 UI 的 VPG 页面中,不会为内部 SRIOV VPG 反映 VLAN 信息。这只是一种间歇性行为。

  • JCB-184776 当 vRouter 收到 ICMPv6 数据包的磁头分段时,磁头分段会立即加入汇编程序的队列。该流被创建为保留流,然后被困在代理中。如果与此磁头片段对应的片段已存在于汇编程序中,或者如果新片段紧随磁头片段之后到达,则汇编器会将它们释放到流模块中。如果在汇编程序将分段释放到流模块时代理未写入流作,则分段将进入保留队列。一次最多有三个片段在保留队列中排队。剩余的片段将从汇编程序中删除到流模块。

    解决方法是,只有在代理写入流作后,头片段才会排队到汇编程序。如果流已处于非保留状态,则会立即将其排队到汇编程序。

  • CEM-4370 不能将其他链接追加到用于创建 PNF 服务链的服务模板。如果需要添加其他链接,则需要删除服务模板并重新添加。

  • CEM-18398 Contrail WebUI 不适用于系统/节点状态监控。解决方法,请检查在相关节点上使用 CLI 进行检查。这不会影响功能。

  • CEM-20414 在容器重启期间Contrail 命令每个contrail_cluster对象触发一个部署作业,并导致重启问题。解决方法是通过 commandcli 修改 contrail-cluster 或 openstack-cluster 对象,而不是直接通过 UI 修改/创建端点。

  • CEM-17648 在 BMS 到 BMS EVPN“透明”服务链的情况下,从透明服务实例发送到 QFX 的隧道数据包具有 vlan-id,因此从左 bms 到右 bms 的流量会被丢弃,因为隧道数据包的内部标头具有 vRouter 内部的 vlan-id 信息,而 QFX 不知道 vlan-id,因此数据包会被交换机丢弃。

  • CEM-17562 在“安全组”下,可以忽略与 __no_rule__ 一起显示的条目。

  • CEM-16855 IPv6 ipam 子网选项“enable_dhcp”始终被忽略。

遥测和分析

  • CEM-21526 将 Contrail 网络从 R2011 之前的版本升级到 Contrail 网络 R2011.138 版本时,在分析节点上运行的 Kafka 容器可能会报告连接问题。

    解决办法:执行以下步骤:

    1. 在所有分析节点上停止 Kafka。

      docker stop analytics_alarm_kafka_1

    2. 在单个 Contrail 控制器上,执行 Zookeeper 清理。

      docker exec -it config_database_zookeeper_1 bash

      bin/zkCli.sh -server <IP>:2181

      deleteall /brokers

      deleteall /consumers

    3. 在所有分析节点上启动 Kafka。

      docker start analytics_alarm_kafka_1

  • CEM-20846 在极少数情况下,初始化 kafka 容器时 sFlow 节点配置会失败。如果在预配期间发生这种情况,则重新部署将显示 sFlow 节点。

  • 不支持 Junos EVO 设备的 CEM-20781 遥测 KPI 显示。

  • CEM-18999 在拥有大约 128 个机架和 4000 个 VN、256k VMI 的大规模数据中心中,如果重新启动 Contrail 见解 OpeSstack 适配器,可能需要大约 4 小时才能与 API 服务器重新同步。

  • CEM-13380 对于交换矩阵上的多宿主设备,AppFormix 流不显示

Contrail 网络 21.4 版中的已知行为

OpenStack

  • CEM-30003 在 Openstack 中重命名包含资源的项目时,该项目的新名称不会在 Contrail 网络 21.4 版中更新。因此,Openstack 中的项目名称与 Contrail 网络 21.4 版不同。但是,如果项目没有任何资源,则在相应项目中创建任何资源时,Contrail 网络 21.4 版中的项目名称和资源名称与 Openstack 中的项目名称和资源名称相同。

  • CEM-26599 在使用远程计算的部署中,在远程站点上创建虚拟机 (VM) 可能需要较长时间。VM 创建时间可能需要 6 分钟以上。

  • CEM-27083 在部署过程中,Contrail 收集器服务有时会出现核心错误。遇到此问题时,Contrail 收集器服务会自动重新启动,并且不会对任何功能造成影响。

  • CEM-20280 在 Kubernetes 和 OpenStack 联合设置中,vrouter-agent 重启有时会导致未经授权的作错误。要解决此问题,请再次重新启动 vrouter-agent。

  • CEM-17991 在使用Kolla和OpenStack Rocky调配的OpenStack HA设置中,如果同时关闭所有服务器并稍后启动它们,Galera集群将失败。要恢复Galera集群,请按照下列步骤作:

    1. 编辑 /etc/kolla/mariadb/galera.cnf 文件以删除 wsrep 其中一个控制器上的地址,如下所示。

      注意:

      如果托管方案中的所有控制器同时关闭,则必须选择最后关闭的控制器。

    2. Docker 在编辑文件的控制器上启动 mariadb。

    3. 等待几分钟,确保 mariadb 容器没有重新启动,然后 Docker 在剩余的控制器上启动 mariadb。

    4. 还原 /etc/kolla/mariadb/galera.cnf 文件更改,并在先前选择的控制器上重新启动 mariadb 容器。

  • CEM-15764 在 Octavia Load Balancer 中,发往负载均衡器 VM 浮动 IP 的流量不会定向到后端 VM。

  • CEM-9979 在 RHOSP 环境中升级使用 OOO 热模板部署的 DPDK 计算期间,观察到 vRouter 核心转储。这是由于服务在升级期间启动的顺序所致,不会影响群集作。

DPDK 和 SR-IOV

  • CEM-22835 在启用了 DPDK 的同一计算节点中运行的虚拟机 (VM) 之间进行高吞吐量数据传输期间,会观察到间歇性性能下降以及校验和错误。功能不受影响。

  • CEM-21547 SR-IOV 配置自动化不适用于多宿主服务器。

  • CEM-18922 在 DPDK 计算上,VM 的内存仅映射到一个 numa。如果 VM 是以 hw:mem_page_size='any' flavor 启动的,则在该 numa 中的巨大页面耗尽后,VM 创建将失败。解决方法,请改用该 hw:mem_page_size='large' 特定情调来避免此问题。

  • CEM-18408 与 X710 网卡DPDK1911,如果配置了 txd 和 rxd,则由于 mbuf 泄漏,性能会下降。英特尔建议在 Fortville NIC 上配置至少 1K tx 和 rx 描述符以获得更好和一致的性能,但它们似乎对 X710 NIC 有降级影响。

  • CEM-18163 在 DPDK 计算上,如果 contrail-vrouter-agent 崩溃,或者在具有许多子接口的扩展设置中重新启动 contrail-vrouter-agent,则所有子接口及其父接口都可能变为非活动状态。解决方法是停止/启动接口已关闭的实例。

  • CEM-17883 VLAN 标记不适用于带有 DPDK 19.11 的 Mellanox CX5 卡。

  • CEM-15561 使用 Mellanox NIC 卡卸载的 vRouter 不起作用。但是,支持不卸载的 Mellanox NIC 上的 DPDK。

  • CEM-13685 DPDK vRouter with MLNX CX5 大约需要 10 分钟,并且还可以看到 lcore 崩溃。这在初始安装期间发生一次。

  • JCB-177787 在 SNAT 和 LBaaS 等需要网络的 DPDK vRouter 用例中,无法设置巨型 MTU。允许的最大 MTU:<=1500。

SmartNIC

  • Fortville X710 NIC 中的 CEM-11163:使用 TX 和 RX 缓冲器时,当 mbufs 耗尽时,性能会下降。

常规路由

  • CEM-27502 要在英特尔 XXV710 NIC 上启用 QOS,您必须首先在计算节点上执行以下过程:

    1. 重新启动计算节点。

    2. 输入 systemctl start lldpad 命令。

    3. 输入 systemctl status lldpaddcbtool sc ens1f0 dcb on 命令。

      您应该知道能够在 NIC 上启用 QoS。

      如果在执行步骤 3 后无法在 NIC 上启用 QoS,请继续执行步骤 4。

    4. 输入 dcbtool sc dcbx v:force-cee 命令。

  • CEM-25388 更新与 VN 关联的 DNS 服务器属性不起作用。要更新、添加或移除 VN 中的 DNS 服务器详细信息,用户可以使用所需的 DNS 服务器详细信息删除并重新创建 VN。

  • CEM-20477 在 EVPN 服务链的情况下,带有透明防火墙的服务链不会在左右 VN 之间建立连接。

  • CEM-21835 如果裸机服务器 (BMS) 路由(VXLAN 路由)在 AAP CIDR 中,则不得使用允许的小于 /32 的地址对 (AAP)。

  • CEM-7262 不得将双向转发检测 (BFD) 协议附加到 BGPaaS 对象。您可以将 BFD 连接到 VMI。

  • CEM-21570 AS_PATH保留不适用于启用了 4 字节自治系统编号 (ASN) 的群集。

  • CEM-20421 在 Contrail 网络中,启用了瞻博网络标头时,逻辑路由器 (LR) 不支持动态下一跃点端口镜像。端口镜像不支持瞻博网络标头,因为在这种情况下,VXLAN 不是用于动态下一跃点的隧道类型。

  • CEM-20419 当在 VN 中启用 MAC/IP 并与 BFD 运行状况检查(目标 ip 设置为“全部”)相关联时,代理重新启动后,BFD 会话需要更长的时间才能恢复。

  • LR 上的 CEM-5043 VNI 更新不会更新路由表。解决方法是删除 LogicalRouter 并使用新 VNI 创建新的 LogicalRouter。

  • CEM-3245 vRouter 会复制源自 6 类无法正常工作的 QFX 设备的组播流量。

  • CEM-22632 使用 MX 系列路由器充当数据中心网关,并且如果在控制器和 MX 之间使用 MPLSoUDP,则浮动 IP 用例不起作用。请改用 MPLSoGRE 或 VXLAN。

Contrail 交换矩阵管理

  • CEM-23931 安装 swift-client 时,使用 Ansible 部署器配置 Contrail Fabric Manager 间歇性失败。如果出现这种情况,请在控制器上预安装 swift-client,然后重新运行预配。

  • CEM-20829 在使用 ML2 插件进行 Contrail 交换矩阵管理时,用于 sFlow 的telemetry_in_band_interface必须是物理接口。不支持 VLAN 接口。

  • CEM-18381 QFX5120不能用作 CRB 角色的 SP 样式中的边界叶角色。

  • CEM-15809 不支持更新企业样式交换矩阵中 VPG 上的 VLAN-ID。解决方法是删除并重新创建交换矩阵。

  • CEM-14679 在交换矩阵非托管 PNF 用例中,在 CRB 网关的情况下,DM 会在主干上的 LR VRF 下推送一些虚假的静态路由。

    解决方法是更改 device_manager docker 中 dummy_ip 变量的值。以下行号基于 2008 年版本代码库。

    https://github.com/Juniper/contrail-controller/blob/R2008/src/config/fabric-ansible/ansible-playbooks/filter_plugins/fabric.py#L2594

    将值更改为所需子网并保存文件后,重新启动 DM docker 以反映更改。请注意,此步骤应在交换矩阵上线之前开始执行。

  • CEM-14264 在版本 2003 中,“虚拟端口组创建”工作流不会使用使用给定虚拟网络的第一个 VPG 定义的现有值预填充 VLAN-ID。与以前的版本不同,该字段是可编辑的。如果交换矩阵在配置时启用了 交换矩阵范围的 VLAN-ID 重要性 复选框,则会出现此问题。

  • CEM-13767 虽然 Contrail 交换矩阵管理器能够让用户为交换矩阵设备使用自定义映像名称,但对于在基于 vmhost 的平台上运行的 QFX10000-60C 等平台,在将映像上传到 CFM 时,应以 junos-vmhost-install-x.tgz 格式选择映像名称。

  • CEM-8701 在 SP 样式交换矩阵上并行载入多个 BMS 不起作用。在使用生命周期管理工作流启动 BMS 时,有时在速度更快的服务器上,重新映像不会通过,实例也不会从具有讽刺意味的 vn 移动到租户 vn。这是因为,如果在 BMS 端口和 Contrail 节点中运行的 TFTP 服务之间的路由融合之前发送来自 BMS 的 PXE 引导请求。解决方法是,可以重新启动服务器,或者将服务器中的 BIOS 配置为具有延迟启动。

  • 不支持 CEM-8149 不支持结构设置为 enterprise_style=True 的 BMS LCM。默认情况下,enterprise_style设置为 False。如果结构对象载入 BMS LCM 实例,请避免使用 enterprise_style=True。

  • CEM-4358 在 Contrail 交换矩阵部署中,无法将QFX5110配置为主干 (CRB-Gateway)。

  • 不支持跨 TOR 的 CEM-3959 BMS 移动。要在 TOR 之间移动 BMS,需要移动整个 VPG。这意味着,如果有多个 BMS 关联到一个 VPG,并且需要移动其中一个 BMS,则需要根据新的关联删除并重新配置整个 VPG。

  • CEM-20794 在使用 ML2 插件进行 Contrail 交换矩阵管理时,无法在与 SRIOV VF 关联的虚拟机中配置 LAG。

  • CEM-20693 “交换矩阵>端口”下的 BGP 路由小组件> Leaf network device 仅考虑来自 inet.0 表的路由。

  • CEM-20272 在 L2 DCI 模式下,如果所选交换矩阵具有相同的叠加 ASN 编号,则在 L2 DCI 模式下,将在交换矩阵设备之间使用叠加 iBGP。在这种情况下,标记为 DCI 网关 RB 角色(路由和桥接)的边界设备(物理路由器)也必须分配 RR(路由反射器)RB 角色。如果没有 RR RB 角色,叠加 IBGP 会话不会跨交换矩阵的叶设备扩展第 2 层租户虚拟网络。因此,我们建议对于 L2 DCI 模式,确保将物理路由器设备标记为 DCI 网关 RB 角色和 RR 角色。

  • CEM-19802 安全组不能在 QFX10K 接口上使用。

Kubernetes

  • JCB-187287 不支持 Kubernetes Master 的高可用性预配。

常规

  • CEM-27916 在使用 Juju Charms 部署并使用 Contrail 网络和 LXD 的环境中,使用 LXD 的节点在重新启动 Contrail 控制器后不会重新启动。重新启动会触发 Contrail 网络无法解决的 IP 表问题。此 IP 表问题在 Charmhub 话语页面上的无法从 lxd 容器访问主机网关一文中进行了描述。

    解决办法:输入 sudo iptables -P FORWARD ACCEPT 命令,在使用 LXD 的节点上启用正向接受。

  • CEM-25524 在使用一个控制器和一个计算进行 K8s 部署的实验室场景中,虽然启用了命名空间间流量,但很少观察到 Contrail 控制器核心,并且系统在核心之后自行恢复。此方案未在 HA 环境中发生,这是建议的生产部署。

  • CEM-25331 在扩展环境中,重新启动控制器节点可能会使架构转换器服务重新启动几次。

  • CEM-25109 在 UI 的 VPG 页面中,不会为内部 SRIOV VPG 反映 VLAN 信息。这只是一种间歇性行为。

  • JCB-184776 当 vRouter 收到 ICMPv6 数据包的磁头分段时,磁头分段会立即加入汇编程序的队列。该流被创建为保留流,然后被困在代理中。如果与此磁头片段对应的片段已存在于汇编程序中,或者如果新片段紧随磁头片段之后到达,则汇编器会将它们释放到流模块中。如果在汇编程序将分段释放到流模块时代理未写入流作,则分段将进入保留队列。一次最多有三个片段在保留队列中排队。剩余的片段将从汇编程序中删除到流模块。

    解决方法是,只有在代理写入流作后,头片段才会排队到汇编程序。如果流已处于非保留状态,则会立即将其排队到汇编程序。

  • CEM-4370 不能将其他链接追加到用于创建 PNF 服务链的服务模板。如果需要添加其他链接,则需要删除服务模板并重新添加。

  • CEM-18398 Contrail WebUI 不适用于系统/节点状态监控。解决方法,请检查在相关节点上使用 CLI 进行检查。这不会影响功能。

  • CEM-20414 在容器重启期间Contrail 命令每个contrail_cluster对象触发一个部署作业,并导致重启问题。解决方法是通过 commandcli 修改 contrail-cluster 或 openstack-cluster 对象,而不是直接通过 UI 修改/创建端点。

  • CEM-17648 在 BMS 到 BMS EVPN“透明”服务链的情况下,从透明服务实例发送到 QFX 的隧道数据包具有 vlan-id,因此从左 bms 到右 bms 的流量会被丢弃,因为隧道数据包的内部标头具有 vRouter 内部的 vlan-id 信息,而 QFX 不知道 vlan-id,因此数据包会被交换机丢弃。

  • CEM-17562 在“安全组”下,可以忽略与 __no_rule__ 一起显示的条目。

  • CEM-16855 IPv6 ipam 子网选项“enable_dhcp”始终被忽略。

遥测和分析

  • CEM-21526 将 Contrail 网络从 R2011 之前的版本升级到 Contrail 网络 R2011.138 版本时,在分析节点上运行的 Kafka 容器可能会报告连接问题。

    解决办法:执行以下步骤:

    1. 在所有分析节点上停止 Kafka。

      docker stop analytics_alarm_kafka_1

    2. 在单个 Contrail 控制器上,执行 Zookeeper 清理。

      docker exec -it config_database_zookeeper_1 bash

      bin/zkCli.sh -server <IP>:2181

      deleteall /brokers

      deleteall /consumers

    3. 在所有分析节点上启动 Kafka。

      docker start analytics_alarm_kafka_1

  • CEM-20846 在极少数情况下,初始化 kafka 容器时 sFlow 节点配置会失败。如果在预配期间发生这种情况,则重新部署将显示 sFlow 节点。

  • 不支持 Junos EVO 设备的 CEM-20781 遥测 KPI 显示。

  • CEM-18999 在拥有大约 128 个机架和 4000 个 VN、256k VMI 的大规模数据中心中,如果重新启动 Contrail 见解 OpeSstack 适配器,可能需要大约 4 小时才能与 API 服务器重新同步。

  • CEM-13380 对于交换矩阵上的多宿主设备,AppFormix 流不显示

Contrail 网络 21.3.1 版中的已知行为

OpenStack

  • CEM-20280 在 Kubernetes 和 OpenStack 联合设置中,vrouter-agent 重启有时会导致未经授权的作错误。要解决此问题,请再次重新启动 vrouter-agent。

  • CEM-17991 在使用Kolla和OpenStack Rocky调配的OpenStack HA设置中,如果同时关闭所有服务器并稍后启动它们,Galera集群将失败。要恢复Galera集群,请按照下列步骤作:

    1. 编辑 /etc/kolla/mariadb/galera.cnf 文件以删除 wsrep 其中一个控制器上的地址,如下所示。

      注意:

      如果托管方案中的所有控制器同时关闭,则必须选择最后关闭的控制器。

    2. Docker 在编辑文件的控制器上启动 mariadb。

    3. 等待几分钟,确保 mariadb 容器没有重新启动,然后 Docker 在剩余的控制器上启动 mariadb。

    4. 还原 /etc/kolla/mariadb/galera.cnf 文件更改,并在先前选择的控制器上重新启动 mariadb 容器。

  • CEM-15764 在 Octavia Load Balancer 中,发往负载均衡器 VM 浮动 IP 的流量不会定向到后端 VM。

  • CEM-9979 在 RHOSP 环境中升级使用 OOO 热模板部署的 DPDK 计算期间,观察到 vRouter 核心转储。这是由于服务在升级期间启动的顺序所致,不会影响群集作。

OpenShift

  • CEM-25482 在基于 Openshift 的环境中升级 Contrail 时,会在升级过程中观察到 Contrail 收集器核心。由于这种情况在系统处于升级窗口时发生一次,并且服务会自动恢复,因此预计不会对功能产生影响。

  • CEM-21614 在 OpenShift 4.6 集群中, contrail-status 命令可能会显示 Zookeeper 和 RabbitMQ 的警告以及未报告的状态。解决方法是,您可以忽略此警告,并且根据其他活动的 Contrail 服务,您可以将 Zookeeper 和 RabbitMQ 状态也视为活动状态。要获取路由器代理状态,请在计算节点上输入 contrail-status -t 15

  • CEM-20802 在 Openshift-4.x/Contrail 上创建任何新的用户定义命名空间时,默认情况下会启用 SNAT,因此默认情况下,此命名空间的所有 Pod 都可以访问 Internet 服务器。解决方法是将命名空间上的 Contrail 注释显式配置为 “opencontrail.org/ip_fabric_snat": "false”。

DPDK 和 SR-IOV

  • CEM-23810 启用通用分段卸载 (GSO) 时,标头长度为 128 字节或以上的 IPv6 数据包将被丢弃。

    解决办法:禁用 GSO。

  • CEM-22835 在启用了 DPDK 的同一计算节点中运行的虚拟机 (VM) 之间进行高吞吐量数据传输期间,会观察到间歇性性能下降以及校验和错误。功能不受影响。

  • CEM-21547 SR-IOV 配置自动化不适用于多宿主服务器。

  • CEM-18922 在 DPDK 计算上,VM 的内存仅映射到一个 numa。如果 VM 是以 hw:mem_page_size='any' flavor 启动的,则在该 numa 中的巨大页面耗尽后,VM 创建将失败。解决方法,请改用该 hw:mem_page_size='large' 特定情调来避免此问题。

  • CEM-18408 与 X710 网卡DPDK1911,如果配置了 txd 和 rxd,则由于 mbuf 泄漏,性能会下降。英特尔建议在 Fortville NIC 上配置至少 1K tx 和 rx 描述符以获得更好和一致的性能,但它们似乎对 X710 NIC 有降级影响。

  • CEM-18163 在 DPDK 计算上,如果 contrail-vrouter-agent 崩溃,或者在具有许多子接口的扩展设置中重新启动 contrail-vrouter-agent,则所有子接口及其父接口都可能变为非活动状态。解决方法是停止/启动接口已关闭的实例。

  • CEM-17883 VLAN 标记不适用于带有 DPDK 19.11 的 Mellanox CX5 卡。

  • CEM-15561 使用 Mellanox NIC 卡卸载的 vRouter 不起作用。但是,支持不卸载的 Mellanox NIC 上的 DPDK。

  • CEM-13685 DPDK vRouter with MLNX CX5 大约需要 10 分钟,并且还可以看到 lcore 崩溃。这在初始安装期间发生一次。

  • JCB-177787 在 SNAT 和 LBaaS 等需要网络的 DPDK vRouter 用例中,无法设置巨型 MTU。允许的最大 MTU:<=1500。

SmartNIC

  • Fortville X710 NIC 中的 CEM-11163:使用 TX 和 RX 缓冲器时,当 mbufs 耗尽时,性能会下降。

常规路由

  • CEM-25388 更新与 VN 关联的 DNS 服务器属性不起作用。要更新、添加或移除 VN 中的 DNS 服务器详细信息,用户可以使用所需的 DNS 服务器详细信息删除并重新创建 VN。

  • CEM-20477 在 EVPN 服务链的情况下,带有透明防火墙的服务链不会在左右 VN 之间建立连接。

  • CEM-21835 如果裸机服务器 (BMS) 路由(VXLAN 路由)在 AAP CIDR 中,则不得使用允许的小于 /32 的地址对 (AAP)。

  • CEM-7262 不得将双向转发检测 (BFD) 协议附加到 BGPaaS 对象。您可以将 BFD 连接到 VMI。

  • CEM-21570 AS_PATH保留不适用于启用了 4 字节自治系统编号 (ASN) 的群集。

  • CEM-20421 在 Contrail 网络中,启用了瞻博网络标头时,逻辑路由器 (LR) 不支持动态下一跃点端口镜像。端口镜像不支持瞻博网络标头,因为在这种情况下,VXLAN 不是用于动态下一跃点的隧道类型。

  • CEM-20419 当在 VN 中启用 MAC/IP 并与 BFD 运行状况检查(目标 ip 设置为“全部”)相关联时,代理重新启动后,BFD 会话需要更长的时间才能恢复。

  • LR 上的 CEM-5043 VNI 更新不会更新路由表。解决方法是删除 LogicalRouter 并使用新 VNI 创建新的 LogicalRouter。

  • CEM-3245 vRouter 会复制源自 6 类无法正常工作的 QFX 设备的组播流量。

  • CEM-22632 使用 MX 系列路由器充当数据中心网关,并且如果在控制器和 MX 之间使用 MPLSoUDP,则浮动 IP 用例不起作用。请改用 MPLSoGRE 或 VXLAN。

Contrail 交换矩阵管理

  • CEM-23931 安装 swift-client 时,使用 Ansible 部署器配置 Contrail Fabric Manager 间歇性失败。如果出现这种情况,请在控制器上预安装 swift-client,然后重新运行预配。

  • CEM-20829 在使用 ML2 插件进行 Contrail 交换矩阵管理时,用于 sFlow 的telemetry_in_band_interface必须是物理接口。不支持 VLAN 接口。

  • CEM-18381 QFX5120不能用作 CRB 角色的 SP 样式中的边界叶角色。

  • CEM-15809 不支持更新企业样式交换矩阵中 VPG 上的 VLAN-ID。解决方法是删除并重新创建交换矩阵。

  • CEM-14679 在交换矩阵非托管 PNF 用例中,在 CRB 网关的情况下,DM 会在主干上的 LR VRF 下推送一些虚假的静态路由。

    解决方法是更改 device_manager docker 中 dummy_ip 变量的值。以下行号基于 2008 年版本代码库。

    https://github.com/Juniper/contrail-controller/blob/R2008/src/config/fabric-ansible/ansible-playbooks/filter_plugins/fabric.py#L2594

    将值更改为所需子网并保存文件后,重新启动 DM docker 以反映更改。请注意,此步骤应在交换矩阵上线之前开始执行。

  • CEM-14264 在版本 2003 中,“虚拟端口组创建”工作流不会使用使用给定虚拟网络的第一个 VPG 定义的现有值预填充 VLAN-ID。与以前的版本不同,该字段是可编辑的。如果交换矩阵在配置时启用了 交换矩阵范围的 VLAN-ID 重要性 复选框,则会出现此问题。

  • CEM-13767 虽然 Contrail 交换矩阵管理器能够让用户为交换矩阵设备使用自定义映像名称,但对于在基于 vmhost 的平台上运行的 QFX10000-60C 等平台,在将映像上传到 CFM 时,应以 junos-vmhost-install-x.tgz 格式选择映像名称。

  • CEM-8701 在 SP 样式交换矩阵上并行载入多个 BMS 不起作用。在使用生命周期管理工作流启动 BMS 时,有时在速度更快的服务器上,重新映像不会通过,实例也不会从具有讽刺意味的 vn 移动到租户 vn。这是因为,如果在 BMS 端口和 Contrail 节点中运行的 TFTP 服务之间的路由融合之前发送来自 BMS 的 PXE 引导请求。解决方法是,可以重新启动服务器,或者将服务器中的 BIOS 配置为具有延迟启动。

  • 不支持 CEM-8149 不支持结构设置为 enterprise_style=True 的 BMS LCM。默认情况下,enterprise_style设置为 False。如果结构对象载入 BMS LCM 实例,请避免使用 enterprise_style=True。

  • CEM-4358 在 Contrail 交换矩阵部署中,无法将QFX5110配置为主干 (CRB-Gateway)。

  • 不支持跨 TOR 的 CEM-3959 BMS 移动。要在 TOR 之间移动 BMS,需要移动整个 VPG。这意味着,如果有多个 BMS 关联到一个 VPG,并且需要移动其中一个 BMS,则需要根据新的关联删除并重新配置整个 VPG。

  • CEM-20794 在使用 ML2 插件进行 Contrail 交换矩阵管理时,无法在与 SRIOV VF 关联的虚拟机中配置 LAG。

  • CEM-20693 “交换矩阵>端口”下的 BGP 路由小组件> Leaf network device 仅考虑来自 inet.0 表的路由。

  • CEM-20272 在 L2 DCI 模式下,如果所选交换矩阵具有相同的叠加 ASN 编号,则在 L2 DCI 模式下,将在交换矩阵设备之间使用叠加 iBGP。在这种情况下,标记为 DCI 网关 RB 角色(路由和桥接)的边界设备(物理路由器)也必须分配 RR(路由反射器)RB 角色。如果没有 RR RB 角色,叠加 IBGP 会话不会跨交换矩阵的叶设备扩展第 2 层租户虚拟网络。因此,我们建议对于 L2 DCI 模式,确保将物理路由器设备标记为 DCI 网关 RB 角色和 RR 角色。

  • CEM-19802 安全组不能在 QFX10K 接口上使用。

Kubernetes

  • JCB-187287 不支持 Kubernetes Master 的高可用性预配。

常规

  • CEM-27916 在使用 Juju Charms 部署并使用 Contrail 网络和 LXD 的环境中,使用 LXD 的节点在重新启动 Contrail 控制器后不会重新启动。重新启动会触发 Contrail 网络无法解决的 IP 表问题。此 IP 表问题在 Charmhub 话语页面上的无法从 lxd 容器访问主机网关一文中进行了描述。

    解决办法:输入 sudo iptables -P FORWARD ACCEPT 命令,在使用 LXD 的节点上启用正向接受。

  • CEM-25538 配置 BGPaaS 可以将内核代理状态引入初始化。

    解决方法是,再次在计算上配置iptables(如CEM-23911中所示)并重新启动代理。

  • CEM-25524 在使用一个控制器和一个计算进行 K8s 部署的实验室场景中,虽然启用了命名空间间流量,但很少观察到 Contrail 控制器核心,并且系统在核心之后自行恢复。此方案未在 HA 环境中发生,这是建议的生产部署。

  • CEM-25331 在扩展环境中,重新启动控制器节点可能会使架构转换器服务重新启动几次。

  • CEM-25109 在 UI 的 VPG 页面中,不会为内部 SRIOV VPG 反映 VLAN 信息。这只是一种间歇性行为。

  • JCB-184776 当 vRouter 收到 ICMPv6 数据包的磁头分段时,磁头分段会立即加入汇编程序的队列。该流被创建为保留流,然后被困在代理中。如果与此磁头片段对应的片段已存在于汇编程序中,或者如果新片段紧随磁头片段之后到达,则汇编器会将它们释放到流模块中。如果在汇编程序将分段释放到流模块时代理未写入流作,则分段将进入保留队列。一次最多有三个片段在保留队列中排队。剩余的片段将从汇编程序中删除到流模块。

    解决方法是,只有在代理写入流作后,头片段才会排队到汇编程序。如果流已处于非保留状态,则会立即将其排队到汇编程序。

  • CEM-4370 不能将其他链接追加到用于创建 PNF 服务链的服务模板。如果需要添加其他链接,则需要删除服务模板并重新添加。

  • CEM-18398 Contrail WebUI 不适用于系统/节点状态监控。解决方法,请检查在相关节点上使用 CLI 进行检查。这不会影响功能。

  • CEM-20414 在容器重启期间Contrail 命令每个contrail_cluster对象触发一个部署作业,并导致重启问题。解决方法是通过 commandcli 修改 contrail-cluster 或 openstack-cluster 对象,而不是直接通过 UI 修改/创建端点。

  • CEM-17648 在 BMS 到 BMS EVPN“透明”服务链的情况下,从透明服务实例发送到 QFX 的隧道数据包具有 vlan-id,因此从左 bms 到右 bms 的流量会被丢弃,因为隧道数据包的内部标头具有 vRouter 内部的 vlan-id 信息,而 QFX 不知道 vlan-id,因此数据包会被交换机丢弃。

  • CEM-17562 在“安全组”下,可以忽略与 __no_rule__ 一起显示的条目。

  • CEM-16855 IPv6 ipam 子网选项“enable_dhcp”始终被忽略。

遥测和分析

  • CEM-21526 将 Contrail 网络从 R2011 之前的版本升级到 Contrail 网络 R2011.138 版本时,在分析节点上运行的 Kafka 容器可能会报告连接问题。

    解决办法:执行以下步骤:

    1. 在所有分析节点上停止 Kafka。

      docker stop analytics_alarm_kafka_1

    2. 在单个 Contrail 控制器上,执行 Zookeeper 清理。

      docker exec -it config_database_zookeeper_1 bash

      bin/zkCli.sh -server <IP>:2181

      deleteall /brokers

      deleteall /consumers

    3. 在所有分析节点上启动 Kafka。

      docker start analytics_alarm_kafka_1

  • CEM-20846 在极少数情况下,初始化 kafka 容器时 sFlow 节点配置会失败。如果在预配期间发生这种情况,则重新部署将显示 sFlow 节点。

  • 不支持 Junos EVO 设备的 CEM-20781 遥测 KPI 显示。

  • CEM-18999 在拥有大约 128 个机架和 4000 个 VN、256k VMI 的大规模数据中心中,如果重新启动 Contrail 见解 OpeSstack 适配器,可能需要大约 4 小时才能与 API 服务器重新同步。

  • CEM-13380 对于交换矩阵上的多宿主设备,AppFormix 流不显示

Contrail 网络 21.3 版中的已知行为

OpenStack

  • CEM-20280 在 Kubernetes 和 OpenStack 联合设置中,vrouter-agent 重启有时会导致未经授权的作错误。要解决此问题,请再次重新启动 vrouter-agent。

  • CEM-17991 在使用Kolla和OpenStack Rocky调配的OpenStack HA设置中,如果同时关闭所有服务器并稍后启动它们,Galera集群将失败。要恢复Galera集群,请按照下列步骤作:

    1. 编辑 /etc/kolla/mariadb/galera.cnf 文件以删除 wsrep 其中一个控制器上的地址,如下所示。

      注意:

      如果托管方案中的所有控制器同时关闭,则必须选择最后关闭的控制器。

    2. Docker 在编辑文件的控制器上启动 mariadb。

    3. 等待几分钟,确保 mariadb 容器没有重新启动,然后 Docker 在剩余的控制器上启动 mariadb。

    4. 还原 /etc/kolla/mariadb/galera.cnf 文件更改,并在先前选择的控制器上重新启动 mariadb 容器。

  • CEM-15764 在 Octavia Load Balancer 中,发往负载均衡器 VM 浮动 IP 的流量不会定向到后端 VM。

  • CEM-9979 在 RHOSP 环境中升级使用 OOO 热模板部署的 DPDK 计算期间,观察到 vRouter 核心转储。这是由于服务在升级期间启动的顺序所致,不会影响群集作。

OpenShift

  • CEM-25482 在基于 Openshift 的环境中升级 Contrail 时,会在升级过程中观察到 Contrail 收集器核心。由于这种情况在系统处于升级窗口时发生一次,并且服务会自动恢复,因此预计不会对功能产生影响。

  • CEM-21614 在 OpenShift 4.6 集群中, contrail-status 命令可能会显示 Zookeeper 和 RabbitMQ 的警告以及未报告的状态。解决方法是,您可以忽略此警告,并且根据其他活动的 Contrail 服务,您可以将 Zookeeper 和 RabbitMQ 状态也视为活动状态。要获取路由器代理状态,请在计算节点上输入 contrail-status -t 15

  • CEM-20802 在 Openshift-4.x/Contrail 上创建任何新的用户定义命名空间时,默认情况下会启用 SNAT,因此默认情况下,此命名空间的所有 Pod 都可以访问 Internet 服务器。解决方法是将命名空间上的 Contrail 注释显式配置为 “opencontrail.org/ip_fabric_snat": "false”。

DPDK 和 SR-IOV

  • CEM-22835 在启用了 DPDK 的同一计算节点中运行的虚拟机 (VM) 之间进行高吞吐量数据传输期间,会观察到间歇性性能下降以及校验和错误。功能不受影响。

  • CEM-21547 SR-IOV 配置自动化不适用于多宿主服务器。

  • CEM-18922 在 DPDK 计算上,VM 的内存仅映射到一个 numa。如果 VM 是以 hw:mem_page_size='any' flavor 启动的,则在该 numa 中的巨大页面耗尽后,VM 创建将失败。解决方法,请改用该 hw:mem_page_size='large' 特定情调来避免此问题。

  • CEM-18408 与 X710 网卡DPDK1911,如果配置了 txd 和 rxd,则由于 mbuf 泄漏,性能会下降。英特尔建议在 Fortville NIC 上配置至少 1K tx 和 rx 描述符以获得更好和一致的性能,但它们似乎对 X710 NIC 有降级影响。

  • CEM-18163 在 DPDK 计算上,如果 contrail-vrouter-agent 崩溃,或者在具有许多子接口的扩展设置中重新启动 contrail-vrouter-agent,则所有子接口及其父接口都可能变为非活动状态。解决方法是停止/启动接口已关闭的实例。

  • CEM-17883 VLAN 标记不适用于带有 DPDK 19.11 的 Mellanox CX5 卡。

  • CEM-15561 使用 Mellanox NIC 卡卸载的 vRouter 不起作用。但是,支持不卸载的 Mellanox NIC 上的 DPDK。

  • CEM-13685 DPDK vRouter with MLNX CX5 大约需要 10 分钟,并且还可以看到 lcore 崩溃。这在初始安装期间发生一次。

  • JCB-177787 在 SNAT 和 LBaaS 等需要网络的 DPDK vRouter 用例中,无法设置巨型 MTU。允许的最大 MTU:<=1500。

SmartNIC

  • Fortville X710 NIC 中的 CEM-11163:使用 TX 和 RX 缓冲器时,当 mbufs 耗尽时,性能会下降。

常规路由

  • CEM-25388 更新与 VN 关联的 DNS 服务器属性不起作用。要更新、添加或移除 VN 中的 DNS 服务器详细信息,用户可以使用所需的 DNS 服务器详细信息删除并重新创建 VN。

  • CEM-20477 在 EVPN 服务链的情况下,带有透明防火墙的服务链不会在左右 VN 之间建立连接。

  • CEM-21835 如果裸机服务器 (BMS) 路由(VXLAN 路由)在 AAP CIDR 中,则不得使用允许的小于 /32 的地址对 (AAP)。

  • CEM-7262 不得将双向转发检测 (BFD) 协议附加到 BGPaaS 对象。您可以将 BFD 连接到 VMI。

  • CEM-21570 AS_PATH保留不适用于启用了 4 字节自治系统编号 (ASN) 的群集。

  • CEM-20421 在 Contrail 网络中,启用了瞻博网络标头时,逻辑路由器 (LR) 不支持动态下一跃点端口镜像。端口镜像不支持瞻博网络标头,因为在这种情况下,VXLAN 不是用于动态下一跃点的隧道类型。

  • CEM-20419 当在 VN 中启用 MAC/IP 并与 BFD 运行状况检查(目标 ip 设置为“全部”)相关联时,代理重新启动后,BFD 会话需要更长的时间才能恢复。

  • LR 上的 CEM-5043 VNI 更新不会更新路由表。解决方法是删除 LogicalRouter 并使用新 VNI 创建新的 LogicalRouter。

  • CEM-3245 vRouter 会复制源自 6 类无法正常工作的 QFX 设备的组播流量。

  • CEM-22632 使用 MX 系列路由器充当数据中心网关,并且如果在控制器和 MX 之间使用 MPLSoUDP,则浮动 IP 用例不起作用。请改用 MPLSoGRE 或 VXLAN。

Contrail 交换矩阵管理

  • CEM-23931 安装 swift-client 时,使用 Ansible 部署器配置 Contrail Fabric Manager 间歇性失败。如果出现这种情况,请在控制器上预安装 swift-client,然后重新运行预配。

  • CEM-20829 在使用 ML2 插件进行 Contrail 交换矩阵管理时,用于 sFlow 的telemetry_in_band_interface必须是物理接口。不支持 VLAN 接口。

  • CEM-18381 QFX5120不能用作 CRB 角色的 SP 样式中的边界叶角色。

  • CEM-15809 不支持更新企业样式交换矩阵中 VPG 上的 VLAN-ID。解决方法是删除并重新创建交换矩阵。

  • CEM-14679 在交换矩阵非托管 PNF 用例中,在 CRB 网关的情况下,DM 会在主干上的 LR VRF 下推送一些虚假的静态路由。

    解决方法是更改 device_manager docker 中 dummy_ip 变量的值。以下行号基于 2008 年版本代码库。

    https://github.com/Juniper/contrail-controller/blob/R2008/src/config/fabric-ansible/ansible-playbooks/filter_plugins/fabric.py#L2594

    将值更改为所需子网并保存文件后,重新启动 DM docker 以反映更改。请注意,此步骤应在交换矩阵上线之前开始执行。

  • CEM-14264 在版本 2003 中,“虚拟端口组创建”工作流不会使用使用给定虚拟网络的第一个 VPG 定义的现有值预填充 VLAN-ID。与以前的版本不同,该字段是可编辑的。如果交换矩阵在配置时启用了 交换矩阵范围的 VLAN-ID 重要性 复选框,则会出现此问题。

  • CEM-13767 虽然 Contrail 交换矩阵管理器能够让用户为交换矩阵设备使用自定义映像名称,但对于在基于 vmhost 的平台上运行的 QFX10000-60C 等平台,在将映像上传到 CFM 时,应以 junos-vmhost-install-x.tgz 格式选择映像名称。

  • CEM-8701 在 SP 样式交换矩阵上并行载入多个 BMS 不起作用。在使用生命周期管理工作流启动 BMS 时,有时在速度更快的服务器上,重新映像不会通过,实例也不会从具有讽刺意味的 vn 移动到租户 vn。这是因为,如果在 BMS 端口和 Contrail 节点中运行的 TFTP 服务之间的路由融合之前发送来自 BMS 的 PXE 引导请求。解决方法是,可以重新启动服务器,或者将服务器中的 BIOS 配置为具有延迟启动。

  • 不支持 CEM-8149 不支持结构设置为 enterprise_style=True 的 BMS LCM。默认情况下,enterprise_style设置为 False。如果结构对象载入 BMS LCM 实例,请避免使用 enterprise_style=True。

  • CEM-4358 在 Contrail 交换矩阵部署中,无法将QFX5110配置为主干 (CRB-Gateway)。

  • 不支持跨 TOR 的 CEM-3959 BMS 移动。要在 TOR 之间移动 BMS,需要移动整个 VPG。这意味着,如果有多个 BMS 关联到一个 VPG,并且需要移动其中一个 BMS,则需要根据新的关联删除并重新配置整个 VPG。

  • CEM-20794 在使用 ML2 插件进行 Contrail 交换矩阵管理时,无法在与 SRIOV VF 关联的虚拟机中配置 LAG。

  • CEM-20693 “交换矩阵>端口”下的 BGP 路由小组件> Leaf network device 仅考虑来自 inet.0 表的路由。

  • CEM-20272 在 L2 DCI 模式下,如果所选交换矩阵具有相同的叠加 ASN 编号,则在 L2 DCI 模式下,将在交换矩阵设备之间使用叠加 iBGP。在这种情况下,标记为 DCI 网关 RB 角色(路由和桥接)的边界设备(物理路由器)也必须分配 RR(路由反射器)RB 角色。如果没有 RR RB 角色,叠加 IBGP 会话不会跨交换矩阵的叶设备扩展第 2 层租户虚拟网络。因此,我们建议对于 L2 DCI 模式,确保将物理路由器设备标记为 DCI 网关 RB 角色和 RR 角色。

  • CEM-19802 安全组不能在 QFX10K 接口上使用。

Kubernetes

  • JCB-187287 不支持 Kubernetes Master 的高可用性预配。

常规

  • CEM-27916 在使用 Juju Charms 部署并使用 Contrail 网络和 LXD 的环境中,使用 LXD 的节点在重新启动 Contrail 控制器后不会重新启动。重新启动会触发 Contrail 网络无法解决的 IP 表问题。此 IP 表问题在 Charmhub 话语页面上的无法从 lxd 容器访问主机网关一文中进行了描述。

    解决办法:输入 sudo iptables -P FORWARD ACCEPT 命令,在使用 LXD 的节点上启用正向接受。

  • CEM-25538 配置 BGPaaS 可以将内核代理状态引入初始化。

    解决方法是,再次在计算上配置iptables(如CEM-23911中所示)并重新启动代理。

  • CEM-25524 在使用一个控制器和一个计算进行 K8s 部署的实验室场景中,虽然启用了命名空间间流量,但很少观察到 Contrail 控制器核心,并且系统在核心之后自行恢复。此方案未在 HA 环境中发生,这是建议的生产部署。

  • CEM-25331 在扩展环境中,重新启动控制器节点可能会使架构转换器服务重新启动几次。

  • CEM-25109 在 UI 的 VPG 页面中,不会为内部 SRIOV VPG 反映 VLAN 信息。这只是一种间歇性行为。

  • JCB-184776 当 vRouter 收到 ICMPv6 数据包的磁头分段时,磁头分段会立即加入汇编程序的队列。该流被创建为保留流,然后被困在代理中。如果与此磁头片段对应的片段已存在于汇编程序中,或者如果新片段紧随磁头片段之后到达,则汇编器会将它们释放到流模块中。如果在汇编程序将分段释放到流模块时代理未写入流作,则分段将进入保留队列。一次最多有三个片段在保留队列中排队。剩余的片段将从汇编程序中删除到流模块。

    解决方法是,只有在代理写入流作后,头片段才会排队到汇编程序。如果流已处于非保留状态,则会立即将其排队到汇编程序。

  • CEM-4370 不能将其他链接追加到用于创建 PNF 服务链的服务模板。如果需要添加其他链接,则需要删除服务模板并重新添加。

  • CEM-18398 Contrail WebUI 不适用于系统/节点状态监控。解决方法,请检查在相关节点上使用 CLI 进行检查。这不会影响功能。

  • CEM-20414 在容器重启期间Contrail 命令每个contrail_cluster对象触发一个部署作业,并导致重启问题。解决方法是通过 commandcli 修改 contrail-cluster 或 openstack-cluster 对象,而不是直接通过 UI 修改/创建端点。

  • CEM-17648 在 BMS 到 BMS EVPN“透明”服务链的情况下,从透明服务实例发送到 QFX 的隧道数据包具有 vlan-id,因此从左 bms 到右 bms 的流量会被丢弃,因为隧道数据包的内部标头具有 vRouter 内部的 vlan-id 信息,而 QFX 不知道 vlan-id,因此数据包会被交换机丢弃。

  • CEM-17562 在“安全组”下,可以忽略与 __no_rule__ 一起显示的条目。

  • CEM-16855 IPv6 ipam 子网选项“enable_dhcp”始终被忽略。

遥测和分析

  • CEM-21526 将 Contrail 网络从 R2011 之前的版本升级到 Contrail 网络 R2011.138 版本时,在分析节点上运行的 Kafka 容器可能会报告连接问题。

    解决办法:执行以下步骤:

    1. 在所有分析节点上停止 Kafka。

      docker stop analytics_alarm_kafka_1

    2. 在单个 Contrail 控制器上,执行 Zookeeper 清理。

      docker exec -it config_database_zookeeper_1 bash

      bin/zkCli.sh -server <IP>:2181

      deleteall /brokers

      deleteall /consumers

    3. 在所有分析节点上启动 Kafka。

      docker start analytics_alarm_kafka_1

  • CEM-20846 在极少数情况下,初始化 kafka 容器时 sFlow 节点配置会失败。如果在预配期间发生这种情况,则重新部署将显示 sFlow 节点。

  • 不支持 Junos EVO 设备的 CEM-20781 遥测 KPI 显示。

  • CEM-18999 在拥有大约 128 个机架和 4000 个 VN、256k VMI 的大规模数据中心中,如果重新启动 Contrail 见解 OpeSstack 适配器,可能需要大约 4 小时才能与 API 服务器重新同步。

  • CEM-13380 对于交换矩阵上的多宿主设备,AppFormix 流不显示