已知问题
本节列出了 Juniper Paragon Automation 中的已知问题。
设备生命周期管理
-
如果您已加入 Cisco 设备,但后来更改了设备上的 TLS 设置(打开或关闭),则设备的状态将在“清单”页面上显示为“已断开连接”。
解决办法:根据之前是关闭还是打开 TLS,将 Insecure 设置为 False,并相应地将 Skip Verify 设置为 True,删除设备并再次载入设备。
-
如果在应用于 QFX 设备的设备配置文件中启用 了信任 ,则将 QFX 设备入网至 Paragon Automation 将失败。
解决办法:禁用对设备配置文件的 信任 ,然后尝试载入 QFX 设备。
-
Paragon Automation 仅在设备初始上线期间触发设备配置文件和接口配置文件中包含的配置模板。设备上线后,您不能使用设备配置文件和接口配置文件中包含的配置模板在设备上应用其他配置。
解决办法:如果需要在设备上线后在设备上应用其他配置,则需要使用 CLI 或通过 Paragon Automation GUI 执行配置模板来手动应用配置。
-
“查看网络资源”页(“设备载入清单>>网络实施计划>更多)不显示与 AE 接口相关的详细信息。
解决办法:您可以在配置折叠(可观察性>故障排除设备>Device-Name)的查看活动配置链接中查看与 AE 接口相关的详细信息。
可观察性
-
由于 XML 路径语言 (XPath) 中的更改,某些自定义规则无法从设备收集 KPI 信息。
解决办法:无。
-
在繁重的引入方案(例如首次加入路由器或路由器维护时段)期间,路由总数需要一些时间才能反映在路由状态图(路由>路由的可观察性>路由浏览器的路由状态 选项卡)。
如果网络中出现任何事件,“路由状态”图表或“路由更新”表(路由>路由浏览器>路由更新>可观察性)可能会显示延迟很大的数据。我们预计在网络稳态运行期间的延迟是合理的。
此外,设备选项卡(路由>路由浏览器>路由状态>可观察性)或邻接选项卡(路由可观察>性>路由浏览器)中的统计信息也会以低延迟(1 到 5 分钟)更新。
解决办法:无。
-
在链路上运行多级 ISIS 协议的极少数情况下,拓扑图可能不会更新,或者可能无法反映最新的实时作状态。
解决办法:拨动 BGP LS 会话,而不是重新启动拓扑服务器。
登录到特定于组织的 CRPD。
kubectl -n $(kubectl get namespaces -o jsonpath='{.items}' | jq -r '.[]|select(.metadata.name | startswith("pf-"))|.metadata.name') exec -it $(kubectl -n $(kubectl get namespaces -o jsonpath='{.items}' | jq -r '.[]|select(.metadata.name | startswith("pf-"))|.metadata.name') get pods -l northstar=bmp -o jsonpath='{.items[0].metadata.name}') -c crpd -- cli清除 BGP 会话。
clear bgp neighbor all
-
如果您尝试使用 REST API 创建 LSP,并且要重复使用现有 LSP 名称,则 REST API 服务器不会返回错误。
解决办法:无。
-
由于遥测路径发生了变化,您无法查看路由和 MPLS 折叠ACX7020设备的 IS-IS 数据(可观察性>运行状况>>设备故障排除> Device-Name)。
解决办法:无。
-
路由浏览器页面(可观察性>路由)仅当安装了 Junos OS 或Junos OS演化版 23.2 或更低版本时才会显示数据。
-
为网络实施计划添加设备配置文件时,如果启用路由协议分析,则会收集设备配置文件中列出的设备的路由数据。发布网络实施计划时,即使上线工作流看似成功,也可能在收集这些设备的路由数据时出现错误。由于这些错误,设备不会配置为向 Paragon Automation 发送数据,因此路由数据不会显示在 Paragon Automation GUI 的路由浏览器页面上。卸载设备时也会发生此问题,其中卸载的设备会继续向 Paragon Automation 发送数据。
当您没有在设备上配置 ASN 或路由器 ID,或者当您锁定了设备配置以进行独占编辑时,也会出现此问题。
解决办法:要解决此问题,请执行以下作:
执行下列作之一:
运行
request paragon debug logs namespace routingbot app routingbot service routingbot-apiserverShell 命令,检查服务日志。根据 #xd_6e389dfcf6e0ccd1-2b9339cf-18ebe20edd7--7ce6__table_xxs_ppc_r2c 中看到的错误消息执行必要的作。表 1:错误消息 错误消息 问题 无法获取 dev_id {dev_id} 的设备配置文件信息:{res.status_code} - {res.text}
无法获取 dev_id {dev['dev_id']} 的设备信息。跳过设备。
对 PAPI 进行 API 调用以获取设备信息失败。 在 dev_id {dev_id} 的响应中找不到结果
无法获取 dev_id {dev['dev_id']} 的设备信息。跳过设备。
对 PAPI 的 API 调用返回不带数据的响应。 在dev_id {dev_id} 的响应中找不到完整的设备信息:{device_info}
对 PAPI 的 API 调用返回的响应数据不完整。 未找到来自 PF 的 dev_id {dev_id} 的数据 对 Pathfinder 获取设备信息的 API 调用失败。 在 PF 数据中找不到dev_id {dev_id} 所需的数据:{node_data} 对 Pathfinder 的 API 调用以获取设备信息将返回包含不完整数据的响应。
EMS 配置失败并出现错误,对于配置:{cfg_data} 或 EMS 配置推送错误 {res} {res.text} |try:{重试}。无法在设备 {mac_id} 上配置 BMP BGP 配置失败。 主要版本、次要版本或发行版本的格式无效:{os_version}
不支持设备的作系统版本。 错误开机自检 {self.config_server_path}/api/v2/config/device/{dev_id}/ {data} {res.json()} Playbook 应用程序失败。 错误 PUT:{self.config_server_path}/api/v2/config/device/{dev_id}/ {data} {res_put.json()} 删除剧本失败。 错误 PUT:{self.config_server_path}/api/v2/config/device/{dev_id}/ {data} {res_put.json()} 设备或 playbook 应用程序到设备组失败。 错误 PUT {self.config_server_path}/api/v2/config/device-group/{site_id}/ {data} {res_put.json()}
从设备组中移除设备或 playbook 失败。
检查设备配置,检查设备是否意外缺少或存在配置。例如,您可以
查看 下的配置
set groups paragon-routing-bgp-analytics routing-options bmp。请检查 JTIMON 吊舱中的设备配置。
解决上述问题后,编辑您为设备申请的网络实施方案的设备配置文件。根据是载入还是卸载设备,启用或禁用设备配置文件中的路由协议分析选项。
发布网络实施方案。
根据 Paragon Automation GUI 的路由浏览器页面上显示的数据,验证是否可以看到所需的结果。
-
升级到 Juniper Paragon Automation 2.4.1 版后,您需要配置 cRPD VIP 地址以启用路由可观察性功能。
要启用路由可观察性功能,请运行以下命令:
set paragon cluster applications routingbot routingbot-crpd-vip <vip-address> commit and exit request paragon config request paragon deploy cluster input "-t metallb,routingbot-crpd,addon-apps -e target_components=routingbot-api-server kubectl -n routingbot rollout restart deployment routingbot-apiserver
-
在接口可折叠面板上,FEC 未纠正错误图表仅在支持速度等于或大于 100-Gbps 的接口上可用。
-
为设备应用新配置后,“活动配置” Device-Name 页面 (可观察性>对设备> Device-Name >配置进行故障排除>查看活动配置链接)不会立即显示最新配置。最新的更改需要几分钟才能反映在“活动配置” Device-Name 页面上。
解决办法:您可以使用 CLI 登录设备,验证新配置是否已应用到设备。
-
如果在设备上线之前就通过 BGP-LS 对等会话发现了设备,则在与设备建立 PCEP 会话时,将创建重复的 LSP。在极少数情况下,创建的重复 LSP 将继续保留。
解决办法:如果看到重复的 LSP,请在确保 TopoServer 已从 edgeAdapter接收 LSP 头端的配置文件后重新运行配置分析。仅当设备上存在提交事件时,才会触发配置分析。要手动触发配置解析:
登录到 Airflow scheduler pod。
kubectl -n airflow exec -it $(kubectl -n airflow get pods -l component=airflow-scheduler -o jsonpath='{.items[0].metadata.name}') -c scheduler -- bash运行配置分析。
cd /opt/airflow/mount /opt/airflow/mount/utils/getipconf -northstar -noVT -noASNodeLink -topo_id 10 -dir /opt/airflow/mount/collection/<org id>/<topo id>/config/config -i /opt/airflow/mount/collection/<org id>/<topo id>/config/interface -geo /opt/airflow/mount/collection/<org id>/<topo id>/config/geo_file.json
-
“设备故障排除”和“运行状况仪表板”页(“可观察性”>“运行状况”)上列出的运行状况不佳的设备数量不匹配。
解决办法:无。
-
您无法从 Paragon Automation GUI 中删除不需要的节点和链接。
解决办法:使用以下 REST API 删除节点和链接:
-
用于删除链接的 REST API:
[删除] https://{{server_ip}}/topology/api/v1/orgs/{{org_id}}/{{topo_id}}/links/{{link_id}}
注意:您可以按照 此处 所述的步骤获取实际 URL。
例如
-
网址:“https://10.56.3.16/topology/api/v1/orgs/f9e9235b-37f1-43e7-9153-e88350ed1e15/10/links/15”
-
卷曲:
curl --location --request DELETE 'https://10.56.3.16:443/topology/api/v1/orgs/f9e9235b-37f1-43e7-9153-e88350ed1e15/10/links/15' \ --header 'Content-Type: application/json' \ --header 'Authorization: Basic dGVzdDFAdGVzdC5jb206RW1iZTFtcGxz'
-
-
用于删除节点的 REST API:
[删除] https:// {{Server_IP}}/topology/api/v1/orgs/{{Org_ID}}/{{}}/nodesTopo_ID/{{Node_ID}}
注意:您可以按照 此处 所述的步骤获取实际 URL。
例如,
-
网址: ' https://10.56.3.16/topology/api/v1/orgs/f9e9235b-37f1-43e7-9153-e88350ed1e15/10/nodes/1'
-
卷曲:
curl --location --request DELETE 'https://10.56.3.16:443/topology/api/v1/orgs/f9e9235b-37f1-43e7-9153-e88350ed1e15/10/nodes/11' \ --header 'Content-Type: application/json' \ --header 'Authorization: Basic dGVzdDFAdGVzdC5jb206RW1iZTFtcGxz' \
使用以下过程获取在 CURL 中用于删除链接或节点的实际 URL:
导航到“拓扑”页面(“可观察性”>“拓扑”)。
使用键盘中的 CTRL + Shift + I 按钮在浏览器中打开开发人员工具。
在开发人员工具中,选择 “网络 ”,然后选择“ XHR 过滤器”选项。
标识链路索引号或节点号。要将链路索引号标识为节点号,请执行以下作:
在 Paragon Automation GUI 的“拓扑”页面上,双击要删除的链接或节点。
此时将显示“链接 Link-Name ”页面或“节点 Node-Name ”页面。
导航到详细信息选项卡,并记下显示的链路索引号或节点号。
在开发人员工具中,根据链接索引号或与要删除的链接或节点相关的节点号选择并单击该行。
复制用于删除 CURL 中的链接或节点所需的 URL。
-
-
-
并非所有光学模块都支持所有与光学相关的 KPI。有关详细信息,请参见 #xd_6e389dfcf6e0ccd1-2b9339cf-18ebe20edd7--7ce6__table_xkn_l1b_cdc 。
解决办法:无。
表 2:光学模块支持的 KPI 模块
Rx 信号丢失 KPI
Tx 信号丢失 KPI
激光禁用 KPI
SFP 光学器件
不
不
不
CFP 光学器件
是的
不
不
CFP_LH_ACO光学器件
是的
不
不
QSFP 光学器件
是的
是的
是的
CXP 光学器件
是的
是的
不
XFP 光学器件
不
不
不
-
对于PTX100002设备,在接口折叠架上观察到以下问题(可观察性>运行状况>设备故障排除>设备名称>概述):
-
在“可插拔详细信息” Device-Name 页(接口>可插拔数据链路)上,“光发射功率”和“光接收功率”图不显示任何数据。
-
在“输入流量详细信息 Device-Name ”页面(接口>输入流量数据链路)上,“信号功能”图表不显示任何数据。
-
服务编排
-
如果不同的 L3VPN 服务使用不同的 MTU 值在同一 IFD 上运行,则服务调配将失败。
解决办法:确保共享相同 IFD 的 L3VPN 服务的 MTU 值相同。
-
Passive Assurance 选项卡(Orchestration > Instances > Service-Order-Name Details)上的以下折叠面板显示不正确的数据或没有数据:
-
BGP 折叠 — 对于具有 IPv4 或 IPv6 邻接方的客户边缘 (CE) 或提供商边缘 (PE) 设备,VPN 状态列显示不正确的数据。
-
OSPF 手风琴 — 对于具有 IPv6 邻接方的 CE 或 PE 设备,“邻接方地址”列中没有 IPv6 条目。
-
L3VPN 折叠 — VPN 状态列显示 OSPF 和 BGP 协议的错误数据。对于具有静态 IPv4 或 IPv6 地址的 CE 或 PE 设备,邻居会话和 VPN 状态列为空。
此问题仅发生在 L3VPN 服务中。
解决办法:无。
-
-
如果 CE 和 PE 设备组合没有有效的接口选项,则接口下拉列表将为空。
解决办法:您可以执行下列作之一:
-
选择不同的 CE 和 PE 组合。
-
在选择 PE 设备及其接口之前,请取消选择 CE 设备。在这种情况下,系统会自动分配 CE 设备。
-
-
如果将 Paragon Automation 从版本 2.3.0 升级到 2.4.1,则可能无法在现有 L3VPN 服务实例上修改站点网络访问的 VLAN。
解决办法:您需要将服务实例升级到版本 2.4.1 才能使用交互式放置功能。
-
将鼠标悬停在 L3VPN 折叠面板的“相关事件”部分的“ 查看详细信息 ”超链接上时,不会显示设备名称(“Orchestration > Instances > Service Instances”> Service-Instance-Name 超链接> Service-Instance-Name “详细信息”>“Passive Assurance”选项卡)。
解决办法:无。
-
如果已将拓扑资源从版本 2.2.0 或 2.3.0 升级到版本 2.4.1,并且稍后编辑和设置在旧版本(版本 2.3.0 或版本 2.2.0)中创建的服务实例(L3VPN 或 EVPN),则服务实例的设置将失败。
解决办法:开始编辑服务实例之前,请确保拓扑资源和服务实例的版本相同。可以选择先升级拓扑资源,然后再升级服务,反之亦然。
- 批量载入设备时,由于 Kubernetes 对气流工作器 Pod 的水平 Pod 自动缩放,处于载入过程中间的设备载入可能会失败。
- 解决办法:使用 Paragon Automation GUI 上的 恢复载 入选项重新启动载入。
-
将 Paragon Automation 从 2.2.0 版本升级到 2.4.1 版本后,请确保在升级拓扑资源实例之前先升级 L3VPN 服务实例;否则,您可能会遇到问题。
解决办法:先升级所有服务实例,然后再升级拓扑资源实例。
-
“vpn_svc_type”服务类型在 Paragon Automation GUI 上通过 REST API 显示为“pbb-evpn”,而不是“evpn-mpls”。
解决办法:无。
-
对于 MX 240 设备,与 OSPF 相关的数据不会填充在 Passive Assurance 选项卡 (编排>实例> Service-Order-Name 详细信息)上。
解决办法:在客户边缘 (CE) 设备上配置 OSPF。
-
创建或修改 EVPN 服务订单时,您不能在聚合以太网 (AE) 接口上配置多个 VLAN ID。EVPN 将 AE 端口视为单一资源,因此即使 AE IFL 上的 VLAN ID 不同,也不能在服务实例之间重复使用 AE 接口。
解决办法:无。
-
单击详细信息页面(Orchestration > Instances >Service-Instance-Name)上的Service-Instance-Name刷新图标时,您可能看不到“相关事件”部分中的最新事件。
解决办法:若要查看最新事件,请转到“服务实例”页(业务流程>实例),而不是使用“刷新”图标,然后选择需要查看其最新事件的服务实例。
-
在修改现有 L3VPN 服务实例时,如果尝试删除已包含在网络实施计划中的设备,则修改工作流将失败。
解决办法:在“监视器”页上,停止与必须在服务实例中删除的设备关联的所有监视器。停止相关监视器后,您可以继续修改 L3VPN 服务实例。
-
如果取消预置服务实例,然后使用与已取消预置服务相同的详细信息置备服务,则“详细信息”页面上的“订单历史记录 L3VPN-Name ”选项卡(“业务流程>实例”> Service-Instance-Name 超链接)会列出所有订单历史记录。
解决办法:无。
-
在扩展设置中,您无法批量升级服务设计。
解决办法:建议一次只升级一个服务设计。
-
即使没有通过设备的流量,逻辑接口折叠>(“编排实例”>“服务实例”页面> service-instance-name 超链接> Service-Instance-Name “详细信息”)上的“输出流量速率”列也会显示一些数据。
解决办法:无。
主动保证
-
如果您的角色类型为“观察者”,您可能无法查看“测试”页面(可观察性> Active Assurance)。
解决办法:无。
-
如果您在使用 Juniper Paragon Automation 2.3.0 或更低版本时在路由器上安装了 Test Agent,并且升级到 Paragon Automation 2.4.1 版并重新启动路由器,则路由器上安装的 Test Agent 版本与 Paragon Automation 中提供的 Test Agent 版本之间会存在不匹配。由于此问题,您无法在重新启动的路由器上运行测试或监视器。
解决办法:将 Paragon Automation 升级到 2.4.1 后,登录到路由器,然后运行
delete services paa test-agent ta-version命令从测试代理配置中删除测试代理版本信息。 -
在设备的路由引擎从主路由引擎切换到备份路由引擎后,测试代理的状态将显示为脱机,反之亦然。仅当您使用的是早于 23.4R2 的 Junos OS 版本时,才会出现此问题。
解决办法:在路由引擎切换后重新安装测试代理。
-
不能在测试代理上运行多个版本的插件。
解决办法:升级 Paragon Automation 时,请先重新启动所有测量,然后再创建任何新测量。
-
当您单击“监视器”页面上的监视器(“可观察性”>“Active Assurance”)时,该 Monitor-Name 页面大约需要一分钟来加载数据。仅当系统中的事件数量较多时,才会发生此问题。
解决办法:无。
使用 DNS 插件创建测试时,不会生成流,并引发以下事件:
Could not get nameserver from resolv.conf如果测试与在安装了 EVO 的 瞻博网络 路由器上运行的测试代理相关联,并且您在配置测试时未指定“名称服务器”字段Junos OS则会出现此问题。
解决办法:确保在配置“测试”时为“名称服务器”字段指定一个值。
-
更新由其他用户创建的监视器或测试模板后,“监视器(可观察性>主动保证)”和“测试模板(Active Assurance 清单>”页面上的“更新依据”列不会反映修改监视器或测试模板的用户的名称。
解决办法:无。
-
将新主机添加到现有监视器时,新测量值不会反映在运行状况仪表板(可观察性>运行状况)的“主动保证”选项卡中。
解决办法:无。
-
“设备”选项卡上的“设备”(“可观察性”>“运行状况”>“运行状况仪表板”>“Active Assurance”(选项卡)>单击任何折叠>“查看详细信息”>“受影响的项目 ”选项卡)上的“设备”表不会列出具有不正常测量值的设备。
解决办法:无。
网络优化
-
使用 SR 隧道配置文件发布路径意图时,不会创建分段路由 (SR) LSP。出现此问题的原因是,由于 OSPF 中的指定路由器 (DR) 或 IS-IS 中的指定中间系统 (DIS) 的动态选择特性,广播链路不受支持。
解决办法:无。
信任
此版本中没有已知问题。
管理
-
LDAP 身份验证可能不适用于未包含在 CN=Users 容器中的用户。
解决办法:将 CN=Users 用户添加到容器。
-
支持的配置模板的最大大小为 1 MB,而不是 GUI 上的错误消息中指示的 10 MB。
解决办法:无。
-
有时,从触发警报到警报出现在 GUI 上之间会出现长达 10 分钟的明显延迟。
解决办法:无。
安装和升级
-
运行
request paragon deploy cluster或request paragon service start命令时,有时命令可能会失败,因为 config.yml 为空。在这种情况下,日志文件可能会显示类似于以下内容的错误:usage: ansible-playbook [-h] [--version] [-v] [--private-key PRIVATE_KEY_FILE] [-u REMOTE_USER] [-c CONNECTION] [-T TIMEOUT] [--ssh-common-args SSH_COMMON_ARGS] [--sftp-extra-args SFTP_EXTRA_ARGS] [--scp-extra-args SCP_EXTRA_ARGS] [--ssh-extra-args SSH_EXTRA_ARGS] [-k | --connection-password-file CONNECTION_PASSWORD_FILE] [--force-handlers] [--flush-cache] [-b] [--become-method BECOME_METHOD] [--become-user BECOME_USER] [-K | --become-password-file BECOME_PASSWORD_FILE] [-t TAGS] [--skip-tags SKIP_TAGS] [-C] [--syntax-check] [-D] [-i INVENTORY] [--list-hosts] [-l SUBSET] [-e EXTRA_VARS] [--vault-id VAULT_IDS] [--ask-vault-password | --vault-password-file VAULT_PASSWORD_FILES] [-f FORKS] [-M MODULE_PATH] [--list-tasks] [--list-tags] [--step] [--start-at-task START_AT_TASK] playbook [playbook ...] Runs Ansible playbooks, executing the defined tasks on the targeted hosts. < output snipped > --become-method BECOME_METHOD privilege escalation method to use (default=sudo), use `ansible-doc -t become -l` to list valid choices. --become-user BECOME_USER run operations as this user (default=root) -b, --become run operations with become (does not imply password prompting)解决办法:在重新运行任一命令之前,请执行以下步骤。
使用
file show /epic/config/config.yml命令验证config.yml文件是否为空。如果 config.yml 文件为空,请执行以下步骤。
使用
request paragon config命令重新生成配置文件。键入
exit以退出 Linux root shell。执行以下命令:
- #
chattr +i /root//epic/config/inventory - #
chattr +i /root//epic/config/config.yml
- #
键入
cli以进入 Paragon Shell。执行
request paragon deploy cluster或request paragon service start命令(视情况而定)。立即键入
exit以退出 Linux root shell。执行以下命令:
- #
chattr -i /root//epic/config/inventory - #
chattr -i /root//epic/config/config.yml
- #
键入
cli以重新进入 Paragon Shell。使用
monitor start /epic/config/log命令监视部署进度。
-
vmrestore 工具将数据还原到 vmstorage pod 中。在执行还原时,该工具会创建一个锁定文件,以防止任何其他应用程序在还原阶段访问数据。但是,有时 vmrestore 工具无法清除锁定文件,并且 vmstorage pod 无法访问数据。
解决办法:可以通过使用相同的备份文件重新运行还原作来释放锁定。有关还原 Paragon Automation 集群的信息,请参阅 备份和还原 Paragon Automation。
-
当工作节点关闭时,如果创建组织或载入设备,则可能会出现问题。
解决办法:当工作节点关闭时,不要创建组织或载入设备。您必须等到群集恢复,然后创建组织或载入设备。恢复状态是指所有 Pod 都处于 Running 或 Pending 状态,并且不处于任何中间状态(如 Terminating、 CrashloopbackOff、等)。