网络问题故障排除
解决网络中的问题
问题
描述
此检查清单提供故障排除基础知识的链接(网络示例)以及诊断路由器和网络问题的命令摘要。
解决 方案
任务 |
命令或操作 |
---|---|
隔离中断的网络连接 | |
ping (ip-address | hostname) 显示路由 (ip-address | ) hostnametraceroute (ip-address | | hostname) |
|
|
|
|
|
|
隔离中断的网络连接
通过应用 图 1 中所示的标准四步流程,可以将故障节点隔离到网络中。请注意,15.1X49、15.1X49-D30 或 15.1X49-D40 版本不支持本节中描述的功能。

但是,在开始四步流程之前,务必为所有网络上不可避免的问题做好准备。您只需尝试各种操作即可找到解决问题的解决方案,但如果您采用系统的方法来实施网络维护和监控,则可以更快地找到合适的解决方案。要为网络上的问题做好准备,了解网络在正常条件下如何运作,记录基准网络活动,并仔细观察网络在问题情况下的行为。
图 2 显示了本主题中使用的网络拓扑,说明了诊断网络问题的过程。

图 2 中的网络由两个自治系统 (AS) 组成。AS 65001 包括两个路由器,AS 65002 包括三个路由器。AS 65001 中的边界路由器 (R1
) 向 AS 65002 网络通告聚合前缀100.100/24
。此网络中的问题是,由于与R6
之间R2
存在环路,R6
无法访问R5
。
要隔离网络中出现故障的连接,请按照以下主题中的步骤操作:
识别网络连接中断的症状
问题
描述
网络中问题的症状通常非常明显,例如无法到达远程主机。
解决 方案
要识别网络上的问题症状,请从网络的一端开始,然后按照另一端的路由,输入以下所有或其中一个 Junos OS 命令行接口 (CLI) 操作模式命令:
user@host> ping (ip-address
|host-name
) user@host> show route (ip-address
|host-name
) user@host> traceroute (ip-address
|host-name
)
示例输出
user@R6> ping 10.0.0.5 PING 10.0.0.5 (10.0.0.5): 56 data bytes 36 bytes from 10.1.26.1: Time to live exceeded Vr HL TOS Len ID Flg off TTL Pro cks Src Dst 4 5 00 0054 e2db 0 0000 01 01 a8c6 10.1.26.2 10.0.0.5 36 bytes from 10.1.26.1: Time to live exceeded Vr HL TOS Len ID Flg off TTL Pro cks Src Dst 4 5 00 0054 e2de 0 0000 01 01 a8c3 10.1.26.2 10.0.0.5 36 bytes from 10.1.26.1: Time to live exceeded Vr HL TOS Len ID Flg off TTL Pro cks Src Dst 4 5 00 0054 e2e2 0 0000 01 01 a8bf 10.1.26.2 10.0.0.5 ^C --- 10.0.0.5 ping statistics --- 3 packets transmitted, 0 packets received, 100% packet loss user@R6> show route 10.0.0.5 inet.0: 20 destinations, 20 routes (20 active, 0 holddown, 0 hidden) + = Active Route, - = Last Active, * = Both 10.0.0.5/32 *[IS-IS/165] 00:02:39, metric 10 > to 10.1.26.1 via so-0/0/2.0 user@R6> traceroute 10.0.0.5 traceroute to 10.0.0.5 (10.0.0.5), 30 hops max, 40 byte packets 1 10.1.26.1 (10.1.26.1) 0.649 ms 0.521 ms 0.490 ms 2 10.1.26.2 (10.1.26.2) 0.521 ms 0.537 ms 0.507 ms 3 10.1.26.1 (10.1.26.1) 0.523 ms 0.536 ms 0.514 ms 4 10.1.26.2 (10.1.26.2) 0.528 ms 0.551 ms 0.523 ms 5 10.1.26.1 (10.1.26.1) 0.531 ms 0.550 ms 0.524 ms
意义
示例输出显示一个未成功的ping
命令,其中由于超出生存时间而拒绝数据包。命令的show route
输出显示接口 (10.1.26.1
),您可以进一步检查以寻找可能的问题。命令traceroute
显示 (R2
) 和 10.1.26.2
(R6
) 之间的10.1.26.1
环路,如两个接口地址的持续重复所示。
隔离网络问题的原因
问题
描述
特定症状可能是一个或多个原因造成的。缩小搜索范围,查找引起不良行为的每个单独原因。
解决 方案
要隔离特定问题的原因,请输入以下一个或全部 Junos OS CLI 操作模式命令:
user@host> show < configuration | bgp | interfaces | isis | ospf | route >
您的特定问题可能需要使用的可能不仅仅是上述命令。有关常用操作模式命令的更详尽列表,请参阅相应的命令参考。
示例输出
user@R6> show interfaces terse Interface Admin Link Proto Local Remote so-0/0/0 up up so-0/0/0.0 up up inet 10.1.56.2/30 iso so-0/0/2 up up so-0/0/2.0 up up inet 10.1.26.2/30 iso so-0/0/3 up up so-0/0/3.0 up up inet 10.1.36.2/30 iso [...Output truncated...]
以下示例输出来自 R2
:
user@R2> show route 10.0.0.5 inet.0: 22 destinations, 25 routes (22 active, 0 holddown, 0 hidden) + = Active Route, - = Last Active, * = Both 10.0.0.5/32 *[Static/5] 00:16:21 > to 10.1.26.2 via so-0/0/2.0 [BGP/170] 3d 20:23:35, MED 5, localpref 100 AS path: 65001 I > to 10.1.12.1 via so-0/0/0.0
意义
示例输出显示,所有R6
接口均已启动。的输出R2
显示,在至 R6
(10.1.26.2
) 的点上R2
配置的静态路由 [Static/5
] 是首选路由,R5
因为它的优先级值较低。但是,路由是从到的环路R2
,如缺少对 R5
(10.1.15.2
) 的引用R6
所示。
采取适当的措施解决网络问题
问题
描述
适当的措施取决于您隔离的问题类型。在此示例中,从 [routing-options
] 层次结构级别中删除在上R2
配置的静态路由。其他适当的操作可能包括以下内容:
解决 方案
检查本地路由器的配置,并在适当时进行编辑。
对中间路由器进行故障排除。
检查远程主机配置,并在适当时进行编辑。
路由协议故障排除。
确定其他可能的原因。
要解决此示例中的问题,请输入以下 Junos OS CLI 命令:
[edit] user@R2# delete routing-options static routedestination-prefix
user@R2# commit and-quit user@R2# show routedestination-prefix
示例输出
[edit] user@R2# delete routing-options static route 10.0.0.5/32 [edit] user@R2# commit and-quit commit complete Exiting configuration mode user@R2> show route 10.0.0.5 inet.0: 22 destinations, 24 routes (22 active, 0 holddown, 0 hidden) + = Active Route, - = Last Active, * = Both 10.0.0.5/32 *[BGP/170] 3d 20:26:17, MED 5, localpref 100 AS path: 65001 I > to 10.1.12.1 via so-0/0/0.0
意义
示例输出显示从 [routing-options
] 层次结构中删除的静态路由和提交的新配置。命令的 show route
输出现在将 BGP 路由显示为首选路由,如星号 (*
) 所示。
评估解决方案以检查网络问题是否已解决
问题
描述
如果问题得到解决,您就完成了。如果问题仍然存在或发现了新问题,请重新开始此过程。
您可以按任意顺序解决可能的原因。关于 隔离中断网络连接的网络,我们选择从本地路由器到远程路由器,但您可以从不同的点开始,特别是如果您有理由相信问题与已知问题有关,例如最近的配置更改。
解决 方案
要评估解决方案,请输入以下 Junos OS CLI 命令:
user@host> show route (ip-address
|host-name
) user@host> ping (ip-address
|host-name
) user@host> traceroute (ip-address
|host-name
)
示例输出
user@R6> show route 10.0.0.5 inet.0: 20 destinations, 20 routes (20 active, 0 holddown, 0 hidden) + = Active Route, - = Last Active, * = Both 10.0.0.5/32 *[BGP/170] 00:01:35, MED 5, localpref 100, from 10.0.0.2 AS path: 65001 I > to 10.1.26.1 via so-0/0/2.0 user@R6> ping 10.0.0.5 PING 10.0.0.5 (10.0.0.5): 56 data bytes 64 bytes from 10.0.0.5: icmp_seq=0 ttl=253 time=0.866 ms 64 bytes from 10.0.0.5: icmp_seq=1 ttl=253 time=0.837 ms 64 bytes from 10.0.0.5: icmp_seq=2 ttl=253 time=0.796 ms ^C --- 10.0.0.5 ping statistics --- 3 packets transmitted, 3 packets received, 0% packet loss round-trip min/avg/max/stddev = 0.796/0.833/0.866/0.029 ms user@R6> traceroute 10.0.0.5 traceroute to 10.0.0.5 (10.0.0.5), 30 hops max, 40 byte packets 1 10.1.26.1 (10.1.26.1) 0.629 ms 0.538 ms 0.497 ms 2 10.1.12.1 (10.1.12.1) 0.534 ms 0.538 ms 0.510 ms 3 10.0.0.5 (10.0.0.5) 0.776 ms 0.705 ms 0.672 ms
意义
示例输出显示,与“命令”show route
之间R5.
R6
现在存在连接,表明首选R5
的 BGP 路由,如星号 (*
) 所示。命令ping
成功traceroute
,命令显示,从R6
到R5
的路径通过 R2
(10.1.26.1
),然后通过 R1
(10.1.12.1
)。
跟踪错误状况的检查清单
问题
描述
表 2 提供了用于配置路由协议守护程序跟踪、边界网关协议 (BGP)、中间系统到中间系统 (IS-IS) 协议以及开放式最短路径优先 (OSPF) 协议跟踪以诊断错误情况的链接和命令。
解决 方案
任务 |
命令或操作 |
---|---|
配置路由协议进程跟踪 | |
|
|
|
|
监控启动filename |
|
监控停止 filename |
|
配置 BGP 特定的选项 | |
|
|
|
|
|
|
配置 IS-IS 特定选项 | |
|
|
|
|
|
|
配置 OSPF 特定的选项 | |
|
|
|
配置路由协议进程跟踪
行动
要配置路由协议进程 (rpd) 跟踪,请执行以下步骤:
在配置模式下,转到以下层级:
[edit] user@host# edit routing-options traceoptions
配置文件、文件大小、编号和标志:
[edit routing-options traceoptions] user@host# set file filename size size file number [edit routing-options traceoptions] user@host# set flag flag
例如:
[edit routing-options traceoptions] user@host# set file daemonlog size 10240 files 10 [edit routing-options traceoptions] user@host# set flag general
验证配置:
user@host# show
例如:
[edit routing-options traceoptions] user@host# show file daemonlog size 10k files 10; flag general;
提交配置:
user@host# commit
某些跟踪选项标记会生成大量信息。跟踪还可以降低路由协议的操作速度。如果不再需要 traceoptions 配置,请将其删除。
查看包含详细消息的文件内容:
user@host# run show log filename
例如:
[edit routing-options traceoptions] user@pro4-a# run show log daemonlog Sep 17 14:17:31 trace_on: Tracing to "/var/log/daemonlog" started Sep 17 14:17:31 Tracing flags enabled: general Sep 17 14:17:31 inet_routerid_notify: Router ID: 10.255.245.44 Sep 17 14:17:31 inet_routerid_notify: No Router ID assigned Sep 17 14:17:31 Initializing LSI globals Sep 17 14:17:31 LSI initialization complete Sep 17 14:17:31 Initializing OSPF instances Sep 17 14:17:31 Reinitializing OSPFv2 instance master Sep 17 14:17:31 OSPFv2 instance master running [...Output truncated...]
意义
表 3 列出了 Junos 支持的路由协议守护程序跟踪的跟踪标志和示例输出。
跟踪标志 |
描述 |
示例输出 |
---|---|---|
所有 |
所有运维 |
不可用。 |
一般 |
正常运行和路由表更改 |
不可用。 |
正常 |
正常运行 |
不可用。 |
政策 |
策略操作和操作 |
11 月 29 22:19:58 导出:Dest 10.0.0.0 proto 静态 11 月 29 日 22:19:58 policy_match_qual_or: 资格赛 proto 感知: 11 月 0 日 29 22:19:58 policy_match_qual_or:资格赛 proto 感知:11 月 29 日 22:19:58 导出:Dest 10.10.10 proto IS-IS |
路线 |
路由表更改 |
11 月 29 日 22:23:59 11 月 29 日 22:23:59 rtlist_walker_job:rt_list步为 RIB inet.0 开始,有 42 个条目开始 11 月 29 日 22:23:59 rt_flash_update_callback: flash KRT (inet.0) 开始 11 月 29 日 22:59 23:59 rt_flash_update_callback: flash KRT (inet.0) 完成 11 月 29 日 22:23:59 rtlist_walker_job: rt_list步 inet.0 以 42 个条目结束 11 月 29 日 22:23:59 KRT 请求: 发送 len 68 v14 seq 0 更改路由/用户 af 2 addr 172.16.0.0 nhop 类型单播 nhop 10.10.10.33 Nov 29 22:23:59 KRT 请求:发送 len 68 v14 seq 0 ADD 路由/用户 af 2 addr 172.17.0 nhop-type 单播 nhop 10.10.10.33 十一月 29 日 22:23:59 KRT 请求:发送 len 68 v14 seq 0 ADD 路由/用户 af 2 add 10.149.3.0 nhop 型单播 nhop 10.10.10.33 11 月 29 日 22:24:19 trace_on: 跟踪到“/var/log/rpdlog”的 11 月 29 日 22:24:19 KRT 请求:发送 len 68 v14 seq 0 DELETE 路由/用户 af 2 addr 10.10.2 18.0 nhop 类型单播 nhop 10.10.10.29 11 月 29 日 22:24:19 版本 10.10.218.0 255. 255.255.0 gw 10.10.29,10.10.10.33 BGP pref 170/-101 指标 so-1/1/0.0,so-1/1/1.0 <Release Delete Int Ext>如 65401 11 月 29 日 22:24:19 KRT 请求: 发送 len 68 v14 seq 0 DELETE 路由/用户 af 2 addr 172.18.0 nhop 类型单播 nhop 10.10.10.33 |
状态 |
状态转换 |
不可用。 |
任务 |
接口事务和处理 |
11 月 29 日 22:50:04 前台调度运行作业task_collect任务时间表 11 月 29 日 22:50:04 task_collect_job:释放任务MGMT_Listen (DELETED) 11 月 29 日 22:50:04 前台调度已完成作业task_collect 任务时间表 11 月 29 日 22:50:04 任务 RT 的后台调度运行作业rt_static_update 11 月 29 日 22:50:04 task_job_delete:删除任务 RT 的后台作业rt_static_update 11 月 29 日 22:50:04 后台调度完成的任务rt_static_updateRT 11 月 29 日 22:50:04 后台调度运行作业 RT 任务闪存更新 11 月 29 日 22:50:04 后台调度返回的任务 RT 闪存更新 11 月 29 日 22:50:04 后台调度运行作业 RT 闪存更新 11 月 11 日 29 22:50:04 task_job_delete:删除任务 RT 的背景作业闪存更新 11 月 29 日 22:50:04 背景调度完成任务 RT 的作业闪存更新 11 月 29 日 22:50:04 任务 RT 的后台调度运行作业闪存更新11 月 29 日 22:50:04 task_job_delete:删除任务 RT 的背景作业闪存更新 |
计时 器 |
计时器使用 |
11 月 29 22:52:07 task_timer_hiprio_dispatch:运行 1 个计时器 11 月 29 日 22:52:07 主:运行正常优先级计时器队列 11 月 29 日 22:52:07 主干:ran 1 计时器 11 月 29 日 22:52:52: 07 task_timer_hiprio_dispatch:运行高优先级计时器队列 11 月 29 日 22:52:07 task_timer_hiprio_dispatch:运行 1 个计时器 11 月 29 日 22:52:07 主干:运行正常优先级计时器队列 11 月 29 日 22:52:07 主干: 运行 11 月 29 日 22:52:07 主:运行正常优先级计时器队列 11 月 29 日 22:52:07 主:ran 2 个计时器 |
为特定路由协议配置路由协议跟踪
行动
要为特定路由协议配置路由协议跟踪,请执行以下步骤:
在配置模式下,转到以下层级:
[edit] user@host# edit protocol protocol-name traceoptions
配置文件、文件大小、编号和标志:
[edit protocols protocol name traceoptions] user@host# set file filename size size files number [edit protocols protocol name traceoptions] user@host# set flag flag
例如:
[edit protocols ospf traceoptions] user@host# set file ospflog size 10240 files 10 [edit protocols ospf traceoptions] user@host# set flag general
验证配置:
user@host# show
例如:
[edit protocols ospf traceoptions] user@host# show file ospflog size 10k files 10; flag general;
提交配置:
user@host# commit
查看包含详细消息的文件内容:
user@host# run show log filename
例如:
[edit protocols ospf traceoptions] user@pro4-a# run show log ospflog Sep 17 14:23:10 trace_on: Tracing to "/var/log/ospflog" started Sep 17 14:23:10 rt_flash_update_callback: flash OSPF (inet.0) start Sep 17 14:23:10 OSPF: multicast address 224.0.0.5/32, route ignored Sep 17 14:23:10 rt_flash_update_callback: flash OSPF (inet.0) done Sep 17 14:23:10 CHANGE 10.255.245.46/32 gw 10.10.208.67 OSPF pref 10/0 metric 1/0 fe-0/0/0.0 <Delete Int> Sep 17 14:23:10 CHANGE 10.255.245.46/32 gw 10.10.208.67 OSPF pref 10/0 metric 1/0 fe-0/0/0.0 <Active Int> Sep 17 14:23:10 ADD 10.255.245.46/32 gw 10.10.208.67 OSPF pref 10/0 metric 1/0 fe-0/0/0.0 <Active Int> Sep 17 14:23:10 CHANGE 10.255.245.48/32 gw 10.10.208.69 OSPF pref 10/0 metric 1/0 fe-0/0/0.0 <Delete Int> Sep 17 14:23:10 CHANGE 10.255.245.48/32 gw 10.10.208.69 OSPF pref 10/0 metric 1/0 fe-0/0/0.0 <Active Int> Sep 17 14:23:10 ADD 10.255.245.48/32 gw 10.10.208.69 OSPF pref 10/0 metric 1/0 fe-0/0/0.0 <Active Int> Sep 17 14:23:10 rt_close: 4/4 routes proto OSPF [...Output truncated...]
意义
表 4 列出了全局可用或可应用于特定协议的标准跟踪选项。您还可以为特定的 BGP 对等组或对等组配置跟踪。有关更多信息,请参阅 Junos System Basics 配置指南。
跟踪标志 |
描述 |
---|---|
所有 |
所有运维 |
一般 |
正常运行和路由表更改 |
正常 |
正常运行 |
政策 |
策略操作和操作 |
路线 |
路由表更改 |
状态 |
状态转换 |
任务 |
接口事务和处理 |
计时 器 |
计时器使用 |
近乎实时地监控写入的跟踪文件消息
目的
在将消息写到跟踪文件中时近乎实时地监控这些消息。
行动
要近乎实时地监控将消息写入跟踪文件,请使用以下 Junos OS 命令行界面 (CLI) 操作模式命令:
user@host> monitor start filename
示例输出
命令名称
user@host> monitor start isis user@host> *** isis *** Sep 15 18:32:21 Updating LSP isis5.02-00 in database Sep 15 18:32:21 Updating L2 LSP isis5.02-00 in TED Sep 15 18:32:21 Adding a half link from isis5.02 to isis6.00 Sep 15 18:32:21 Adding a half link from isis5.02 to isis5.00 Sep 15 18:32:21 Adding a half link from isis5.02 to isis6.00 Sep 15 18:32:21 Adding a half link from isis5.02 to isis5.00 Sep 15 18:32:21 Scheduling L2 LSP isis5.02-00 sequence 0xd87 on interface fxp2.3 Sep 15 18:32:21 Updating LSP isis5.00-00 in database Sep 15 18:32:21 Updating L1 LSP isis5.00-00 in TED Sep 15 18:32:21 Sending L2 LSP isis5.02-00 on interface fxp2.3 Sep 15 18:32:21 sequence 0xd87, checksum 0xc1c8, lifetime 1200
停止跟踪文件监控
行动
要近乎实时地停止监控跟踪文件,在开始监控后,使用以下 Junos OS CLI 操作模式命令:
user@host monitor stop filename
示例输出
user@host> monitor start isis user@host> *** isis *** Sep 15 18:32:21 Updating LSP isis5.02-00 in database Sep 15 18:32:21 Updating L2 LSP isis5.02-00 in TED Sep 15 18:32:21 Adding a half link from isis5.02 to isis6.00 Sep 15 18:32:21 Adding a half link from isis5.02 to isis5.00 Sep 15 18:32:21 Adding a half link from isis5.02 to isis6.00 Sep 15 18:32:21 Adding a half link from isis5.02 to isis5.00 Sep 15 18:32:21 Scheduling L2 LSP isis5.02-00 sequence 0xd87 on interface fxp2.3 Sep 15 18:32:21 Updating LSP isis5.00-00 in database Sep 15 18:32:21 Updating L1 LSP isis5.00-00 in TED Sep 15 18:32:21 Sending L2 LSP isis5.02-00 on interface fxp2.3 Sep 15 18:32:21 sequence 0xd87, checksum 0xc1c8, lifetime 1200 monitor stop isis user@host>