EX3400 组件故障排除
了解 EX 系列交换机上的告警类型和严重性级别
本主题仅适用于 J-Web 应用程序包。
警报会提醒您注意可能妨碍交换机正常运行的情况。在监控瞻博网络 EX 系列以太网交换机上的告警之前,请熟悉 表 1 中定义的术语。
期限 |
定义 |
|---|---|
alarm |
发出警报,提醒您注意可能妨碍正常运行的情况。在交换机上,报警信号是机箱正面亮起的 ALM LED。 |
alarm condition |
触发告警的故障事件。 |
alarm severity |
警报的严重性。如果告警 (ALM) LED 为红色,则表示存在重大告警。如果报警 LED 为黄色或琥珀色,则表示轻微报警。如果报警 LED 不亮,则没有报警或交换机已停止。 |
chassis alarm |
由交换机上的物理状况(如电源故障、组件温度过高或介质故障)触发的预设告警。 |
system alarm |
由于缺少救援配置或未能安装许可软件功能的许可证而触发的预设告警。
注意:
在 EX6200 交换机上,内部链路错误可能会触发系统告警。 |
报警类型
交换机支持以下报警:
机箱报警可指示交换机或其某个组件出现故障。机箱警报是预设的,无法修改。
系统报警指示缺少救援配置。系统报警是预设的,无法修改,但您可以将其配置为自动显示在 J-Web 界面显示或 CLI 显示中。
报警严重性级别
交换机上的告警有两个严重级别:
主要(红色)— 表示交换机上由于以下情况之一而出现的危急情况。红色报警情况需要立即采取行动。
一个或多个硬件组件出现故障。
一个或多个硬件组件已超过温度阈值。
接口上配置的告警条件触发了严重警告。
轻微(黄色或琥珀色)— 表示交换机上的非严重状况,如果不选中该情况,可能会导致服务中断或性能下降。黄色或琥珀色报警情况需要监控或维护。
缺少救援配置将生成黄色或琥珀色系统告警。
也可以看看
EX3400 交换机上的机箱组件报警情况
本主题介绍 EX3400 交换机上的机箱组件报警情况。
表 2 列出了 EX3400 交换机上的告警条件、其严重性级别以及您可以采取的响应措施。
机箱组件 |
报警情况 |
报警严重性 |
补救措施 |
|---|---|---|---|
| 风扇模块 | 未安装风扇模块。 |
主要(红色) |
安装风扇模块。 |
混合使用不同气流方向的风扇模块。 |
主要(红色) |
请勿在同一机箱中混用具有不同气流方向的风扇模块。 |
|
混合使用具有不同气流方向的风扇模块和电源。 |
主要(红色) |
请勿在同一机箱中混用不同方向的风扇模块和气流方向的电源。 |
|
| 电源 | 电源已从机箱上拔下。 |
次要(黄色) |
在空插槽中安装电源。 |
电源未打开。 |
次要(黄色) |
检查电源的输入连接。 |
|
安装了未知电源。 |
主要(红色) |
安装瞻博网络推荐的电源。 |
|
混合使用具有不同气流方向的电源。 |
主要(红色) |
请勿在同一机箱中混用不同方向的气流电源。 |
|
混合使用具有不同气流方向的风扇模块和电源。 |
主要(红色) |
请勿在同一机箱中混用不同方向的风扇模块和气流方向的电源。 |
|
| 温度 | 机箱内部温度达到黄色报警限值。 |
次要(黄色) |
|
机箱内部温度达到红色报警限值。 |
主要(红色) |
|
|
温度传感器出现故障。 |
主要(红色) |
使用 https://www.juniper.net/support/ 的案例管理器链接创建支持案例,或致电 1-888-314-5822(美国和加拿大境内的免费电话)或 1-408-745-9500(美国境外)。 |
|
| 管理以太网接口 | 管理以太网链路已关闭。 |
主要(红色) |
|
| 路由引擎 | /var 分区使用率很高。 |
次要(黄色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
/var 分区已满。 |
主要(红色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
|
未设置救援配置。 |
次要(黄色) |
使用命令 |
|
功能使用需要许可证,或者功能使用的许可证已过期。 |
次要(黄色) |
安装警报中指定功能所需的许可证。有关更多信息,请参阅 了解 EX 系列交换机的软件许可证。 |
也可以看看
使用 J-Web 界面检查活动报警
目的
本主题仅适用于 J-Web 应用程序包。
使用监控功能查看 EX 系列交换机的告警信息,包括告警类型、告警严重性以及交换平台上每个活动告警的简要说明。
行动
要查看活动警报,请执行以下作:
在 J-Web 界面中选择监控>事件和告警>查看告警。
根据告警类型、严重性、描述和日期范围选择告警过滤器。
单击 Go。
将显示与过滤器匹配的所有告警。
交换机重置时,将显示活动告警。
意义
表 3 列出了报警输出字段。
字段 |
价值观 |
|---|---|
类型 |
报警类别:
|
严重性 |
报警严重性 - 主要(红色)或次要(黄色或琥珀色)。 |
描述 |
警报的简要概要。 |
时间 |
检测到故障的日期和时间。 |
也可以看看
监控系统日志消息
目的
本主题仅适用于 J-Web 应用程序包。
使用监控功能过滤和查看 EX 系列交换机的系统日志消息。
行动
要在 J-Web 界面中查看事件,请选择 Monitor > Events and Alarms > View Events。
应用筛选器或筛选器组合来查看邮件。您可以使用过滤器来显示相关事件。 表 4 介绍了不同的过滤器、其功能以及相关作。
要查看 CLI 中的事件,请输入以下命令:
show log
字段 |
功能 |
您的作 |
|---|---|---|
系统日志文件 |
指定要显示其记录事件的系统日志文件的名称。 列出您配置的所有系统日志文件的名称。 默认情况下,目录中 |
要指定特定文件中记录的事件,请从列表中选择系统日志文件名,例如消息。 选择 “包括存档文件” 以将存档文件包含在搜索中。 |
流程 |
指定生成要显示的事件的进程的名称。 要查看系统上运行的所有进程,请输入 CLI 命令 有关进程的更多信息,请参阅 Junos OS 安装和升级指南。 |
要指定进程生成的事件,请键入进程的名称。 例如,键入 |
日期开始 自 |
指定生成要显示的事件的时间段。 显示日历,允许您选择年、月、日和时间。它还允许您选择当地时间。 默认情况下,显示最近一小时内生成的消息。结束时间显示当前时间,开始时间显示结束时间前一小时的时间。 |
要指定时间段:
|
事件 ID |
指定要为其显示消息的事件 ID。 允许您键入部分 ID 并自动完成其余部分。 事件 ID(也称为系统日志消息代码)可唯一标识系统日志消息。它以一个前缀开头,表示生成软件进程或库。 |
要指定具有特定 ID 的事件,请键入部分或完整 ID,例如 TFTPD_AF_ERR。 |
描述 |
指定要显示的事件描述中的文本。 允许您使用正则表达式来匹配事件描述中的文本。
注意:
正则表达式匹配区分大小写。 |
要指定具有特定描述的事件,请使用正则表达式键入描述中的文本字符串。 例如,键入 ^Initial* 以显示以术语 Initial开头的所有消息。 |
搜索 |
应用指定的筛选器并显示匹配的消息。 |
要应用过滤器并显示邮件,请单击 搜索。 |
重置 |
重置“事件过滤器”框中的所有字段。 |
若要重置“事件过滤器”框中列出的字段值,请单击 “重置”。 |
生成原始报告
注意:
|
以非表格格式生成事件日志消息列表。 |
要生成原始报告:
|
生成报告
注意:
从 Junos OS 14.1X53 版开始,可以根据事件详细信息表中加载的事件日志消息生成格式化报告。“生成报告”按钮仅在事件日志消息完全加载到“事件详细信息”(Events Detail) 表中后才显示。加载事件日志消息时,将显示生成原始报告按钮。 |
以表格形式生成事件日志消息列表,其中显示系统详细信息、事件过滤器条件和事件详细信息。 |
要生成格式化报告,请执行以下作:
|
意义
表 5 介绍了“事件摘要”字段。
默认情况下,J-Web 界面中的“查看事件”页面会显示最近的 25 个事件,严重性级别以不同的颜色突出显示。指定过滤器后,事件摘要将显示与指定过滤器匹配的事件。单击 第一个、 下一个、 上一个和 最后一个 链接以浏览消息。
字段 |
功能 |
其他信息 |
|---|---|---|
流程 |
显示生成系统日志消息的进程的名称和 ID。 |
对于在本地路由引擎上生成的消息,此字段中显示的信息与在另一个路由引擎上生成的消息(在安装了两个路由引擎且可运行的系统上)上生成的信息不同。来自其他路由引擎的消息还包括标识路由引擎的标识符 re0 和 re1 。 |
严重性 |
邮件的严重性级别由不同的颜色表示。
|
严重性级别表示触发事件对交换机功能影响的严重程度。配置用于记录设施的位置时,还要为该设施指定严重性级别。只有来自该级别或更高级别设备中的消息才会记录到指定文件。 |
事件 ID |
显示唯一标识邮件的代码。 每个代码上的前缀标识消息源,代码的其余部分表示特定事件或错误。 |
事件 ID 以表示生成软件进程的前缀开头。 交换机上的某些进程不使用代码。在从此类进程生成的消息中,此字段可能是空的。 事件可以属于以下类型类别之一:
|
活动描述 |
显示消息的更详细说明。 |
|
时间 |
显示记录消息的时间。 |
也可以看看
排除具有 PoE 功能的 EX2300、EX3400、EX4300 或 EX4400 交换机型号中的 PoE 电压注入故障
问题
描述
从具有以太网供电 (PoE) 功能的 EX2300、EX3400、EX4300 或 EX4400 交换机型号供电的设备不会从这些交换机获取电力。重新启动交换机或升级到最新版本的 Junos OS 后,问题仍然存在。在初始安装期间,PoE 在瞻博网络 EX3400、EX2300、EX4300 或 EX4400 设备上停止工作。值得注意的是,连接到 POE 设备的新 PD 不会通电。
-
当交换机 - EX2200、EX3200、EX4200 和 EX4400 的 PoE 端口连接到 EX3400、EX4300、EX2300、EX4400 交换机上的 PoE 端口时,EX4300、EX3400、EX2300、EX4400 交换机上的 PoE 功能将受到影响。这是预期行为。
-
当一台 EX3400 连接到另一台 EX3400 或一台 EX4300 连接到 EX3400 时,PoE 将以正常方式运行 — 这是预期行为。
通过分析瞻博网络交换机上的 PoE 端口状态来调试和确认电压注入
可以通过在 EX3400、EX2300、EX4300 和 EX4400 上启用 syslog any any 来识别 PoE 端口扫描上的电压注入。
在show log消息中,任何状态为36的POE电压注入端口都表示存在此问题。这是由于 EX3400、EX4300、EX2300 和 EX4400 上的端口注入了 PoE 电源所致。
端口状态 36 是由于交换机相互供电造成的。这是因为瞻博网络交换机支持传统设备检测。支持传统检测的交换机会将其他交换机检测为传统设备,并相互供电。
解决方案
将上行链路设备连接到 EX3400、EX4300、EX2300、EX4400 时,请确保接口(上行链路设备)上的 PoE 已禁用。只有在连接了接入点/VOIP 电话或任何其他 PoE 供电设备的接口上才能启用 PoE。
使用以下命令
set poe interface <interface name>
将 EX4200、EX3200、EX2200 连接到 EX4400、EX4300、EX3400 和 EX2300 时,禁用传统交换机(EX4200、EX3200、EX2200)上的 PoE,如下所示:
set poe interface ge-0/0/0 disable
也可以看看
在 EX2300 和 EX3400 交换机中升级 Junos OS 时排除存储问题
问题
描述
在 EX2300 和 EX3400 交换机中升级 Junos OS 失败。
症状
在 EX2300 和 EX3400 交换机中升级 Junos OS 时,您会收到错误 not enough space to unpack installation-pack-name。
原因
交换机中的内存不足,无法安装升级安装包。
解决方案
如果由于交换机内存不足而导致在 EX2300 和 EX3400 交换机中升级 Junos OS 失败:
使用以下命令执行系统存储清理并删除系统存储中不需要的文件:
user@switch> request system storage cleanup
注意:您可以使用以下命令获取此命令删除的文件列表:
user@switch> request system storage cleanup dry-run
此命令不会删除 根 文件夹中的文件;它仅删除文件夹 jail、 log 和 tmp 中的文件。
如果任何目录占用大量内存,请删除该目录中不需要的文件。使用以下命令检查内存利用率:
user@switch> show system storage
删除非恢复快照。
如果交换机中安装了 Junos OS 15.1X53D56 或更高版本:
使用以下命令删除非恢复快照:
user@switch> request system software add software-image-name force
如果交换机中安装了早于 Junos OS 15.1X53D56 发布的 Junos OS 版本:
使用以下命令检查非恢复快照:
user@switch> show system snapshot
-
注意:
快照名称不会在 CLI 中自动完成;您必须输入快照名称。
使用以下命令删除非恢复快照:
user@switch> request system snapshot delete snapshot-name
升级 Junos OS 后,请使用以下命令删除升级安装包:
user@switch> request system software add software-image-name force unlink
也可以看看
排除 EX 系列交换机中的温度告警
本主题是通用主题,适用于所有 EX 系列交换机。根据交换机的不同,输出可能会有所不同。例如,在 EX4100-H-12MP 等无风扇交换机中,任何风扇相关信息均不适用。
问题
描述
当交换机温度过高时,EX 系列交换机会触发温度告警 FPC 0 EX-PFE1 Temp Too Hot 。
原因
机箱中的温度传感器可监控机箱的温度。如果风扇发生故障或机箱温度因其他原因超过允许水平,交换机将触发告警。
解决方案
当交换机触发温度告警(如告警) FPC 0 EX-PFE1 Temp Too Hot 时,请使用 和 和 show chassis environment show chassis temperature-thresholds 命令识别触发告警的情况。
为防止开关过热,请在环境温度在推荐范围内的区域作。为防止气流受限,通风口周围至少留出 6 英寸(15.2 厘米)的间隙。有关 EX4100-H-12MP 交换机,请参阅 EX4100-H 站点准则和要求中的环境准则。
-
使用 Telnet 连接到交换机,然后发出
show chassis environment命令。此命令显示有关交换机机箱的环境信息,包括温度。该命令还显示有关风扇、电源和路由引擎的信息。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出与此类似。请注意,对于无风扇交换机(如 EX4100-H-12MP),风扇输出不会显示在输出中。show chassis environment(EX9208 交换机)
user@switch> show chassis environment Class Item Status Measurement Temp PEM 0 OK 40 degrees C / 104 degrees F PEM 1 OK 40 degrees C / 104 degrees F PEM 2 Absent PEM 3 Absent Routing Engine 0 OK 37 degrees C / 98 degrees F Routing Engine 0 CPU OK 35 degrees C / 95 degrees F Routing Engine 1 Absent Routing Engine 1 CPU Absent CB 0 Intake OK 36 degrees C / 96 degrees F CB 0 Exhaust A OK 34 degrees C / 93 degrees F CB 0 Exhaust B OK 40 degrees C / 104 degrees F CB 0 ACBC OK 39 degrees C / 102 degrees F CB 0 XF A OK 46 degrees C / 114 degrees F CB 0 XF B OK 45 degrees C / 113 degrees F CB 1 Intake Absent CB 1 Exhaust A Absent CB 1 Exhaust B Absent CB 1 ACBC Absent CB 1 XF A Absent CB 1 XF B Absent FPC 3 Intake OK 48 degrees C / 118 degrees F FPC 3 Exhaust A OK 46 degrees C / 114 degrees F FPC 3 Exhaust B OK 51 degrees C / 123 degrees F FPC 3 XL TSen OK 67 degrees C / 152 degrees F FPC 3 XL Chip OK 58 degrees C / 136 degrees F FPC 3 XL_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR0 Chip OK 51 degrees C / 123 degrees F FPC 3 XL_XR1 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR1 Chip OK 63 degrees C / 145 degrees F FPC 3 XQ TSen OK 67 degrees C / 152 degrees F FPC 3 XQ Chip OK 63 degrees C / 145 degrees F FPC 3 XQ_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XQ_XR0 Chip OK 68 degrees C / 154 degrees F FPC 3 XM TSen OK 67 degrees C / 152 degrees F FPC 3 XM Chip OK 76 degrees C / 168 degrees F FPC 3 XF TSen OK 67 degrees C / 152 degrees F FPC 3 XF Chip OK 75 degrees C / 167 degrees F FPC 3 PLX PCIe Switch TSe OK 51 degrees C / 123 degrees F FPC 3 PLX PCIe Switch Chi OK 54 degrees C / 129 degrees F FPC 3 Aloha FPGA 0 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 0 Chip OK 70 degrees C / 158 degrees F FPC 3 Aloha FPGA 1 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 1 Chip OK 75 degrees C / 167 degrees F FPC 5 Intake Testing FPC 5 Exhaust A Testing FPC 5 Exhaust B Testing Fans Top Rear Fan OK Spinning at intermediate-speed Bottom Rear Fan OK Spinning at intermediate-speed Top Middle Fan OK Spinning at intermediate-speed Bottom Middle Fan OK Spinning at intermediate-speed Top Front Fan OK Spinning at intermediate-speed Bottom Front Fan OK Spinning at intermediate-speed表 6 列出了命令
show chassis environment的输出字段。该表按输出字段的大致出现顺序列出了输出字段。表 6: show chassis environment输出字段字段名称
字段说明
Class有关机箱组件的类别或类别的信息:
-
Temp:流经机箱的空气温度,单位为摄氏度 (°C) 和华氏度 (°F) -
Fans:有关风机和鼓风机状态的信息
Item有关机箱组件的信息:
-
灵活的 PIC 集中器 (FPC) — 即线卡
-
控制板 (CB)
-
路由引擎
-
电源入口模块 (PEM) — 即电源
Status指定机箱组件的状态。例如,如果 是
Fans,则Class风扇状态可以是:-
OK:风扇正在运行。 -
Testing:风扇在初次开机期间正在接受测试。 -
Failed:风扇出现故障或风扇不旋转。 -
Absent:未安装风扇托架。
Measurement取决于班级。例如,如果 是
Temp,表示Class温度(单位为摄氏度 (°C))和华氏度 (°F)。如果是ClassFans,则表示风扇的实际转速。 -
-
发出命令
show chassis temperature-thresholds。此命令显示机箱温度阈值设置。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出与此类似。show chassis temperature-thresholds(EX9208 交换机)user@ host> show chassis temperature-thresholds Fan speed Yellow alarm Red alarm Fire Shutdown (degrees C) (degrees C) (degrees C) (degrees C) Item Normal High Normal Bad fan Normal Bad fan Normal Chassis default 48 54 65 55 80 65 100 Routing Engine 0 70 80 95 95 110 110 112 FPC 3 55 60 75 65 105 80 110 FPC 5 55 60 75 65 90 80 95下表列出了命令
show chassis temperature-thresholds的输出字段。该表按输出字段的大致出现顺序列出了输出字段。表 7: show chassis temperature-thresholds输出字段字段名称
字段说明
项目
机箱组件。您可以为每个 FRU 中每个插槽的组件(如机箱、路由引擎和 FPC)配置阈值信息,以便在输出中显示。默认情况下,仅显示机箱和路由引擎的信息。
风扇速度
风扇正常高速运行的温度阈值(以摄氏度为单位)。
-
正常 — 风扇以正常速度运行以及所有风扇都存在并正常运行时的温度阈值。
-
高 — 风扇高速运行时或风扇出现故障或丢失时的温度阈值。
注意:当温度超过黄色、琥珀色或红色报警的阈值设置时,将触发告警。
黄色或琥珀色报警
触发黄色或琥珀色报警的温度阈值(以摄氏度为单位)。
-
正常 — 当风扇全速运行时,必须超过设备上的温度阈值才能触发黄色或琥珀色告警。
-
风扇故障 — 当一个或多个风扇出现故障或丢失时,必须超过设备上的温度阈值才能触发黄色或琥珀色告警。
红色报警
温度阈值(以摄氏度为单位)会触发红色告警。
-
正常 — 当风扇全速运行时,必须超过设备上的温度阈值才能触发红色告警。
-
风扇故障 — 当一个或多个风扇出现故障或丢失时,必须超过设备上的温度阈值才能触发红色告警。
消防关闭
温度阈值,以摄氏度为单位,在发生火灾时开关关闭的温度阈值。
-
触发温度告警时,您可以运行命令 show chassis environment 以显示每个组件的机箱温度值,并将这些温度值与温度阈值进行比较,从而确定触发温度告警的条件。您可以通过运行 show chassis temperature-thresholds 命令来显示温度阈值。
例如,对于 FPC 3:
-
如果温度
FPC 3超过 55° C,则输出指示风扇正在高速运行(不会触发警报)。 -
如果温度
FPC 3超过 65°C,则会触发黄色告警,表示一个或多个风扇出现故障。 -
如果温度
FPC 3超过 75° C,则会触发黄色告警,表示超过温度阈值限制。 -
如果温度
FPC 3超过 80°C,则会触发红色告警,表示一个或多个风扇出现故障。 -
如果温度
FPC 3超过 105° C,则会触发红色告警,表示超过温度阈值限制。 -
如果温度
FPC 3超过 110°C,则开关断电。
表 8 列出了交换机生成温度告警的可能原因。它还列出了相应的补救措施。
| 原因 |
补救措施 |
|---|---|
| 环境温度高于阈值温度。 |
确保环境温度在阈值温度限制内。请参阅 EX 系列交换机的环境要求和规格。 |
| 风扇模块或风扇托架出现故障。 |
注意:
此步骤不适用于 EX4100-H-12MP 等无风扇交换机
|
| 由于已安装的交换机周围间隙不足,通过交换机的气流受限。 |
确保已安装的交换机周围有足够的间隙。 |
变更历史表
是否支持某项功能取决于您使用的平台和版本。使用 功能资源管理器 确定您的平台是否支持某个功能。