EX4300 组件故障排除
了解 EX 系列交换机上的告警类型和严重性级别
本主题仅适用于 J-Web 应用程序包。
警报会提醒您注意可能会妨碍交换机正常运行的情况。在监控瞻博网络 EX 系列以太网交换机上的告警之前,请熟悉 表 1 中定义的术语。
术语 |
定义 |
---|---|
alarm |
信号提醒您注意可能妨碍正常运行的情况。在交换机上,报警信号是机箱正面亮起的 ALM LED 。 |
alarm condition |
触发警报的故障事件。 |
alarm severity |
警报的严重性。如果警报 (ALM) LED 为红色,则表示发生重大警报。如果警报 LED 为黄色或琥珀色,则表示轻微警报。如果报警 LED 不亮,则没有报警或开关停止。 |
chassis alarm |
由交换机上的物理状况(例如电源故障、组件温度过高或介质故障)触发的预设告警。 |
system alarm |
因缺少救援配置或无法安装许可软件功能的许可证而触发的预设警报。
注意:
在 EX6200 交换机上,内部链路错误可能会触发系统告警。 |
报警类型
交换机支持以下警报:
机箱报警表示交换机或其某个组件出现故障。机箱报警是预设的,无法修改。
系统告警指示缺少救援配置。系统警报是预设的,无法修改,但您可以将其配置为自动显示在 J-Web 界面显示或 CLI 显示中。
报警严重性级别
交换机上的告警有两个严重性级别:
主要(红色) — 表示交换机上由以下情况之一引起的危急情况。红色报警情况需要立即采取行动。
一个或多个硬件组件出现故障。
一个或多个硬件组件已超过温度阈值。
接口上配置的告警情况触发了严重警告。
次要(黄色或琥珀色) — 表示交换机上的非关键情况,如果不加以控制,可能会导致服务中断或性能下降。黄色或琥珀色报警情况需要监控或维护。
缺少救援配置会生成黄色或琥珀色系统告警。
另见
EX4300 交换机上的机箱组件报警情况
本主题介绍 EX4300 交换机上的机箱组件告警情况。
表 2 列出了机箱组件可在 EX4300 交换机上生成的告警、警报的严重性级别以及您可以采取的响应措施。
机箱组件 |
报警情况 |
报警严重性 |
补救 |
---|---|---|---|
电源 | 电源已从机箱中拔下。 |
次要(黄色或琥珀色) |
在空插槽中安装电源。 |
电源输出出现故障。 |
主要(红色) |
检查电源输出连接。 |
|
电源出现故障。 |
主要(红色) |
更换故障电源。 |
|
安装了未知电源。 |
主要(红色) |
安装瞻博网络推荐的电源。 |
|
混合使用不同气流方向的电源。 |
主要(红色) |
请勿在同一机箱内混用不同气流方向的电源。 |
|
风扇模块和电源的混合使用,具有不同的气流方向。 |
主要(红色) |
请勿在同一机箱内混用不同方向的风扇模块和电源以使气流流通。 |
|
风扇模块 | 风扇模块未安装。 |
主要(红色) |
安装风扇模块。 |
风扇模块出现故障。 |
主要(红色) |
更换风扇模块。 |
|
混合使用不同气流方向的风扇模块。 |
主要(红色) |
请勿在同一机箱中混用具有不同气流方向的风扇模块。 |
|
风扇模块和电源的混合使用,具有不同的气流方向。 |
主要(红色) |
请勿在同一机箱内混用不同方向的风扇模块和电源以使气流流通。 |
|
温度 | 机箱内部的温度达到黄色或琥珀色报警限值。 |
次要(黄色或琥珀色) |
|
机箱内的温度达到红色报警限值。 |
主要(红色) |
|
|
管理以太网接口 | 管理以太网链路已关闭 |
主要(红色) |
|
路由引擎 | /var 分区使用率很高。 |
次要(黄色或琥珀色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
/var 分区已满。 |
主要(红色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
|
未设置救援配置。 |
次要(黄色或琥珀色) |
|
|
功能使用需要许可证,或者功能使用的许可证已过期。 |
次要(黄色或琥珀色) |
安装警报中指定功能所需的许可证。有关更多信息,请参阅 了解 EX 系列交换机的软件许可证。 |
另见
使用 J-Web 界面检查活动警报
目的
本主题仅适用于 J-Web 应用程序包。
使用监控功能查看 EX 系列交换机的告警信息,包括告警类型、告警严重程度以及交换平台上每个活动告警的简要说明。
行动
要查看活动警报,请执行以下作:
在 J-Web 界面中选择监控>事件和警报>查看警报。
根据警报类型、严重性、描述和日期范围选择警报过滤器。
单击 “开始”。
将显示与过滤器匹配的所有告警。
重置交换机时,将显示活动报警。
意义
表 3 列出了告警输出字段。
田 |
值 |
---|---|
类型 |
警报类别:
|
严厉 |
警报严重性 - 主要(红色)或次要(黄色或琥珀色)。 |
描述 |
警报的简要概述。 |
时间 |
检测到故障的日期和时间。 |
另见
监控系统日志消息
目的
本主题仅适用于 J-Web 应用程序包。
使用监控功能过滤和查看 EX 系列交换机的系统日志消息。
行动
要在 J-Web 界面中查看事件,请选择监控>事件和警报>查看事件。
应用筛选器或筛选器组合来查看邮件。您可以使用筛选器来显示相关事件。 表 4 介绍了不同的过滤器、它们的功能和关联的作。
要在 CLI 中查看事件,请输入以下命令:
show log
田 |
功能 |
您的作 |
---|---|---|
系统日志文件 |
指定要显示其记录事件的系统日志文件的名称。 列出您配置的所有系统日志文件的名称。 默认情况下,目录中包含 |
若要指定特定文件中记录的事件,请从列表中选择系统日志文件名,例如 消息。 选择 “包括存档文件” 以在搜索中包括存档文件。 |
过程 |
指定生成要显示的事件的进程的名称。 要查看系统上运行的所有进程,请输入 CLI 命令 有关进程的详细信息,请参阅《 Junos OS 安装和升级指南》。 |
若要指定进程生成的事件,请键入该进程的名称。 例如,键入 |
起始日期 自 |
指定生成要显示的事件的时间段。 显示允许您选择年、月、日和时间的日历。它还允许您选择当地时间。 默认情况下,将显示最近 1 小时内生成的消息。“结束时间”显示当前时间,“开始时间”显示结束时间前一小时的时间。 |
要指定时间段,请执行以下作:
|
事件 ID |
指定要为其显示消息的事件 ID。 允许您键入 ID 的一部分并自动完成其余部分。 事件 ID(也称为系统日志消息代码)唯一标识系统日志消息。它以前缀开头,该前缀表示生成软件进程或库。 |
若要指定具有特定 ID 的事件,请键入部分或完整 ID,例如 TFTPD_AF_ERR。 |
描述 |
指定要显示的事件说明中的文本。 允许您使用正则表达式来匹配事件描述中的文本。
注意:
正则表达式匹配区分大小写。 |
若要使用特定描述指定事件,请从描述中键入带有正则表达式的文本字符串。 例如,键入 ^Initial* 以显示以术语 Initial开头的行的所有消息。 |
搜索 |
应用指定的筛选器并显示匹配的消息。 |
若要应用筛选器并显示消息,请单击 “搜索”。 |
重置 |
重置“事件筛选器”框中的所有字段。 |
若要重置“事件筛选器”框中列出的字段值,请单击 “重置”。 |
生成原始报告
注意:
|
以非表格格式生成事件日志消息列表。 |
要生成原始报告,请执行以下作:
|
生成报告
注意:
从 Junos OS 14.1X53 版开始,可以从事件详细信息表中加载的事件日志消息生成格式化报告。“生成报告”按钮仅在“事件详细信息”表中完全加载事件日志消息后才会显示。加载事件日志消息时,将显示“生成原始报告”按钮。 |
以表格格式生成事件日志消息列表,其中显示系统详细信息、事件筛选条件和事件详细信息。 |
要生成格式化的报告,请执行以下作:
|
意义
表 5 介绍了“事件摘要”字段。
默认情况下,J-Web 界面中的“查看事件”页面显示最近 25 个事件,严重性级别以不同颜色突出显示。指定筛选器后,“事件摘要”将显示与指定筛选器匹配的事件。单击 “第一个”、“ 下一个”、“ 上一个”和 “最后一个 ”链接以浏览邮件。
田 |
功能 |
其他信息 |
---|---|---|
过程 |
显示生成系统日志消息的进程的名称和 ID。 |
对于在本地路由引擎上生成的消息,此字段中显示的信息与在其他路由路由引擎上生成的消息(在已安装两个路由引擎并运行的系统上)不同。来自其他路由引擎的消息还包括标识路由引擎的标识符 re0 和 re1 。 |
严厉 |
消息的严重性级别用不同的颜色表示。
|
严重性级别表示触发事件影响交换机功能的严重程度。配置记录设施的位置时,还要指定设施的严重性级别。只有来自分级为该级别或更高级别的设施的邮件才会记录到指定的文件中。 |
事件 ID |
显示唯一标识消息的代码。 每个代码上的前缀标识消息源,代码的其余部分指示特定的事件或错误。 |
事件 ID 以前缀开头,该前缀表示生成软件进程。 交换机上的某些进程不使用代码。在此类进程生成的消息中,此字段可能为空。 事件可以属于以下类型类别之一:
|
事件描述 |
显示消息的更详细解释。 |
|
时间 |
显示记录消息的时间。 |
另见
在具有 PoE 功能的 EX2300、EX3400、EX4300 或 EX4400 交换机型号中,PoE 电压注入故障故障
问题
描述
从具有以太网供电 (PoE) 功能的 EX2300、EX3400、EX4300 或 EX4400 交换机型号供电的设备不会从这些交换机获得电源。重新启动交换机或升级到最新版本的 Junos OS 后,问题仍然存在。初次安装期间,瞻博网络 EX3400、EX2300、EX4300 或 EX4400 设备上的 PoE 停止工作。需要注意的是,连接到 POE 设备的新 PD 不上电。
-
当交换机 EX2200、EX3200、EX4200 和 EX4400 的 PoE 端口连接到 EX3400、EX4300、EX2300、EX4400 的 PoE 端口时,EX4300、EX3400、EX2300、EX4400 交换机上的 PoE 功能将受到影响。这是预期行为。
-
当一台 EX3400 连接到另一台 EX3400 或一台 EX4300 连接到一台 EX3400 时,PoE 会以正常方式运行 - 这是预期行为。
通过分析瞻博网络交换机上的 PoE 端口状态来调试和确认电压注入
可以通过在 EX3400、EX2300、EX4300 和 EX4400 上启用 syslog any any
来识别 PoE 端口扫描上的电压注入。
在 show log messages 中,任何状态为 36 的 POE 电压注入端口都表示存在此问题。这是由于 EX3400、EX4300、EX2300 和 EX4400 上的端口注入了 PoE 电源所致。
端口状态 36 是由于交换机的相互供电所致。这是因为瞻博网络交换机支持旧版设备检测。支持传统检测的交换机会将其他交换机作为传统设备进行检测,并相互供电。
溶液
将上行链路设备连接到 EX3400、EX4300、EX2300、EX4400 时,请确保接口(上行链路设备)已禁用 PoE。PoE 只能在连接接入点/VOIP 电话或任何其他 PoE 受电设备的接口上启用。
使用以下命令
set poe interface <interface name>
将 EX4200、EX3200、EX2200 连接到 EX4400、EX4300、EX3400 和 EX2300 时,请禁用旧交换机(EX4200、EX3200、EX2200)上的 PoE,如下所示:
set poe interface ge-0/0/0 disable
另见
排除 EX 系列交换机中的温度告警
本主题为通用主题,适用于所有 EX 系列交换机。输出可能会因交换机而异。
问题
描述
当交换机温度过高时,EX 系列交换机会触发温度警报 FPC 0 EX-PFE1 Temp Too Hot
。
原因
机箱中的温度传感器监控机箱的温度。如果风扇发生故障或机箱温度因其他原因超过允许水平,交换机会触发警报。
溶液
当交换机触发温度告警(如 FPC 0 EX-PFE1 Temp Too Hot
告警)时,使用 show chassis environment
和 命令 show chassis temperature-thresholds
确定触发告警的情况。
为防止开关过热,请在环境温度在推荐范围内的区域作开关。为防止气流受限,请在通风口周围留出至少 6 英寸(15.2 厘米)的间隙。
-
使用 Telnet 连接到交换机,然后发出
show chassis environment
命令。此命令显示有关交换机机箱的环境信息,包括温度。命令还显示有关风扇、电源和路由引擎的信息。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出也类似。请注意,对于 EX4100-H-12MP 等无风扇交换机,风扇输出不会显示在输出中。show chassis environment(EX9208 交换机)
user@switch> show chassis environment Class Item Status Measurement Temp PEM 0 OK 40 degrees C / 104 degrees F PEM 1 OK 40 degrees C / 104 degrees F PEM 2 Absent PEM 3 Absent Routing Engine 0 OK 37 degrees C / 98 degrees F Routing Engine 0 CPU OK 35 degrees C / 95 degrees F Routing Engine 1 Absent Routing Engine 1 CPU Absent CB 0 Intake OK 36 degrees C / 96 degrees F CB 0 Exhaust A OK 34 degrees C / 93 degrees F CB 0 Exhaust B OK 40 degrees C / 104 degrees F CB 0 ACBC OK 39 degrees C / 102 degrees F CB 0 XF A OK 46 degrees C / 114 degrees F CB 0 XF B OK 45 degrees C / 113 degrees F CB 1 Intake Absent CB 1 Exhaust A Absent CB 1 Exhaust B Absent CB 1 ACBC Absent CB 1 XF A Absent CB 1 XF B Absent FPC 3 Intake OK 48 degrees C / 118 degrees F FPC 3 Exhaust A OK 46 degrees C / 114 degrees F FPC 3 Exhaust B OK 51 degrees C / 123 degrees F FPC 3 XL TSen OK 67 degrees C / 152 degrees F FPC 3 XL Chip OK 58 degrees C / 136 degrees F FPC 3 XL_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR0 Chip OK 51 degrees C / 123 degrees F FPC 3 XL_XR1 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR1 Chip OK 63 degrees C / 145 degrees F FPC 3 XQ TSen OK 67 degrees C / 152 degrees F FPC 3 XQ Chip OK 63 degrees C / 145 degrees F FPC 3 XQ_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XQ_XR0 Chip OK 68 degrees C / 154 degrees F FPC 3 XM TSen OK 67 degrees C / 152 degrees F FPC 3 XM Chip OK 76 degrees C / 168 degrees F FPC 3 XF TSen OK 67 degrees C / 152 degrees F FPC 3 XF Chip OK 75 degrees C / 167 degrees F FPC 3 PLX PCIe Switch TSe OK 51 degrees C / 123 degrees F FPC 3 PLX PCIe Switch Chi OK 54 degrees C / 129 degrees F FPC 3 Aloha FPGA 0 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 0 Chip OK 70 degrees C / 158 degrees F FPC 3 Aloha FPGA 1 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 1 Chip OK 75 degrees C / 167 degrees F FPC 5 Intake Testing FPC 5 Exhaust A Testing FPC 5 Exhaust B Testing Fans Top Rear Fan OK Spinning at intermediate-speed Bottom Rear Fan OK Spinning at intermediate-speed Top Middle Fan OK Spinning at intermediate-speed Bottom Middle Fan OK Spinning at intermediate-speed Top Front Fan OK Spinning at intermediate-speed Bottom Front Fan OK Spinning at intermediate-speed
表 6列出了命令的
show chassis environment
输出字段。下表按输出字段的大致出现顺序列出了输出字段。表 6: show chassis environment
输出字段字段名称
字段说明
Class
有关机箱组件的类别或类别的信息:
-
Temp
:流经机箱的空气温度,单位为摄氏度 (°C) 和华氏度 (°F) -
Fans
:有关风扇和鼓风机状态的信息
Item
有关机箱组件的信息:
-
灵活的 PIC 集中器 (FPC)— 即线卡
-
控制板 (CB)
-
路由引擎
-
电源输入模块 (PEM)— 即电源
Status
指定机箱组件的状态。例如,如果
Class
为Fans
,则风扇状态可以是:-
OK
:风扇可运行。 -
Testing
:风扇在初始开机期间正在接受测试。 -
Failed
:风扇坏了或风扇没有旋转。 -
Absent
:未安装风扇托架。
Measurement
取决于班级。例如,如果
Class
为Temp
,则表示以摄氏度 (°C) 和华氏度 (°F) 为单位的温度。如果为Class
Fans
,则表示实际风扇 RPM。 -
-
发出命令
show chassis temperature-thresholds
。此命令显示机箱温度阈值设置。以下是 EX4300 交换机上的输出。show chassis temperature-thresholds
user@switch> show chassis temperature-thresholds Fan speed Yellow alarm Red alarm Fire Shutdown (degrees C) (degrees C) (degrees C) (degrees C) Item Normal High Normal Bad fan Normal Bad fan Normal FPC 0 CPU 35 85 77 77 85 85 95 FPC 0 NW-PFE 35 60 59 59 67 67 70 FPC 0 SE-PFE 35 71 70 70 78 78 81 FPC 0 PHY-2/3 35 65 64 64 72 72 75 FPC 0 MGMT PHY 35 73 72 72 80 80 84 FPC 0 PHY-4/5 35 70 69 69 77 77 80 FPC 1 CPU 35 85 77 77 85 85 95 FPC 1 NW-PFE 35 60 59 59 67 67 70 FPC 1 SE-PFE 35 71 70 70 78 78 81 FPC 1 PHY-2/3 35 65 64 64 72 72 75 FPC 1 MGMT PHY 35 73 72 72 80 80 84 FPC 1 PHY-4/5 35 70 69 69 77 77 80 FPC 2 CPU 35 85 77 77 85 85 95 FPC 2 NW-PFE 35 60 59 59 67 67 70 FPC 2 SE-PFE 35 71 70 70 78 78 81 FPC 2 PHY-2/3 35 65 64 64 72 72 75 FPC 2 MGMT PHY 35 73 72 72 80 80 84 FPC 2 PHY-4/5 35 70 69 69 77 77 80
表 7 列出了命令的
show chassis temperature-thresholds
输出字段。下表按输出字段的大致出现顺序列出了输出字段。表 7: show chassis temperature-thresholds
输出字段字段名称
字段说明
项目
机箱组件。您可以为每个 FRU 中的每个插槽配置机箱、路由引擎和 FPC 等组件的阈值信息,以便在输出中显示。默认情况下,仅显示机箱和路由引擎的信息。
风扇速度
温度阈值,以摄氏度为单位,使风扇以正常和高速运行。
-
正常 — 风扇以正常速度运行以及所有风扇都存在且工作正常时的温度阈值。
-
高 — 风扇高速运行或者风扇发生故障或丢失时的温度阈值。
注意:当温度超过黄色、琥珀色或红色警报的阈值设置时,将触发警报。
黄色或琥珀色报警
触发黄色或琥珀色警报的温度阈值(单位:摄氏度)。
-
正常 — 风扇全速运转时,设备必须超过该温度阈值才能触发黄色或琥珀色警报。
-
风扇故障 — 当一个或多个风扇发生故障或丢失时,设备必须超过该温度阈值才能触发黄色或琥珀色警报。
红色警报
触发红色警报的温度阈值(单位:摄氏度)。
-
正常 — 风扇全速运转时,设备必须超过该温度阈值才能触发红色警报。
-
风扇故障 — 当一个或多个风扇发生故障或丢失时,设备必须超过该温度阈值才能触发红色警报。
防火关闭
温度阈值,以摄氏度为单位,在发生火灾时开关关闭。
-
触发温度告警时,可以通过运行 show chassis environment
命令以显示每个组件的机箱温度值并将其与温度阈值进行比较来识别触发该告警的情况。您可以通过运行 show chassis temperature-thresholds
命令来显示温度阈值。
例如,对于 FPC 3
:
-
如果温度
FPC 3
超过 55°C,输出表示风扇正在高速运行(未触发警报)。 -
如果温度
FPC 3
超过 65° C,将触发黄色警报,表示一个或多个风扇出现故障。 -
如果温度
FPC 3
超过 75°C,则会触发黄色警报,表示已超过温度阈值限制。 -
如果温度
FPC 3
超过 80°C,则会触发红色警报,表示一个或多个风扇出现故障。 -
如果温度
FPC 3
超过 105° C,将触发红色警报,表示超过温度阈值限制。 -
如果温度
FPC 3
超过 110°C,则开关断电。
表 8 列出了交换机生成温度告警的可能原因。它还列出了各自的补救措施。
原因 |
补救 |
---|---|
环境温度高于阈值温度。 |
确保环境温度在阈值温度限制范围内。请参阅 EX 系列交换机的环境要求和规格。 |
风扇模块或风扇托架出现故障。 |
注意:
此步骤不适用于无风扇交换机,例如 EX4100-H-12MP
|
由于已安装的交换机周围间隙不足,通过交换机的气流受限。 |
确保已安装的交换机周围有足够的间隙。 |
变更历史表
是否支持某项功能取决于您使用的平台和版本。使用 功能浏览器 查看您使用的平台是否支持某项功能。