EX4400 组件故障排除
排除 EX 系列交换机中的温度告警
本主题是通用主题,适用于所有 EX 系列交换机。根据交换机的不同,输出可能会有所不同。例如,在 EX4100-H-12MP 等无风扇交换机中,任何风扇相关信息均不适用。
问题
描述
当交换机温度过高时,EX 系列交换机会触发温度告警 FPC 0 EX-PFE1 Temp Too Hot 。
原因
机箱中的温度传感器可监控机箱的温度。如果风扇发生故障或机箱温度因其他原因超过允许水平,交换机将触发告警。
解决方案
当交换机触发温度告警(如告警) FPC 0 EX-PFE1 Temp Too Hot 时,请使用 和 和 show chassis environment show chassis temperature-thresholds 命令识别触发告警的情况。
为防止开关过热,请在环境温度在推荐范围内的区域作。为防止气流受限,通风口周围至少留出 6 英寸(15.2 厘米)的间隙。有关 EX4100-H-12MP 交换机,请参阅 EX4100-H 站点准则和要求中的环境准则。
-
使用 Telnet 连接到交换机,然后发出
show chassis environment命令。此命令显示有关交换机机箱的环境信息,包括温度。该命令还显示有关风扇、电源和路由引擎的信息。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出与此类似。请注意,对于无风扇交换机(如 EX4100-H-12MP),风扇输出不会显示在输出中。show chassis environment(EX9208 交换机)
user@switch> show chassis environment Class Item Status Measurement Temp PEM 0 OK 40 degrees C / 104 degrees F PEM 1 OK 40 degrees C / 104 degrees F PEM 2 Absent PEM 3 Absent Routing Engine 0 OK 37 degrees C / 98 degrees F Routing Engine 0 CPU OK 35 degrees C / 95 degrees F Routing Engine 1 Absent Routing Engine 1 CPU Absent CB 0 Intake OK 36 degrees C / 96 degrees F CB 0 Exhaust A OK 34 degrees C / 93 degrees F CB 0 Exhaust B OK 40 degrees C / 104 degrees F CB 0 ACBC OK 39 degrees C / 102 degrees F CB 0 XF A OK 46 degrees C / 114 degrees F CB 0 XF B OK 45 degrees C / 113 degrees F CB 1 Intake Absent CB 1 Exhaust A Absent CB 1 Exhaust B Absent CB 1 ACBC Absent CB 1 XF A Absent CB 1 XF B Absent FPC 3 Intake OK 48 degrees C / 118 degrees F FPC 3 Exhaust A OK 46 degrees C / 114 degrees F FPC 3 Exhaust B OK 51 degrees C / 123 degrees F FPC 3 XL TSen OK 67 degrees C / 152 degrees F FPC 3 XL Chip OK 58 degrees C / 136 degrees F FPC 3 XL_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR0 Chip OK 51 degrees C / 123 degrees F FPC 3 XL_XR1 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR1 Chip OK 63 degrees C / 145 degrees F FPC 3 XQ TSen OK 67 degrees C / 152 degrees F FPC 3 XQ Chip OK 63 degrees C / 145 degrees F FPC 3 XQ_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XQ_XR0 Chip OK 68 degrees C / 154 degrees F FPC 3 XM TSen OK 67 degrees C / 152 degrees F FPC 3 XM Chip OK 76 degrees C / 168 degrees F FPC 3 XF TSen OK 67 degrees C / 152 degrees F FPC 3 XF Chip OK 75 degrees C / 167 degrees F FPC 3 PLX PCIe Switch TSe OK 51 degrees C / 123 degrees F FPC 3 PLX PCIe Switch Chi OK 54 degrees C / 129 degrees F FPC 3 Aloha FPGA 0 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 0 Chip OK 70 degrees C / 158 degrees F FPC 3 Aloha FPGA 1 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 1 Chip OK 75 degrees C / 167 degrees F FPC 5 Intake Testing FPC 5 Exhaust A Testing FPC 5 Exhaust B Testing Fans Top Rear Fan OK Spinning at intermediate-speed Bottom Rear Fan OK Spinning at intermediate-speed Top Middle Fan OK Spinning at intermediate-speed Bottom Middle Fan OK Spinning at intermediate-speed Top Front Fan OK Spinning at intermediate-speed Bottom Front Fan OK Spinning at intermediate-speed表 1 列出了该
show chassis environment命令的输出字段。该表按输出字段的大致出现顺序列出了输出字段。表 1: show chassis environment输出字段字段名称
字段说明
Class有关机箱组件的类别或类别的信息:
-
Temp:流经机箱的空气温度,单位为摄氏度 (°C) 和华氏度 (°F) -
Fans:有关风机和鼓风机状态的信息
Item有关机箱组件的信息:
-
灵活的 PIC 集中器 (FPC) — 即线卡
-
控制板 (CB)
-
路由引擎
-
电源入口模块 (PEM) — 即电源
Status指定机箱组件的状态。例如,如果 是
Fans,则Class风扇状态可以是:-
OK:风扇正在运行。 -
Testing:风扇在初次开机期间正在接受测试。 -
Failed:风扇出现故障或风扇不旋转。 -
Absent:未安装风扇托架。
Measurement取决于班级。例如,如果 是
Temp,表示Class温度(单位为摄氏度 (°C))和华氏度 (°F)。如果是ClassFans,则表示风扇的实际转速。 -
-
发出命令
show chassis temperature-thresholds。此命令显示机箱温度阈值设置。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出与此类似。show chassis temperature-thresholds(EX9208 交换机)user@ host> show chassis temperature-thresholds Fan speed Yellow alarm Red alarm Fire Shutdown (degrees C) (degrees C) (degrees C) (degrees C) Item Normal High Normal Bad fan Normal Bad fan Normal Chassis default 48 54 65 55 80 65 100 Routing Engine 0 70 80 95 95 110 110 112 FPC 3 55 60 75 65 105 80 110 FPC 5 55 60 75 65 90 80 95下表列出了命令
show chassis temperature-thresholds的输出字段。该表按输出字段的大致出现顺序列出了输出字段。表 2: show chassis temperature-thresholds输出字段字段名称
字段说明
项目
机箱组件。您可以为每个 FRU 中每个插槽的组件(如机箱、路由引擎和 FPC)配置阈值信息,以便在输出中显示。默认情况下,仅显示机箱和路由引擎的信息。
风扇速度
风扇正常高速运行的温度阈值(以摄氏度为单位)。
-
正常 — 风扇以正常速度运行以及所有风扇都存在并正常运行时的温度阈值。
-
高 — 风扇高速运行时或风扇出现故障或丢失时的温度阈值。
注意:当温度超过黄色、琥珀色或红色报警的阈值设置时,将触发告警。
黄色或琥珀色报警
触发黄色或琥珀色报警的温度阈值(以摄氏度为单位)。
-
正常 — 当风扇全速运行时,必须超过设备上的温度阈值才能触发黄色或琥珀色告警。
-
风扇故障 — 当一个或多个风扇出现故障或丢失时,必须超过设备上的温度阈值才能触发黄色或琥珀色告警。
红色报警
温度阈值(以摄氏度为单位)会触发红色告警。
-
正常 — 当风扇全速运行时,必须超过设备上的温度阈值才能触发红色告警。
-
风扇故障 — 当一个或多个风扇出现故障或丢失时,必须超过设备上的温度阈值才能触发红色告警。
消防关闭
温度阈值,以摄氏度为单位,在发生火灾时开关关闭的温度阈值。
-
触发温度告警时,您可以运行命令 show chassis environment 以显示每个组件的机箱温度值,并将这些温度值与温度阈值进行比较,从而确定触发温度告警的条件。您可以通过运行 show chassis temperature-thresholds 命令来显示温度阈值。
例如,对于 FPC 3:
-
如果温度
FPC 3超过 55° C,则输出指示风扇正在高速运行(不会触发警报)。 -
如果温度
FPC 3超过 65°C,则会触发黄色告警,表示一个或多个风扇出现故障。 -
如果温度
FPC 3超过 75° C,则会触发黄色告警,表示超过温度阈值限制。 -
如果温度
FPC 3超过 80°C,则会触发红色告警,表示一个或多个风扇出现故障。 -
如果温度
FPC 3超过 105° C,则会触发红色告警,表示超过温度阈值限制。 -
如果温度
FPC 3超过 110°C,则开关断电。
表 3 列出了交换机生成温度告警的可能原因。它还列出了相应的补救措施。
| 原因 |
补救措施 |
|---|---|
| 环境温度高于阈值温度。 |
确保环境温度在阈值温度限制内。请参阅 EX 系列交换机的环境要求和规格。 |
| 风扇模块或风扇托架出现故障。 |
注意:
此步骤不适用于 EX4100-H-12MP 等无风扇交换机
|
| 由于已安装的交换机周围间隙不足,通过交换机的气流受限。 |
确保已安装的交换机周围有足够的间隙。 |
EX4400 交换机上的机箱组件报警情况
在本主题中,您将了解 EX4400 交换机机箱中安装的组件的告警情况。
表 4 列出了机箱组件可以在 EX4400 交换机上生成的告警、其严重性级别,以及您可以采取的响应措施。
| 机箱组件 |
报警情况 |
报警严重性 |
补救措施 |
|---|---|---|---|
| 风扇模块 | 未安装风扇模块。 |
主要(红色) |
安装风扇模块。 |
| 混合使用不同气流方向的风扇模块。 |
主要(红色) |
请勿在同一机箱中混用具有不同气流方向的风扇模块。 |
|
| 混合使用具有不同气流方向的风扇模块和电源。 |
主要(红色) |
请勿在同一机箱中混用不同方向的风扇模块和气流方向的电源。 |
|
| 电源 | 电源从机箱中拔下。 |
主要(红色) |
在空插槽中安装电源。 |
| 电源未打开。 |
次要(黄色) |
检查电源的输入连接。 |
|
| 安装了未知电源。 |
主要(红色) |
安装瞻博网络推荐的电源。 |
|
| 混合使用具有不同气流方向的电源。 |
主要(红色) |
请勿在同一机箱中混用具有不同气流方向的电源。 |
|
| 混合使用具有不同气流方向的风扇模块和电源。 |
主要(红色) |
请勿在同一机箱中混用具有不同气流方向的风扇模块和电源。 |
|
| 交流和直流 PSU 的混合 | 主要(红色) |
请勿在同一机箱中混用交流、直流和直流电源。 |
|
| 温度 | 机箱内部温度达到黄色报警限值。 |
次要(黄色) |
|
| 机箱内部温度达到红色报警限值。 |
主要(红色) |
|
|
| 温度传感器出现故障。 |
主要(红色) |
使用 https://www.juniper.net/support/ 的案例管理器链接创建支持案例,或致电 1-888-314-5822(美国和加拿大境内的免费电话)或 1-408-745-9500(美国境外)。 |
|
| 管理以太网接口 | 管理以太网链路已关闭。 |
主要(红色) |
|
| 路由引擎 | /var 分区使用率很高。 |
次要(黄色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
| /var 分区已满。 |
主要(红色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
|
| 未设置救援配置。 |
次要(黄色) |
使用命令 |
|
| 功能使用需要许可证,或者功能使用的许可证已过期。 |
次要(黄色) |
安装警报中指定功能所需的许可证。有关更多信息,请参阅 了解 EX 系列交换机的软件许可证。 |
EX4400 交换机硬件和 CLI 术语映射
本主题介绍 EX4400 交换机文档中使用的硬件术语以及 Junos OS CLI 中使用的相应术语(请参阅 表 5。
| 硬件项目 (CLI) | 说明 (CLI) | 文档中的值项目 | 附加信息 | |
|---|---|---|---|---|
| 机箱 | 以下一项:
|
- | 交换机机箱 | EX4400 型号和规格 |
| 路由引擎 (n) | 以下一项:
|
n 是 0 到 9 范围内的值。
|
路由引擎 | - |
| FPC (n) | 灵活 PIC 集中器 (FPC) 的缩写名称 以下一项:
|
n 是 0 到 9 范围内的值。 | 了解接口命名约定 | |
| 在独立交换机中,默认值为 0。 | 在这种情况下,FPC 指的是交换机本身。 | |||
| 在虚拟机箱配置中,这些值与虚拟机箱中交换机的分配成员 ID 对应。 | 在这种情况下,FPC 编号指的是分配给交换机的成员 ID。 | |||
| PIC (n) | 物理接口卡 (PIC) 的缩写名称 | n 是 0 到 2 范围内的值。 | 了解接口命名约定 | |
| 以下一项:
|
PIC 0 | PIC 0 代表编号为 0 到 23 或 0 到 47 的内置网络端口 | EX4400 系统概述 | |
| 以下一项:
|
图 1 | 编号为 0 和 1 的 QSFP28 端口 | ||
以下一项:
|
图 2 | 交换机中安装的扩展模块 | EX4400 交换机中的扩展模块 | |
| XCVR (n) | 收发器的缩写名称 | n 该值相当于收发器安装所在的端口编号。 | 光收发器 | EX4400 交换机支持可插拔收发器和电缆 |
| 电源 (n) | 以下一项:
|
n 值为 0 或 1,对应于电源插槽编号。 | 交流电源或直流电源 | |
| 风扇托架 | 以下一项:
|
n 值为 0 或 1,对应于风扇模块插槽编号。 | 风扇模块 | EX4400 交换机中的冷却系统和气流 |
CLI 与 EX4400 交换机文档中使用的术语等效