EX4400 组件故障排除
排除 EX 系列交换机中的温度告警
本主题为通用主题,适用于所有 EX 系列交换机。输出可能会因交换机而异。例如,在 EX4100-H-12MP 等无风扇交换机中,任何与风扇相关的信息都不适用。
问题
描述
当交换机温度过高时,EX 系列交换机会触发温度警报 FPC 0 EX-PFE1 Temp Too Hot
。
原因
机箱中的温度传感器监控机箱的温度。如果风扇发生故障或机箱温度因其他原因超过允许水平,交换机会触发警报。
溶液
当交换机触发温度告警(如 FPC 0 EX-PFE1 Temp Too Hot
告警)时,使用 show chassis environment
和 命令 show chassis temperature-thresholds
确定触发告警的情况。
为防止开关过热,请在环境温度在推荐范围内的区域作开关。为防止气流受限,请在通风口周围留出至少 6 英寸(15.2 厘米)的间隙。对于 EX4100-H-12MP 交换机,请参阅 表 2。
-
使用 Telnet 连接到交换机,然后发出
show chassis environment
命令。此命令显示有关交换机机箱的环境信息,包括温度。命令还显示有关风扇、电源和路由引擎的信息。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出也类似。请注意,对于 EX4100-H-12MP 等无风扇交换机,风扇输出不会显示在输出中。show chassis environment(EX9208 交换机)
user@switch> show chassis environment Class Item Status Measurement Temp PEM 0 OK 40 degrees C / 104 degrees F PEM 1 OK 40 degrees C / 104 degrees F PEM 2 Absent PEM 3 Absent Routing Engine 0 OK 37 degrees C / 98 degrees F Routing Engine 0 CPU OK 35 degrees C / 95 degrees F Routing Engine 1 Absent Routing Engine 1 CPU Absent CB 0 Intake OK 36 degrees C / 96 degrees F CB 0 Exhaust A OK 34 degrees C / 93 degrees F CB 0 Exhaust B OK 40 degrees C / 104 degrees F CB 0 ACBC OK 39 degrees C / 102 degrees F CB 0 XF A OK 46 degrees C / 114 degrees F CB 0 XF B OK 45 degrees C / 113 degrees F CB 1 Intake Absent CB 1 Exhaust A Absent CB 1 Exhaust B Absent CB 1 ACBC Absent CB 1 XF A Absent CB 1 XF B Absent FPC 3 Intake OK 48 degrees C / 118 degrees F FPC 3 Exhaust A OK 46 degrees C / 114 degrees F FPC 3 Exhaust B OK 51 degrees C / 123 degrees F FPC 3 XL TSen OK 67 degrees C / 152 degrees F FPC 3 XL Chip OK 58 degrees C / 136 degrees F FPC 3 XL_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR0 Chip OK 51 degrees C / 123 degrees F FPC 3 XL_XR1 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR1 Chip OK 63 degrees C / 145 degrees F FPC 3 XQ TSen OK 67 degrees C / 152 degrees F FPC 3 XQ Chip OK 63 degrees C / 145 degrees F FPC 3 XQ_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XQ_XR0 Chip OK 68 degrees C / 154 degrees F FPC 3 XM TSen OK 67 degrees C / 152 degrees F FPC 3 XM Chip OK 76 degrees C / 168 degrees F FPC 3 XF TSen OK 67 degrees C / 152 degrees F FPC 3 XF Chip OK 75 degrees C / 167 degrees F FPC 3 PLX PCIe Switch TSe OK 51 degrees C / 123 degrees F FPC 3 PLX PCIe Switch Chi OK 54 degrees C / 129 degrees F FPC 3 Aloha FPGA 0 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 0 Chip OK 70 degrees C / 158 degrees F FPC 3 Aloha FPGA 1 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 1 Chip OK 75 degrees C / 167 degrees F FPC 5 Intake Testing FPC 5 Exhaust A Testing FPC 5 Exhaust B Testing Fans Top Rear Fan OK Spinning at intermediate-speed Bottom Rear Fan OK Spinning at intermediate-speed Top Middle Fan OK Spinning at intermediate-speed Bottom Middle Fan OK Spinning at intermediate-speed Top Front Fan OK Spinning at intermediate-speed Bottom Front Fan OK Spinning at intermediate-speed
表 1 列出了命令
show chassis environment
的输出字段。下表按输出字段的大致出现顺序列出了输出字段。表 1: show chassis environment
输出字段字段名称
字段说明
Class
有关机箱组件的类别或类别的信息:
-
Temp
:流经机箱的空气温度,单位为摄氏度 (°C) 和华氏度 (°F) -
Fans
:有关风扇和鼓风机状态的信息
Item
有关机箱组件的信息:
-
灵活的 PIC 集中器 (FPC)— 即线卡
-
控制板 (CB)
-
路由引擎
-
电源输入模块 (PEM)— 即电源
Status
指定机箱组件的状态。例如,如果
Class
为Fans
,则风扇状态可以是:-
OK
:风扇可运行。 -
Testing
:风扇在初始开机期间正在接受测试。 -
Failed
:风扇坏了或风扇没有旋转。 -
Absent
:未安装风扇托架。
Measurement
取决于班级。例如,如果
Class
为Temp
,则表示以摄氏度 (°C) 和华氏度 (°F) 为单位的温度。如果为Class
Fans
,则表示实际风扇 RPM。 -
-
发出命令
show chassis temperature-thresholds
。此命令显示机箱温度阈值设置。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出也类似。show chassis temperature-thresholds
(EX9208 交换机)user@ host> show chassis temperature-thresholds Fan speed Yellow alarm Red alarm Fire Shutdown (degrees C) (degrees C) (degrees C) (degrees C) Item Normal High Normal Bad fan Normal Bad fan Normal Chassis default 48 54 65 55 80 65 100 Routing Engine 0 70 80 95 95 110 110 112 FPC 3 55 60 75 65 105 80 110 FPC 5 55 60 75 65 90 80 95
表 2 列出了命令的
show chassis temperature-thresholds
输出字段。下表按输出字段的大致出现顺序列出了输出字段。表 2: show chassis temperature-thresholds
输出字段字段名称
字段说明
项目
机箱组件。您可以为每个 FRU 中的每个插槽配置机箱、路由引擎和 FPC 等组件的阈值信息,以便在输出中显示。默认情况下,仅显示机箱和路由引擎的信息。
风扇速度
温度阈值,以摄氏度为单位,使风扇以正常和高速运行。
-
正常 — 风扇以正常速度运行以及所有风扇都存在且工作正常时的温度阈值。
-
高 — 风扇高速运行或者风扇发生故障或丢失时的温度阈值。
注意:当温度超过黄色、琥珀色或红色警报的阈值设置时,将触发警报。
黄色或琥珀色报警
触发黄色或琥珀色警报的温度阈值(单位:摄氏度)。
-
正常 — 风扇全速运转时,设备必须超过该温度阈值才能触发黄色或琥珀色警报。
-
风扇故障 — 当一个或多个风扇发生故障或丢失时,设备必须超过该温度阈值才能触发黄色或琥珀色警报。
红色警报
触发红色警报的温度阈值(单位:摄氏度)。
-
正常 — 风扇全速运转时,设备必须超过该温度阈值才能触发红色警报。
-
风扇故障 — 当一个或多个风扇发生故障或丢失时,设备必须超过该温度阈值才能触发红色警报。
防火关闭
温度阈值,以摄氏度为单位,在发生火灾时开关关闭。
-
触发温度告警时,可以通过运行 show chassis environment
命令以显示每个组件的机箱温度值并将其与温度阈值进行比较来识别触发该告警的情况。您可以通过运行 show chassis temperature-thresholds
命令来显示温度阈值。
例如,对于 FPC 3
:
-
如果温度
FPC 3
超过 55°C,输出表示风扇正在高速运行(未触发警报)。 -
如果温度
FPC 3
超过 65° C,将触发黄色警报,表示一个或多个风扇出现故障。 -
如果温度
FPC 3
超过 75°C,则会触发黄色警报,表示已超过温度阈值限制。 -
如果温度
FPC 3
超过 80°C,则会触发红色警报,表示一个或多个风扇出现故障。 -
如果温度
FPC 3
超过 105° C,将触发红色警报,表示超过温度阈值限制。 -
如果温度
FPC 3
超过 110°C,则开关断电。
表 3 列出了交换机生成温度告警的可能原因。它还列出了各自的补救措施。
原因 |
补救 |
---|---|
环境温度高于阈值温度。 |
确保环境温度在阈值温度限制范围内。请参阅 EX 系列交换机的环境要求和规格。 |
风扇模块或风扇托架出现故障。 |
注意:
此步骤不适用于无风扇交换机,例如 EX4100-H-12MP
|
由于已安装的交换机周围间隙不足,通过交换机的气流受限。 |
确保已安装的交换机周围有足够的间隙。 |
EX4400 交换机上的机箱组件报警情况
在本主题中,您将了解 EX4400 交换机机箱中安装组件的报警情况。
表 4 列出了机箱组件可在 EX4400 交换机上生成的告警、警报的严重性级别以及您可以采取的响应措施。
机箱组件 |
报警情况 |
报警严重性 |
补救 |
---|---|---|---|
风扇模块 | 风扇模块未安装。 |
主要(红色) |
安装风扇模块。 |
混合使用不同气流方向的风扇模块。 |
主要(红色) |
请勿在同一机箱中混用具有不同气流方向的风扇模块。 |
|
风扇模块和电源的混合使用,具有不同的气流方向。 |
主要(红色) |
请勿在同一机箱内混用不同方向的风扇模块和电源以使气流流通。 |
|
电源 | 电源已从机箱上拔下。 |
主要(红色) |
在空插槽中安装电源。 |
电源未打开。 |
次要(黄色) |
检查电源的输入连接。 |
|
安装了未知电源。 |
主要(红色) |
安装瞻博网络推荐的电源。 |
|
混合使用不同气流方向的电源。 |
主要(红色) |
请勿在同一机箱中混用具有不同气流方向的电源。 |
|
风扇模块和电源的混合使用,具有不同的气流方向。 |
主要(红色) |
请勿在同一机箱中混用具有不同气流方向的风扇模块和电源。 |
|
温度 | 机箱内的温度达到黄色报警限值。 |
次要(黄色) |
|
机箱内的温度达到红色报警限值。 |
主要(红色) |
|
|
温度传感器出现故障。 |
主要(红色) |
使用案例管理器链接 https://www.juniper.net/support/ 或致电 1-888-314-5822(美国和加拿大境内免费电话)或 1-408-745-9500(美国境外)创建支持案例。 |
|
管理以太网接口 | 管理以太网链路已关闭。 |
主要(红色) |
|
路由引擎 | /var 分区使用率很高。 |
次要(黄色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
/var 分区已满。 |
主要(红色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
|
未设置救援配置。 |
次要(黄色) |
|
|
功能使用需要许可证,或者功能使用的许可证已过期。 |
次要(黄色) |
安装警报中指定功能所需的许可证。有关更多信息,请参阅 了解 EX 系列交换机的软件许可证。 |
EX4400 交换机硬件和 CLI 术语映射
本主题介绍 EX4400 交换机文档中使用的硬件术语以及 Junos OS CLI 中使用的相应术语(请参阅 表 5.
硬件项目 (CLI) | 说明 (CLI) | 文档中的值 | 项目附加 | 信息 |
---|---|---|---|---|
底盘 | 实现以下情况之一:
|
- | 交换机机箱 | EX4400 型号和规格 |
路由引擎 (n) | 实现以下情况之一:
|
n 是 0 到 9 范围内的值。
|
路由引擎 | - |
FPC (n) | 灵活 PIC 集中器 (FPC) 的缩写名称 实现以下情况之一:
|
n 是 0 到 9 范围内的值。 | 了解接口命名约定 | |
在独立交换机中,默认值为 0。 | 在这种情况下,FPC 指的是交换机本身。 | |||
在虚拟机箱配置中,这些值与虚拟机箱中为交换机分配的成员 ID 相对应。 | 在这种情况下,FPC 编号是指分配给交换机的成员 ID。 | |||
图片 (n) | 物理接口卡 (PIC) 的缩写名称 | n 是 0 到 2 范围内的值。 | 了解接口命名约定 | |
实现以下情况之一:
|
PIC 0 | PIC 0 代表编号为 0 到 23 或 0 到 47 的内置网络端口 | EX4400 系统概述 | |
实现以下情况之一:
|
图1 | 编号为 0 和 1 的 QSFP28 端口 | ||
实现以下情况之一:
|
图2 | 交换机中安装的扩展模块 | EX4400 交换机中的扩展模块 | |
Xcvr (n) | 收发器的缩写名称 | n 等效于安装收发器的端口号的值。 | 光收发器 | EX4400 交换机上支持的可插拔收发器和电缆 |
电源 (n) | 实现以下情况之一:
|
n 的值为 0 或 1,对应于电源插槽编号。 | 交流电源或直流电源 | |
风扇托架 | 实现以下情况之一:
|
n 的值为 0 或 1,对应于风扇模块插槽编号。 | 风扇模块 | EX4400 交换机中的冷却系统和气流 |
EX4400 交换机文档中使用的术语的等效项的 CLI