EX2300 组件故障排除
了解 EX 系列交换机上的告警类型和严重性级别
本主题仅适用于 J-Web 应用程序包。
警报会提醒您注意可能阻止交换机正常运行的情况。在瞻博网络 EX 系列以太网交换机上监控告警之前,请熟悉 表 1 中定义的术语。
术语 |
定义 |
---|---|
alarm |
提醒您注意可能妨碍正常操作的情况的信号。在交换机上,报警信号是机箱前面亮起的 ALM LED。 |
alarm condition |
触发警报的故障事件。 |
alarm severity |
警报的严重性。如果报警 (ALM) LED 为红色,则表示出现重大报警。如果报警 LED 为黄色或琥珀色,则表示轻微报警。如果报警 LED 未亮起,则表示没有报警或开关已停止。 |
chassis alarm |
由交换机上的物理状况(如电源故障、组件温度过高或介质故障)触发的预设警报。 |
system alarm |
缺少救援配置或未能安装许可软件功能的许可证时触发的预设警报。
注意:
在 EX6200 交换机上,内部链路错误可能会触发系统告警。 |
报警类型
交换机支持以下告警:
机箱报警指示交换机或其某个组件出现故障。机箱报警是预设的,无法修改。
系统报警指示缺少救援配置。系统报警是预设的,无法修改,但您可以将它们配置为自动显示在 J-Web 界面显示或 CLI 显示中。
报警严重性级别
交换机上的告警有两个严重性级别:
主要(红色)— 表示交换机上出现由以下情况之一引起的严重情况。红色报警情况需要立即采取行动。
一个或多个硬件组件出现故障。
一个或多个硬件组件已超过温度阈值。
接口上配置的报警条件触发了严重警告。
次要(黄色或琥珀色)— 表示交换机上的非关键情况,如果不加以选中,可能会导致服务中断或性能下降。黄色或琥珀色报警情况需要监控或维护。
缺少救援配置会生成黄色或琥珀色系统警报。
参见
EX2300 交换机上的机箱组件报警情况
本主题介绍 EX2300 交换机上的机箱组件报警情况。
表 2 列出了 EX2300 交换机上的报警情况、严重性级别以及可采取的响应措施。
机箱组件 |
报警情况 |
报警严重性 |
补救 |
---|---|---|---|
温度 | 机箱内温度达到黄色报警限值。 |
次要(黄色) |
|
机箱内温度达到红色报警限值。 |
主要(红色) |
|
|
温度传感器出现故障。 |
主要(红色) |
使用案例管理器链接 https://www.juniper.net/support/ 或致电 1-888-314-5822(美国和加拿大境内免费)或 1-408-745-9500(美国境外)。 |
|
管理以太网接口 | 管理以太网链路已关闭。 |
主要(红色) |
|
路由引擎 | /var 分区使用率很高。 |
次要(黄色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
/var 分区已满。 |
主要(红色) |
清理交换机上的系统文件存储空间。有关详细信息,请参阅 释放系统存储空间。 |
|
未设置救援配置。 |
次要(黄色) |
使用 |
|
功能使用需要许可证,或者功能使用的许可证已过期。 |
次要(黄色) |
为警报中指定的功能安装所需的许可证。有关详细信息,请参阅 了解 EX 系列交换机的软件许可证。 |
参见
使用 J-Web 界面检查活动警报
目的
本主题仅适用于 J-Web 应用程序包。
使用监控功能查看 EX 系列交换机的告警信息,包括告警类型、告警严重性以及交换平台上每个活动告警的简要说明。
行动
要查看活动警报:
在 J-Web 界面中选择 监控 >事件 和警报 > 查看警报 。
根据警报类型、严重性、描述和日期范围选择警报筛选器。
单击 “开始”。
将显示与过滤器匹配的所有警报。
重置交换机时,将显示活动报警。
意义
表 3 列出了报警输出字段。
领域 |
值 |
---|---|
类型 |
报警类别:
|
严重性 |
警报严重性 - 主要(红色)或次要(黄色或琥珀色)。 |
描述 |
警报的简要概述。 |
时间 |
检测到故障的日期和时间。 |
参见
监控系统日志消息
目的
本主题仅适用于 J-Web 应用程序包。
使用监控功能过滤和查看 EX 系列交换机的系统日志消息。
行动
要在 J-Web 界面中查看事件,请选择 监控 > 事件和警报 > 查看事件。
应用筛选器或筛选器组合以查看邮件。您可以使用筛选器来显示相关事件。 表 4 介绍了不同的筛选器、其功能和关联的操作。
要查看 CLI 中的事件,请输入以下命令:
show log
领域 |
功能 |
您的行动 |
---|---|---|
系统日志文件 |
指定要为其显示已记录事件的系统日志文件的名称。 列出您配置的所有系统日志文件的名称。 默认情况下,目录中包含一个 |
要指定特定文件中记录的事件,请从列表中选择系统日志文件名,例如 消息。 选择“ 包括存档文件 ”以在搜索中包括存档文件。 |
过程 |
指定生成要显示的事件的进程的名称。 要查看系统上运行的所有进程,请输入 CLI 命令 有关进程的详细信息,请参阅 Junos OS 安装和升级指南。 |
若要指定进程生成的事件,请键入进程的名称。 例如,键入 |
日期开始 自 |
指定生成要显示的事件的时间段。 显示允许您选择年、月、日和时间的日历。它还允许您选择本地时间。 默认情况下,将显示过去一小时内生成的消息。结束时间显示当前时间,开始时间显示结束时间前一小时的时间。 |
要指定时间段:
|
事件 ID |
指定要为其显示消息的事件 ID。 允许您键入部分 ID 并自动完成其余部分。 事件 ID(也称为系统日志消息代码)唯一标识系统日志消息。它以指示生成软件进程或库的前缀开头。 |
要指定具有特定 ID 的事件,请键入部分或完整 ID,例如 TFTPD_AF_ERR。 |
描述 |
指定要显示的事件说明中的文本。 允许您使用正则表达式来匹配事件描述中的文本。
注意:
正则表达式匹配区分大小写。 |
要指定具有特定描述的事件,请使用正则表达式键入说明中的文本字符串。 例如,键入 ^Initial* 以显示行以术语 Initial开头的所有消息。 |
搜索 |
应用指定的筛选器并显示匹配的消息。 |
若要应用筛选器并显示消息,请单击“ 搜索”。 |
重 置 |
重置“事件筛选器”框中的所有字段。 |
若要重置“事件筛选器”框中列出的字段值,请单击“ 重置”。 |
生成原始报告
注意:
|
以非表格格式生成事件日志消息的列表。 |
要生成原始报告,请执行以下操作:
|
生成报告
注意:
从 Junos OS 14.1X53 版开始,可以根据事件详细信息表中加载的事件日志消息生成格式化报告。只有在事件日志消息完全加载到“事件详细信息”表中后,才会显示“生成报告”按钮。加载事件日志消息时,将显示“生成原始报告”按钮。 |
以表格格式生成事件日志消息列表,其中显示系统详细信息、事件筛选条件和事件详细信息。 |
要生成带格式的报告,请执行以下操作:
|
意义
表 5 介绍了“事件摘要”字段。
默认情况下,J-Web 界面中的“查看事件”页面显示最近的 25 个事件,严重性级别以不同的颜色突出显示。指定筛选器后,“事件摘要”将显示与指定筛选器匹配的事件。单击 “第一个”、“ 下一个”、“ 上一个”和 “最后一个 ”链接以浏览邮件。
领域 |
功能 |
其他信息 |
---|---|---|
过程 |
显示生成系统日志消息的进程的名称和 ID。 |
对于在本地路由引擎上生成的消息,此字段中显示的信息不同于在另一个路由引擎(在安装了两个路由引擎且正在运行的系统上)上生成的消息。来自其他路由引擎的消息还包括用于识别路由引擎的标识符 re0 和 re1 。 |
严重性 |
消息的严重性级别由不同的颜色表示。
|
严重性级别表示触发事件对交换机功能的严重程度。配置用于记录设施的位置时,还要指定设施的严重性级别。只有来自设施的评级为该级别或更高级别的消息才会记录到指定的文件中。 |
事件 ID |
显示唯一标识消息的代码。 每个代码上的前缀标识消息源,其余代码指示特定事件或错误。 |
事件 ID 以指示生成软件进程的前缀开头。 交换机上的某些进程不使用代码。在从此类进程生成的消息中,此字段可能为空。 事件可以属于以下类型类别之一:
|
事件描述 |
显示消息的更详细说明。 |
|
时间 |
显示记录消息的时间。 |
参见
排除具有 PoE 功能的 EX2300、EX3400、EX4300 或 EX4400 交换机型号的 PoE 电压注入故障
问题
描述
从具有以太网供电 (PoE) 功能的 EX2300、EX3400、EX4300 或 EX4400 交换机型号获取电源的设备无法从这些交换机获得电力。重新启动交换机或升级到最新版本的 Junos OS 后,问题仍然存在。 在初始安装期间,瞻博网络 EX3400、EX2300、EX4300 或 EX4400 设备上的 PoE 将停止工作。请注意,连接到 POE 设备的新 PD 无法通电。
-
当交换机的 PoE 端口(EX2200、EX3200、EX4200 和 EX4400)连接到 EX3400、EX4300、EX2300、EX4400 交换机上的 PoE 端口时,EX4300、EX3400、EX2300、EX4400 交换机上的 PoE 功能将受到影响。这是预期行为。
-
当一个 EX3400 连接到另一个 EX3400 或 EX4300 连接到 EX3400 时,PoE 以正常方式运行 - 这是预期行为。
通过分析瞻博网络交换机上的 PoE 端口状态来调试和确认电压注入
可以通过启用 syslog any any
EX3400、EX2300、EX4300 和 EX4400 来识别 PoE 端口扫描上的电压注入。
在显示日志消息中,状态为 36 的任何 POE 电压注入端口都表示此问题。这是由于 PoE 功率注入到 EX3400、EX4300、EX2300 和 EX4400 上的端口所致。
端口状态 36 是由于交换机的相互供电。这是因为瞻博网络交换机支持传统设备检测。支持传统检测的交换机会将其他交换机检测为传统设备,并相互供电。
解决 方案
将上行链路设备连接到 EX3400、EX4300、EX2300、EX4400 时,请确保在接口(上行链路设备)上禁用 PoE。只有在连接了接入点/VOIP 电话或任何其他 PoE 供电设备的接口上才能启用 PoE。
使用以下命令
set poe interface <interface name>
将 EX4200、EX3200、EX2200 连接到 EX4400、EX4300、EX3400 和 EX2300 时,请在传统交换机(EX4200、EX3200、EX2200)上禁用 PoE,如下所示:
set poe interface ge-0/0/0 disable
参见
在 EX2300 和 EX3400 交换机中升级 Junos OS 时解决存储问题
问题
描述
升级 EX2300 和 EX3400 交换机中的 Junos OS 失败。
症状
在 EX2300 和 EX3400 交换机中升级 Junos OS 时,出现错误 not enough space to unpack installation-pack-name
。
原因
交换机中没有足够的内存来安装升级安装包。
解决 方案
如果由于交换机内存不足而无法升级 EX2300 和 EX3400 交换机中的 Junos OS:
使用以下命令执行系统存储清理并删除系统存储中不需要的文件:
user@switch> request system storage cleanup
注意:您可以使用以下命令获取此命令删除的文件列表:
user@switch> request system storage cleanup dry-run
此命令不会删除 根 文件夹中的文件;它仅删除文件夹 监狱、 日志 和 TMP 中的文件。
如果任何目录占用大量内存,请删除该目录中不需要的文件。使用以下命令检查内存利用率:
user@switch> show system storage
删除非恢复快照。
如果交换机中安装了 Junos OS 15.1X53D56 或更高版本:
使用以下命令删除非恢复快照:
user@switch> request system software add software-image-name force
如果交换机中安装了早于 Junos OS 15.1X53D56 的 Junos OS 版本:
使用以下命令检查非恢复快照:
user@switch> show system snapshot
-
注意:
快照名称不会在 CLI 中自动完成;您必须输入快照名称。
使用以下命令删除非恢复快照:
user@switch> request system snapshot delete snapshot-name
升级 Junos OS 后,使用以下命令删除升级安装包:
user@switch> request system software add software-image-name force unlink
参见
排除 EX 系列交换机中的温度报警故障
问题
描述
当交换机温度过热时,EX 系列交换机会触发温度警报 FPC 0 EX-PFE1 Temp Too Hot
。
原因
机箱中的温度传感器监控机箱的温度。如果风扇出现故障或机箱温度因其他原因超过允许水平,交换机将触发警报。
解决 方案
当交换机触发温度警报(如 FPC 0 EX-PFE1 Temp Too Hot
警报)时,请使用 show chassis environment
和 show chassis temperature-thresholds
命令确定触发警报的条件。
为防止开关过热,请在环境温度在建议范围内的区域操作。为防止气流受限,通风口周围留出至少 6 英寸(15.2 厘米)的间隙。
-
使用 Telnet 连接到交换机,然后发出
show chassis environment
命令。此命令显示有关交换机机箱的环境信息,包括温度。该命令还显示有关风扇、电源和路由引擎的信息。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出与此类似。show chassis environment(EX9208 交换机)
user@switch> show chassis environment Class Item Status Measurement Temp PEM 0 OK 40 degrees C / 104 degrees F PEM 1 OK 40 degrees C / 104 degrees F PEM 2 Absent PEM 3 Absent Routing Engine 0 OK 37 degrees C / 98 degrees F Routing Engine 0 CPU OK 35 degrees C / 95 degrees F Routing Engine 1 Absent Routing Engine 1 CPU Absent CB 0 Intake OK 36 degrees C / 96 degrees F CB 0 Exhaust A OK 34 degrees C / 93 degrees F CB 0 Exhaust B OK 40 degrees C / 104 degrees F CB 0 ACBC OK 39 degrees C / 102 degrees F CB 0 XF A OK 46 degrees C / 114 degrees F CB 0 XF B OK 45 degrees C / 113 degrees F CB 1 Intake Absent CB 1 Exhaust A Absent CB 1 Exhaust B Absent CB 1 ACBC Absent CB 1 XF A Absent CB 1 XF B Absent FPC 3 Intake OK 48 degrees C / 118 degrees F FPC 3 Exhaust A OK 46 degrees C / 114 degrees F FPC 3 Exhaust B OK 51 degrees C / 123 degrees F FPC 3 XL TSen OK 67 degrees C / 152 degrees F FPC 3 XL Chip OK 58 degrees C / 136 degrees F FPC 3 XL_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR0 Chip OK 51 degrees C / 123 degrees F FPC 3 XL_XR1 TSen OK 67 degrees C / 152 degrees F FPC 3 XL_XR1 Chip OK 63 degrees C / 145 degrees F FPC 3 XQ TSen OK 67 degrees C / 152 degrees F FPC 3 XQ Chip OK 63 degrees C / 145 degrees F FPC 3 XQ_XR0 TSen OK 67 degrees C / 152 degrees F FPC 3 XQ_XR0 Chip OK 68 degrees C / 154 degrees F FPC 3 XM TSen OK 67 degrees C / 152 degrees F FPC 3 XM Chip OK 76 degrees C / 168 degrees F FPC 3 XF TSen OK 67 degrees C / 152 degrees F FPC 3 XF Chip OK 75 degrees C / 167 degrees F FPC 3 PLX PCIe Switch TSe OK 51 degrees C / 123 degrees F FPC 3 PLX PCIe Switch Chi OK 54 degrees C / 129 degrees F FPC 3 Aloha FPGA 0 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 0 Chip OK 70 degrees C / 158 degrees F FPC 3 Aloha FPGA 1 TSen OK 51 degrees C / 123 degrees F FPC 3 Aloha FPGA 1 Chip OK 75 degrees C / 167 degrees F FPC 5 Intake Testing FPC 5 Exhaust A Testing FPC 5 Exhaust B Testing Fans Top Rear Fan OK Spinning at intermediate-speed Bottom Rear Fan OK Spinning at intermediate-speed Top Middle Fan OK Spinning at intermediate-speed Bottom Middle Fan OK Spinning at intermediate-speed Top Front Fan OK Spinning at intermediate-speed Bottom Front Fan OK Spinning at intermediate-speed
表 6 列出了命令
show chassis environment
的输出字段。该表按输出字段的大致显示顺序列出输出字段。表 6: show chassis environment
输出字段字段名称
字段说明
Class
有关机箱组件类别或类别的信息:
-
Temp
:流过机箱的空气温度,单位为摄氏度 (°C) 和华氏度 (°F) -
Fans
:有关风扇和鼓风机状态的信息
Item
有关机箱组件的信息:
-
柔性 PIC 集中器 (FPC) — 即线卡
-
控制板 (CB)
-
路由引擎
-
电源输入模块 (PEM) — 即电源
Status
指定机箱组件的状态。例如,如果是 ,则
Class
Fans
风扇状态可以是:-
OK
:风扇正在运行。 -
Testing
:在初始开机期间正在测试风扇。 -
Failed
:风扇出现故障或风扇未旋转。 -
Absent
:未安装风扇托架。
Measurement
取决于类。例如,如果为
Temp
,则Class
表示以摄氏度 (°C) 和华氏度 (°F) 为单位的温度。Class
Fans
如果是 ,则表示实际风扇 RPM。 -
-
发出命令
show chassis temperature-thresholds
。此命令显示机箱温度阈值设置。以下是 EX9208 交换机上的示例输出。其他 EX 系列交换机上的输出与此类似。show chassis temperature-thresholds
(EX9208 交换机)user@ host> show chassis temperature-thresholds Fan speed Yellow alarm Red alarm Fire Shutdown (degrees C) (degrees C) (degrees C) (degrees C) Item Normal High Normal Bad fan Normal Bad fan Normal Chassis default 48 54 65 55 80 65 100 Routing Engine 0 70 80 95 95 110 110 112 FPC 3 55 60 75 65 105 80 110 FPC 5 55 60 75 65 90 80 95
表 7 列出了命令
show chassis temperature-thresholds
的输出字段。该表按输出字段的大致显示顺序列出输出字段。表 7: show chassis temperature-thresholds
输出字段字段名称
字段说明
项目
机箱组件。您可以为每个 FRU 中的每个插槽配置组件(如机箱、路由引擎和 FPC)的阈值信息,以显示在输出中。默认情况下,仅显示机箱和路由引擎的信息。
风扇速度
风扇正常和高速运行的温度阈值(以摄氏度为单位)。
-
正常 - 风扇以正常速度运行以及所有风扇都存在并正常运行时的温度阈值。
-
高 - 风扇高速运行或风扇发生故障或缺失时的温度阈值。
注意:当温度超过黄色、琥珀色或红色警报的阈值设置时,将触发警报。
黄色或琥珀色警报
触发黄色或琥珀色警报的温度阈值(以摄氏度为单位)。
-
正常 - 当风扇全速运行时,必须超过该温度阈值才能触发黄色或琥珀色警报。
-
风扇损坏 - 当一个或多个风扇发生故障或丢失时,必须超过设备上的温度阈值才能触发黄色或琥珀色警报。
红色报警器
触发红色警报的温度阈值(以摄氏度为单位)。
-
正常 - 风扇全速运行时触发红色警报时,设备上必须超过的温度阈值。
-
风扇损坏 - 当一个或多个风扇发生故障或丢失时,必须超过设备上的温度阈值才能触发红色警报。
灭火停机
温度阈值,以摄氏度为单位,发生火灾时开关将关闭。
-
触发温度报警时,您可以通过运行 show chassis environment
命令以显示每个组件的机箱温度值并将其与温度阈值进行比较来确定触发该告警的条件。您可以通过运行 show chassis temperature-thresholds
命令来显示温度阈值。
例如,对于 FPC 3
:
如果温度
FPC 3
超过 55°C,则输出指示风扇正在高速运行(不触发警报)。如果温度超过
FPC 3
65°C,则会触发黄色警报,指示一个或多个风扇出现故障。如果温度超过
FPC 3
75°C,则会触发黄色警报,表示已超过温度阈值限制。如果温度超过
FPC 3
80°C,则会触发红色警报,表示一个或多个风扇出现故障。如果温度超过
FPC 3
105°C,则会触发红色警报,表示已超过温度阈值限制。如果温度超过
FPC 3
110°C,则关闭交换机电源。
表 8 列出了交换机生成温度报警的可能原因。它还列出了相应的补救措施。
原因 |
补救 |
---|---|
环境温度高于阈值温度。 |
确保环境温度在阈值温度限制范围内。请参阅 EX 系列交换机的环境要求和规格。 |
风扇模块或风扇托架出现故障。 |
执行以下步骤:
|
由于已安装交换机周围的间隙不足,通过交换机的气流受到限制。 |
确保已安装的交换机周围有足够的间隙。 |
更改历史记录表
功能支持由您使用的平台和版本决定。使用 功能资源管理器 确定您的平台是否支持某个功能。