誤検出によるAC損失イベントが原因で、管理コントローラがSELエントリを使用できません
環境
- NetApp H610S ストレージノード
- NetApp H615C コンピューティングノード
- システムイベントログ(SEL)
問題
「Management controller unavailable」より前のSELイベント(センサー番号は「AC lost」 0x7a
)が、ストレージノードがリブートされなかった
SEL Record ID : 00a7
Record Type : 02
Timestamp : 11/24/2022 11/24/2022
Generator ID : 0020
EvM Revision : 04
Sensor Type : Management Subsys Health
Sensor Number : 7a
Event Type : Sensor-specific Discrete
Event Direction : Assertion Event
Event Data : 0306ff
Description : Management controller unavailable
H615CノードのSELログエントリは次のとおりです。
Aug/12/2023 16:06:17 [Information] [Power Unit] [Power Unit] Power Off / Power Down - Deasserted
Aug/12/2023 16:06:12 [Warning] [BMC FW Health] [Management Subsystem Health] Management controller unavailable (BMC hardware watchdog timeout reset) - Asserted
Aug/12/2023 15:36:49 [Information] [Power Unit] [Power Unit] AC Lost - Asserted
Jul/8/2023 15:36:18 [Information] [Power Unit] [Power Unit] Power Off / Power Down - Deasserted
Jul/8/2023 15:36:13 [Warning] [BMC FW Health] [Management Subsystem Health] Management controller unavailable (BMC hardware watchdog timeout reset) - Asserted
Jul/8/2023 15:14:23 [Information] [Power Unit] [Power Unit] AC Lost - Asserted