EシリーズのBMCが応答せず、ハードウェアアラートの誤検出がトリガーされることがある
環境
- NetApp Eシリーズ
- SANtricity OSのバージョンが11.70.1R1 ~ 11.70.4(BMCファームウェアが14.10より前)
- NetApp EF300およびEF600
問題
- コントローラのBMC (ベースボード 管理 コントローラ) が「
MEL
(メジャーイベントログ)」に応答していません。
A:10/29/21, 12:35:33 PM (12:35:33) 2800 2868 The controller's BMC was unresponsive and the recovery process successfully
recovered the BMC - Shelf 99, Bay A
A:10/29/21, 12:34:31 PM (12:34:31) 2799 2867 The controller's BMC is unresponsive - Shelf 99, Bay A
- メジャーイベントログでは、次のような誤検出ハードウェアアラートが報告されることもあります。
A:11/22/21, 11:16:25 AM (11:16:25) 1676 280b Controller shelf component failed - Shelf 99, Controller 1, Fan canister 5, Bay 1 <--CRITICAL
- EシリーズサポートバンドルおよびAutoSupport(Dom0-wathcdog BMC -logs-%.7Z)には、wathcdogタイムアウトのリセットがトリガーされたことを示す次のBMCイベント(SP _system_event_log.txt)が含まれています。
740 | 01/01/2000 | 00:00:30 | Power Supply #0x72 | Presence detected | Asserted
741 | 01/01/2000 | 00:00:30 | Power Supply #0x73 | Presence detected | Asserted
742 | OEM record f2 | Watchdog1 Timeout
743 | OEM record f2 | Pilot Software reset
744 | 01/01/2000 | 00:00:36 | Battery #0x4f | State Deasserted
745 | 01/01/2000 | 00:00:38 | System Event #0xff | Timestamp Clock Sync | Asserted
746 | 11/16/2022 | 19:37:07 | System Event #0xff | Timestamp Clock Sync | Asserted