NetApp H610S ノードがマシンチェックエラーで予期せずリブートしました
環境
- NetApp H610S
- NetApp Element ソフトウェア
- 現在サポートされているすべてのバージョンの BIOS
問題
- Element クラスタ内のノードが nodeOffline イベントに約 7-15 分間記録します
- ログには、ノードが予期せずリブートしたことが記録されてい
Uncorrectable Machine Check Exception
Correctable machine check error
またはのエントリは、 nodeOffline イベントの発生時点を中心とした BMC システムイベントログに記録されます- BMC SEL イベントの例:
SEL Record ID : 0053 Record Type : 02 Timestamp : 11/22/2020 13:18:25 Generator ID : 0020 EvM Revision : 04 Sensor Type : Processor Sensor Number : 74 Event Type : Sensor-specific Discrete Event Direction : Assertion Event Event Data : 0bffff Description : Uncorrectable machine check exception ========================= SEL Record ID : 0076 Record Type : 02 Timestamp : 04/04/2021 11:21:35 Generator ID : 0001 EvM Revision : 04 Sensor Type : Processor Sensor Number : a8 Event Type : Sensor-specific Discrete Event Direction : Assertion Event Event Data : ac032b Description : Correctable machine check error