修正可能なマシンチェックエラーが発生してNetApp H610Sノードが予期せずリブートする
環境
- NetApp H610S
- NetApp Elementソフトウェア
- 現在サポートされているすべてのバージョンの BIOS
問題
- Elementクラスタ内のノードでnodeOfflineイベントが約7~15分間ログに記録されます。
- ノードが予期せずリブートされたことがログに記録されている
-
Correctable machine check error
のエントリが 、nodeOfflineイベントの前後にBMCシステムイベントログに記録されている - BMC SELイベントの例:
SEL Record ID : 0076 Record Type : 02 Timestamp : 04/04/2021 11:21:35 Generator ID : 0001 EvM Revision : 04 Sensor Type : Processor Sensor Number : a8 Event Type : Sensor-specific Discrete Event Direction : Assertion Event Event Data : ac032b Description : Correctable machine check error