NetApp H610Sノードが修正不能なマシンチェックエラーで予期せずリブートしました
環境
- NetApp H610S
- NetApp Element ソフトウェア
- 現在サポートされているすべてのバージョンの BIOS
問題
- Element クラスタ内のノードが nodeOffline イベントに約 7-15 分間記録します
- メタデータドライブのステータスが「available」になっているため、アレイに戻すことはできません。
- ログには、ノードが予期せずリブートしたことが記録されてい
- のエントリは
Uncorrectable Machine Check Exception
、nodeOfflineイベントの発生時点を記録したBMCシステムイベントログに記録されています - BMC SELイベントの例:
SEL Record ID : 0053 Record Type : 02 Timestamp : 11/22/2020 13:18:25 Generator ID : 0020 EvM Revision : 04 Sensor Type : Processor Sensor Number : 74 Event Type : Sensor-specific Discrete Event Direction : Assertion Event Event Data : 0bffff Description : Uncorrectable machine check exception