H610C / H615CノードでNetApp HCI マシンのチェックエラーが発生しました
環境
NetApp H610C / H615C(コンピューティングノード)
問題
- パープルスクリーンオブデス(PSOD)でノードがクラッシュしました
Correctable ECC
多数のエラーが発生することで、次のような[Information] [Memory Error] [Memory] Correctable ECC(CPU#_##) - Asserted
[Critical] [Memory Error] [Memory] Correctable ECC Error Logging Limit Reached(CPU#_##)
- IPMI SEL アラート:
[Warning] [Additional MCE Error] [OEM Record C2] ManufacturerID:001C4C, Extra Information : 0 MSCOD:0010 MCACOD:0134
[Critical] [MCERR] [Processor] Uncorrectable Error - Machine Check Error: Bank #/CPU #/Core ## - Asserted