パニック:FAS9500/AFF A900のCPUXで修正不能なマシンチェックエラーが発生
環境
- FAS9500
- AFF A900
- ONTAP 9.11.1P4
問題
修正不能なマシンチェックエラーが原因でFAS9500/AFF A900ノードがパニック状態になります。
BMCログ:
PANIC:Uncorrectable Machine Check Error at CPU10. ICL_UBOX Error:STATUS<0xba00000000000e0b>(VALID,UC,EN,MISCV,PCC,CESI(0),CERR_CNT(0),OTHER_INFO(0),MSCOD(0),MCACOD(0xe0b))MISC<0x0000000049100000>(BUS_LOG(0x49),DEVICE_LOG(0x2),FUNCTION_LOG(0),SEGMENT_LOG(0))IIOMachine Check from device(s):RPT(73,2,0):
MicrochipPCI-E Switch on Controller, Br[4000](75,0,0): Link down. . in process idle: cpu10 on release 9.11.1P4(C) on Mon Nov 20 13:54:15 JST 2023
Device 76/0/0 (SLOT-4) missing
System is resetting to enable power removal from missingdevice.