CPUXXで修正不能なマシンチェックエラー。NIC交換後のAFF A800でSKL_IIOエラー
環境
- AFF-A800
- AFF-C800
問題
AFF-A800 / C800 aPCI Analysis toolで呼び出されたスロット2のNICを交換したあと、ノードで修正不能なマシンチェックエラーが再び発生した
PANIC: Uncorrectable Machine Check Error at CPU47. SKL_IIO Error: STATUS<0xbb80000000000e0b>(VALID,UC,EN,MISCV,PCC,S,AR,CORR_ERR_STATUS(0),CORR_ERR_CNT(0),MSCOD(0),MCACOD(0xe0b))MISC<0x0000000085000000>(UCR_BUS_LOG(133),UCR_DEVICE_LOG(0),UCR_FUNCTION_LOG(0),UCR_SEGMENT_LOG(0))IIO Machine Check from device(s):RPT(133,0,0):ErrSrcID(CorrSrc(0),UCorrSrc(0x8500)), PLX PCIE 8796 switch on Controller, PCI Device 1425:600d in slot 2 on Controller, T62100-CR Dual 40/100G NIC in slot 2 on Controller. in SK process wafl_exempt04