パニック: DIMM-XX の ECC エラー、修正できないマシンチェックエラーです
環境
- ONTAP 9
- AFFシステム
- FASシステム
問題
コントローラがパニック文字列でリブートしました:
PANIC : ECC error at DIMM-3: CE-02-1907-313B1B60,ADDR 0x52da867c80,(Node(1), Memory controller(0), CH(1), DIMM(0), Rank(1), Bank Group(0), Bank(0x1), Row(0x142d8), Col(0x2f8), Uncorrectable Machine Check Error at CPU21.
または
PANIC: Uncorrectable Machine Check Error at CPU14. ECC error at DIMM-13: CE-01-1941-03A203B8,ADDR 0x15f09e1f40,(Node(1), Memory controller(0), CH(1), DIMM(0), Rank(0), Bank Group(3), Bank(0x0), Row(0x15e0f), Col(0x70)) SKL_IMC0 Error: STATUS<0xfe0000c001010091>(VALID,OVERFLOW,UC,EN,MISCV,ADDRV,PCC,CORR_ERR_STATUS(0),CORR_ERR_CNT(0x3),OTHER_INFO(0),MscodDdrType(0x1),MscodDataRdErr,MCACOD(0x91))MISC<0x200400c00fc02086>(DataErrorChunk(0x2),McCmdChnl(0x1),McCmdMemRegion(0),McCmdOpcode(0),McCmdVld,SmiAD,SmiMsgClass(0),SmiOpcode(0),TrkId(0x7e),Error_Type(0x4),ADDRMODE(0x2),ADDRLSB(0x6))ADDR<0x00000015f09e1f40>(HIPHYADDR(0x15),LOPHYADDR(0x3c2787d))(Node(1), Memory controller(0), CH(1), DIMM(0), Rank(0), Bank Group(3), Bank(0x0), Row(0x15e0f), Col(0x70)