FAS8200のルートポート0、1、0でPCIエラーNMIがパニック状態になり、UCorrErr(ECRC)が発生
環境
- FAS 8200
- AFF A300
- ONTAP 9
問題
- ルートポート0、1、0でPCIエラーNMIが発生してノードがパニック状態になる:
PANIC: PCI Error NMI from device(s):ErrSrcID(CorrSrc(0),UCorrSrc(0x8)), RPT(0,1,0): in process idle: cpu11
- パニック文字列の前に、次のエラーが表示されることもあります。
0x000000cc539579ed: Add bad root port 0/1/0 (1)
0x000000cc53ea7f3a: 0/1/0 ucerr_status 0x80000
0x000000cc53ea8423: Recovery process terminated PANIC : PCI Error NMI from device(s):ErrSrcID(CorrSrc(0),UCorrSrc(0x8)), RPT(0,1,0):
- SSRAM/Pelogsには、修正不可能なエラーがエンドツーエンドCRC(ECRC)によって発生していることが示されています。
RZR,1_0.IIO0: GNERR<0x00000040>(P1A), GNFERR<0x00000040>(P1A); RPT(0,1,0): GLB<0x00000002>(NFERR), PTR<0x1>, Status(SigSysErr), DevStatus(NFatal), RootErr(UCor,NFatal), ErrSrcID(CorrSrc(0),UCorrSrc(0x8)), UCorrErr(ECRC), FirstUCorrErr(ECRC), TLPType(4MWrRq)
- すべてのブート試行が同じパニック状態で失敗します。