デバイスからの AFF A250 または FAS500F UMCE : 処理中アイドル: cpuxx
環境
- AFF A250
- FAS500f
問題
- 修正不能なマシンチェックエラーが原因で、 AFF A250 または FAS500f ノードがパニック状態になります。リブートおよびギブバック後も問題は発生しません。
- パニック・メッセージの例:
PANIC: Uncorrectable Machine Check Error at CPU11. SKL_IIO Error: STATUS<0xb380000000000e0b>(VALID,UC,EN,PCC,S,AR,CORR_ERR_STATUS(0),CORR_ERR_CNT(0),MSCOD(0),MCACOD(0xe0b))IIO Machine Check from device(s):. in process idle: cpu11 on release 9.8P3 (C) on Tue Jun 00 00:00:00 MDT 2021
[node_name: idle: cpu11: sk.panic:alert]: Panic String: Uncorrectable Machine Check Error at CPU11. SKL_IIO Error: STATUS<0xb380000000000e0b>(VALID,UC,EN,PCC,S,AR,CORR_ERR_STATUS(0),CORR_ERR_CNT(0),MSCOD(0),MCACOD(0xe0b))IIO Machine Check from device(s):. in process idle: cpu11 on release 9.8P1 (C)