PCINMI パニック DMI (0,0,0) 、コントローラ上の Intel 1G NIC が原因でノードがダウンする
環境
- AFF A220
- AFF C190用
- FAS8200
問題
- ノードがパニック状態になってリブートします。
- ノードのステータスはと表示されます
'dumping spare core'
Takeover
Node Partner Possible State Description
-------------- -------------- -------- -------------------------------------
Node-n1 Node-n2 - Dumping sparecore
Node-n2 Node-n1 false In takeover, Auto giveback deferred
- またはブートループでスタックしています
Uptime: 42s
multiple recursive panics - rebooting.
cpuid = 13
Uptime: 42s
multiple recursive panics - rebooting.
cpuid = 13
SP-LATEST-CONSOLE-LOGS
PANIC: PCI Error NMI from device(s):DMI(0,0,0),Intel 1G NIC on Controller. in process idle: cpu6 on release 9.7P6 (C) on Tue Aug 17 00:24:30 GMT 2021
version: 9.7P6: Tue Jul 28 00:08:29 EDT 2020
compile flags: x86_64.optimize
Writing panic info to HA mailbox disks.
HA: current time (in sk_msecs) 301869 (in sk_cycles) 933286516957473
DUMPCORE: START
Dumping to boot device.