AFF A250、C250 または FAS500f のパニック:IPMIインターフェースの輻輳によりwatchdog nmi
環境
- AFF A250、AFF C250
- ASA A250、ASA C250
- FAS500f
- BMC 15.11以前
問題
- ノードがパニックでリブートします:
PANIC: watchdog nmi because IPMI interface congested. in process idle: cpu9- BMCイベントログ または
SP-LATEST-SYSTEM-EVENT-LOGは、ウォッチドッグ割り込みとそれに続く複数のバス修正可能エラーを示します。
292 | 12/02/2022 | 17:14:14 | Watchdog 2 #0x0f | Timer interrupt | Asserted293 | 12/02/2022 | 17:14:16 | Watchdog 2 #0x0f | Hard reset | Asserted294 | 12/02/2022 | 17:14:17 | Unknown #0x51 | State Asserted2a2 | 12/02/2022 | 17:15:00 | Critical Interrupt #0x31 | Bus Correctable error | Asserted2a3 | 12/02/2022 | 17:15:00 | Critical Interrupt #0x31 | Bus Correctable error | Asserted2a4 | 12/02/2022 | 17:15:00 | Critical Interrupt #0x31 | Bus Correctable error | Asserted- SSRAMログが報告される
NMIsource(WdogBMCFail) - パニックリブート後、ノードで
Cluster::>event log showの温度エラーが報告される場合があります
[monitor.temp.unreadable:error]: The controller temperature (HIC2 Temp0) is not readable.
[monitor.temp.unreadable:error]: The controller temperature (HIC2 Temp1) is not readable.
[callhome.chassis.hitemp:error]: Call home for CHASSIS OVER TEMPERATURE