レベル 2 watchdog リセット(ソフトウェア NMI )による予期しないテイクオーバー AFF A700s
環境
- AFF A700s
- BMCバージョン1.81より前
問題
- ASUP イベントが原因でケースが生成される可能性があります
(CONTROLLER TAKEOVER COMPLETE AUTOMATIC) ALERT
- 影響を受けるノードで BMC ログを収集したあと、
system log sel
コマンドの出力に「 Software NMI 」と「 Hard reset 」が記録されたことが示されます。
admin@BMC01:~$ system log sel
…
352 | 11/07/2020 | 00:00:20 | CriticalInt | Software NMI | Asserted
353 | 11/07/2020 | 00:00:20 | Watchdog2 | Timer interrupt | Asserted
354 | 11/07/2020 | 00:00:21 | Watchdog2 | Hard reset | Asserted
…