AFF A700sのレベル2ウォッチドッグ リセット(ソフトウェアNMI)による予期しないテイクオーバー
環境
- AFF A700s
- BMC version 1.81より前
問題
- ASUP イベント
(CONTROLLER TAKEOVER COMPLETE AUTOMATIC) ALERTが原因でケースが生成された可能性があります - 影響を受けたノードで BMC ログを収集した後、
system log selコマンドの出力に「Software NMI」と「Hard reset」がログに記録されたことが示されます:
admin@BMC01:~$ system log sel
…
352 | 11/07/2020 | 00:00:20 | CriticalInt | Software NMI | Asserted
353 | 11/07/2020 | 00:00:20 | Watchdog2 | Timer interrupt | Asserted
354 | 11/07/2020 | 00:00:21 | Watchdog2 | Hard reset | Asserted
…