CFBMC-3996:BMC 13.10P1でSP HBTが停止したためノードがリブートする
問題
- ハートビートの停止または欠落が原因でAFF A400、AFF C400、ASA A400、ASA C400、FAS8300、またはFAS8700のノードが予期せずリブートする
- 次のイベントはこの問題の例です。[Node-01:spmgrd:ipmgrd:heartbeat.stopped:error]:サービスプロセッサ(SP)から600秒以内にSPハートビートを受信していません。
[Node-01:spmgrd:callhome.hbt.missed:notice]:SP SP SP HBTが失敗した場合のコールホーム[Node-01:spmgrd:callhome.hbt.stopped:alert]:SP SP HBTが停止した場合
のコールホーム
[Node-01:env_mgr:SP。ハードウェアの損傷やデータ損失を防ぐため、システムは10分後にシャットダウンします。
[Node-01:env_mgr:monitor.shutdown.emergency:emergency]:緊急時のシャットダウン:環境上の理由によるシャットダウン(BMCをリカバリするためのシステムリブート)
- IPMI_KCS_ERRメッセージは、sktraceのリブートのタイムスタンプで観察されます。log:
2024-03-10T01:30:58Z 2180899785867098[5:0] IPMI_KCS_ERR:KCS_START_WRITE:cmd 0x31 NF 0x36 STATE 3
not
write
- ノードがリブートしてオンラインに戻ります。