BMCのアップグレードに失敗したためにアップグレード中にノードのリブートが停止する
環境
NetApp StorageGRIDアプライアンス
問題
StorageGRIDをアップグレードすると、1つのストレージノードがリブートステージで停止します。
BMCコンソールにアクセスしようとすると、リブートが繰り返されます。
ノードがPGEモードで停止したり、継続的にリブートしたりすることもあります。
sg-fw-update.log レポート:[2025-01-15 18:10:00+00:00 SGA] Starting BMC firmware update. DO NOT REBOOT!
[2025-01-15 18:10:00+00:00 SGA] =============================================================================
[2025-01-15 18:10:00+00:00 SGA] Executing 'timeout 300 ./Yafuflash2 -cd -info rom.ima_enc'
[2025-01-15 18:10:00+00:00 SGA]
[2025-01-15 18:14:59+00:00 SGA] ERROR: failed BMC firmware update.
[2025-01-15 18:14:59+00:00 SGA] Executing 'timeout 120 ipmitool bmc reset cold'
[2025-01-15 18:15:00+00:00 SGA] Sent cold reset command to MC
[2025-01-15 18:15:00+00:00 SGA] Waiting for BMC to finish reset.