隣接ノードのNIC交換中に、PSUの障害によりノードが停止する
環境
- ONTAP 9
- AFF / FAS
- クラスタ化ONTAP環境
問題
- ノードNode-1(AFF-C800)での計画されたNIC交換中に、パートナーノードNode-2が予期せずダウンしました。これによりクラスタのフェイルオーバーが発生し、約27のボリュームが一時的に利用できなくなり、複数の電源関連のアラートが生成されました。
- 関連するログ出力:
[IPMI.notice]: PSU2_IOUT | AssertionEvent, "LowerCritical going low" | Reading: 0.000 | Threshold: 0.000
[IPMI.notice]: PSU2_AC_Curr_IIN | AssertionEvent, "LowerCritical going low" | Reading: 0.000 | Threshold: 0.000
[IPMI.notice]: PSU2_PIN | AssertionEvent, "LowerCritical going low" | Reading: 0.000 | Threshold: 7.100|[env_mgr:monitor.chassisPowerSupply.degraded]: Chassis power supply 2 is degraded: PSU2 CurrIn is Critical Low (0mA)
[power_low_monitor:callhome.chassis.power:error]: Callhome for CHASSIS POWER DEGRADED: PowerSupplyStatusCritical: PSU2.
[IPMI.notice]: OEM: BMCPowerReset[IPMI.notice]: OEM: POSRegister: PoweronReset (NormalPowerCycle)
- タイムラインは、イベント発生時にthatNode-2がNode-1のテイクオーバー状態にあったことを示しています。