ネットワークの輻輳が原因でテイクオーバーが無効になったアラート
環境
- ONTAP 9
- MetroCluster IP
- AFF A250(ソフトウェアiWARP)
問題
- MetroCluster IP 構成でテイクオーバー無効化アラートが報告されました:
[Node_A1: cf_main: cf.fsm.takeoverOfPartnerDisabled:error]: Failover monitor: takeover of Node_A2 disabled (unsynchronized log).
- テイクオーバー機能は数秒で自動的に復旧します:
[NodeA1: cf_main: cf.fsm.takeoverOfPartnerEnabled:notice]: Failover monitor: takeover of Node_A2 enabled
- ONTAP はネットワーク輻輳イベントを報告します:
[Node_A1: mccip_mirror_congestion_mgr_p: mcc.network.congestion:notice]: Network congestion detected. Action taken: Increased ic_timeout to 1200 msec.
- ノードからのifstat出力では、e0c/e0dポートで高いTXエラーが報告される場合があります。
- sw_iwarpスレッドが原因でHostos使用率が高くなっています