ネットワークの輻輳が原因のテイクオーバー無効アラート
環境
- ONTAP 9
- MetroCluster IP
- AFF A250(ソフトウェアiWARP)
問題
- MetroCluster IP構成で報告されるテイクオーバー無効アラート:
[Node_A1: cf_main: cf.fsm.takeoverOfPartnerDisabled:error]: Failover monitor: takeover of Node_A2 disabled (unsynchronized log).
- テイクオーバー機能は数秒で自動的にリカバリされます。
[NodeA1: cf_main: cf.fsm.takeoverOfPartnerEnabled:notice]: Failover monitor: takeover of Node_A2 enabled
- ONTAPは ネットワーク輻輳イベントを報告します。
[Node_A1: mccip_mirror_congestion_mgr_p: mcc.network.congestion:notice]: Network congestion detected. Action taken: Increased ic_timeout to 1200 msec.
- ノードからのifstatの出力で、e0c / e0dポートで大量のTXエラーが報告されることがあります。
- sw_iWARPスレッドが原因でホストの使用率が高い