ONTAPのアップグレード時にパートナーノードからギブバックするとノードがクォーラムのメンバーでなくなる
環境
- ONTAP 9
- AFF-A400
問題
Failed to get ONTAP version of the node node2
ONTAPシステムマネージャを使用して9.8P5から9.8P20へのONTAPのアップグレードが失敗する- ONTAPのアップグレード中、マスターノードからギブバックすると、セカンダリノードがクォーラムのメンバーでなくなります。
[2023-12-29 13:15:18.994] 12/29/2023 11:42:33 node1 ERROR upgrademgr.update.pausedErr: The automated update of the cluster has been paused due to the following reason: Node "node1": Error: {Failed to get ONTAP version of the node "node2".}, Action: {Verify that the node "node2" was booted with the intended version using the "system image show" command.}.
[2023-12-29 13:15:19.007] 12/29/2023 11:41:00 node1 EMERGENCY clam.node.ooq: Node (name=node2, ID=1001) is out of "CLAM quorum" (reason=seen by HA partner).
[2023-12-29 13:15:19.007] 12/29/2023 11:41:00 node1 EMERGENCY callhome.clam.node.ooq: Call home for NODE(S) OUT OF CLUSTER QUORUM.
- スイッチレスクラスタ構成では両方のクラスタポートが停止します。ポートアクティブLEDは消灯しています。
[2023-12-29 13:15:19.032] 12/29/2023 11:26:43 node1 ERROR vifmgr.port.monitor.failed: The "link_flapping" health check for port e3b (node node1) has failed. The port is operating in a degraded state.
[2023-12-29 13:15:19.034] 12/29/2023 11:26:43 node1 ERROR vifmgr.port.monitor.failed: The "link_flapping" health check for port e3a (node node1) has failed. The port is operating in a degraded state.
- X1151Aカードファームウェアは1.4.0-E-96で、 バグ1383080が修正されています。
- 次の操作を実行してみます。いずれもこの問題には効果がありません。
クラスタポートに接続されているSFPとケーブルを抜き差しします。
各ローカルノードでe3aからe3bへのループバックテストを実行して、障害のある側を特定し、すべてのクラスタポートがリンクアップに失敗していることを確認します。
スロット3にカードを取り付け直します
両方のノードで電源を再投入する