クラスタネットワークのケーブル接続不備により、クラスタスイッチのリブート中にノードがクォーラムから外れる
環境
- ONTAP 9
- クラスタネットワークスイッチ
- 接続性、稼働性、および可用性モニター(CLAM)
問題
- クラスタスイッチのアップグレード/reboot中、データトラフィック接続は一時的に失われます。
- ノードデータLIFは別のノードにフェイルオーバーします
- EMS log file outputの確認で、クラスタがquorumから外れていることがわかります。
[Node-02: kltp: clam.node.ooq:EMERGENCY]: Node (name=Node-01, ID=1000) is out of "CLAM quorum" (reason=node in minority).
[Node-02: kltp: clam.node.ooq:EMERGENCY]: Node (name=Node-03, ID=1002) is out of "CLAM quorum" (reason=node in minority).- 影響を受けるノードの両方のクラスタポートが同時にダウンします。
[Node-01: vifmgr: vifmgr.portdown:notice]: A link down event was received on node Node-01, port e0a.
[Node-01: vifmgr: vifmgr.clus.linkdown:EMERGENCY]: The cluster port e0a on node Node-01 has gone down unexpectedly.
[Node-01: vifmgr: vifmgr.portdown:notice]: A link down event was received on node Node-01, port e0b.
[Node-01: vifmgr: vifmgr.clus.linkdown:EMERGENCY]: The cluster port e0b on node Node-01 has gone down unexpectedly.
- ノードでCLAM panicが発生してリブートすることがあります。
[Node-01: gop_eq_thread: sk.panic:alert]: Panic String: Received PANIC packet from partner, receiving message is (Coredump and takeover initiated because Connectivity, Liveliness and Availability Monitor (CLAM) has determined this node is out of quorum.) in SK process gop_eq_thread on release 9.10.1P6 (C)
- 影響を受けるノードのクラスタアプリケーションはオフラインになります。