クラスタスイッチ N9K C9336 の再起動によりクラスタ通信が失われました
環境
- FAS/AFFシステム
- Cisco N9K-C9336C-FX2クラスタスイッチ
- NX-OSバージョン10.2.5
問題
- すべてのノードの両方のクラスタポートが同時にダウンし、クラスタ通信が失われます:
Sat Nov 01 00:30:34 [Node-01: mgmt_port_link_status_poll: netif.linkDown:info]: Ethernet e3b: Link down, check cable.Sat Nov 01 00:31:23 [Node-01: mgmt_port_link_status_poll: netif.linkDown:info]: Ethernet e3a: Link down, check cable.
Sat Nov 01 00:30:34 [Node-02: mgmt_port_link_status_poll: netif.linkDown:info]: Ethernet e3b: Link down, check cable.Sat Nov 01 00:31:23 [Node-02: mgmt_port_link_status_poll: netif.linkDown:info]: Ethernet e3a: Link down, check cable.
Sat Nov 01 00:30:35 [Node-03: mgmt_port_link_status_poll: netif.linkDown:info]: Ethernet e3b: Link down, check cable.Sat Nov 01 00:31:24 [Node-03: mgmt_port_link_status_poll: netif.linkDown:info]: Ethernet e3a: Link down, check cable.
Sat Nov 01 00:30:35 [Node-04: mgmt_port_link_status_poll: netif.linkDown:info]: Ethernet e3b: Link down, check cable.Sat Nov 01 00:31:24 [Node-04: mgmt_port_link_status_poll: netif.linkDown:info]: Ethernet e3a: Link down, check cable.
- クラスタ内のすべてのノードが CLAM クォーラムから外れます:
Sat Nov 01 00:32:30 [Node-01: kltp: clam.node.ooq:EMERGENCY]: Node (name=Node-01, ID=1000) is out of "CLAM quorum" (reason=node in minority).Sat Nov 01 00:32:31 [Node-02: kltp: clam.node.ooq:EMERGENCY]: Node (name=Node-01, ID=1000) is out of "CLAM quorum" (reason=node in minority).Sat Nov 01 00:32:22 [Node-03: kltp: clam.node.ooq:EMERGENCY]: Node (name=Node-01, ID=1000) is out of "CLAM quorum" (reason=node in minority).Sat Nov 01 00:32:31 [Node-04: kltp: clam.node.ooq:EMERGENCY]: Node (name=Node-01, ID=1000) is out of "CLAM quorum" (reason=node in minority).
- クラスタの RDB が非同期になり、クォーラムが失われます。
- スイッチログには、両方のクラスタスイッチが再起動され、これらのスイッチにリンクされているクラスタポートが非アクティブになったことが示されています:
Cluster-switch1:
Sat Nov 1 04:39:01 2025: Card Uptime Record----------------------------------------------Uptime: 83, 0 days 0 hour(s) 1 minute(s) 23 second(s)Reset Reason: Unknown (0)
Cluster-switch-2:
Sat Nov 1 04:38:33 2025: Card Uptime Record----------------------------------------------Uptime: 83, 0 days 0 hour(s) 1 minute(s) 23 second(s)Reset Reason: Unknown (0)