Vifmgr:あるクラスタLIFから別のクラスタLIFへのpingを実行すると、パケット損失が発生します
環境
- クラスタ ネットワーク スイッチ
- ONTAP 9
問題
- すべてのクラスタノードで同様のタイプのEMSメッセージが表示されます。
Fri Nov 19 18:06:27 +0100 [node1: vifmgr: vifmgr.cluscheck.ctdpktloss:alert]: Continued packet loss when pinging from cluster lif node1_clus2 (node node1) to cluster lif node5_clus1 (node node5)
Thu Dec 23 03:36:41 +0100 [node2: vifmgr: vifmgr.cluscheck.droppedlarge:alert]: Partial packet loss when pinging from cluster lif node2_clus1 (node node2) to cluster lif node6_clus2 (node node6)
Tue Dec 28 16:54:49 +0100 [node3: vifmgr: vifmgr.cluscheck.droppedall:alert]: Total packet loss when pinging from cluster lif node3_clus2 (node node3) to cluster lif node1_clus1 (node node1)
- 多くのクラスタポートで問題が報告されるため、症状はインタースイッチリンク(ISL)経由での2つのクラスタスイッチ間のネットワークトラフィックの問題を示しています。例:
::> event show -message-name *vifmgr.cluscheck*
Time Node Severity Event
------------------- ---------------- ------------- ---------------------------
8/24/2022 08:14:27 node_name-01 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-01_clus1 (node node_name-01) to cluster lif node_name-11_clus2 (node node_name-11).
8/23/2022 18:36:43 node_name-12 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-12_clus1 (node node_name-12) to cluster lif node_name-11_clus2 (node node_name-11).
8/23/2022 12:41:38 node_name-11 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-01_clus2 (node node_name-01).
8/23/2022 09:33:27 node_name-02 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-02_clus1 (node node_name-02) to cluster lif node_name-11_clus2 (node node_name-11).
8/23/2022 08:28:35 node_name-11 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-12_clus2 (node node_name-12).
8/21/2022 13:58:34 node_name-12 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-12_clus1 (node node_name-12) to cluster lif node_name-01_clus2 (node node_name-01).
8/21/2022 13:36:54 node_name-01 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-01_clus1 (node node_name-01) to cluster lif node_name-11_clus2 (node node_name-11).
8/21/2022 01:51:56 node_name-01 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-01_clus1 (node node_name-01) to cluster lif node_name-12_clus2 (node node_name-12).
8/21/2022 01:08:57 node_name-11 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-01_clus2 (node node_name-01).
8/21/2022 01:08:57 node_name-11 ALERT vifmgr.cluscheck.ctdpktloss: Continued packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-01_clus2 (node node_name-01).
8/20/2022 22:48:56 node_name-11 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-01_clus2 (node node_name-01).
8/20/2022 22:48:56 node_name-11 ALERT vifmgr.cluscheck.ctdpktloss: Continued packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-01_clus2 (node node_name-01).
8/20/2022 22:11:29 node_name-02 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-02_clus1 (node node_name-02) to cluster lif node_name-12_clus2 (node node_name-12).
8/20/2022 10:58:50 node_name-11 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-01_clus2 (node node_name-01).
8/20/2022 01:39:14 node_name-01 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-01_clus1 (node node_name-01) to cluster lif node_name-12_clus2 (node node_name-12).
8/20/2022 01:39:14 node_name-11 ALERT vifmgr.cluscheck.droppedlarge: Partial packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-12_clus2 (node node_name-12).
8/20/2022 01:39:14 node_name-11 ALERT vifmgr.cluscheck.ctdpktloss: Continued packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-12_clus2 (node node_name-12).
8/19/2022 17:29:32 node_name-11 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-12_clus2 (node node_name-12).
8/19/2022 17:29:32 node_name-11 ALERT vifmgr.cluscheck.ctdpktloss: Continued packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-12_clus2 (node node_name-12).
8/18/2022 21:13:36 node_name-11 ALERT vifmgr.cluscheck.droppedall: Total packet loss when pinging from cluster lif node_name-11_clus1 (node node_name-11) to cluster lif node_name-12_clus2 (node node_name-12).
20 entries were displayed.
- 上記の例に基づいて、問題 は 常に1つのノードのクラスタLIF - clus1と 別のノードのクラスタLIF - clus2の間で発生します。逆も同様です
- すべてのノードのclus1ポートは1つのクラスタスイッチに接続し 、clus2 ポートはもう一方のクラスタスイッチに接続しています
- ISLポート を一度に1つずつ無効にし、エラーメッセージが返された場合はクラスタのpingでチェックします。例:
::> set advanced
::*> cluster ping-cluster
- 障害のあるISL接続を特定し、リンク固有のハードウェア部品を調べた