ic.HAInterconnectLinkDown が頻繁に発生する

規定のコンテンツブロック内にのみテキストを追加してください。ソルブループコンテンツの作成の詳細については、こちら をクリックしてください。
環境
- ONTAP 9
- AFF-A400
- FAS8300
- FAS8700
- HAインターコネクト
問題
- 「
system ha interconnect status show」が表示され、link 0とlink 1がダウン状態です。
Cluster::*> system ha interconnect status show
Node:node-1
Link 0 Status: down
Link 1 Status: down
Is Link 0 Active: false
Is Link 1 Active: false
IC RDMA Connection: up
Node:node-2
Link 0 Status: down
Link 1 Status: down
Is Link 0 Active: false
Is Link 1 Active: false
IC RDMA Connection: up
2 entries were
displayed.
- EMSログは1時間ごとに「
ic.HAInterconnectLinkDown」を報告します。
[?] Thu Apr 28 02:00:00 +0000 [node-1: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73387 minutes.
[?] Thu Apr 28 03:00:00 +0000 [node-1: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73447 minutes.
[?] Thu Apr 28 04:00:00 +0000 [node-1: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73507 minutes.
[?] Thu Apr 28 05:00:00 +0000 [node-1: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73567 minutes.
[?] Thu Apr 28 02:00:00 +0000 [node-2: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73309 minutes.
[?] Thu Apr 28 03:00:00 +0000 [node-2: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73429 minutes.
[?] Thu Apr 28 04:00:00 +0000 [node-2: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73489 minutes.
[?] Thu Apr 28 05:00:00 +0000 [node-2: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73549 minutes.
- node-1 "
sysconfig -a" e0a SFP情報は空白です。
slot 0: 10G/25G Ethernet Controller CX5
e0a MAC Address: d0:39:ea:38:fb:bb (auto-unknown-fd-down)
SFP Vendor:
SFP Part Number:
SFP Serial Number:
e0b MAC Address: d0:39:ea:38:fb:bc (auto-25g_cr-fd-up)
SFP Vendor: Molex
SFP Part Number: 1111455002
SFP Serial Number: XXXXXXXXXXXXXX
Device Type: CX5 PSID(NAP0000000006)
Firmware Version: 16.26.4012
原因
- InterconnectのSFP情報が正しく読み取られない
- Interconnectケーブルまたはオンボードポートのハードウェア障害
解決策
- node-1 e0aとnode-2 e0aのSFPケーブルを確認し、抜き差ししてください。
- ケーブルを抜き差ししても問題が解決しない場合は、node-1 e0aからnode-2 e0aへのSFPケーブルを交換してください。
- SFPケーブルを交換しても上記の問題が解決しない場合は、node-2からTakeoverを実行してください。
- CFO givebackを実行し、ローカルループバックテストを実行して、問題の原因となっているノードを特定してください。
- さらにサポートが必要な場合は、 NetApp Technical Support にお問い合わせの上、この記事をご参照ください。
追加情報
追加情報_text
内部情報
- HA ICポートおよびHAクラスタポートに関連する問題に対処する場合、LEDステータスだけではどちらの側に障害が発生しているかを特定できません。
- 障害が発生している側を特定するには、以下のすべての手順が重要です。
- ケーブルの再接続
- ケーブルの交換
- ループバックテスト
- ASUPログの確認
例:
ケース番号 2009500112
- ネットワークケーブルの再接続テストを行っていたところ、ノード1のポートe0bのLEDは消灯(オフ)していましたが、ノード2のポートe0bのLEDは緑色に点灯していました。
- そのため、ノード1のネットワークポートに問題があると考えました。
- しかし、その後の調査で、ノード1のネットワークポートのLEDが消灯したのはノード2のネットワークポートの問題であることが分かりました。
- この例では、sysconfig -aの出力に重要な情報が含まれています。つまり、ノード2のポート情報にSFP関連の情報が欠けているのです。
Node1
slot 0: 10G/25G Ethernet Controller CX5
e0a MAC Address: d0:39:ea:xx:xx:xx (auto-25g_cr-fd-up)
SFP Vendor: Molex
SFP Part Number: 1111455002
SFP Serial Number: xxxxxxxxxxxxx
e0b MAC Address: d0:39:ea: xx:xx:xx (auto-unknown-fd-down)
SFP Vendor: Molex
SFP Part Number: 1111455002
SFP Serial Number: xxxxxxxxxxxxx
Device Type: CX5 PSID(NAP0000000006)
Firmware Version: 16.26.4012
Node2
slot 0: 10G/25G Ethernet Controller CX5
e0a MAC Address: d0:39:ea: xx:xx:xx (auto-25g_cr-fd-up)
SFP Vendor: Molex
SFP Part Number: 1111455002
SFP Serial Number: xxxxxxxxxxxxx
e0b MAC Address: d0:39:ea: xx:xx:xx (auto-unknown-fd-down)
SFP Vendor:
SFP Part Number:
SFP Serial Number:
Device Type: CX5 PSID(NAP0000000006)
Firmware Version: 16.26.4012