メインコンテンツへスキップ

ic.HAInterconnectLinkDown が頻繁に発生する

Views:
74
Visibility:
Public
Votes:
0
Category:
fas-systems
Specialty:
hw
Last Updated:

Color_Def.png

規定のコンテンツブロック内にのみテキストを追加してください。ソルブループコンテンツの作成の詳細については、こちら をクリックしてください。

環境

  • ONTAP 9
  • AFF-A400
  • FAS8300
  • FAS8700
  • HAインターコネクト

問題

  • system ha interconnect status show」が表示され、link 0link 1がダウン状態です。

Cluster::*> system ha interconnect status show

           Node:node-1

       Link 0 Status: down
       Link 1 Status: down
     Is Link 0 Active: false
     Is Link 1 Active: false

 IC RDMA Connection: up

           Node:node-2
       Link 0 Status: down
       Link 1 Status: down
     Is Link 0 Active: false
     Is Link 1 Active: false
    IC RDMA Connection: up
2 entries were
displayed.

  • EMSログは1時間ごとに「ic.HAInterconnectLinkDown」を報告します。

[?] Thu Apr 28 02:00:00 +0000 [node-1: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73387 minutes.
[?] Thu Apr 28 03:00:00 +0000 [node-1: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73447 minutes.
[?] Thu Apr 28 04:00:00 +0000 [node-1: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73507 minutes.
[?] Thu Apr 28 05:00:00 +0000 [node-1: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73567 minutes.

[?] Thu Apr 28 02:00:00 +0000 [node-2: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73309 minutes. 
[?] Thu Apr 28 03:00:00 +0000 [node-2: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73429 minutes.
[?] Thu Apr 28 04:00:00 +0000 [node-2: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73489 minutes.
[?] Thu Apr 28 05:00:00 +0000 [node-2: statd: ic.HAInterconnectLinkDown:error]: HA interconnect: External link #0 has been down for 73549 minutes.

  • node-1 "sysconfig -a" e0a SFP情報は空白です。

slot 0: 10G/25G Ethernet Controller CX5
  e0a MAC Address:   d0:39:ea:38:fb:bb (auto-unknown-fd-down)
    SFP Vendor:      
    SFP Part Number:      
    SFP Serial Number:      
  e0b MAC Address:   d0:39:ea:38:fb:bc (auto-25g_cr-fd-up)
    SFP Vendor:      Molex
    SFP Part Number:   1111455002
    SFP Serial Number:  XXXXXXXXXXXXXX
  Device Type:     CX5 PSID(NAP0000000006)
  Firmware Version:   16.26.4012

原因

  • InterconnectのSFP情報が正しく読み取られない
  • Interconnectケーブルまたはオンボードポートのハードウェア障害

解決策

  1. node-1 e0aとnode-2 e0aのSFPケーブルを確認し、抜き差ししてください。
  2. ケーブルを抜き差ししても問題が解決しない場合は、node-1 e0aからnode-2 e0aへのSFPケーブルを交換してください。
  3. SFPケーブルを交換しても上記の問題が解決しない場合は、node-2からTakeoverを実行してください。
  4. CFO givebackを実行し、ローカルループバックテストを実行して、問題の原因となっているノードを特定してください。
  5. さらにサポートが必要な場合は、 NetApp Technical Support にお問い合わせの上、この記事をご参照ください。

追加情報

追加情報_text

内部情報

  • HA ICポートおよびHAクラスタポートに関連する問題に対処する場合、LEDステータスだけではどちらの側に障害が発生しているかを特定できません。
  • 障害が発生している側を特定するには、以下のすべての手順が重要です。
  1. ケーブルの再接続
  2. ケーブルの交換
  3. ループバックテスト
  4. ASUPログの確認

例:

ケース番号 2009500112

  • ネットワークケーブルの再接続テストを行っていたところ、ノード1のポートe0bのLEDは消灯(オフ)していましたが、ノード2のポートe0bのLEDは緑色に点灯していました。
  • そのため、ノード1のネットワークポートに問題があると考えました。
  • しかし、その後の調査で、ノード1のネットワークポートのLEDが消灯したのはノード2のネットワークポートの問題であることが分かりました。
  • この例では、sysconfig -aの出力に重要な情報が含まれています。つまり、ノード2のポート情報にSFP関連の情報が欠けているのです。

Node1

 slot 0: 10G/25G Ethernet Controller CX5
  e0a MAC Address:   d0:39:ea:xx:xx:xx (auto-25g_cr-fd-up)
    SFP Vendor:      Molex
    SFP Part Number:   1111455002
    SFP Serial Number:  xxxxxxxxxxxxx
  e0b MAC Address:   d0:39:ea: xx:xx:xx (auto-unknown-fd-down)
    SFP Vendor:      Molex
    SFP Part Number:   1111455002
    SFP Serial Number:  xxxxxxxxxxxxx
  Device Type:     CX5 PSID(NAP0000000006)
  Firmware Version:   16.26.4012

Node2

 slot 0: 10G/25G Ethernet Controller CX5
  e0a MAC Address:   d0:39:ea: xx:xx:xx (auto-25g_cr-fd-up)
    SFP Vendor:      Molex
    SFP Part Number:   1111455002
    SFP Serial Number:  xxxxxxxxxxxxx
  e0b MAC Address:   d0:39:ea: xx:xx:xx (auto-unknown-fd-down)
    SFP Vendor:      
    SFP Part Number:      
    SFP Serial Number:      
  Device Type:     CX5 PSID(NAP0000000006)
  Firmware Version:   16.26.4012

Sign in to view the entire content of this KB article.

New to NetApp?

Learn more about our award-winning Support

NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.