ノードが再起動すると、LACP ポートがダウンし、スイッチ ポートが「Link Flap error-disable」状態になります。

環境

  • ONTAP
  • リンクアグリゲーション制御プロトコル(LACP)を使用したインターフェイスグループ

問題

  • ONTAP のアップグレード中にストレージノードが再起動され、一部の LACP メンバーがダウン状態になっています。

::> ifgrp show -fields down-ports,up-ports

  • ノードのネットワーク ポートがダウンしており、リンクなしの状態です。

::> network port show -node <node_name>

  • ​​​​​​ストレージ側からリンクフラッピングやLACPネゴシエーションの試みの兆候は見られず、Active IQ IFCONFIG-VVVセクションまたはnode run -node <node> ifconfig -v

a0a: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 9000
lagg statistics:
active ports: 0
flapping: 0
laggport: e0a flags=20000<DEFAULT> state=41<ACTIVITY,DEFAULTED>
     input/output LACPDUs: 0 / 0
laggport: e2c flags=20000<DEFAULT> state=41<ACTIVITY,DEFAULTED>
     input/output LACPDUs: 0 / 0
status: no carrier

  • Cisco ネットワーク スイッチが調査され、対応するスイッチ ポートが Link Flap error-disable 状態であることが判明しました。
  • Cisco スイッチのログには、リンク障害が繰り返し発生し、無効になっていることが表示されます:

%ETHPORT-2-IF_DOWN_LINK_FAILURE: Interface Ethernet1/1/2 is down (Link failure)
%ETHPORT-2-IF_DOWN_LINK_FAILURE: Interface Ethernet1/1/2 is down (Link failure)
%ETH_PORT_CHANNEL-8-PORT_SUSPENDED: Ethernet1/1/2: Ethernet1/1/2 is suspended.
%ETHPORT-2-IF_DOWN_LINK_FAILURE: Interface Ethernet1/1/2 is down (Link failure)
%ETHPORT-2-IF_DOWN_LINK_FAILURE: Interface Ethernet1/1/2 is down (Link failure)
%ETHPORT-2-IF_DOWN_ERROR_DISABLED: Interface Ethernet1/1/2 is down (Error disabled. Reason:Too many link flaps)