クラスタネットワークデグレード状態のアラートが、クラスタポートのエラーが原因で何度も報告されました
環境
- ONTAP 9
- クラスタ スイッチ
問題
- 次のクラスタネットワークデグレードAutoSupport 通知を複数回受信しました。
HA Group Notification (CLUSTER NETWORK DEGRADED) ALERT
- ifstatの出力のRECEIVEセクションに示されるように、1つのクラスタポートを除くすべてのノードのクラスタポートで複数のエラーが報告されます。
system health alert show
コマンドの出力で、クラスタスイッチのヘルスがデグレードと表示されることがあります。- CRCが大量にある場合、パフォーマンスに影響が生じる可能性があります。
- 複数のエラーがあるクラスタポート(CRCエラー、エラーシンボル、不正シンボルなどの組み合わせが表示される場合があります):
clustershell::>system node run -node <nodename> -command ifstat -a
-- interface e0b (219 days, 5 hours, 16 minutes, 2 seconds) --
RECEIVE
Frames/second: 2301 | Bytes/second: 3785k | Errors/minute: 0
Discards/minute: 0 | Total frames: 154g | Total bytes: 176t
Total errors: 43918 | Total discards: 65 | Multi/broadcast: 4452k
No buffers: 0 | Non-primary u/c: 0 | L2 terminate: 14908
Tag drop: 0 | Vlan tag drop: 0 | Vlan untag drop: 0
Vlan forwards: 0 | CRC errors: 29328 | Runt frames: 0
Fragment: 0 | Long frames: 65 | Jabber: 0
Error symbol: 29328 | Illegal symbol: 14590 | Bus overruns: 0
Queue drop: 0 | Xon: 0 | Xoff: 0
Jumbo: 5634k | JMBuf RxFrames: 162g | JMBuf DrvCopy: 27146
- エラーのない単一クラスタポート:
clustershell::>system node run -node <nodename> -command ifstat -a
-- interface e0b (219 days, 7 hours, 2 minutes, 24 seconds) --
RECEIVE
Frames/second: 1092 | Bytes/second: 950k | Errors/minute: 0
Discards/minute: 0 | Total frames: 47631m | Total bytes: 107t
Total errors: 0 | Total discards: 1159 | Multi/broadcast: 4473k
No buffers: 1087 | Non-primary u/c: 0 | L2 terminate: 302
Tag drop: 0 | Vlan tag drop: 0 | Vlan untag drop: 0
Vlan forwards: 0 | CRC errors: 0 | Runt frames: 0
Fragment: 0 | Long frames: 50 | Jabber: 0
Error symbol: 0 | Illegal symbol: 0 | Bus overruns: 22
Queue drop: 0 | Xon: 0 | Xoff: 0
Jumbo: 2769m | JMBuf RxFrames: 0 | JMBuf DrvCopy: 0
- 単一クラスタポートの
ifconfig -vvv
出力でLow mWが報告されます。
::> system node run -node <nodename> -command ifconfig -vvv
…
e0b: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 9000
uuid: 0320a80b-caa3-11eb-b14a-d039ea306760
...
RX: 0.06 mW (-12.13 dBm) TX: 0.55 mW (-2.59 dBm)
- EMSログおよびヘルスアラートで生成された次のWiNGメッセージが表示されることがあります。
netif.linkErrors: Excessive link errors on network interface e2c. Might indicate a bad cable, switch port, or NIC, or that a
cable connector is not fully inserted in a socket. On a 10/100 port, might indicate a duplex mismatch.
- CRCエラーを受信しない唯一のノードポートの接続されているスイッチポートに対して、次のアラートが生成されることがあります。
[?] Tue Nov 01 18:13:10 -0700 [node-01: mgwd: callhome.hm.alert.major:alert]: Call home for Health Monitor process cshm: ClusterIfInErrorsWarn_Alert[switch01(FOC123456789)/Ethernet1/9].