メインコンテンツへスキップ

エンドデバイスのSFPの障害が原因でC3 Txが破棄され、フレームタイムアウトになりました。

Views:
720
Visibility:
Public
Votes:
0
Category:
fabric-interconnect-and-management-switches
Specialty:
brocade
Last Updated:

 

環境

  • BrocadeファブリックOS
  • SAN
  • ONTAP 9以上

問題

  • errdump -a フレームを受信したポート(rx)と送信できないポート (tx)を、損失信号およびオーバーサブスクライブされたアラートとともに記録しますframe timeout,

2022/02/09-22:31:04, [AN-1014], 2266, SLOT 2 | FID 128, INFO, switch, Frame timeout detected, tx port 9/7 rx port 9/27, sid c8f907, did 678740, timestamp 2022-02-09 22:31:04 .
2023/12/23-10:47:16 (IST), [MAPS-1003], 274485, SLOT 2 | FID 128 | PORT 11/8, WARNING, switch, IB_INFINI_3185_W_N3P6, F-Port 11/8, Condition=ALL_PORTS(PORT_BANDWIDTH/NONE==OVERSUBSCRIBED), Current Value:[PORT_BANDWIDTH, OVERSUBSCRIBED, (TXQL=914 us, TX=72.8%) ], RuleName=defALL_PORTS_OVERSUBSCRIBED, Dashboard Category=Fabric Performance Impact, Quiet Time=15 min.
2023/12/18-01:35:43 (IST), [MAPS-1003], 270764, SLOT 1 | FID 128 | PORT 10/21, WARNING, switch, U-Port 10/21, Condition=ALL_PORTS(LOSS_SIGNAL/min>5), Current Value:[LOSS_SIGNAL, 8 LOS], RuleName=defALL_PORTSLOSS_SIGNAL_5, Dashboard Category=Port Health, Quiet Time=None.

  • frame timeouts は、これらのTxポートが指定されたRxポートにフレームを転送できなかったため、タイムアウトしたことを示します。
  • IO_FRAME_LOSS  IO_PERF_IMPACT スイッチエンドのerrdump に記録されたフレーム遅延 イベントを示すイベント-

2024/12/02-04:56:04 (IST), [MAPS-1001], 1664654, SLOT 2 | FID 128 | PORT 12/8, CRITICAL, switch, slot12 port8, F-Port 12/8, Condition=ALL_PORTS(DEV_LATENCY_IMPACT/NONE==IO_FRAME_LOSS), Current Value:[DEV_LATENCY_IMPACT, IO_FRAME_LOSS, (174 ms Frame Delay in VC: 2) ], RuleName=ALL_PORTS_IO_FRAME_LOSS_UNQUAR, Dashboard Category=Fabric Performance Impact, Quiet Time=1 day.

2024/12/02-04:56:04 (IST), [MAPS-1001], 1664654, SLOT 2 | FID 128 | PORT 12/8, CRITICAL, switch, slot12 port8, F-Port 12/8, Condition=ALL_PORTS(DEV_LATENCY_IMPACT/NONE==IO_FRAME_LOSS), Current Value:[DEV_LATENCY_IMPACT, IO_FRAME_LOSS, (174 ms Frame Delay in VC: 2) ], RuleName=ALL_PORTS_IO_FRAME_LOSS_UNQUAR, Dashboard Category=Fabric Performance Impact, Quiet Time=1 day.
2024/12/02-04:56:04 (IST), [MAPS-1003], 1664655, SLOT 2 | FID 128 | PORT 12/45, WARNING, switch, slot12 port45, F-Port 12/45, Condition=ALL_PORTS(DEV_LATENCY_IMPACT/NONE==IO_PERF_IMPACT), Current Value:[DEV_LATENCY_IMPACT, IO_PERF_IMPACT, (39.3% of 10 secs in VC: 3-7) ], RuleName=defALL_PORTS_IO_PERF_IMPACT_UNQUAR_1, Dashboard Category=Fabric Performance Impact, Quiet Time=1 day.

  • Rx値とTx値はエンドデバイスで最適です。

Rx - 958.1 (uWatts)
Tx - 958.8 (uWatts)

  • sfpshow 推奨範囲内のTx電力とRx電力の両方を報告します。

=============
Slot 12/Port 45:
=============
RX Power:   -2.7   dBm (532.0uW)
TX Power:   -1.5   dBm (711.2 uW)

  • porterrshow に、link failureslink resetsc3 discards  Tx timeouts 関連のエラーカウンタの増分を示します。

/fabos/cliexec/porterrshow:
      frames     enc    crc    crc    too    too    bad    enc   disc   link   loss   loss   frjt   fbsy   c3timeout   pcs    uncor
     tx     rx    in    err    g_eof   shrt   long   eof    out   c3   fail   sync   sig            tx   rx    err    err
391:   45.3g   3.4g   0     0     0     0     0     0     0    43.1k   5     0     5     0     0    43.1k   0     0     2.5k

  • c3-timeout tx
    •  タイムアウト(プラットフォームおよびポート固有)のために送信ポートで廃棄された送信クラス3フレームの数。
    •  これは、デバイスがスイッチに接続された問題を示します。
  • sfpshow 受信電力が低いことを示します。

=============
Port  391:
=============
RX Power:    -8.1    dBm (155.8uW)
TX Power:    -3.0    dBm (500.6 uW)

  • portshow リモートデバイスが オフラインプリミティブを送信したローカルポートよりも多くのリンクをリセットしたことを示します。

portshow 391
[...]
Lr_in:             133     Ols_in:       5
Lr_out:            7       Ols_out:      6

  • 影響を受けるスイッチポートでマルチRDY/フレーム損失が検出されました。

2025/01/24-13:53:15, [C5-1040], 162569, SLOT 2 | CHASSIS, WARNING, Brocade_X7-8, Multi RDY/Frame Loss detected on Slot 12, Port 680(120) m_rdy(0x1)/m_frame(0x0). Link Reset done.
2025/01/24-13:53:16, [C5-1040], 162571, SLOT 2 | CHASSIS, WARNING, Brocade_X7-8, Multi RDY/Frame Loss detected on Slot 12, Port 680(120) m_rdy(0x1)/m_frame(0x0). Link Reset done.

  • 解決策に進む前に、以下のトラブルシューティング手順を確認できます。

    • エンドデバイスのワークロードを分析 し、 タイムアウトとフレーム損失を報告するポートに接続されているエンドデバイスでハードウェアチェックを実行することに重点を置きます。

    • 次のデバイスを検証する必要があります。これらのいずれかで問題が発生した場合は 、エンドデバイスでも同じことを交換する必要があります。
      • SFP
      • ケーブル
      • HBAカード
      • パッチパネルリンクおよび コネクタに欠陥があります。

 

 

Sign in to view the entire content of this KB article.

New to NetApp?

Learn more about our award-winning Support

NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.