スイッチ側のSFPに障害があるため、BrocadeスイッチでC3が破棄され、フレームが失われました。
環境
- BrocadeファブリックOS
- ONTAP
- Hyper-V Windowsホスト
問題
- ONTAP ターゲット ポートが Brocade スイッチ ポートに接続され、 discards C3 (disc c3)およびC3 timeout TX が発生しました。
- 対応するデバイスまたはONTAP SFPを正常なものと交換済み
- ケーブルはスワップ済み、または正常なケーブルと交換済み
- スロードレインデバイスの報告
- ホストでディスクIOエラーが発生し 、IOの一時停止/停止が発生する
例:
The system failed to flush data to the transaction log. Corruption may occur in VolumeId: xxxxxxxx, DeviceName: \Device\HarddiskVolume123.
({Data Overrun}
A data overrun error occurred - Ntfs
The IO operation at logical block address 0x1debb18 for Disk 0 (PDO name: \Device\0000002f) was retried
- ディスクC3およびC3タイムアウト tx破棄
porterrshow
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs uncor
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err err
352: 40.0m 183.4m 0 0 0 0 0 0 29.5k 6.3k 10 5 1 0 0 605 0 0 0
portstatsshow
portstatsshow 103
er_tx_c3_timeout 360 Class 3 transmit frames discarded due to timeout
- 最適な範囲のRXとTX
sfpshow
Port 23:
=============
[...]
RX Power: -1.8 dBm (655.2uW)
TX Power: -2.1 dBm (618.8 uW)
Errdumpによってポートのフラップがログに記録されることがある
Switch 0; Wed Jan 29 01:24:01 2025 IST (GMT+5:30) 01:24:01.713417 SCN LR_PORT(0);g=0x4984 D0,P0 D0,P0 186 NA 01:24:01.762542 SCN Port Online; g=0x4984,isolated=0 D0,P0 D0,P1 186 NA 01:24:01.762718 Port Elp engaged D0,P1 D0,P0 186 NA 01:24:01.762731 *Removing all nodes from port D0,P0 D0,P0 186 NA 01:24:01.762918 SCN Port F_PORT D0,P1 D0,P0 186 NA
のC3 Txタイムアウトイベントとともに観察されたIOフレーム損失イベント
errdump
CRITICAL, CDVL_X, slot11 port32, F-Port 11/32, Condition=ALL_OTHER_F_PORTS(C3TXTO/min>3), Current Value:[C3TXTO, 20 Timeouts], RuleName=defALL_OTHER_F_PORTSC3TXTO_3, Dashboard Category=Port Health.
CRITICAL, CDVL_X, slot11 port32, F-Port 11/32, Condition=ALL_PORTS(DEV_LATENCY_IMPACT==IO_FRAME_LOSS), Current Value:[DEV_LATENCY_IMPACT, IO_FRAME_LOSS, (20 C3TX Timeouts) ], RuleName=defALL_PORTS_IO_FRAME_LOSS_UNQUAR, Dashboard Category=Fabric Performance Impact.
WARNING, , Flow (SID=0x6cc0c0,DID=0x6c9bc1,Host Port=9/40), Condition=sys_flow_monitor(RD_STATUS_TIME/10SEC>12000), Current Value:[RD_STATUS_TIME, 223776 Microseconds], RuleName=defRD_STATUS_TIME_12000, Dashboard Category=IO Latency.
INFO, FAB1, Frame timeout detected, tx port 1/23 rx port 1/23, sid 123, did 456, timestamp xy
INFO, FAB1, Local domain 1, port index 123: A zoned device 0x123456 has been quarantined.
WARNING, FAB1, Port 1/23 (Port index 123) has been marked as Slow Drain Device.