単一の NIC ポートで CRC エラーが発生しました
のしんだ
環境
- ONTAP 9
- FAS / AFF システム
- 1 つのポートで CRC エラーが報告される
問題
- イベントログには、物理ポートや論理ポートのハードウェアエラーが記録されます。
[node-01: vifmgr: vifmgr.cluscheck.crcerrors]: Port a0b on node node-01 is reporting a high number of observed hardware errors, possibly CRC errors
[node-02: vifmgr: vifmgr.cluscheck.crcerrors]: Port e0d on node node-02 is reporting a high number of observed hardware errors, possibly CRC errors
[node-02: vifmgr: vifmgr.cluscheck.hwerrors:alert]: Port e0d on node node-02 is reporting a high number (at least 1 per 1000 packets) of observed hardware errors (CRC, length, alignment, dropped)
[node-02: vifmgr: callhome.clus.net.degraded:alert]: Call home for CLUSTER NETWORK DEGRADED: CRC Errors Detected - High CRC errors detected on port e0d node node-02
ifstat
ONTAP がエラーを受信している場合、出力にCRCエラーが表示されます。- 問題は、ケーブル/ SFP を再度取り付けて
ifstat -z
影響を受けるノードに接続したあとも維持されます。
RECEIVE
Total frames: 36418m | Frames/second: 23646 | Total bytes: 179t
Bytes/second: 116m | Total errors: 170k | Errors/minute: 7
Total discards: 0 | Discards/minute: 0 | Multi/broadcast: 1686k
Non-primary u/c: 0 | CRC errors: 159k | Long frames: 0
- スイッチポートまたはクライアント側で CRC エラーが発生し、パケット損失が原因で遅延が発生する可能性があります
2022-03-20T17:39:36.443Z cpu36:2098075)WARNING: ScsiDeviceIO: 1498: Device naa.600a09803830574c4d5d53ddf26c4543 performance has deteriorated. I/O latency increased from average value of 18171 microseconds to 1816780 microseconds.
覚えておくべきポイント:
多くのスイッチング環境では、その速度のために、ストアスイッチングとフォワードスイッチングではなくカットスルースイッチングを使用します
- これは、障害のあるハードウェアが直接接続されたリンク上にない可能性があることを意味します
- CRCがアップストリームで発生した可能性があります
ifstat
これは、CRCエラーの場合、ではゼロ以外の値として表示されます- CRCがゼロで、スイッチにCRCがある場合、問題は送信される可能性がありますが、ONTAPはエラーを認識していません