スイッチ終端のsfpの障害が原因で1つのNICポートでCRCエラーを受信
環境
- ONTAP 9
- FAS / AFF システム
- 単一ポートでのCRCエラーの報告
問題
Event
物理ポートおよび/または論理ポートのハードウェアエラーをログレポートします。
[node-01: vifmgr: vifmgr.cluscheck.crcerrors]: Port a0b on node node-01 is reporting a high number of observed hardware errors, possibly CRC errors
[node-02: vifmgr: vifmgr.cluscheck.crcerrors]: Port e0d on node node-02 is reporting a high number of observed hardware errors, possibly CRC errors
[node-02: vifmgr: vifmgr.cluscheck.hwerrors:alert]: Port e0d on node node-02 is reporting a high number (at least 1 per 1000 packets) of observed hardware errors (CRC, length, alignment, dropped)
[node-02: vifmgr: callhome.clus.net.degraded:alert]: Call home for CLUSTER NETWORK DEGRADED: CRC Errors Detected - High CRC errors detected on port e0d node node-02
ifstat
ONTAPがエラーを受信している場合、output showCRC
エラーが表示されます。
RECEIVE
Total frames: 36418m | Frames/second: 23646 | Total bytes: 179t
Bytes/second: 116m | Total errors: 170k | Errors/minute: 7
Total discards: 0 | Discards/minute: 0 | Multi/broadcast: 1686k
Non-primary u/c: 0 | CRC errors: 159k | Long frames: 0
- CRCエラーはスイッチ ポートまたはクライアント側で観測され、パケット損失によってレイテンシが発生する場合があります
2022-03-20T17:39:36.443Z cpu36:2098075)WARNING: ScsiDeviceIO: 1498: Device naa.600a09803830574c4d5d53ddf26c4543 performance has deteriorated. I/O latency increased from average value of 18171 microseconds to 1816780 microseconds.
- NetApp側で
ifstat -z
を実行して、影響を受けたノードの統計情報をクリアし、増加するエラーを確認します。
- 以下の手順に従って問題をさらに切り分けることができます
- CRCエラーはメディアに問題がある(ケーブルやSFPの装着不良、断線など)ことを示します
- ポートが正常であることを確認するためにポート分離テストを実施します。
- エラーを報告しているポートとリンク内の次のデバイス間の接続の健全性を確認します。
- ケーブルの両端を再度取り付けてみてください。
- ポートを切り替えて問題が解決するか確認します
- 両端のSFPを一度に1つずつ取り付け直します。
- 接続ケーブルを交換します。
- SFPまたはケーブルの交換後も問題が解決しない場合は、解決策に進みます。