EMS event "netif.tcp.conn.bad.checksum"
環境
ONTAP 9.11.1以降
問題
- The following EMS message appears.
Mon Sep 26 02:09:05 +0900 [node01: kernel: netif.tcp.conn.bad.checksum:error]: TCP packet with bad checksum detected on port e0c. The packet arrived on connection with source address xx.xx.xx.xx and destination_address xx.xx.x.xx.
- Bad TCP cksum is also increasing on port
::> system node run -node node_name -command ifstat port_name
.
-- interface e0c (40 days, 5 hours, 34 minutes, 37 seconds) --
RECEIVE
Total frames: 2047m | Frames/second: 589 | Total bytes: 2625g
Bytes/second: 755k | Total errors: 0 | Errors/minute: 0
...
LRO bytes: 2527g | LRO6 segments: 0 | LRO6 bytes: 0
Bad UDP cksum: 0 | Bad UDP6 cksum: 0 | Bad TCP cksum: 21
Bad TCP6 cksum: 0 | Mcast v6 solicit: 0 | Lagg errors: 0
...
- 解決に進む前に、以下のトラブルシューティング手順を実行できます。
ifstat
でCRCエラーがないか確認し、CRCエラーが見られる場合はポートに接続されているケーブル / SFPのトラブルシューティングを行います。ifstat
でCRCエラーが報告されない場合:- If only one client is reported in the EMS message, investigate that client
- If there is no change in the client, investigate the device between the client IP and LIF described in the EMS message
- Ensure that the correct MTU is set on all interfaces (storage, switch, host)
- 注:TCPの不正なチェックサムを確認するために、ストレージ、接続されているスイッチポート、およびクライアントの影響を受けたポートから同時にtcpdumpまたはパケットトレースを収集します現在のところ、貢献者を除外したり、原因を特定したりするための他の既知の方法はありません。