EMSイベント「netif.tcp.conn.bad.checksum"」
環境
ONTAP 9.11.1以降
問題
- 次のEMSメッセージが表示されます。
Mon Sep 26 02:09:05 +0900 [node01: kernel: netif.tcp.conn.bad.checksum:error]: TCP packet with bad checksum detected on port e0c. The packet arrived on connection with source address xx.xx.xx.xx and destination_address xx.xx.x.xx.
- 不正なTCP cksumも
::> system node run -node node_name -command ifstat port_name
のポートで増加しています。
-- interface e0c (40 days, 5 hours, 34 minutes, 37 seconds) --
RECEIVE
Total frames: 2047m | Frames/second: 589 | Total bytes: 2625g
Bytes/second: 755k | Total errors: 0 | Errors/minute: 0
...
LRO bytes: 2527g | LRO6 segments: 0 | LRO6 bytes: 0
Bad UDP cksum: 0 | Bad UDP6 cksum: 0 | Bad TCP cksum: 21
Bad TCP6 cksum: 0 | Mcast v6 solicit: 0 | Lagg errors: 0
...
- 解決策を開始する前に、以下のトラブルシューティング手順を実行できます。
ifstat
エラーが表示される場合は、 でCRCエラーを確認し、ポートに接続されているケーブル/SFPをトラブルシューティングします。ifstat
でCRCエラーが報告されない場合は、次の手順を実行します。- EMSメッセージで単一のクライアントが報告されている場合は 、そのクライアントを調査します。
- クライアント数のトレンドがない場合は、EMSメッセージに記載されているクライアントIPとLIFの間のデバイスを調査します。
- すべてのインターフェイス(ストレージ、スイッチ、ホスト)に正しいMTUが設定されていることを確認する
- 注:ストレージ、接続されているスイッチポート、およびクライアントの影響を受けるポートから同時にtcpdumpまたはパケットトレースを収集して、TCP不良チェックサムを確認します。現時点では、コントリビュータを除外したり、原因を決定したりするための他の既知の方法はありません。