パケット損失によるONTAP外部での速度低下とレイテンシ
環境
- ONTAP 9
- ネットワーク
- パフォーマンス
問題
- 複数の重複確認応答(少なくとも#1、#2、#3)と(高速)再送信によって識別されるパケット損失
例:
- アプリケーションの速度低下やI/O待機時間の延長、パフォーマンスの問題、レイテンシの上昇が見られる
- Linuxコマンドの「Make RPM」および「CP」の実行時に応答時間が遅くなる特筆すべきは、ストレージ側から高いレイテンシが観察されないことです
- ローカルディスクへの書き込みは、NFSv3共有への書き込みよりも比較的高速です
- スループットはゼロに低下してから回復する可能性があります
- 損失が深刻な場合は、接続が切断される可能性があります
- ONTAPレイテンシが低く、CPUとディスクの利用率が通常または想定よりも低い
- パケット損失がONTAP 9.5以降で増加している可能性があります
例:netstat -anceWCT からの 10.1.2.9 の Rexmit 列と OOORcv 列の増加
node 1: Proto Recv-Q Send-Q Rexmit OOORcv 0-win Local Address Foreign Address =-=-=-=-=-=Sat Aug 13 2022, 23:16:01 -0400 BSD-NETSTAT-ANCEWCT 6 lines tcp4 0 0 6198853 112463181 0 10.1.2.3.3260 10.1.2.9.47254 =-=-=-=-=-=Sat Aug 20 2022, 23:26:09 -0400 BSD-NETSTAT-ANCEWCT 6 lines tcp4 0 0 1304064 57461127 0 10.1.2.3.3260 10.1.2.9.21933 node 2: =-=-=-=-=-=Sat Aug 13 2022, 23:15:27 -0400 BSD-NETSTAT-ANCEWCT 6 lines tcp4 0 48 5768522 3592331 0 10.40.40.27.3260 10.1.2.9.43744 =-=-=-=-=-=Sat Aug 20 2022, 23:25:03 -0400 BSD-NETSTAT-ANCEWCT 6 lines tcp4 0 48 1366568 11947331 0 10.40.40.27.3260 10.1.2.9.43425
ifstatデータLIFのポートにエラーが0個あるevent log showCRCやその他のローカルリンクの劣化を示すエントリがない- パケット損失によりTCPのパフォーマンスが低下し、ユーザ側またはアプリケーション側で最大数秒のレイテンシが発生する