大量のFlexCache接続によるWAN利用率の上昇とNFSの低速化
環境
- NetApp ONTAP 9
- FlexCache
- WAN
- NFS
問題
- お客様からは、WANリンクを介してNFS経由でFlexCacheボリュームにアクセスする2000+人のユーザーが大幅に遅くなったと報告されています。FlexCache関連のクラスタ間トラフィックのWAN利用率は20%以上(時には最大25%)でしたが、実際のデータ使用量ははるかに少なく(1~2%)でした。これにより、パフォーマンスが低下し、リモートサイトが使用できなくなりました。
- 症状/ログ出力:
- WANを経由するTCPセッション数とデータ数が多い(ファイアウォールチームによる報告は最大2TB/日)。
- クラスタ間プログラムポート11105での頻繁な再送信。
- 大量のキープアライブトラフィック:キープアライブのみで~113GB/日と計算。
- クラスタ間の接続数が多い(特にノードのリブートやピア追加後)。