ネットワークの輻輳が原因でVMwareでAPDエラーメッセージが表示される
環境
- ONTAP 9
- NFS
- Ciscoネットワークスイッチ
問題
- VMware ESXiで確認されたNFS APDの問題。
- vmkernelログには 、次のようなエラーメッセージが表示されます。
Lost connection to server 1xx.2x.xc.xx mount point
Restored connection to server 1xx.2x.xc.xx
- 1時間ごとにデータストアの接続が切断されています。
- 切断が発生すると、VMはハング状態になります。
- ESXiホストのMTUは1500に設定されています。
- NFS。 MaxQueueDepth パラメータは128に調整されましたが、ホストのリブート後も問題は維持されました。
- APDメッセージは、VMが実行中でStorage VMotionが実行されているときに受信されます。
- キャプチャされた 同時パケットトレース と、特定のポートまたはトランクリンク上の2つのエンドポイント間のパスで観察されたネットワーク輻輳
- パフォーマンスアーカイブ が分析されてレイテンシはあるかどうかが確認されますが、影響を受けたボリュームでレイテンシは観察されませんでした。