FlexGroupが100ミリ秒を超える外れ値を秒単位で認識すると、クライアントがタイムアウトする
環境
- ONTAP 9
- FlexGroup
- CIFS
- NFS
問題
- 特定のFlexGroupの平均レイテンシは良好ですが、ヒストグラムを見ると外れ値が高いことがわかります。
- クライアントアプリケーションがレイテンシの影響を非常に受けやすい
- 例:外れ値が高い値は、NFSv3ルックアップレイテンシのヒストグラムなど、さまざまな外れ値に表示されることがあります。
Cluster::> set adv Warning: These advanced commands are potentially dangerous; use them only when directed to do so by NetApp personnel. Do you want to continue? {y|n}: y Cluster::*> statistics statistics statistics-v1 Cluster::*> statistics start -object nfsv3 -counter lookup_latency_hist Statistics collection is being started for sample-id: sample_381 Cluster::*> statistics statistics statistics-v1 Cluster::*> statistics show Object: nfsv3 Instance: svm2 Start-time: 12/19/2024 11:30:20 End-time: 12/19/2024 11:37:20 Scope: node1 Number of Constituents: 1 (complete_aggregation) Counter Value -------------------------------- -------------------------------- lookup_latency_hist - ... <100ms 12 <200ms 16 <400ms 9 <2s 15 <6s 3 Cluster::*>