IOPSが低いのにワークロードのレイテンシが高いのはなぜですか?
環境
- ONTAP 9
- Data ONTAP 7-mode
回答
- ONTAPはリクエストが到着したときに応答し、リクエストが少ないワークロードは高いように見えますが、完全に問題なく応答します。
- IOPSが低いワークロード(5 IOPSと32KB/秒)では次のような効果が得られます。
- RAMキャッシュにないため、ディスクに移動する必要があります。
- サンプルサイズが大きくないため、統計的には無関係と見なされます(追加情報で詳しく説明)。
- 異常値を平均化するのに十分なサンプルがない
- 別の言い方をすると、IOPSの低いワークロードは、他の症状(エラー、アプリケーションが応答しない、ネットワークの問題など)がない場合でも問題になりません。
- 低IOPSは一般に500~600 IOPS未満ですが、レイテンシの平均誤差が原因で、報告されるレイテンシは秒または数十秒の範囲に達する可能性があります。
- IOPSが低いボリュームのワークロードを増やすと、レイテンシの増加が原因であるかどうかを判断するのにさらに役立ちます。
追加情報
- 用語の意味:
- 平均:平均、またはすべてのインスタンス値の合計をインスタンス数で割った値
- 中央値(Median):値が最小から最大に順序付けされている場合の中央のインスタンス値。
- モード:最も頻繁に発生するインスタンス値
- 数学の統計ブランチでは、平均、中央値、およびモードを使用して計算する必要があります。
例1:ある期間に3つのインスタンスで観察されたレイテンシ(たとえば1分間に3つの処理):1ミリ秒、100ミリ秒、1ミリ秒
- 平均:(1 + 100 + 1)/ 3 = 34 ms
- 中央値:1ミリ秒
- モード:1ミリ秒
- ONTAPでは平均レイテンシが発生することがよくありますが、この場合の中央値とモードは、レイテンシが実際には非常に良好であることを示しています。
例2:20個のインスタンスで観察されたレイテンシ(7ops /秒):1ms、1ms、1ms、100ms、1ms、1ms ~1ms(19@1ms、1@100ms)
- 平均:(19 + 100)/ 20 = 5.95ミリ秒
- 中央値:1ミリ秒
- モード:1ミリ秒
- この場合、平均レイテンシは前の例よりも正確です。データが十分にあるため、数値の信頼性を高めることができます。