パフォーマンスに関する一般的な用語を教えてください。
環境
- Data ONTAP 8.X
- ONTAP 9.X
- 複数のONTAPサブシステムで一般的に使用されるパフォーマンスの概念と用語、および外部の指標。
回答
- Throughput:通信チャネルを介して送信されるデータのレート。多くの場合、交換されたり帯域幅と混同されたりします。
- 単位
- 処理/秒、またはIOPS
- バイト/秒
- MB/秒
- GB/秒
- 単位
- 帯域幅-通信チャネルを介して転送できるデータの最大レート。多くの場合、交換されたり、スループットと混同されたりします。
- 単位
- バイト/秒
- MB/秒
- GB/秒
- 単位
- Latency -入力またはコマンドが発行され、応答が受信されてからの合計時間
- 単位
- 秒(秒)
- ミリ秒(ms)
- マイクロ秒(us)
- 単位
- Utilization -サンプル期間中に特定のリソースが使用されていた時間の測定値。利用率はパフォーマンスの指標として有用ですが、Data ONTAPの場合は主に使用しないでください。
- 単位
- %
- 単位
- ボトルネック:パフォーマンスに影響を与えるコンピューティングシステムの輻輳ポイント。1つの環境に複数のボトルネックが存在する可能性があります。
- NetAppテクニカルサポートは、全体的なレイテンシに最も大きな影響を与えているボトルネックに最初に対処する
- サービスセンター-サービスシステム内の処理ポイント、およびそのセンターでのリクエストのキューイングと処理に関連する時間。
- 遅延センター-その遅延センター内のキュー時間。
- ネットワーク処理- ONTAPのネットワークおよびプロトコル処理の一部。
- 歴史的には、D-Bladeと統合される前は独立したブレードサーバであったため、N-Bladeとも呼ばれていました。
- N-Bladeという用語は存続しており、同じ意味で使用されることもありますが、これは従来の用語です。
- ここでは、Network Exempt CPUドメインが主要な処理ポイントです。
- Data Processing - WAFL処理、またはファイルシステムレベルでのデータの処理。
- ONTAPのネットワーク処理ノードは、ローカルのネットワーク処理ノードを介してData Processingノードに要求を送信します。
- データLIFを所有するノードをリモートとみなし、ディスクを所有するノードをローカルとみなします。
- 歴史的には、これはN-Bladeと同じ理由でD-Bladeと呼ばれ、いくつかのドキュメントで今日まで残っています。
- CPU_ExemptはData Processingによって処理されるプライマリWAFLドメインですが、他のいくつかのドメインはONTAPのData Processing部分に含まれています。
- ONTAPのネットワーク処理ノードは、ローカルのネットワーク処理ノードを介してData Processingノードに要求を送信します。
- Concurrency:コンピューティングシステムにおけるワークロードの並列処理の測定
- ワークロード内の並列処理が多いほど、任意の時点での同時処理数が増加します。
- これにより、同時実行数の少ないワークロードとして処理あたりのレイテンシが同じであっても、システムの処理効率が向上し、処理時間を短縮してより多くの処理を完了できるようになります。
- リトルの法則は、安定した状態におけるスループット、レイテンシ、同時実行数の関係を示しています。直感的には簡単に見えますが、非常に驚くべき結果です。
Throughput = Concurrency / Latency
- レイテンシはData ONTAPで制御
- 同時実行数はクライアント/アプリケーションによって制御される
- 最高のスループットを実現するには、レイテンシの低減や同時実行数の増加を検討する必要があります。
例:
要求が完了するまでに1ミリ秒(ms)かかると仮定します。1つのスレッドを使用し、1つの未処理の読み取りまたは書き込み処理を実行するアプリケーションは、1000 IOPS( 1秒または1000ミリ秒/ 1ミリ秒/要求)を達成する必要があります。理論的には、スレッド数を2倍にすると、アプリケーションは2000 IOPSを達成できるはずです。各スレッドの未処理の非同期読み取り/書き込み処理が2倍になると、アプリケーションは4000 IOPSを達成できるはずです。実際には、タスクスケジューリング、コンテキストスイッチングなどによるクライアントのオーバーヘッドのため、要求レートは必ずしも線形にスケーリングされません。
注:この例では、1ミリ秒のレイテンシで十分であり、レイテンシの観点からこれ以上改善する余地がないことを前提に、クライアント側で同時処理数を増やしてスループットを最適化する方法を示しています。
- I/Oまたはブロックサイズ-入出力操作のサイズを示します。次の式を使用して計算できます。
I/O size = Throughput/IOPS
I/Oサイズが大きいほど、スループットは高くなります。
- ランダム性-順序やパターンを伴わずに予期せぬ順序で実行されるワークロード
- シーケンシャル性-事前に決められた順序で実行されるワークロードです。フォワード、バックワード、スキップカウントなど、多くのパターンを検出できます。
追加情報
- リトルの法則のWikipediaページ
- スループットとレイテンシの違いは何ですか?
- 上記のメトリックの多くは、コマンドセットに含まれています。