ユーザワークロードによるディスクのボトルネックが原因で読み取りまたは書き込みのレイテンシが高い
環境
- ONTAP 9
- HDDテイスクヲトウサイシタFASシステム
問題
- SATA またはSASディスク アグリゲートに配置され、 利用率が高い(100%)ボリュームでは、読み取り処理と書き込み処理のレイテンシが高くなります。
- ディスク利用率が高いため、バックアップに時間がかかる
- 大容量階層から高パフォーマンス階層へのデータの読み出しに時間がかかることがある
- Linuxで
cp
コマンドを使用した場合と比較して、あるクラスタのユーザに低速なコピーが表示される -
statit
を使用し て 、ボリュームを含むアグリゲートのディスク利用率やレイテンシが高いかどうかを特定するdisk ut% xfers ureads--chain-usecs writes--chain-usecs cpreads-chain-usecs greads--chain-usecs gwrites-chain-usecs /data_aggr1/plex0/rg0: 0a.11.1 10 23.42 0.00 .... . 11.21 61.56 133 12.21 57.15 50 0.00 .... . 0.00 .... . 0a.10.1 11 23.80 0.00 .... . 11.66 59.25 147 12.14 57.37 55 0.00 .... . 0.00 .... . 1a.12.1 100 158.69 120.29 5.43 2299 10.26 34.39 553 28.15 9.93 839 0.00 .... . 0.00 .... . 0a.11.2 100 156.09 118.85 5.39 2253 9.96 34.97 553 27.28 10.05 794 0.00 .... . 0.00 .... . 0a.10.2 100 158.41 121.44 5.35 2337 9.95 35.11 542 27.01 9.93 835 0.00 .... . 0.00 .... . 0a.12.2 100 153.05 115.90 5.59 2158 9.88 35.00 524 27.27 9.97 803 0.00 .... . 0.00 .... . 0a.11.3 100 162.10 124.59 5.45 2262 10.05 35.10 528 27.45 10.10 809 0.00 .... . 0.00 .... . 0a.10.3 100 158.72 121.88 5.39 2298 9.82 34.82 573 27.02 10.05 838 0.00 .... . 0.00 .... . 1a.12.3 100 157.60 120.63 5.49 2274 9.85 34.90 571 27.11 9.82 875 0.00 .... . 0.00 .... . 0a.11.4 100 157.67 120.74 5.39 2328 9.96 35.29 568 26.97 10.10 857 0.00 .... . 0.00 .... . 0a.10.4 100 156.72 119.29 5.64 2180 9.96 34.65 556 27.47 9.79 825 0.00 .... . 0.00 .... .
- クライアントでパフォーマンスが低下している
- クラスタを監視しているActive IQ Unified Manager(AIQUM) でレイテンシが高くなるアラートが生成される
- 例:
Latency value of XX.X ms/op on volname has triggered a WARNING event based on threshold setting of 20.0 ms/op.
- 例:
- 読み取りレイテンシは25~40ミリ秒
- sysstat -xによると、ディスク利用率が高くなっています(わかりやすくするために列を削除)。
CPU ... HDD ... util 10% ... 90% 9% ... 100%