ユーザワークロードによるCPUのボトルネックが原因で読み取りまたは書き込みのレイテンシが高い
環境
- AFFおよびFAS
- ONTAP 9
問題
- ノードに対してActive IQ Unified ManagerからPerformance Capacityアラートがトリガーされることがある
- アラーム
IO wait time
vCenterから報告されます。 - 高いCPU利用率が80%を超えている
- ユーザのワークロードが原因でノード1のCPU使用率が高くなっているが、ノード2はノードシェルの
sysstat -x 1
コマンドでアイドル状態になっている - ボリュームで読み取り/書き込みのレイテンシが高い
- ユーザワークロードの大部分が特定のノード上にあり、クラスタのパートナー/他のノードがほとんどアイドル状態またはアンバランス
- レイテンシが高く、CPU利用率違反が発生した場合にActive IQ Unified Managerに表示される可能性のあるアラートの例を次に示します。
Latency value of 12.2 ms/op on Cluster1_N6 has triggered a WARNING event based on threshold setting of 10.0 ms/op
NetApp Node Node-1:kernel:Node-1 is reporting hig CPU utilization of 91.1637%, placing the node into warn state
注: 読みやすさを向上させるため、列は削除されています。
Cluster::> node run node1 sysstat -x 1 CPU NFS CIFS HTTP Total Net kB/s Disk kB/s in out read write 79% 22453 0 0 22463 1491948 8098 664188 2631848 76% 22448 0 0 22478 1492337 8121 607184 658216 75% 22478 0 0 22509 1492134 8106 78844 101992 75% 22453 0 0 23134 1492587 8108 810668 2736420 Cluster::> qos statistics volume latency show Workload ID Latency Network Cluster Data Disk QoS NVRAM --------------- ------ ---------- ---------- ---------- ---------- --------- --------- --------- -total- - 136.49ms 99.00us 70.00us 136.17ms 153.00us 0ms 0ms vserver1_vol1.. 4201 206.05ms 130.00us 0ms 205.88ms 44.00us 0ms 0ms