ユーザワークロードが原因で高いCPUが原因で、読み取り、書き込み、その他のレイテンシが発生している
環境
ONTAP 9
問題
- CPU利用率が100%に近く、読み取り/書き込みレイテンシに影響しない可能性がある
- AIQUMまたは CPU D-bladeの影響を受けるボリュームのノードレベルで表示される高い書き込み/読み取りレイテンシ:
- EMSログから
wafl.cp.toolong
エラーイベントが報告される - アプリケーション/ジョブに一貫性がない か、通常よりも時間がかかる
- Active IQ Unified Managerアラートが表示されることもあります。
High CPU utilization Error: cluster1:kernel:node1 on cluster1 is reporting high CPU utilization of 91.1024 %, placing the node into warn state
例:ユーザのワークロードが原因でノード1のCPU使用率が高く なっているが、クラスタの他のノードはアイドル状態であり、ノードシェルのsysstat -x 1
コマンドではほとんど利用されていない
注: 読みやすさを向上させるため、列は削除されています。
::> node run node1 sysstat -x 1 CPU NFS CIFS HTTP Total Net kB/s Disk kB/s in out read write 97% 22453 0 0 22463 1491948 8098 664188 2631848 91% 22448 0 0 22478 1492337 8121 607184 658216 94% 22478 0 0 22509 1492134 8106 78844 101992 96% 22453 0 0 23134 1492587 8108 810668 2736420 ::> qos statistics volume latency show Workload ID Latency Network Cluster Data Disk QoS NVRAM --------------- ------ ---------- ---------- ---------- ---------- --------- --------- --------- -total- - 136.49ms 99.00us 70.00us 136.17ms 153.00us 0ms 0ms vserver1_vol1.. 4201 206.05ms 130.00us 0ms 205.88ms 44.00us 0ms 0ms