ユーザのワークロードが原因でCPUが高くなり、さまざまな問題が発生
環境
ONTAP 9
問題
- CPU利用率はほぼ100%です。
- CPU D-bladeからのボリュームで表示される高い書き込み/読み取りレイテンシ。
- EMSログで
wafl.cp.toolong
エラーイベントが報告されます。 - アプリケーション/ジョブに一貫性がない か、通常よりも時間がかかります。
- Active IQ Unified Managerアラートが表示されることもあります。
High CPU utilization Error: cluster1:kernel:node1 on cluster1 is reporting high CPU utilization of 91.1024 %, placing the node into warn state
- ワークロードを減らすことはできません。
例:ユーザのワークロードが原因でノード1のCPU使用率が高く なっていますが、クラスタの他のノードはアイドル状態であり、ノードシェルのsysstat -x 1
コマンドではほとんど利用されていません。
注: 読みやすさを向上させるため、列は削除されています。
Cluster::> node run node1 sysstat -x 1 CPU NFS CIFS HTTP Total Net kB/s Disk kB/s in out read write 97% 22453 0 0 22463 1491948 8098 664188 2631848 91% 22448 0 0 22478 1492337 8121 607184 658216 94% 22478 0 0 22509 1492134 8106 78844 101992 96% 22453 0 0 23134 1492587 8108 810668 2736420 Cluster::> qos statistics volume latency show Workload ID Latency Network Cluster Data Disk QoS NVRAM --------------- ------ ---------- ---------- ---------- ---------- --------- --------- --------- -total- - 136.49ms 99.00us 70.00us 136.17ms 153.00us 0ms 0ms vserver1_vol1.. 4201 206.05ms 130.00us 0ms 205.88ms 44.00us 0ms 0ms