メインコンテンツまでスキップ

OnCommand Unified Manager :ノードリソースのオーバー利用率と対処方法を教えてください。

Views:
2
Visibility:
Public
Votes:
0
Category:
oncommand-unified-manager
Specialty:
om
Last Updated:

に適用されます

  • ONTAP 9 、 9.1 、 9.6
  • clustered Data ONTAP 8.2
  • OnCommand Unified Manager 6.x 、 7.2 、 7.3 、 9.4 、 9.5
  • AIQ を使用します
  • Unified Manager 9.6.

回答

ノードリソースの使用率が高い理由と、その対処方法を教えてください。

OnCommand Unified Manager には、パフォーマンスを監視し、イベントを自動的に生成する標準のしきい値ポリシーがいくつか用意されています。これらのポリシーはデフォルトで有効になっており、監視対象のしきい値が 6 つの連続した収集期間( 30 分)を超えた場合に警告イベントが生成されます。ノードリソースの使用率が高すぎると、 1 つのノードが運用効率の限界を超えて動作しており、ワークロードのレイテンシに影響を与える可能性がある状況が特定されます。これは、 CPU リソースの 85% 以上を使用しているノードを探すことで実現します。

OnCommand Unified Manager では、この計算は次のカウンタを使用した複雑なアルゴリズムに基づいて行われます。

 avg_processor_busy cpu_elapsed_time1 total_cp_msecs cp_phase_times[P2_FLUSH] domain_busy{kahuna] processor_elapsed_time 

このアラートは、ストレージコントローラが 30 分以上ビジー状態であることを示しています。対処が必要ない場合や、問題なくデータの提供を継続できる場合があります。ただし、状況によっては、このアラートが生成されたときに、コントローラのワークロードのパフォーマンスに影響が出ることがあります。ネットアップのテクニカルサポートケースを開く前に、次のことを確認してください。

  • アラートが生成された時点で、レーテンシーに直面しているボリュームや LUN はありますか。
  • レイテンシは、環境やアプリケーションで許容されるしきい値を超えていますか?
  • 影響を受ける操作の種類は何ですか?読み取り、書き込み、
  • ユーザのワークロードやインフラなど、環境に何らかの変更がありましたか。
  • パフォーマンスへの影響は再現可能ですか?アクティビティやワークロードがパフォーマンスへの影響をトリガしますか?

このアラートが生成されたときにワークロードに影響があることを確認できる場合は、ネットアップのテクニカルサポートケースを開いて詳細な調査を依頼してください。同時に、トラブルシューティングの目的でパフォーマンスデータを収集します。

ワークロードに影響がない場合や、データを通常どおり処理する場合は、アラートを無視しても問題ありません。ただし、ノードのパフォーマンスを厳密に監視する必要があります。

Data ONTAP での CPU のスケジューリングと使用率の詳細については、「 KB : Data ONTAP での CPU 使用率:スケジューリングと監視」を参照してください。

追加情報