OnCommand Unified Manager :ノードリソースのオーバー利用率と対処方法を教えてください。
に適用されます
- ONTAP 9 、 9.1 、 9.6
- clustered Data ONTAP 8.2
- OnCommand Unified Manager 6.x 、 7.2 、 7.3 、 9.4 、 9.5
- AIQ を使用します
- Unified Manager 9.6.
回答
ノードリソースの使用率が高い理由と、その対処方法を教えてください。
OnCommand Unified Manager には、パフォーマンスを監視し、イベントを自動的に生成する標準のしきい値ポリシーがいくつか用意されています。これらのポリシーはデフォルトで有効になっており、監視対象のしきい値が 6 つの連続した収集期間( 30 分)を超えた場合に警告イベントが生成されます。ノードリソースの使用率が高すぎると、 1 つのノードが運用効率の限界を超えて動作しており、ワークロードのレイテンシに影響を与える可能性がある状況が特定されます。これは、 CPU リソースの 85% 以上を使用しているノードを探すことで実現します。
OnCommand Unified Manager では、この計算は次のカウンタを使用した複雑なアルゴリズムに基づいて行われます。
avg_processor_busy cpu_elapsed_time1 total_cp_msecs cp_phase_times[P2_FLUSH] domain_busy{kahuna] processor_elapsed_time
このアラートは、ストレージコントローラが 30 分以上ビジー状態であることを示しています。対処が必要ない場合や、問題なくデータの提供を継続できる場合があります。ただし、状況によっては、このアラートが生成されたときに、コントローラのワークロードのパフォーマンスに影響が出ることがあります。ネットアップのテクニカルサポートケースを開く前に、次のことを確認してください。
- アラートが生成された時点で、レーテンシーに直面しているボリュームや LUN はありますか。
- レイテンシは、環境やアプリケーションで許容されるしきい値を超えていますか?
- 影響を受ける操作の種類は何ですか?読み取り、書き込み、
- ユーザのワークロードやインフラなど、環境に何らかの変更がありましたか。
- パフォーマンスへの影響は再現可能ですか?アクティビティやワークロードがパフォーマンスへの影響をトリガしますか?
このアラートが生成されたときにワークロードに影響があることを確認できる場合は、ネットアップのテクニカルサポートケースを開いて詳細な調査を依頼してください。同時に、トラブルシューティングの目的でパフォーマンスデータを収集します。
- clustered Data ONTAP 8.2.x 以前を実行しているストレージコントローラの場合は、パフォーマンスに影響を与えるイベント中に perfstat を収集します。
- clustered Data ONTAP 8.3+ を実行しているストレージコントローラの場合は、パフォーマンスに影響を与えるイベント中に perfstat を収集し、アラートが生成されたときにパフォーマンスに最初に影響があった時点からパフォーマンスアーカイブをトリガーします。
- Performance and Statistics Collector ( Perfstat clustered Data ONTAP )
- KB: Performance Archives: Performance First Failure Data Collection for clustered Data ONTAP 8.3 以降を参照してください
ワークロードに影響がない場合や、データを通常どおり処理する場合は、アラートを無視しても問題ありません。ただし、ノードのパフォーマンスを厳密に監視する必要があります。
Data ONTAP での CPU のスケジューリングと使用率の詳細については、「 KB : Data ONTAP での CPU 使用率:スケジューリングと監視」を参照してください。
追加情報
- OnCommand Unified Manager のノード使用率が高いと警告が表示されます
- のノードで OnCommand Unified Manager のノード利用率が大幅に変わります ONTAP 9.4 以降にアップグレードされたクラスタ
- ActiveIQ Unified Manager 9.7 および 9.8 では、このイベントに関するアラートが大幅に改善されています。ノードリソース過剰使用に関するアラートが発生している場合は、これらのいずれかのバージョンにアップグレードしてください。