ONTAPデータコレクタの内部エラーが原因で、Data Infrastructure Insightsのパフォーマンスのポーリングが失敗しました
環境
- Data Infrastructure Insights(DII)(旧称Cloud Insights)
- ONTAP 9
- ONTAP System Manager
- NetApp ONTAPデータ管理ソフトウェアのデータコレクタ(高度な指標が有効)
問題
- DII またはOnCommand System Managerのデータコレクタのランディングページに次のメッセージが表示されてパフォーマンスのポーリングが失敗するため、パフォーマンスデータを取得できません。
Unable to poll performance ... error = Performance Recent Status
Internal error:
com.onaro.sanscreen.acquisition.framework.datasource.DataSourceErrorException: General Error
または
Data ONTAP API fail: System busy: 7 requests on table "perf_object_get_instances" have been pending for 1678674 seconds. The last completed call took 0 seconds.
- 該当するONTAPクラスタのデータコレクタの
storageperformance
サンプルログ(acq folder
storageperformance_datacollectorname
>one of the timestamp folders
log_sample.log
の[Error Report]にあります)を確認すると、 次のエラーメッセージが表示される場合があります。
例:
2021-03-12 17:19:33,895 ERROR [com.onaro.sanscreen.acquisition.datasource.netapp_ontap.NetAppOntapPerformancePackage] datalake collect and report (Poll Count: 1207, Is Macro Poll: false) : [storageperformance] data-collector-name: 1 apis failed: [storageperformance] data-collector-name: perf-object-get-instances(Object : workload) failed: Trying to perform arithmetic between two counters with different cardinality. Counter "read_io_type" has 1 elements, but the other counter "read_io_type" has 10 elements. (1 times)
2021-03-12 17:21:54,206 ERROR [com.onaro.sanscreen.acquisition.datasource.netapp_ontap.builder.ZapiIterBase] Aborting all performance api calls due to: perf-object-instance-list-info-iter(Object : lif) failed: System busy: 7 requests on table "perf_object_instance_list_info" have been pending for 2922550 seconds. The last completed call took 0 seconds.
2022-03-19 01:13:22,377 ERROR [com.onaro.sanscreen.acquisition.datasource.netapp_ontap.NetAppOntapPerformancePackage] datalake collect and report (Poll Count: 10124, Is Macro Poll: false) : [storageperformance] data-collector-name: 15 apis failed: [storageperformance] data-collector-name: perf-object-get-instances(Object : workload) failed: RPC: Remote system error [from mgwd on node "node_name" (VSID: -1) to cm at 127.0.0.1] (1 times)
- さらに、 次のようにクラスタSVMに対してCLI(クラスタ内のいずれかのノードのノード管理LIF経由でアクセス)で
statistics lif show
コマンドを実行しようとすると、同様のエラーが発生することがあります。
注:エラーメッセージは、DIIのパフォーマンスサンプルログから取得されたハイライト部分と同一である必要があります。ただし、特定のperformance-object
ZAPI呼び出しは、次の2つのエラーメッセージで異なる場合があります。
cluster1::> statistics lif show -vserver cluster1
Error: command failed: System busy: 7 requests on table "perf_object_get_instances" have been pending for 1147109 seconds. The last completed call took 0 seconds.