最大接続数の枯渇が原因でAIQUMのすべてのクラスタの取得に失敗しました
環境
- ActiveIQ Unified Manager(AIQUM)9.6以降
- すべてのOSプラットフォーム
- ONTAP 9.x
問題
- AIQUMに追加されたすべてのクラスタでデータ収集が断続的に失敗する
Cluster Monitoring Failed
Cluster Not Reachable
AIQUMによってアラートがトリガーされる- ただし、しばらくすると、または手動でトリガーされた場合は、取得が自動的に開始されます。
- [1] AV除外や、 CPU /メモリ/ディスクスペースの観点からのリソースの可用性など、すべての前提条件がAIQUMに適用されます。
- AIQUMおよびONTAPクラスタのSSL証明書が有効である
- AIQUM
au.log
:
ERROR [common-pool-2064] c.o.s.a.d.n.NetAppOCIEArchivePerformancePackage (NetAppOCIEArchivePerformancePackage.java:381) - Failed to get archive file names from zapi. java.net.SocketTimeoutException: connect timed out
at java.net.PlainSocketImpl.waitForConnect(Native Method) ~[?:?]
...
Wrapped by: com.onaro.sanscreen.acquisition.framework.datasource.DataSourceErrorException: Failed to connect to <cluster IP/Hostname>
at com.onaro.sanscreen.acquisition.datasource.netapp_ocie.transport.zapi.ZAPIConnection.createDefaultNaServer(ZAPIConnection.java:803) ~[au-datasource-netappfoundation.jar:9.13.0-2023.09.J299]
...
ERROR [common-pool-2064] c.o.s.a.f.d.BaseDataSource (DataSourceErrorException.java:246) - <cluster_IP/Hostname> [Error connecting] - Failed to connect to <cluster IP/Hostname> (connect timed out)
- AIQUM
ocumserver.log
:
ERROR [oncommand] [reconciliation-0] [c.n.d.c.ClusterStatusListener] Socket connection error for cluster: <cluster IP/Hostname>java.net.ConnectException: Connection timed out: connect
ERROR [oncommand] [reconciliation-0] [c.n.d.c.ClusterStatusListener] Cluster : <cluster IP/Hostname> is not reachable. Generating cluster not reachable event.