接続数の上限に達したため、AIQUM のすべてのクラスタで取得に失敗しました
環境
- Active IQ Unified Manager (AIQUM) 9.6+
- すべてのOSプラットフォーム
- ONTAP 9.x
問題
- AIQUMに追加されたすべてのクラスタで断続的に取得が失敗しています
Cluster Monitoring FailedおよびCluster Not ReachableアラートがAIQUMによってトリガーされます- しかし、取得はしばらくすると自動的に、または手動でトリガーされた場合に機能し始めます。
- すべての前提条件(AV除外やCPU/Memory/Disk spaceのリソース可用性など)はAIQUMに適用されています。
- AIQUMおよびONTAPクラスタのSSL証明書は有効です。
- AIQUM
au.log:
ERROR [common-pool-2064] c.o.s.a.d.n.NetAppOCIEArchivePerformancePackage (NetAppOCIEArchivePerformancePackage.java:381) - Failed to get archive file names from zapi. java.net.SocketTimeoutException: connect timed outat java.net.PlainSocketImpl.waitForConnect(Native Method) ~[?:?]...Wrapped by: com.onaro.sanscreen.acquisition.framework.datasource.DataSourceErrorException: Failed to connect to <cluster IP/Hostname>at com.onaro.sanscreen.acquisition.datasource.netapp_ocie.transport.zapi.ZAPIConnection.createDefaultNaServer(ZAPIConnection.java:803) ~[au-datasource-netappfoundation.jar:9.13.0-2023.09.J299]...ERROR [common-pool-2064] c.o.s.a.f.d.BaseDataSource (DataSourceErrorException.java:246) - <cluster_IP/Hostname> [Error connecting] - Failed to connect to <cluster IP/Hostname> (connect timed out)
- AIQUM
ocumserver.logが表示されます:
ERROR [oncommand] [reconciliation-0] [c.n.d.c.ClusterStatusListener] Socket connection error for cluster: <cluster IP/Hostname>java.net.ConnectException: Connection timed out: connectERROR [oncommand] [reconciliation-0] [c.n.d.c.ClusterStatusListener] Cluster : <cluster IP/Hostname> is not reachable. Generating cluster not reachable event.apache_error.logはHTTP接続の制限に達したことを示しています:
[mpm_event:warn] [pid 7215:tid 34401862144] A keepalive connection from ipspace ID -1, remote address <AIQUM IP/Hostname> is being suspended between requests while the 80-connection limit has been reached. (80 active, 8 waiting) Clients should limit the number of concurrent keepalive connections to avoid large performance penalties and/or failures.
[mpm_event:notice] [pid 7215:tid 34402611200] Holding a connection from ipspace ID -1, remote address <AIQUM_IP/Hostname> while 54 others are held and 80 are active
[mpm_event:notice] [pid 7215:tid 34402611200] Holding a connection from ipspace ID -1, remote address <AIQUM_IP/Hostname> while 55 others are held and 80 are active
apache_access.logはAIQUM API呼び出し要求のステータス 408(Request Timed out) を表示します。
<AIQUM IP/Hostname> pii_encrypt/3haVFUKxlfQdtYhedGIaWKrSBVCn+5sImuFntsUoOAk=/pii_encrypt - - [Date/Time] "-"408 - 38 - 0 - - -
<AIQUM IP/Hostname> pii_encrypt/3haVFUKxlfQdtYhedGIaWKrSBVCn+5sImuFntsUoOAk=/pii_encrypt - - [Date/Time] "-" 408 - 31 - 0 - - -