AIQUM サーバに断続的に到達できず、取得が失敗することがある
環境
- Active IQ Unified Manager (AIQUM) 9.8+
- すべてのOSバージョン
問題
- AIQUMサーバに到達できないことがある
- GUIにアクセスできても、クラスタの取得が断続的に失敗する
- その結果、AIQUMに現在のONTAP数値と一致しない古いデータ(ディスク容量使用率など)が表示される
acq.logには、異なるクラスタで複数の"Data source is already performing a poll of netappstorageperformance. Therefore this poll is skipped."が発生する- これはアップグレード後に発生することがあります
- MySQL
error.logで頻繁に「server out of memory」レコードが発生します - 再起動後、しばらくの間問題は解決されます
- 以下のエラーが表示される場合があります:
oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=/,mems_allowed=0,global_oom,task_memcg=/system.slice/ocie.service,task=java,pid=3879248,uid=997 out of memory: killed process 3879248 (java) total=vm:8816112kb, anon=rss:4154524kb, file-rss:0kb, shmem-rss:0kb, UID:997 pgtables:9072kb oom_score_adj:0 ocie.service: A process of this unit has been killed by the OOM killer. ocie.service: Main process exited, code=killed, status=9/KILL Stopping Active IQ Manamgent Server service ocie
ERROR [oncommand] [org.springframework.jms.listener.DefaultMessageListenerContainer#2-1] [c.n.i.s.r.dao.AcquisitionInfoDao] Data Acquistion Save exception:
org.springframework.dao.DuplicateKeyException: PreparedStatementCallback; SQL [INSERT INTO opm.acquisition_info (time,success,clusterId,analysisDuration,collectionDuration,msgRcvTime,isHistorical)
VALUES (?,?,?,?,?,?,?)]; (conn=19056) Duplicate entry 'XXXXXXXXX-XXXXX' for key 'acquisition_info.PRIMARY'; nested exception is java.sql.SQLIntegrityConstraintViolationException: (conn=19056)
Duplicate entry 'XXXXXXXXX-XXXXX' for key 'acquisition_info.PRIMARY'