AIQUMのEMSイベント処理との同時実行数の競合によりクラスタのポーリングが停止する
環境
- Active IQ Unified Manager(AIQUM)9.x
- ONTAP clustered Data ONTAP
問題
- Active IQ Unified Manager(AIQUM)でのクラスタポーリングが断続的に停止するため、クラスタの健全性の更新に失敗したり、重要なアラートが失われたりします。
- ポーリングがUIでスタックしたと表示され、後続のポーリングはスキップまたはドロップされます。
観察されたログ出力:
ERROR [oncommand][reconciliation-0][c.n.dfm.collector.OcieJmsListener] Previous foundation poll at <timestamp> ongoing for ds=<id>(<cluster>), adding to the dropped JmsDataSources list...org.springframework.orm.hibernate5.HibernateOptimisticLockingFailureException: Batch update returned unexpected row count from update [0]; actual row count: 0; expected: 1; statement executed: update Cluster set healthStatus=? where id=? and healthStatus=?; nested exception is org.hibernate.StaleStateException: Batch update returned unexpected row count from update [0]; actual row count: 0; expected: 1; statement executed: update Cluster set healthStatus=? where id=? and healthStatus=?...INFO [oncommand][SyslogServer:udp][c.n.dfm.impl.ems.SysLogEventHandler] Received EMS from: [[<cluster>:cpeer.unavailable:ALERT]:]