ASUPの収集時に9.13.1へのアップグレード後のMGWDリングのOOQ
環境
- ONTAP 9.13.1以降
- SnapMirrorソースクラスタ
- フルまたは週単位のAutoSupport中にONTAP mgwd RDBクォーラムが失われる
問題
- クラスタがONTAP 9.13.1にアップグレードされました。
- Weekly AutoSupportが自動的にトリガーされるか、手動の
type=all
Autosuuportが呼び出されてcollection-in-progress
状態になります。 - AutoSupportがcollection-in-progress状態のときにrdb ring mgwdがクォーラムのメンバーでなくなった。
- ログファイル
mgwd.log
にはlocalSrcSmCgVolRelInfoView_sql
LU_STATE_BUSY
、60秒を超える実行に対する処理と、SQLトランザクションの結果が表示されます。
Wed May 01 2024 21:07:36 +02:00 [kern_mgwd:info:3486] A [src/rdb/sql_stmt_cache.cc 806 (0x82a004f00)]: evaluateInUse: Statement in use for 60+ seconds: 4854 0x82d211b88 'SELECT ... FROM localSrcSmCgVolRelInfoView_sql WHERE ...;'
Tue Apr 30 2024 19:54:13 +02:00 [kern_mgwd:info:3486] rdb::TM:Tue Apr 30 19:53:51 2024:src/rdb/TM.cc:5180 (thr_id:0x820b9a600) TM 1002: _localCommitSql: after saveTxnChanges, st=LU_STATE_BUSY
- ログファイル
vldb.log
が参照するチェックポイントの速度が遅いresult: LU_STATE_BUSY
:
Sun May 05 2024 18:15:22 +02:00 [kern_vldb:info:8569] E [src/rdb/sql_local_unit.cc 2276 (0x80d110500)]: checkpoint: Giving up checkpointing: took 60034312us and 274 attempt(s) to checkpoint 21541 pages out of 25479 in WAL file (84.544 pct). Pages in WAL file now: 25479.
Sun May 05 2024 18:15:22 +02:00 [kern_vldb:info:8569] W [src/rdb/sql_local_unit.cc 2359 (0x80d110500)]: checkpoint: Long checkpoint detected: total time 60037066us, total attempts 274, result: LU_STATE_BUSY