ONTAP を 9.8 または 9.9 から 9.10.1 以降にアップグレードした後、すべてのノードで MGWD がクラッシュ/再起動する
環境
- ONTAP
- ONTAP 9.8 または 9.9 の特定のバージョンから 9.10.1 以降にアップグレードします
問題
mgmt
1 つ以上のノードが ONTAP 9.10.1 にアップグレードされた後、クラスタ アプリケーションがすべてのノードで頻繁に再起動し、オフラインとオンラインの間をフラップ/切り替えます。
clus1::*> cluster ring show
Node UnitName Epoch DB Epoch DB Trnxs Master Online
--------- -------- -------- -------- -------- --------- ---------
clus1-01 mgmt 0 1208 45 - offline
clus1-01 vldb 32 32 525821 clus1-01 master
clus1-01 vifmgr 104 104 889174 clus1-01 master
clus1-01 bcomd 32 32 2879 clus1-01 master
clus1-01 crs 32 32 745 clus1-01 master
clus1-02 mgmt 0 1208 45 - offline
clus1-02 vldb 32 32 525821 clus1-01 secondary
clus1-02 vifmgr 104 104 889174 clus1-01 secondary
clus1-02 bcomd 32 32 2879 clus1-01 secondary
clus1-02 crs 32 32 745 clus1-01 secondary
clus1-03 mgmt 0 1208 45 - offline
clus1-03 vldb 32 32 525821 clus1-01 secondary
clus1-03 vifmgr 104 104 889174 clus1-01 secondary
clus1-03 bcomd 32 32 2879 clus1-01 secondary
clus1-03 crs 32 32 745 clus1-01 secondary
clus1-04 mgmt 0 1208 45 - offline
clus1-04 vldb 32 32 525821 clus1-01 secondary
clus1-04 vifmgr 104 104 889174 clus1-01 secondary
clus1-04 bcomd 32 32 2879 clus1-01 secondary
clus1-04 crs 32 32 745 clus1-01 secondary
- 他のクラスタアプリケーションがオンラインのままなので、データは引き続き提供されますが、管理がオフラインのときはノードはアグリゲートのステータスを確認できません(
aggr show
状態にある他のノードの集計を報告しますunknown
) であり、次のようなメッセージが報告されることがあります。
Info: Node clus1-04 that hosts aggregate aggr1 is offline
- MGWDログにSQL挿入エラーが表示される
sp_cap_rdb
:
[kern_mgwd:info:2136] 0x828839500: SQL error: "INSERT INTO sp_cap_rdb(rowid, _epoch, _tid, [node], [nodeid], [id], [version]) VALUES (-350277020502054092, 828, 141, 'clus1-04', 'xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx', 33, 2);" UNIQUE constraint failed: sp_cap_rdb.node, sp_cap_rdb.id(19)
[kern_mgwd:info:2136] 0x828839500: 0: ERR: SQL_CONTEXT: execute_sql:src/sql_context.cc:836 SQL: failed on connection 0x81efa7308: UNIQUE constraint failed: sp_cap_rdb.node, sp_cap_rdb.id(19), txn: 'saveTxnChanges:sp_cap_rdb create',active_connection: 0x81efa7308, active_thread: 0x828839500, active_label: 'saveTxnChanges:sp_cap_rdb create', stmt: "INSERT INTO sp_cap_rdb(rowid, _epoch, _tid, [node], [nodeid], [id], [version]) VALUES (-350277020502054092, 828, 141, 'clus1-04', 'xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx', 33, 2);"
[kern_mgwd:info:2136] E [src/rdb/sql_local_unit.cc 5116 (0x828839500)]: saveTxnChanges: failed to execute SQL: 'INSERT INTO sp_cap_rdb(rowid, _epoch, _tid, [node], [nodeid], [id], [version]) VALUES (-350277020502054092, 828, 141, 'clus1-04', 'xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx', 33, 2);'.
[kern_mgwd:info:2136] W [src/rdb/sql_local_unit.cc 5288 (0x828839500)]: saveTxnChanges: abandoning due to INTERNAL_ERROR.