停電後、手動で削除を実行せずにFlexGroupのSnapshotが失われる
環境
- 3ノード以上のONTAP 9クラスタ
- 1つのHAペアにまたがるコンスティチュエントで使用されているFlexGroup
- FlexGroupスナップショット
問題
- 1つのHAペアで構成される2つのノード:
- 同じFlexGroupの自身のコンスティチュエント。
- クリーンシャットダウンを行わずに(複数のディスクでパニック状態が発生したり停電が発生したりした場合など)、同時に予期せずリブートする。
- 同時に再起動します。
- リブート後、
-
snapshot show
Size Total% Used%
一部のコンスティチュエントだけで対応するFlexGroup Snapshotが失われた場合、単一または複数のFlexGroup Snapshotが完全に失われるか、から表示されます。
::>set adv
Warning: These advanced commands are potentially dangerous; use them only when directed to do so by NetApp personnel.Do you want to continue? {y|n}: y
::*>vol show -vserver svm1 -volume MyFlexgroup1 -fields is-flexgroup
vserver volume is-flexgroup
------- ------------ ------------
svm1 MyFlexgroup1 true
::*>volume snapshot show -vserver svm1 -volume MyFlexgroup1
---Blocks---
Vserver Volume Snapshot Size Total% Used%
-------- -------- ------------------------------------- -------- ------ -----
svm1 MyFlexgroup1
MySnapshot1 - - -
hourly.2024-03-11_0905 360KB 0% 36%
2 entries were displayed.
1 entry was acted on.
::*>node run -node MyCluster-01 -command snap status MyFlexgroup1__0001
Node: MyCluster-01
Volume MyFlexgroup1__0001
snapid status date ownblks release fsRev name
------ ------ ------------ ------- ------- ----- --------
2 complete Mar 11 09:05 47 9.7 35092 hourly.2024-03-11_0905
1 complete Mar 11 09:00 47 9.7 35092 MySnapshot1
::*>node run -node MyCluster-02 -command snap status MyFlexgroup1__0002
Node: MyCluster-02
Volume MyFlexgroup1__0002
snapid status date ownblks release fsRev name
------ ------ ------------ ------- ------- ----- -------
2 complete Mar 11 09:05 47 9.7 35092 hourly.2024-03-11_0905
注: コンスティチュエントMyFlexgroup1__0002にMySnapshot1がありません。
::*>snapshot show -vserver svm1 -volume MyFlexgroup1 -snapshot MySnapshot1 -fields state
vserver volume snapshot state
------- ------------ ----------- -----
svm1 MyFlexgroup1 MySnapshot1 unknown
- Snapshotを大量に削除すると、リブート後に該当するノードがパニック状態になることがあります。
Panic_Message: timeout table full in SK process snap_lopri_work on release 9.11.1P8