自己暗号化ドライブ障害後にエラーが発生したためにONTAPアップグレードが一時停止する
環境
- ONTAP
- NVMe自己暗号化ドライブ(SED)を搭載したAFFシステム。以下に該当しますが、これらに限定されません。
- X4014S173315TNTE
- X4014S173A15TNTE
問題
- ONTAPのアップグレード中に、ブート中にパーティショニングされたディスクが次のエラーで失敗します。
[cluster-01:nse.op.failed:error]: Control failure on self-encrypting drive 0n.30; security provider: None, authority: None, during operation "tcg_tper_properties_sm".
[cluster-01:disk.init.failure.error:error]: Drive 0n.30 failed initialization due to error 5, sense code(5 2c 0 c).
[cluster-01:disk.init.failure.error:error]: Drive 0n.36 failed initialization due to error 5, sense code(5 2c 0 c).
[cluster-01:disk.init.failure.error:error]: Drive 0n.25 failed initialization due to error 5, sense code(5 2c 0 c).
[cluster-01:disk.init.failure.error:error]: Drive 0n.31 failed initialization due to error 5, sense code(5 2c 0 c).
[cluster-01:disk.init.failure.error:error]: Drive 0n.26 failed initialization due to error 5, sense code(5 2c 0 c).
[cluster-01:disk.init.failure.error:error]: Drive 0n.24 failed initialization due to error 5, sense code(5 2c 0 c).
- その結果、パートナーノードでディスクのインベントリが一致しない可能性があります。
[cluster-01: svc_queue_thread: cf.disk.inventory.mismatch:error]: Status of the disk 0n.30P2 (xxxxxxxx:xxxxxxxx:xxxxxxxx:xxxxxxxx:xxxxxxxx:xxxxxxxx:00000000:00000000:00000000:00000000) has recently changed or the node (cluster-01) is missing the disk.
- ディスクが不足しているため、パートナーがギブバックに失敗することがあります。
[cluster-02: svc_queue_thread: cf.giveback.disk.check.fail:alert]: cf giveback failed: Partner is missing disks.
- ファブリックプールが原因でギブバックが拒否される場合もあります。
sfo.giveback.failed: Giveback of aggregate aggr1 failed due to destination check failed.
sfo.sendhome.subsystemAbort: The giveback operation of 'aggr1' was aborted by 'fabric pools'.
gb.netra.ca.check.failed: Giveback of aggregate 'aggr1' (uuid: xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx) failed due to Object store is not reachable on destination preventing object store access on the destination node.
- ルートアグリゲートで複数のディスクで障害が発生した場合、ブート時にノードがブートして次の状態になることがあります。
Waiting for giveback...(Press Ctrl-C to abort wait)Entering FM state:5 because mbFound:0 local in headswap:0
Entering FM state:5 because mbFound:0 local in headswap:0
Entering FM state:5 because mbFound:0 local in headswap:0