スペアディスクの追加後にディスクインベントリが AWS HA と一致しない
環境
Cloud Volumes ONTAP ( AWS )
問題
バックエンド EBS イベントが原因で発生したディスク障害です。 次にアグリゲートに「 failed 」のディスクが 2 つ表示されます。
Aggregate: aggr1 (failed, raid0, partial) (advanced zoned checksums) Plex: /aggr1/plex0 (offline, failed, inactive) RAID Group /aggr1/plex0/rg0 (partial, advanced_zoned checksums) Usable Physical Position Disk Pool Type RPM Size size Status -------- ------ ------ ----- ----- ----- ------ ------ data Net-2.3 0 VMDISK - 1007GB 1023GB (normal) data FAILED 0 - - 1007GB 0B (failed) data FAILED 0 - - 1007GB 0B (failed)
続いて、( 2 )スペアディスクを AWS ポータルに追加し、 EBS ディスクが CVO 側( CLI と System Manager )で障害状態のままと表示されました。
インベントリの不一致が原因で、元の「障害」ディスクがオンラインに戻ったときに「テイクオーバーを実行できません」というステータスが表示されます。
awsfiler1::> cf status Takeover Node Partner Possible State Description -------------- -------------- -------- ------------------------------------- awsfiler1-01 awsfiler1-02 true Connected to awsfiler1-02 awsfiler1-02 awsfiler1-01 false Connected to awspfiler1-01, Takeover is not possible: Local node missing partner disks
また、 EMS で不足しているディスクに関するメッセージが表示されます。
awsfiler1-02 ERROR cf.disk.inventory.mismatch: Status of the disk 0f.15 (34363435:36316534:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000)has recently changed or the node(awsfiler1-02) is missing the disk.