SyncMirror Plex Failed - AutoSupport メッセージ
環境
- MetroCluster
- Data ONTAP 8
- ONTAP 9
- SyncMirror
イベント サマリ
AutoSupport メッセージ SYNCMIRROR PLEX FAILED
には、SyncMirror のプレックスで障害が発生し、SyncMirror 関係がデグレード状態になっていることが示されています。
検証
障害が発生したと報告するプレックスを特定します。
storage aggregate show
Aggregate Size Available Used% State #Vols Nodes RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
aggr0_siteA_02
953.8GB 46.22GB 95% online 1 siteA-02 raid_dp,
mirrored,
normal
aggr1_siteA_02
2.79TB 2.78TB 0% online 2 siteA-02 raid_dp,
mirror
degraded
解決策
ONTAP 9
- アグリゲートと障害が発生したプレックスを特定します。
siteA::>storage aggregate show
Aggregate Size Available Used% State #Vols Nodes RAID Status
--------- -------- --------- ----- ------- ------ ---------------- ------------
aggr0_siteA_02
953.8GB 46.22GB 95% online 1 siteA-02 raid_dp,
mirrored,
normal
aggr1_siteA_02
2.79TB 2.78TB 0% online 2 siteA-02 raid_dp,
mirror
degraded
ステータスがの degraded
場合は、動作していないプレックスが表示されます
- プレックスで障害が発生した理由を特定します。
- ディスク
- シェルフ
- スイッチのISLで障害が発生して
- サイト障害
SiteA::>storage aggregate show-status -aggregate aggr2_siteA_02
Owner Node: SiteA-02
Aggregate: aggr2_siteA_02 (online, raid_dp, mirror degraded) (block checksums)
Plex: /aggr2_siteA_02/plex0 (online, normal, active, pool0)
RAID Group /aggr2_siteA_02/plex0/rg0 (normal, block checksums)
Usable Physical
Position Disk Pool Type RPM Size Size Status
-------- --------------------------- ---- ----- ------ -------- -------- ----------
dparity 3.11.4 0 SAS 10000 1.09TB 1.09TB (normal)
parity 3.11.5 0 SAS 10000 1.09TB 1.09TB (normal)
data 3.11.6 0 SAS 10000 1.09TB 1.09TB (normal)
data 3.11.18 0 SAS 10000 1.09TB 1.09TB (normal)
data 3.11.19 0 SAS 10000 1.09TB 1.09TB (normal)
Plex: /aggr2_siteA_02/plex1 (offline, failed, inactive, pool1)
RAID Group /aggr2_siteA_02/plex1/rg0 (partial, none checksums)
Usable Physical
Position Disk Pool Type RPM Size Size Status
-------- --------------------------- ---- ----- ------ -------- -------- ----------
dparity FAILED - - - 1.09TB 0B (failed)
parity FAILED - - - 1.09TB 0B (failed)
data FAILED - - - 1.09TB 0B (failed)
data FAILED - - - 1.09TB 0B (failed)
data FAILED - - - 1.09TB 0B (failed)
原因 を解決すると、ディスクが稼働状態に戻り、プレックスが動作可能状態に戻ることがあります。プレックスが運用状態に戻ると、再同期プロセスが自動的に開始されます。この場合、これ以上の操作は必要ありません。再同期プロセスは次の方法で監視できます。
SiteA:>storage aggregate plex show
- 実際のディスク(ハードウェア)障害、サイト障害、電力サージなどのような原因 の問題を修正できず、プレックスをオンラインにするために十分なディスクが稼働状態に戻らない場合、プレックスを修復できませんが、破棄して再作成する必要があります。
メモ:プレックスを削除して再作成するには、完全なミラーベースラインが必要です。ミラーを再作成するための十分なスペアがプールにあることを確認してください。
ミラーを破棄して再作成するには'次の手順に従います
storage aggregate plex delete -aggregate <aggr_name> -plex <degraded_plex_name>
storage aggregate mirror -aggregate <aggr_name>
Data ONTAP 8.2の場合
- アグリゲートと障害が発生したプレックスを
'aggr status -v
出力から判別します
>aggr status -v
Aggr State Status Options
aggr1 online raid_dp, aggr nosnap=on, raidtype=raid_dp, raidsize=14,
mirrored ignore_inconsistent=off, snapmirrored=off,
64-bit resyncsnaptime=60, fs_size_fixed=off,
lost_write_protect=on, ha_policy=cfo,
hybrid_enabled=off, percent_snapshot_space=15%,
free_space_realloc=off
Volumes: vol1, vol2, vol3
Plex /aggr1/plex0: online, normal, active
RAID group /aggr1/plex0/rg0: normal, block checksums
Plex /aggr1/plex1: offline, failed, inactive
RAID group /aggr1/plex1/rg0: partial, block checksums
ステータスがpartial
「」の場合は、動作していないプレックスが表示されます。
- プレックスで障害が発生した理由を特定します。
- ディスク
- シェルフ
- スイッチのISLで障害が発生して
- サイト障害
原因 を解決すると、ディスクが稼働状態に戻り、プレックスが動作可能状態に戻ることがあります。プレックスが運用状態に戻ると、再同期プロセスが自動的に開始されます。この場合、これ以上の操作は必要ありません。再同期プロセスは次の方法で監視できます。
>sysconfig -r
- 実際のディスク(ハードウェア)障害、サイト障害、電力サージなどのような原因 の問題を修正できず、プレックスをオンラインにするために十分なディスクが稼働状態に戻らない場合、プレックスを修復できませんが、破棄して再作成する必要があります。
メモ:プレックスを削除して再作成するには、完全なミラーベースラインが必要です。ミラーを再作成するための十分なスペアがプールにあることを確認してください。
ミラーを破棄して再作成するには'次の手順に従います
aggr destroy aggr0/plex1
aggr mirror aggr0
追加情報
プレックスの障害のトラブルシューティングに関するサポートやその他のサポートが必要 な場合は、ネットアップテクニカルサポートにお問い合わせください。