shutdown pending(degraded mode)critical - AutoSupport メッセージです
環境
- ONTAP 9
- CallHome, shutdown.pending
- monitor.brokenDisk
- HA Group Notification from node_name(shutdown pending(degraded mode))アラート
イベント サマリ
このメッセージは、ディスクドライブで障害が発生した場合に、再構築に使用できる適切なスペアがない場合に表示されます。
- データを保護するために、システムはデグレードモードになります。
- 設定した時間間隔でデグレードモードで実行されると、二重ディスクドライブ障害が発生したり、データが失われたりするのを防ぐために、システムは自動的に停止します。
- デフォルトのタイムアウトは通常24時間です。
- システムがデグレードモードで実行されている間にスペアドライブが使用可能になると、システムはただちに障害が発生したドライブのリビルドを開始します。
検証
イベント ログ
event log show -severity * -message-name callhome*
[node1: statd: callhome.shutdown.pending:alert]: Call home for SHUTDOWN PENDING (degraded mode)
event log show -severity * -message-name monitor.brokenDisk*
[node1: statd: monitor.brokenDisk.notice:info]: When two disks are broken in raid_dp volume, the system shuts down automatically every 24 hours to encourage you to replace the disk. If you reboot the system it will run for another 24 hours before shutting down. (The 24 hour timeout may be increased by altering the "raid.timeout" value using the "options" command.)
[node1: statd: monitor.shutdown.brokenDisk.pending:notice]: two data disks in RAID group "/aggregate_name/plex0/rg0" are broken. Halting system in 24 hours.
コマンドライン
アグリゲートのステータスを確認してを実行します storage aggregate show-status
RAID group /aggregate_name/plex0/rg1 (double degraded, block checksums) RAID Disk Device HA SHELF BAY CHAN Pool Type RPM Used (MB/blks) Phys (MB/blks) --------- ------ ------------- ---- ---- ---- ----- -------------- -------------- dparity 0b.07.12 0b 7 12 SA:B 0 SAS 10000 1713523/3509295616 1716957/3516328368 parity 0b.07.13 0b 7 13 SA:B 0 SAS 10000 1713523/3509295616 1716957/3516328368 data FAILED N/A 1713523/ - data 0b.07.15 0b 7 15 SA:B 0 SAS 10000 1713523/3509295616 1716957/3516328368 data FAILED N/A 1713523/ - data 0b.07.21 0b 7 21 SA:B 0 SAS 10000 1713523/3509295616 1716957/3516328368
フェイルオーバーステータス を確認して、を実行し、storage failover show
再構築または退避する必要のあるディスクを含むアグリゲートが部分的なギブバック状態にあるかどうかを確認します
storage failover show
Takeover
Node Partner Possible State Description
-------------- -------------- -------- -------------------------------------
Node-1 Node-2 true Connected to Node-2, Partial giveback
Node-2 Node-1 true Connected to Node-1.
解決策
- 未割り当てのディスクがないかどうかを確認し、再構築を開始するためにスペアが必要なノードに割り当てます。
-
::> storage disk show -container-type unassigned
-
::> storage disk assign -disk <stackID>.<shelfID>.<bayID> -owner <node name>
- 部分的なギブバック 状態の場合は、ギブバックを完了します。部分的なギブバック状態のときは、ディスクの再構築も退避も実行されません
- 障害が発生したドライブを交換します。このKBを参照して、「Part Status - disk failed - AutoSupport 」メッセージを確認してください
回避策
- パートナーノードに同じタイプのスペアディスクが2本以上あるかどうかを確認し、ディスクを再割り当てします。HA またはDRのパートナーノードからスペアディスクを再割り当てする方法に従います
注:サポートが必要な場合は、ネットアップサポートにお問い合わせください