「monitor.shutdown.brokenDisk:EMERGENCY" error」が表示されるノードのシャットダウン
環境
- ONTAP 9.12.1より前のバージョン
- FAS / AFFモデル
問題
monitor.shutdown.brokenDisk
このメッセージは 、自動シャットダウンシーケンスがcallhome.shutdown.pending
ごとに期限切れになると表示されます( RAIDグループが指定された時間間隔でデグレードモードになっていました。デフォルトは通常24時間です)。
- 次のエラーが発生し、テイクオーバーを実行せずにノードがシャットダウンします。
例:
[Node-01: statd: monitor.brokenDisk.notice:info]: When two disks are broken in raid_dp volume, the system shuts down automatically every 24 hours to encourage you to replace the disk. If you reboot the system it will run for another 24 hours before shutting down. (The 24 hour timeout may be increased by altering the "raid.timeout" value using the "options" command.)
[Node-01: statd: monitor.shutdown.brokenDisk:EMERGENCY]: data disk,parity disk in RAID group "/aggr0_n1/plex0/rg0" are broken. Halting system now.
[Node-01: shutdown_thread0: ha.localNodeShutDown:notice]: Shutdown of the local node has been initiated with inhibit_takeover set to TRUE.
[Node-01: shutdown_thread0: kern.shutdown:notice]: System shut down because : "BROKEN DISK".
::> cluster ring show
Node UnitName Epoch DB Epoch DB Trnxs Master Online
--------- -------- -------- -------- -------- --------- ---------
node01 mgmt 0 2 13923732 - offline
node01 vldb 0 2 556665 - offline
node01 vifmgr 0 2 56 - offline
node01 bcomd 0 2 11 - offline
node01 crs 0 2 1 - offline
::> storage failover show
Takeover
Node Partner Possible State Description
-------------- -------------- -------- -------------------------------------
node01 node02 false Waiting for node02, Takeover is not
possible: Partner node halted after
disabling takeover
node02 node01 - Unknown
- 同じRAID-DPグループの2本のディスクで障害が発生し、「ダブルデグレード」状態になっている:
例:
Aggregate aggr0_n1 (online, raid_dp, degraded) (block checksums)
Plex /aggr0_n1/plex0 (online, normal, active, pool0)
RAID group /aggr0_n1/plex0/rg0 (double degraded, block checksums)
RAID Disk Device HA SHELF BAY CHAN Pool Type RPM Used (MB/blks) Phys (MB/blks)
--------- ------ ------------- ---- ---- ---- ----- -------------- --------------
dparity 0d.03.0 0d 3 0 SA:A 0 SAS 10000 1142352/2339537408 1144641/2344225968
parity FAILED N/A 1142352/ -
data FAILED N/A 1142352/ -