CVOにディスクが見つからないためにシステムがパニック状態になる
環境
- Cloud Volumes ONTAP (CVO)
- Blue XP(旧称Cloud Manager)
- Microsoft Azure
- Amazon Web Services(AWS)
- Google Cloud Platform(GCP)
- シングルノードまたはHAペア
問題
- 下線のインフラに問題が含まれているために1つ以上のディスクが到達不能になり、パニック状態になります。
[Cluster-01: pha_remove000: mlm.array.lun.removed:notice]: Array LUN '0b.29' (00000000i3g268fHE60S) is no longer being presented to this node.
 [Cluster-01: dmgr_thread: raid.disk.missing:info]: Disk /aggr04/plex0/rg0/0b.29 S/N [00000000i3g268fHE60S] UID [00000000i3g268fHE60S] is missing from the system
 [Cluster-01: config_thread: sk.panic:alert]: Panic String: aggr aggr04: raid volfsm, fatal disk error in RAID group with no parity disk..  Raid type - raid0 Group name plex0/rg0 state NORMAL. 1 disk failed in the group. Disk 0b.29 S/N [00000000i3g268fHE60S] UID [00000000i3g268fHE60S] error: disk does not exist. in SK process config_thread on release 9.7P7 (C)
[Cluster-01: config_thread: sk.panic:alert]: params: {'reason': 'aggr aggr04: raid volfsm, fatal disk error in RAID group with no parity disk..  Raid type - raid0 Group name plex0/rg0 state NORMAL. 1 disk failed in the group. Disk 0b.29 S/N [00000000i3g268fHE60S] UID [00000000i3g268fHE60S] error: adapter error prevents command from being sent to device. in SK process config_thread on release 9.7P7 (C)'}
- 状況によっては、WAFL Hungパニックが発生してシステムがパニック状態になることがあります。
 Panic String: WAFL hung for aggr1. in SK process wafl_exempt02 on release 9.9.0 (C)
- AWS / GCPでは、プレックスで障害が発生し、ノードのステータスが「不明」に戻ることがあります。
 SYMPFA:HA Group Notification from Node-02 (SYNCMIRROR PLEX FAILED) ALERT
- Azureでディスク(Azure HAルート/データアグリゲートの場合はページBLOB)にアクセスできないと、パニック状態になる可能性があります。
- HA Group Notification (PARTNER DOWN, TAKEOVER IMPOSSIBLE ) EMERGENCYアラートが原因でサポートケースが自動的に作成されることがある