パートナーのMBの装着替え中にノードがパニック状態になる
環境
- AFF C800
- ONTAP 9
問題
- パートナーのマザーボードの再装着中にノードがパニック状態になる
- パートナーの再装着中にノードがディスクへのアクセスを失い始める、
ems-logレポート
Node-01: kernel: nvme.link.error:error]: PCIe link initialization error for NVMe SSD in slot XNode-01: kernel: nvme.link.error:error]: PCIe link initialization error for NVMe SSD in slot XNode-01: kernel: nvme.link.error:error]: PCIe link initialization error for NVMe SSD in slot XNode-01: kernel: nvme.link.error:error]: PCIe link initialization error for NVMe SSD in slot XNode-01: kernel: nvme.link.error:error]: PCIe link initialization error for NVMe SSD in slot XNode-01: kernel: nvme.link.error:error]: PCIe link initialization error for NVMe SSD in slot XNode-01: scsi_cmdblk_strthr_admin: disk.timeout.flush.start:debug]: Aggressive timeout flush started on disk 0n.X- Panic String レポート
Node-01: splog_main: mgr.stack.string:notice]: Panic string: aggr Node-01_n2_root: raid volfsm, fatal multi-disk error.. Raid type - raid_dp Group name plex0/rg0 state NORMAL. 6 disks failed in the group. Disk 0Node-01: splog_main: mgr.stack.at:notice]: Panic occurred at: Fri Feb 7 09:28:24 2025Node-01: splog_main: mgr.stack.proc:notice]: Panic in process: config_thread- 問題は、パートナーの再装着時に両方のノードで発生します
- 消失したディスクを回復するには、パニック状態になったノードのマザーボードの再装着が必要です