長時間電源オフ後のWAFL不整合とノードダウン
環境
- ONTAP 9
- AFF / FAS システム
問題
- 約2か月間電源がオフになっていたクラスタの電源を入れた後、1つのノードが起動に失敗し、ルートアグリゲートでWAFLの不整合が報告されました。以下のログメッセージがAutoSupportとコンソールで確認されました:
Tue Mar 03 16:53:26+0000 [node1:wafl_exempt02:wafl.raid.incons.buf:error]: WAFL inconsistent: bad block at VBN 8406877 (vvbn:12652616 fbn:1764 level:0) in public inode (fileid:4294967295 snapid:0 fixable:1 file_type:1 disk_flags:0x2 error:118 raid_set:1) in volume partner:vol0.
[node1:callhome.root.vol.recovery.reqd:EMERGENCY]: Call home for ROOT VOLUME NOT WORKING PROPERLY: RECOVERY REQUIRED. - さらに、次のようなEMSメッセージが繰り返し
raid_cksum_wc_blkErr_1, raid_multierr_bad_block_1, and wafl_raid_incons_buf_1報告されました。