ONTAP 9 12.1および9.13.1RC1でWAFLがハングしたためにパニックが発生する
環境
- ONTAP 9 .12.1~9.12.1P4
- ONTAP 9.13.1RC1
問題
- ノードがパニック状態になり、次のようなメッセージが表示されます。
Panic String: WAFL hung for aggregate_name. in SK process wafl_exempt04 on release 9.12.1P2 (C)
- Medium recoveredまたはunrecovered エラーが報告されます。
[node_name: disk_server_1: disk.ioMediumError:notice]: Medium error on disk 0a.0.1: op 0x88:0000000386e57cf0:00000200 sector 15148088672 SCSI:medium error - Unrecovered read error - If the disk is in a RAID group, the subsystem will attempt to reconstruct unreadable data (3 11 0 2d) (2987) Disk 0a.0.1 Shelf 0 Bay 1 [NETAPP X318_HARHE08TA07 NA01] S/N [XXXXXXXX] UID [5000CCA2:62000574:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000]
[node_name: isp2400_intrd: scsi.cmd.checkCondition:error]: Disk device 0a.0.2: Check Condition: CDB 0x28:00031c00:0200: Sense Data SCSI:recovered error - (0x1 - 0x17 0x1 0x2c)(1086).
[node_name: disk_server_0: disk.ioRecoveredError.retry:info]: Recovered error on disk 0a.0.2: op 0x28:00031c00:0200 sector 204240 SCSI:recovered error - Disk used internal retry algorithm to obtain data (1 17 1 2c) (1086) Disk 0a.0.2 Shelf 0 Bay 2 [NETAPP X318_HARHE08TA07 NA01] S/N [XXXXXXXX] UID [5000CCA2:60DFFDDC:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000]
- パニック状態になってデータサービスが停止することがある