モデル X336_HAKPE04TA07 のディスクで複数のディスク障害が発生しました
環境
- x336_HAKPE04TA07 NA00
問題
- 同じ RAID グループ内の 3 本以上のディスクで障害が発生しています。例:
Aggregate node_name_aggr1 (online, raid_dp) (block checksums)
Plex /node_name_aggr1/plex0 (online, normal, active, pool0)
RAID group /node_name_aggr1/plex0/rg0 (normal, block checksums)
RAID Disk Device HA SHELF BAY CHAN Pool Type RPM Used (MB/blks) Phys (MB/blks)
--------- ------ ------------- ---- ---- ---- ----- -------------- --------------
...
data 0a.01.0P1 0a 1 0 SA: A 0 FSAS 7200 3752604/7685333504 3752612/7685349888 (prefail)
data 0a.01.1P1 0a 1 1 SA: A 0 FSAS 7200 3752604/7685333504 3752612/7685349888 (prefail)
data 0a.01.2P1 0a 1 2 SA: A 0 FSAS 7200 3752604/7685333504 3752612/7685349888 (prefail)
...
- 複数のディスクでリカバリされた複数のエラーが原因で、ディスク障害が発生します
[node_name: disk_server_0: disk.ioRecoveredError.retry:info]: Recovered error on disk 0a.01.0: op (...) sector 6 SCSI:recovered error - Disk used internal retry algorithm to obtain data (1 b 97 97)...
[node_name: disk_server_0: disk.ioRecoveredError.pfa:error]: Recovered error predictive failure alert on disk 0a.01.0: op (...) sector 6 SCSI:recovered error - Disk reports predicted failure event (1 5d 90 90)
[node_name: disk_server_0: scsi.debug: debug]: shm_setup_for_failure disk 0a.01.0 (S/N AAAAAAAA) error 8000h
[node_name: disk_server_0: disk.ioRecoveredError.retry:info]: Recovered error on disk 0a.01.1: op (...) sector 6 SCSI:recovered error - Disk used internal retry algorithm to obtain data (1 b 97 97)...
[node_name: disk_server_0: disk.ioRecoveredError.pfa:error]: Recovered error predictive failure alert on disk 0a.01.1: op 0x8f: 00000001cf0a2200:00000400 sector 6 SCSI:recovered error - Disk reports predicted failure event (1 5d 90 90)
[node_name: disk_server_0: scsi.debug: debug]: shm_setup_for_failure disk 0a.01.1 (S/N BBBBBBBB) error 8000h
[node_name: disk_server_0: disk.ioRecoveredError.retry:info]: Recovered error on disk 0a.01.2: op 0x8f:00000001cce52200: 00000400 sector 5 SCSI:recovered error - Disk used internal retry algorithm to obtain data (1 b 97 97)...
[node_name: disk_server_0: disk.ioRecoveredError.pfa:error]: Recovered error predictive failure alert on disk 0a.01.2: op 0x8f: 00000001cce97600:00000400 sector 5 SCSI:recovered error - Disk reports predicted failure event (1 5d 90 90)
[node_name: disk_server_0: scsi.debug: debug]: shm_setup_for_failure disk 0a.01.2 (S/N CCCCCCCC) error 8000h
- ディスクやその他のストレージハードウェアコンポーネントで、メディアエラーやリカバリ不能な問題が発生していません。