DS460CディスクシェルフドロワーでSASエキスパンダがリセットされたためにディスクで障害が発生した
環境
- MetroCluster IP
- DS460C
問題
- 多数のディスクで同時に障害が発生した場合、プレックスは障害状態になります
::> run -node <nodename> -command sysconfig -r
障害が発生したディスクを表示します::> storage shelf drawer show -fields shelf,drawer,firmware-a,firmware-b,serial-number,part-number,vendor, fru-type,error,mfg-date
障害が発生した一部のディスクの情報がありません::> storage shelf drawer show-phy
が表示される場合がありenabled enabled enabled-rate-unknown enabled-12gbs
- 一部のドライブはリカバリしてデータディスクおよびスペアとして戻すことができますが、一部のドライブは回復しません。
- リカバリ後もエラーメッセージが断続的に発生するのは、該当するドロワーだけです。
cluster-02: scsi_cmdblk_strthr_admin: scsi.cmd.abortedByHost:error]: Disk device 0c.12.14: Command aborted by host adapter: HA status 0x4: cdb 0x28:bd9d57d8:0008......................................
.............................................................
[cluster-02: scsi_cmdblk_strthr_admin: scsi.cmd.retrySuccess:debug]: Disk device 4d.12.14: request successful after retry #1/#0: cdb 0x2f:04519800:0400 (8712).
[cluster-02: scsi_cmdblk_strthr_admin: scsi.cmd.retrySuccess:debug]: Disk device 4d.12.14: request successful after retry #1/#0: cdb 0x88:0000000197576710:00000020 (17071).
- さらに、次のような別のエクスパンダリセットがイベントログに表示されます。
[cluster-02: acpa_interface_main: acp.exp.reset:info]: SAS expander reset issued to 4d.12.B (NA), (disk shelf serial number: SHJHU2048000006).
[cluster-02: acp_ib_response_thread: acp.exp.reset.success:info]: SAS expander reset command sent to 4d.12.B (NA) was successful, (disk shelf serial number: SHJHU2048000006).