ロングCP実行中にVMがリブートされる
環境
ONTAP 9
問題
- ディスクエラーが原因で、長時間CPが発生している間はVMにアクセスできないか、VMを再起動した。
- 失敗するまでのメッセージの例:
Sat Nov 19 18:20:35 +0900 [node-01: scsi_cmdblk_strthr_admin: scsi.cmd.checkCondition:error]: Disk device 0a.10.7: Check Condition: CDB 0x88:00000006ebfa57b8:00000200: Sense Data SCSI:aborted command - (0xb - 0x2f 0x12 0x10)(4516).
Sat Nov 19 18:20:35 +0900 [node-01: scsi_cmdblk_strthr_admin: scsi.cmd.checkCondition:error]: Disk device 0a.10.7: Check Condition: CDB 0x88:000000043a23d0d8:00000200: Sense Data SCSI:aborted command - (0xb - 0x2f 0x12 0x10)(4480).
Sat Nov 19 18:20:35 +0900 [node-01: scsi_cmdblk_strthr_admin: scsi.cmd.checkCondition:error]: Disk device 0a.10.7: Check Condition: CDB 0x88:00000006c5ef9448:00000200: Sense Data SCSI:aborted command - (0xb - 0x2f 0x12 0x10)(4472).
Sat Nov 19 18:20:36 +0900 [node-01: scsi_cmdblk_strthr_admin: scsi.cmd.checkCondition:error]: Disk device 0a.10.7: Check Condition: CDB 0x88:00000005e0c5a848:00000078: Sense Data SCSI:aborted command - (0xb - 0x2f 0x12 0x10)(4408).
Sat Nov 19 18:20:42 +0900 [node-01: scsi_cmdblk_strthr_admin: scsi.cmd.abortedByHost:error]: Disk device 0a.10.7: Command aborted by host adapter: HA status 0x4: cdb 0x88:000000043a24adf8:00000078.
Sat Nov 19 18:20:43 +0900 [node-01: scsi_cmdblk_strthr_admin: scsi.cmd.abortedByHost:error]: Disk device 0a.10.7: Command aborted by host adapter: HA status 0x4: cdb 0x88:00000006bb6015f0:00000008
- 長い整合ポイントが記録されます。
[?] Sat Nov 19 18:26:33 +0900 [node-01: wafl_exempt09: wafl.cp.toolong:error]: Aggregate N1_aggr1 experienced a long CP.