NVMeコントローラのコマンドタイムアウト後のONTAP Selectノードのリブート
環境
ONTAP Select
問題
ONTAP Select ノードが次の EMS エラーで再起動されました:
clock: nvme.cmds.timedout:notice]: The NVMe controller of "nvmeX" has detected 1 commands that have timed out. Command recovery action: resetting controller.
このエラーは、以下と関連しています:
vm.dev.diskSlowIO:error]:The read request on disk scsi1:1:0 took 40 seconds (datasize 24576 bytes, threshold 20 seconds).
kernel: Nblade.nfsLongRunningOp:debug]: Detected a long running network process operation.