scsi.cmd.abortedByHost:ストレッチMetroClusterでエラーが報告されました
環境
- ONTAP 9
- 2ノードブリッジ接続ストレッチMetroCluster
問題
- ノードNode-01で、パス2b経由で異なるディスクドライブに対して次の「scsi.cmd.abortedByHost」イベントが表示されます。
Thu Mar 20 16:35:06 +0100 [Node-01: slifc_intrd: scsi.cmd.abortedByHost:error]: Disk device 2b.125L62: Command aborted by host adapter: HA status 0x4: cdb 0xea:0bbc6000:01e0.Thu Mar 20 16:35:09 +0100 [Node-01: slifc_intrd: scsi.cmd.abortedByHost:error]: Disk device 2b.125L55: Command aborted by host adapter: HA status 0x4: cdb 0x2a:8bb9edf8:0008.- ノードNode-01のFCポート2Dは頻繁にフラッピングしており、その理由としてStorageFCAdapterFault_Alertが報告されています。
Thu Mar 20 16:36:29 +0100 [Node-01: slifc_asyncd_4: fci.adapter.link.online:info]: Fibre Channel adapter 2b link online.Thu Mar 20 16:37:10 +0100 [Node-01: slifc_timeout_4: fci.link.error:error]: Could not recover link on Fibre Channel adapter 2b after 30 seconds. Taking the adapter offline.Thu Mar 20 16:37:10 +0100 [Node-01: dsbridge_admin: bridge.removed:info]: FC-to-SAS bridge 2b.125L0 [ATTO FibreBridge7600N 4.35] S/N [FB7600N106192] was removed.Thu Mar 20 16:37:20 +0100 [Node-01: nchmd: hm.alert.raised:alert]: Alert Id = StorageFCAdapterFault_Alert , Alerting Resource = 100000109b4ede02 raised by monitor node-connectThu Mar 20 16:51:11 +0100 [Node-01: slifc_asyncd_4: fci.adapter.online:info]: Fibre Channel adapter 2b is now online.Thu Mar 20 16:51:27 +0100 [Node-01: dsbridge_admin: bridge.discovered:info]: FC-to-SAS bridge 2b.125L0 [ATTO FibreBridge7600N 4.35] S/N [FB7600N106192] was discovered.- FCポート2bが停止すると、ATTOブリッジFB7600N106192へのアクセスが失われたためノードが混在パス構成に移行しており、次のイベントが報告されます。
Thu Mar 20 16:48:44 +0100 [Node-01: svc_queue_thread: callhome.dsk.redun.fault:error]: Call home for DISK REDUNDANCY FAILEDThu Mar 20 16:49:24 +0100 [Node-01: dsa_disc: ses.multipath.ReqError:alert]: SAS disk shelf detected without a multipath configuration.Thu Mar 20 16:50:03 +0100 [Node-01: mgwd: callhome.hm.alert.major:alert]: Call home for Health Monitor process nchm: SinglePathToDiskShelf_Alert[2937244207926544976].- ATTOポートの統計には、FCポート1のリンク障害、同期損失、CRCエラーが表示されます。
FC Port 2100001086b11d80:State: upSpeed: 16 Gb/sTopology: point-to-pointLink Failure Count: 263<--------------------Loss of Sync Count: 492019335CRC Error Count: 10967LIP Count: 0Frames In: 17894Frames Out: 24957655SFP Vendor: AVAGOSFP Part Number: AFBR-57G5MZ-ELXSFP Serial Number: AN2138G016MSFP Capabilities: 8, 16,- ノードNode-02では、アダプタ1bで過剰なエラーが報告されていることと、「scsi.cmd.abortedByHost」エラーが報告されていることがあります。
Mon Mar 17 18:20:45 +0100 [Node-02: slifc_intrd: scsi.cmd.abortedByHost:error]: Disk device 1b.125L8: Command aborted by host adapter: HA status 0x4: cdb 0x2a:1da79600:0200.Mon Mar 17 18:31:03 +0100 [Node-02: slifc_intrd: scsi.cmd.abortedByHost:error]: Disk device 1b.125L3: Command aborted by host adapter: HA status 0x4: cdb 0x28:59974688:0008.Thu Mar 20 01:27:22 +0100 [Node-02: slifc_intrd: scsi.path.excessiveErrors:error]: Excessive errors encountered by adapter 1b on disk device 1b.125.Thu Mar 20 01:27:22 +0100 [Node-02: slifc_intrd: scsi.cmd.transportErrorEMSOnly:error]: Disk device 1b.125L30: Transport error during execution of command: HA status 0x9: cdb 0x28:84756688:0088.