スイッチ間リンクの障害が原因でボリュームイベントへのアクセスが失われました
環境
- ONTAP 9
- SnapMirror Active Sync(SMA)
- Brocade FCスイッチ
- スイッチ間リンク(ISL)で接続された2つのサイト
- VMware ESXi
問題
- VMwareでは、ボリュームイベントへのアクセスが断続的に失われると表示されます。
Lost access to volume 63864940-ca00f732-af03-0025b511000e (example_ds1) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.
Successfully restored access to volume 63864940-ca00f732-af03-0025b511000e (example_ds1) following connectivity issues.
- EMSでは、影響を受けたファイバチャネルの問題がクラスタの反対側のサイトのホストだけにログに記録されます
S_ID
。これは、次のログに記録されます。
[cluster1_node1: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:2b IO WQE failure, Handle 0x1, Type 8, S_ID: 16210D, VPI: 130, OX_ID: 46D8, Status 0x3 Ext_Status 0x16
[cluster1_node1: fct_tpd_thread_1: fcp.io.status:debug]: STIO Adapter:2b, found hung cmd:0xfffff8042aea04b0(state=5, flags=0x0, ctio_sent=1/1,RecvExAddr=0x14c7, OX_ID=0x4947, RX_ID=0xffff,SID=0x16210d, Cmd[2A], req_q_free:0)
[cluster1_node2: fct_tpd_thread_1: fcp.io.status:debug]: STIO Adapter:2b, found hung cmd:0xfffff8042af79d28(state=5, flags=0x0, ctio_sent=1/1,RecvExAddr=0x16b0, OX_ID=0x4fb7, RX_ID=0xffff,SID=0x16190b, Cmd[2A], req_q_free:0)
[cluster2_node1: fct_tpd_thread_1: fcp.io.status:debug]: STIO Adapter:2b, found hung cmd:0xfffff804254b0478(state=5, flags=0x0, ctio_sent=1/1,RecvExAddr=0x1666, OX_ID=0x44ce, RX_ID=0xffff,SID=0xc2109, Cmd[2A], req_q_free:0)
[cluster2_node1: fct_tpd_thread_1: fcp.io.status:debug]: STIO Adapter:2b, found hung cmd:0xfffff80425401d10(state=5, flags=0x0, ctio_sent=1/1,RecvExAddr=0x1568, OX_ID=0x4291, RX_ID=0xffff,SID=0xc2109, Cmd[2A], req_q_free:0)
[cluster2_node2: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:2b IO WQE failure, Handle 0x1, Type 8, S_ID: 16210D, VPI: 130, OX_ID: 4273, Status 0x3 Ext_Status 0x11
- 1つのスイッチは、ISLの受信電力が低いことを示しています。
RX Power: -6.1 dBm (245.0uW)
TX Power: 0.4 dBm (1093.9 uW)
- ISLの反対側の電源は良好です。
RX Power: -2.8 dBm (523.9uW)
TX Power: -0.2 dBm (949.3 uW)
- 本番環境は、ISL経由でもう一方のサイトのデータストアにアクセスするホスト上のVMに影響します。