FC LUNのホストで「IO operation error」が報告されました
環境
- ONTAP
- FC
- Brocade Fabric OS V7.4.2D
- Windows
- AIX
問題
IO operation Error 153
WindowsホストおよびDisk Operation Error
AIXエンドでレポートされ、パスとLUNに数分間アクセスできなくなり、自動リカバリが実行されます。- Windowsホスト では 、ホスト側でディスク一時停止エラーが生成され、IOの遅延 が観察され、ホストがディスクに対して読み取りまたは書き込みを実行できない。
- AIXホスト は ホスト側でパスフラッピングを報告し、ディスク操作エラーが報告されたパスではディスクにアクセスできません。
IO WQE error
ストレージ0x2
0x1d
・レポートのステータスが拡張されているか'ストレージ・エンドの同じFCポートでレポートされます- 両方のホストが同じFCポートを使用してストレージにアクセスしている。
Tue Nov 30 20:17:47 +07 [NetApp: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:2b IO WQE failure, Handle 0x1, Type 8, S_ID: 79Dxx0, VPI: 275, OX_ID: B63, Status 0x3 Ext_Status 0x1d
Mon Sep 26 13:26:52 +07 [NetApp: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:2b IO WQE failure, Handle 0x1, Type 8, S_ID: 79Dxy0, VPI: 275, OX_ID: 8AD, Status 0x3 Ext_Status 0x1d
Tue Jan 03 16:36:22 +07 [NetApp: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:2b IO WQE failure, Handle 0x1, Type 8, S_ID: 79Dxx0, VPI: 275, OX_ID: DA3, Status 0x3 Ext_Status 0x2
Fri Jan 13 12:05:37 +07 [NetApp: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:2b IO WQE failure, Handle 0x1, Type 8, S_ID: 79Dxy0, VPI: 275, OX_ID: 459, Status 0x3 Ext_Status 0x1d
- ストレージ側では、IO WQEエラーを除き、その他の誤ったイベントは表示されません。
- Brocadeスイッチ 側で長距離Eポートが手動で無効になっており、 ストレージ側でIO WQEエラーが検出されたポートに関連付けられているゾーンが多すぎます。
switchshow :
switchName: XXXXY
switchType: 62.0
switchState: Online
switchMode: Native
switchRole: Principal
switchDomain: 102
Index Slot Port Address Media Speed State Proto
============================================================
150 2 22 661400 id 8G No_Light FC LS Disabled (Persistent)
ELP,EFP
Fabriclog
Brocadeスイッチの出力にポートフラッピングの兆候があり、SEENが拒否されています。
00:19:55.386609 *ELP Snd ACC:rev=2,flow=1,flen=80,sz=164 .. F0,P1 F0,P2 166 0x8937
00:19:55.386610 op_mode=0x5580 F0,P1 F0,P2 166 0x8937
00:19:55.386803 BF ACC Rcv F0,P3 F0,P3 318 0x6ad3
00:19:55.386852 SCN Domain 102 invalid F0,NA F0,NA NA NA
00:19:55.386877 ELP RJT Rcv - ct prfrm,in prgs,vu=0 F0,P2 F0,P2 166 0x6ad4
00:19:55.391604 SCN Port Offline;g=0x1c F0,P2 F0,P0 150 NA
00:19:55.391611 *Removing all nodes from port F0,P0 F0,P0 150 NA
先に進む前に、次のことを考慮してください
- FOSのバージョン が古い場合は 、アップグレードを検討する必要があります。FOSをアップグレードすると、ファブリック上の多くの既知のバーストや問題を修正するのに役立ちます。
- 多くのデバイスに接続されているゾーンが多すぎるため、スイッチ間で問題が発生した場合は、フレーム問題が故障する可能性があります。ここで確認しています
- 不要なゾーンをクリーンアップし、必要なゾーンのみを保持します
- NetAppでは1対1のゾーニングを推奨しており、AIXホストとWindowsホストの両方が同じターゲットポートにゾーニングされていないことを確認してください。
- ステータス
0x02
と0x1d
、順序が乱れたFCフレームシーケンスを示しています。これは一般的にファブリック内の問題を示しています。