ファイバチャネルSAN環境でのネットワーク遅延
環境
- NetApp FAS / AFFシステム
- Fiber Channel Protocol(FCP)
- VMware ESXi
- Linux
- Windows
問題
- FCPを使用してLUNにアクセスするホスト上のワークロードでは、アプリケーションとクライアントのレイテンシが大きくなる
- ONTAPのレイテンシカウンタが低い(5ミリ秒未満)
- SAN環境では、ストレージがホストから要求を受信すると、内部タイマーが開始され、各ストレージ遅延センターでの処理にかかる時間が追跡されます。これらの処理は、「ネットワーク」を除くすべて内部で行われます。
- この タイマーは、要求がストレージによって処理され、 ホストから確認応答を受信するまで停止しません。
- ホストの確認応答を待機している間に発生するこの遅延は「ネットワーク」レイテンシとして観察されるため、ストレージコントローラの外部とみなされます。
- FCポートのEMSログで確認されたエラーを次に示します。
Thu Oct 19 07:08:40 +0100 [NetApp-01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:0e AEN 0x8048 (RECV_ERROR) MboxStatus1 0xfffe MboxStatus2 0x2
Thu Oct 19 08:16:30 +0100 [NetApp-01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:0e AEN 0x8048 (RECV_ERROR) MboxStatus1 0xfffe MboxStatus2 0x1
Thu Oct 19 08:55:45 +0100 [NetApp-01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:0f AEN 0x8048 (RECV_ERROR) MboxStatus1 0xfffe MboxStatus2 0x1
- SAN環境のネットワークレイテンシは
Network
遅延センターまたはNetwork
Active IQ Unified Manager(AIQUM)に表示されますが、Network Processing
[Cluster Components]ボリュームビューには表示されません。
例:
qos statistics volume latency show
は、 Network
3つのSANワークロードの列の高レイテンシを示しています。
cluster::> qos statistics volume latency show -node san_node1
Workload ID Latency Network Cluster Data Disk QoS NVRAM Cloud ----------- ------ ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- volume_SAN1 17882 20.51ms 20.51ms 0ms 0ms 0ms 0ms 0ms 0ms volume_SAN2 5232 15.00ms 15.00ms 0ms 0ms 0ms 0ms 0ms 0ms volume_SAN3 17160 16.00ms 16.00ms 0ms 0ms 0ms 0ms 0ms 0ms