Fibre Channel SAN環境におけるネットワーク遅延
環境
- NetApp FAS/AFF システム
- Fiber Channel Protocol(FCP)
- VMware ESXi
- Linux
- Windows
問題
- FCP経由でLUNにアクセスするホストのワークロードは、アプリケーションとクライアントに多大なレイテンシを引き起こします
- スイッチの交換などネットワーク インフラの変更によりクライアントがレイテンシに直面する可能性があります
- ONTAPはレイテンシカウンタで低レイテンシ(5ミリ秒未満)を示します
- SAN環境では、ストレージがホストからリクエストを受け取ると内部タイマーが開始され、ストレージ遅延センターごとに処理にかかる時間を追跡します。これらは「Network」以外すべて内部です
- タイマーは、リクエストがストレージによって処理され、ホストから確認応答を受信するまで停止しません
- ホストの確認応答を待つ間に発生するこの遅延は「Network」レイテンシとして観測されるため、ストレージコントローラの外部とみなされます
- 以下のエラーがFCポートのEMSログで観測される場合がありますが、すべてのケースで表示されるわけではありません
Thu Oct 19 07:08:40 +0100 [NetApp-01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:0e AEN 0x8048 (RECV_ERROR) MboxStatus1 0xfffe MboxStatus2 0x2
Thu Oct 19 08:16:30 +0100 [NetApp-01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:0e AEN 0x8048 (RECV_ERROR) MboxStatus1 0xfffe MboxStatus2 0x1
Thu Oct 19 08:55:45 +0100 [NetApp-01: fct_tpd_work_thread_0: fcp.io.status:debug]: STIO Adapter:0f AEN 0x8048 (RECV_ERROR) MboxStatus1 0xfffe MboxStatus2 0x1
- SAN環境のネットワーク レイテンシは、
Network
遅延センターまたはNetwork
Active IQ Unified Manager(AIQUM)には表示されますが、Network Processing
クラスタ コンポーネントのボリューム ビューには表示されず、ネットワーク レイテンシが報告されない場合もあります。
例:
qos statistics volume latency show
は、3つのSANワークロードの Network
列で高レイテンシを示しています
cluster::> qos statistics volume latency show -node san_node1
Workload ID Latency Network Cluster Data Disk QoS NVRAM Cloud ----------- ------ ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- volume_SAN1 17882 20.51ms 20.51ms 0ms 0ms 0ms 0ms 0ms 0ms volume_SAN2 5232 15.00ms 15.00ms 0ms 0ms 0ms 0ms 0ms 0ms volume_SAN3 17160 16.00ms 16.00ms 0ms 0ms 0ms 0ms 0ms 0ms