リモートディスクでの断続的なレイテンシの急増とレイテンシ
環境
- ONTAP 9
- AFF - A400
- MetroCluster
- ディスクX4013S17337T6NTE
問題
- ESXi データストアでサービス停止に伴う一定の時間に高レイテンシが観察される
- 問題の実行時にEMSログに次のメッセージが表示される
[XXXXXX-XX:wafl_exempt18: wafl.cp.toolong:error]: Aggregate XXXX_XXXX_aggr1 experienceda long CP
[XXXXXX -XX:disk_latency_monitor: shm.ssd.threshold.ioLatency:notice]: SSD 0v.i1.2L20 hasexceeded the expected block latency in the current timeframe with an averagelatency of 4670 us and an average utilization of 11 percent. The next highestSSD latency: 110 us. Disk 0v.i1.2L20 Shelf 10 Bay 22 [NETAPP X4013S17337T6NTE NA53] S/N [S60RNA0R900618] UID[36305230:52900618:00253841:00000002:00000000:00000000:00000000:00000000:00000000:00000000
- P2フラッシュフェーズでほとんどの時間が経過した状態で、連続CPが観察されます。
- レイテンシはリモートプレックスのいずれかのディスクによるものです。
- 同じシェルフのモデル
[X4013S17337T6NTE]
のディスクで頻繁にディスク障害が発生する