AV スキャナの過負荷または切断により、vscan が有効になっているときに I/O が遅くなったり失敗したりする
環境
- ONTAP 9
- ウィルススキャン(Vscan)
問題
- レイテンシが高く表示されますが、 ストレージサブシステムには反映されません。
::> qos statistics workload latency show Workload ID Latency Network Cluster Data Disk QoS Max QoS Min NVRAM Cloud FlexCache SM Sync VA --------------- ------ ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- vol1 4040 64.16ms 1.72ms 0ms 57.00us 14.00us 1ms 0ms 1.00us 0ms 0ms 0ms 0ms vol2 6053 49.26ms 1.21ms 35.00us 870.00us 106.00us 0ms 0ms 2.00us 0ms 0ms 0ms 0ms
- VscanによってCIFSのレイテンシが高くなることが原因でパフォーマンスが低下する
例:
::*> statistics show -object offbox_vscan_server -instance * -counter scan_latency|scan_latency_base -sample-id vscan_test1 -sort-order descending -sort-key scan_latency -max 10
Object: offbox_vscan_server
Instance: ...
Start-time: 3/10/2020 04:56:22
End-time: 3/10/2020 05:58:29
Elapsed-time: 3722s
[...]
Counter Value
-------------------------------- --------------------------------
scan_latency 456294us
scan_latency_base 372867
注 scan_latency_base
で、要求が平均値の基準としてカウントされます。 scan_latency
- このメッセージは、CIFS処理が40秒以内に完全に処理できなかったためにタイムアウトした場合に表示されます。
Tue Dec 08 11:23:26 CET [Node-01: kernel: Nblade_CifsOperationTimedOut_1:error]: params: {'remoteBladeID': 'xxx-xxxxxxxxxxxx (Node-02)', 'cmdRestartCnt': '0', 'vserverId': '5', 'commandName': 'SMB2_COM_CREATE', 'isQosEnabled': 'QoS_disabled', 'lastSpinNpError': 'SPINNP_ERR_OFFBOX_VSCAN_REQD', 'localIpAddress': '10.10.10.10', 'lastCsmError': 'CSM_OK', 'clientIpAddress': '10.10.10.20', 'suspensionCnt': '6', 'dsId': '0'}
- Vscanサーバのレイテンシの増大につながるネットワークの問題が除外されました