StorageGRIDからの処理タイムアウトが原因でFabricPoolボリュームの移動が停止/失敗する
環境
- FabricPool
- ONTAP OS 9.12
- StorageGRID OS 11.5.0
問題
- からのオブジェクトの読み取り中に処理がタイムアウトしたためにAFFからのボリューム移動が停止/失敗する StorageGRID:
OSC_ERR: logCmd:368 GET CmdId: 1265 obj-name: <Object_path> failed with OSC error: Operation Timedout
- StorageGRIDゲートウェイノード
nginx-gw
access.log
に「ERROR:
[error] 23431#23431: *1031715311 connect() failed (111: Connection refused) while connecting to upstream, client: <Gateway_node>, server: _, request: "GET /<Object_path> HTTP/1.1", upstream: "https://<Storage_node>:18082/<Object_path>", host: "<Endpoint>:10443"
499
ボリューム移動の開始に伴ってゲートウェイノードでエラーが増加する:
Grid manager > Nodes > gateway node > Load Balancer > Error Response Rate graph
: