Kubernetesノードのアップグレード中にPodのオンライン状態が非常に遅くなる
環境
Kubernetes / OpenShift向けTrident(23.01.0~24.06.0)
問題
Kubernetesノードをアップグレードする際、Tridentがボリューム(un)パブリケーションについてKubernetesを更新しようとすると、ポッドのオンライン化が遅くなり、ボリューム操作(detach/attach)に関するクライアントレート制限メッセージが表示されます。
level=error msg="error saving volume publication record" error="client rate limiter Wait returned an error: context deadline exceeded" logLayer=core requestID=<REQUEST_ID> requestSource=CSI workflow="controller=publish"
level=error msg="error saving volume publication record" Method=ControllerPublishVolume Type=CSI_Controller logLayer=csi_frontend requestID=<REQUEST_ID> requestSource=CSI workflow="controller=publish"
level=error msg="GRPC error: rpc error: code = Unknown desc = error saving volume publication record" logLayer=csi_frontend requestID=<REQUEST_ID> requestSource=CSI