Kubernetesノードのアップグレード中にPODが再びオンラインになるのには時間がかかる
環境
Trident for Kubernetes/Openshift(23.01.0から24.06.0)
問題
Kubernetesノードをアップグレードする際、Tridentがボリュームの(非)公開に関するKubernetesを更新しようとしたときに、ボリューム処理(デタッチ/アタッチ)でPODのオンライン化に時間がかかり、クライアントの速度制限メッセージが表示されます:
level=error msg="error saving volume publication record" error="client rate limiter Wait returned an error: context deadline exceeded" logLayer=core requestID=<REQUEST_ID> requestSource=CSI workflow="controller=publish"
level=error msg="error saving volume publication record" Method=ControllerPublishVolume Type=CSI_Controller logLayer=csi_frontend requestID=<REQUEST_ID> requestSource=CSI workflow="controller=publish"level=error msg="GRPC error: rpc error: code = Unknown desc = error saving volume publication record" logLayer=csi_frontend requestID=<REQUEST_ID> requestSource=CSI