Trident導入時のCrashLoopBackOffのTridentポッド
環境
- NetApp Astra Trident 23.10
- RedHat RHEL 9.3 Linuxワーカーノード
- Ciliumネットワークプラグイン
- Kubernetes 1.28
- KubernetesノードはVMware環境のVM
問題
TridentがKubernetesクラスタに導入されると、Tridentポッドは次のようになります。
- 適切に起動しない
- CrashLoopBackOffステータスのままになります。
ステータスがCrashLoopBackOffのTridentポッドのイベントでは、次のトレースが表示されます。
Type Reason Age From Message
---- ------ ---- ---- -------
Warning Unhealthy 29m (x29055 over 46h) kubelet Readiness probe failed: HTTP probe failed with statuscode: 503
Warning BackOff 4m35s (x11638 over 46h) kubelet Back-off restarting failed container driver-registrar in pod trident-node-linux-xxx
Tridentのログには、いずれかのホストのtrident-registrarログに次の情報が表示されます。
IMMDD hh:mm:ss main.go:135] Version: v2.9.0
IMMDD hh:mm:ss main.go:136] Running node-driver-registrar in mode=
IMMDD hh:mm:ss main.go:157] Attempting to open a gRPC connection with: "/plugin/csi.sock"
IMMDD hh:mm:ss connection.go:213] Connecting to unix:///plugin/csi.sock
IMMDD hh:mm:ss connection.go:232] Still connecting to unix:///plugin/csi.sock
IMMDD hh:mm:ss connection.go:232] Still connecting to unix:///plugin/csi.sock
IMMDD hh:mm:ss connection.go:232] Still connecting to unix:///plugin/csi.sock
IMMDD hh:mm:ss main.go:160] error connecting to CSI driver: context deadline exceeded