Trident - OpenShiftポッドがコンテナ内にスタックしています。iSCSIセッション認証エラーが原因で状態が作成されています
環境
- トライデント
- SolidFire
- OpenShift 4.4.4.13以降
- Red Hat Enterprise Linux CoreOS 4.5以上
- Red Hat Enterprise Linux 8.2以降
問題
1. NetApp Trident PVCを使用してポッドをプロビジョニングしているときに、ハッシュアルゴリズムの不一致が原因でOpenShiftワーカーノードがElementとのiSCSIセッションを確立できないため、ポッドが「containerCreating」状態で停止します
2. OpenShift 4.4.13以降にアップグレードすると、PVCを含む既存のPODでiSCSIセッションを再確立できなくなります
この状態を確認するには、次の手順を実行します。
- Tridentが想定どおりにPVCを作成
[root@master k8s]# kubectl get pvc
NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE
persistent-volume-claim-sf Bound pvc-7489898e-087b-4db0-b211-e5b254074d56 2Gi RWO sf-gold 46h
iscsiadm -m discovery
ワーカーノードで実行すると、ポータルが正しく検出されていることが表示されます。
[root@node-1 iscsi]# iscsiadm -m discovery
192.168.1.50:3260 via sendtargets
iscsiadm -m node
は、正しく検出されたターゲットを表示します
[root@node-1 iscsi]# iscsiadm -m node
192.168.1.50:3260,1 iqn.2010-01.com.solidfire:3x71.pvc-7489898e-087b-4db0-b211-e5b254074d56.1
- ただし、
iscsiadm -m session
はエントリを表示しません。
[root@node-1 ~]# iscsiadm -m session
iscsiadm: No active sessions.
/var/log/messages
ポッドが存在するワーカーノードで確認すると、ターゲットへのログイン中に認証エラーが表示される
Jul 30 04:12:36 node-1 iscsid[1372]: iscsid: Login authentication failed with target iqn.2010-01.com.solidfire:3x71.pvc-7489898e-087b-4db0-b211-e5b254074d56.1
Jul 30 04:12:36 node-1 iscsid[1372]: iscsid: Kernel reported iSCSI connection 207:0 error (1020 - ISCSI_ERR_TCP_CONN_CLOSE: TCP connection closed) state (1)
Jul 30 04:12:41 node-1 iscsid[1372]: iscsid: Login failed to authenticate with target iqn.2010-01.com.solidfire:3x71.pvc-7489898e-087b-4db0-b211-e5b254074d56.1
Jul 30 04:12:41 node-1 iscsid[1372]: iscsid: session 207 login rejected: Initiator failed authentication with target
Jul 30 04:12:41 node-1 iscsid[1372]: iscsid: Connection207:0 to [target: iqn.2010-01.com.solidfire:3x71.pvc-7489898e-087b-4db0-b211-e5b254074d56.1, portal: 192.168.1.50,3260] through [iface: default] is shutdown.