F5ネットワークロードバランサでSSL証明書の有効期限が切れているため、ノードのリブート後にオブジェクトストアを使用できない
環境
- ONTAP 9
- StorageGRID
- F5ネットワークロードバランサ
問題
ハードウェアの障害が原因でONTAPオンプレミスクラスタ内のノードがパニック状態になり、テイクオーバーされました。
ノードはリカバリされたが、ギブバックが失敗し、リブートしたノードが所有するアグリゲートにオブジェクトストアにアクセスできない。
cluster::> aggregate object-store show
(storage aggregate object-store show)
Aggregate Object Store Name Availability Mirror Type
-------------- ----------------- ------------- -----------
...
node1_aggr2 NPH_StorageGRID available primary
node3_aggr1 NPH_StorageGRID unavailable primary
node3_aggr2 NPH_StorageGRID available primary
6/8/2024 08:53:51 NODE04 ERROR Unable to connect to the object store "StorageGRID" from node 266af68c-6536-11e8-bcdd-xxxxxxxxxxxx. Reason: Connection unavailable.
6/8/2024 08:31:12 NODE04 ALERT sfo.giveback.attemptExceeded: Attempts for automatic giveback of SFO aggregates exceeded the maximum number (3) of allowed attempts.
6/8/2024 08:30:36 NODE04 ALERT sfo.giveback.failed: Giveback of aggregate node3_aggr2 failed due to destination check failed.
6/8/2024 08:30:36 NODE04 ALERT sfo.sendhome.subsystemAbort: The giveback operation of 'node3_aggr2' was aborted by 'fabric pools'.
6/8/2024 08:30:36 NODE04 ERROR gb.netra.ca.check.failed: Giveback of aggregate 'node3_aggr2' (uuid: 27f187b6-45f7-4125-b1ac-xxxxxxxxxxxx) failed due to Object store is not reachable on destination preventing object store access on the destination node.
ノードでクラスタ間LIFが正常に機能しており、オブジェクトストアにpingを送信できます。
HTTPSが使用され、SSL検証が有効になっています。
cluster::> storage aggregate object-store config show -fields server,port
object-store-name server port
----------------- ------------------------------ ----
StorageGRID storagegrid.domain.com 443CA認証局と証明書のカスタム設定があります。
有効期限が切れた証明書があります。
cluster::*> security certificate truststore check -server storagegrid.domain.com -vserver cluster
Error: command failed: Failed to verify server's certificate chain. Reason: certificate has expired
証明書はONTAPでチェックされ、StorageGRIDに問題は見つかりませんでした。
署名済み証明書を削除して再インポートしても、問題は解決しません。