レプリケートされたデータまたはILM評価の運用停止時にStorageGRID の処理が遅くなる
環境
NetApp StorageGRID
問題
- StorageGRIDストレージノードの運用停止プロセス が特定の段階で遅い、またはまったく進行しない
- Grid Managerにログインします。
- [Maintenance]>[Decommission]に移動します。
- StorageGRIDバージョンが11.4より前の場合、運用停止ステージは「Evaluating ILM」です。
- StorageGRID 11.4よりも新しいバージョンの場合、運用停止ステージは「レプリケートデータの運用停止」です。
- 運用停止タスクの進行が遅い、またはまったく進行していない
- Grid Managerで、 [Support] > [Grid topology] >[Primary Admin Node] > [CMN] > [Grid Tasks]の順に選択します。
- ストレージノードの運用停止 タスクの[Stage]と「% Complete」の値を確認します。
- 運用停止ノードは 、同じオブジェクトデータファイルの切り捨てを待機しています。
- SSH セッションを使用して運用停止ノードにログインします。
- rootユーザに切り替えます。
su -
- デバッグロギングを有効にします。
(echo "moduledebuglevel DCOM 1";sleep 1) | telnet 0 1402
- 運用停止ログを監視します。
tail -f /var/local/log/bycast.log | grep DCOM
- ログに次のようなメッセージが繰り返し表示されるかどうかを確認します。
Feb 24 14:48:59 <nodename> ADE: |12983731 0734583769 DCOM CSRT 2023-02-24T14:48:59.113673| INFO 0405 e3e6699e31d46b7e DCOM: Waiting for data file /var/local/rangedb/0/p/02/1F/00qLyqjT>z-sgPRdr4$h to be truncated
- デバッグロギングを無効にします。
(echo "moduledebuglevel DCOM -1";sleep 1) | telnet 0 1402
- 運用停止ノードが 同じオブジェクトファイルの切り捨てを繰り返し試行していることを確認したら、少なくとも2回のスキャン期間を待ってから、上記の手順を繰り返して運用停止のデバッグログを確認します。スキャン期間は 、Grid ManagerのDashboarで確認できます。
- 複数のスキャン期間が経過 しても同じオブジェクトファイルの切り捨てをノードが待機している場合は、このKBが適用されます。