StorageGRIDのレプリケートデータの運用停止やILM評価の進行が遅い、または進捗がない
環境
NetApp StorageGRID
問題
- StorageGRIDストレージノードの運用停止プロセスが特定の段階で遅い、または進行しない
- Grid Managerにログインします。
- Maintenance > Decommissionに移動します。
- StorageGRIDのバージョンが11.4より前の場合、運用停止段階は「Evaluating ILM」です。
- StorageGRIDのバージョンが11.4より新しい場合、運用停止段階は「Decommissioning Replicated Data」です。
- 運用停止タスクの完了率が遅い、またはまったく進んでいません
- Grid Managerで、Support > Grid topology > Primary Admin Node > CMN > Grid Tasksに移動します。
- Stageと「% Complete」の値をStorage Node Decommissioningタスクで確認します。
- 運用停止ノードは、同じオブジェクト データ ファイルの切り捨てを待機しています:
- SSHセッションを使用して運用停止ノードにログインします
- rootユーザに切り替えます:
su -
- デバッグ ログを有効にします:
(echo "moduledebuglevel DCOM 1";sleep 1) | telnet 0 1402
- 運用停止ログを監視します:
tail -f /var/local/log/bycast.log | grep DCOM
- ログに次のようなメッセージが繰り返し表示されるかどうかを確認します:
Feb 24 14:48:59 <nodename> ADE: |12983731 0734583769 DCOM CSRT 2023-02-24T14:48:59.113673| INFO 0405 e3e6699e31d46b7e DCOM: Waiting for data file /var/local/rangedb/0/p/02/1F/00qLyqjT>z-sgPRdr4$h to be truncated
- デバッグ ログを無効にします:
(echo "moduledebuglevel DCOM -1";sleep 1) | telnet 0 1402
- 運用停止ノードが同じオブジェクト ファイルの切り捨てを繰り返し試行していることを確認したら、少なくとも2回のスキャン期間待ち、その後、上記の手順を繰り返して運用停止のデバッグ ログを確認します。スキャン期間はGrid Managerのダッシュボードから確認できます。
- 複数回のスキャン期間が経過しても、ノードが同じオブジェクト ファイルの切り捨てを待機している場合は、このKBが適用されます。