StorageGRIDの修復または運用停止タスクが99%で停止している
環境
- NetApp StorageGRID。
- 運用停止と修復の手順
問題
- StorageGRID修復および運用停止タスクが99%で進捗がなくスタックしているように見える場合があります。運用停止タスクは、 Decommission Erasure Coded(EC)Data段階にあります。
- オンラインストレージ ノードの運用停止操作中、 bycast.log(/var/local/logまたはアプリケーションログ収集内)は、運用停止がレプリケートされたオブジェクトを切り捨てようとしていることを示します。
Jun 23 14:40:26 DC2SG06 ADE: |11111111 2222222 DCOM CSRT 2025-06-23T17:40:26.626954| INFO 0240 DCOM: Waiting for data file /var/local/rangedb/0/p/00/00/8FE5E1EE165D1954p to be truncated
- オンラインサイトの運用停止操作中、/var/local/log またはアプリケーションログ収集の bycast.log は、運用停止がレプリケートされたオブジェクトまたはチャンクファイルを切り捨てようとしていることを示します。チャンクファイルは、イレイジャー コーディング オブジェクトの一部(データまたはパリティ)です。
Jun 23 14:40:26 DC2SG06 ADE: |11111111 2222222 DCOM CSRT 2025-06-23T17:40:26.626954| INFO 0240 DCOM: Waiting for data file /var/local/rangedb/0/p/00/00/8FE5E1EE165D1954p to be truncated
Jun 23 18:00:00 xx-xx-objs03 ADE: |11111111 2222222 DCOM ^RDY 2025-06-23T19:00:00.000000| DEBUG 1 0000 0123456789abcdef DCOM: Waiting for chunk file "/var/local/rangedb/0/chunk/01234567-89AB-CDEF-0123-456789ABCDEF/FEDCBA98-7654-3210-FEDC-BA987654321.01234567890123456_0_1" to be truncated
- ボリュームまたはノードの修復操作中、/var/local/log またはアプリケーションログ収集の bycast.log は、ILM(情報ライフサイクル管理)エンジンが同じオブジェクトを複数回修復しようとしていることを示します。これは各スキャンサイクル中に繰り返し発生し、replicated 修復でのみ発生します。
Apr 22 16:19:59 Lab340-SG6060-170-51 ADE: |12790671 4156744866 SCAN ^RDY 2025-04-22T16:19:59.746128| DEBUG 1 0472 SCAN: Found object requiring repair tracking: id: 10120640-18B4-11F0-B80B-691798A814EF, token: 3210758077639734803
..
Apr 22 18:14:17 Lab340-SG6060-170-51 ADE: |12790671 4161489743 SCAN ^RDY 2025-04-22T18:14:17.489221| DEBUG 1 0472 SCAN: Found object requiring repair tracking: id: 0575BE86-18B4-11F0-B80B-6914B7A814EF, token: 3256590664266569417