中止または再開されたNDMP処理のバックアップログによって原因 、ONTAP ノードのルートボリュームがいっぱいになり、ノードがパニック状態になる可能性があります
環境
- ONTAP 9
- Network Data Management Protocol(NDMP;ネットワークデータ管理プロトコル)処理など
ndmpcopy
問題
- 1つのノードのルートボリュームの使用済みサイズが急増している。これを確認するには、次のコマンドを定期的に実行します。
cluster1::> volume show -vserver cluster1-01
Vserver Volume Aggregate State Type Size Available Used%
--------- ------------ ------------ ---------- ---- ---------- ---------- -----
cluster1-01 vol0 aggr0 online RW 442.4GB 407.6GB 7%
( -vserver
パラメータとしてノード名を使用すると、そのノードのルートボリュームが返されます)
- にあるバックアップログに
/mroot/etc/log/backup
は、次のようなメッセージが記録されます。
Tue Mar 27 00:11:36 EDT 2018 /svm1/vol1 Log_msg (Flush DIRNET for BKP ID=248, type=3 interrupted while waiting for min inflight. Error = Interrupted system call.
backup
ログにアクセスする最も簡単な方法は、Service Processor Infrastructure(SPI;サービスプロセッサインフラ)インターフェイスから logs
リンクをクリックする方法です。 ONTAPストレージシステムから手動でログを収集してファイルをコピーする方法 SPIの使用方法については、KB:clustered Data ONTAPストレージシステムからログを手動で収集してファイルをコピーする方法(「オプション1」)を参照してください。
- 該当するノードがパニック状態になり、次のようなメッセージが表示されることがあります。
例1:
Process vldb unresponsive for 631 seconds in process nodewatchdog onrelease 9.2P1 (C)
メモ :このパニックは、他の多くの問題が原因で発生する可能性があります。 このパニック状態だけでは、ここで説明する問題は示されません。ノードのルートボリュームのステータスと バックアップ ログの内容を確認してください。
例2:
Apr 12 15:49:43 [node-02:callhome.mdb.recovery.unsuccessful:EMERGENCY]: Call home for MDB RECOVERY UNSUCCESSFUL FOR THE coresegd WARNING.
Apr 12 15:51:58 [node-02:callhome.mdb.recovery.unsuccessful:EMERGENCY]: Call home for MDB RECOVERY UNSUCCESSFUL FOR THE mcached WARNING.
Apr 12 15:54:07 [node-02:spm.vifmgr.process.exit:EMERGENCY]: Logical Interface Manager(VifMgr) with ID 9996 aborted as a result of signal normal exit (1). The subsystem will attempt to restart.
Apr 12 15:54:09 [node-02:callhome.mdb.recovery.unsuccessful:EMERGENCY]: Call home for MDB RECOVERY UNSUCCESSFUL FOR THE vifmgr WARNING.
Apr 12 16:03:14 [node-02:callhome.mdb.recovery.unsuccessful:EMERGENCY]: Call home for MDB RECOVERY UNSUCCESSFUL FOR THE bcomd WARNING.
PANIC : Process vifmgr unresponsive for 630 seconds
version: 9.4P3: Thu Oct 11 18:25:55 EDT 2018
conf : x86_64.optimize
cpuid = 3
KDB: stack backtrace:
PANIC: Process vifmgr unresponsive for 630 seconds in process nodewatchdog on release 9.4P3 (C) on Wed Apr 12 16:04:13 KST 2023
Apr 12 16:21:11 [node-02:extCache.rw.replay.canceled:notice]: WAFL external cache replay canceled for aggregate node2_aggr0: Aggregate came online after timeout.
Apr 12 16:22:21 [node-02:mgmtgwd.rootvolrec.low.space:EMERGENCY]: The root volume on node "node-02" is dangerously low on space. Less than 10 MB of free space remaining.
Apr 12 16:22:21 [node-02:callhome.root.vol.recovery.reqd:EMERGENCY]: Call home for ROOT VOLUME NOT WORKING PROPERLY: RECOVERY REQUIRED.
- バックアップログの増加により ルートボリュームのスペースが不足し、 ルートアグリゲートがオフラインになることがあります。
214G /mroot/etc/log/backup
96G /mroot/etc/log/backup.0