メインコンテンツまでスキップ

中止または再開されたNDMP処理のバックアップログによって原因 、ONTAP ノードのルートボリュームがいっぱいになり、ノードがパニック状態になる可能性があります

Views:
46
Visibility:
Public
Votes:
0
Category:
ndmp
Specialty:
dp
Last Updated:

環境

  • ONTAP 9
  • Network Data Management Protocol(NDMP;ネットワークデータ管理プロトコル)処理など ndmpcopy

問題

  • 1つのノードのルートボリュームの使用済みサイズが急増している。これを確認するには、次のコマンドを定期的に実行します。

cluster1::> volume show -vserver cluster1-01
Vserver   Volume       Aggregate    State      Type       Size  Available Used%
--------- ------------ ------------ ---------- ---- ---------- ---------- -----
cluster1-01 vol0     aggr0 online RW 442.4GB    407.6GB    7%

( -vserver パラメータとしてノード名を使用すると、そのノードのルートボリュームが返されます)

  • にあるバックアップログに /mroot/etc/log/backup は、次のようなメッセージが記録されます。

Tue Mar 27 00:11:36 EDT 2018 /svm1/vol1 Log_msg (Flush DIRNET for BKP ID=248, type=3 interrupted while waiting for min inflight. Error = Interrupted system call.

backup ログにアクセスする最も簡単な方法は、Service Processor Infrastructure(SPI;サービスプロセッサインフラ)インターフェイスから logs リンクをクリックする方法です。   ONTAP ストレージシステムからログを手動で収集してファイルをコピーする方法  SPIの使用方法については、KB:clustered Data ONTAPストレージシステムからログを手動で収集してファイルをコピーする方法(「オプション1」)を参照してください。

  • 該当するノードがパニック状態になり、次のようなメッセージが表示されることがあります。

例1:

Process vldb unresponsive for 631 seconds in process nodewatchdog onrelease 9.2P1 (C)

メモ :このパニックは、他の多くの問題が原因で発生する可能性があります。  このパニック状態だけでは、ここで説明する問題は示されません。ノードのルートボリュームのステータスと バックアップ ログの内容を確認してください。

例2:

Apr 12 15:49:43 [node-02:callhome.mdb.recovery.unsuccessful:EMERGENCY]: Call home for MDB RECOVERY UNSUCCESSFUL FOR THE coresegd WARNING. 
Apr 12 15:51:58 [node-02:callhome.mdb.recovery.unsuccessful:EMERGENCY]: Call home for MDB RECOVERY UNSUCCESSFUL FOR THE mcached WARNING. 
Apr 12 15:54:07 [node-02:spm.vifmgr.process.exit:EMERGENCY]: Logical Interface Manager(VifMgr) with ID 9996 aborted as a result of signal normal exit (1). The subsystem will attempt to restart. 
Apr 12 15:54:09 [node-02:callhome.mdb.recovery.unsuccessful:EMERGENCY]: Call home for MDB RECOVERY UNSUCCESSFUL FOR THE vifmgr WARNING. 
  
Apr 12 16:03:14 [node-02:callhome.mdb.recovery.unsuccessful:EMERGENCY]: Call home for MDB RECOVERY UNSUCCESSFUL FOR THE bcomd WARNING. 
PANIC  : Process vifmgr unresponsive for 630 seconds 
version: 9.4P3: Thu Oct 11 18:25:55 EDT 2018 
conf   : x86_64.optimize 
cpuid = 3 
KDB: stack backtrace: 
  
PANIC: Process vifmgr unresponsive for 630 seconds in process nodewatchdog on release 9.4P3 (C) on Wed Apr 12 16:04:13 KST 2023 
  
Apr 12 16:21:11 [node-02:extCache.rw.replay.canceled:notice]: WAFL external cache replay canceled for aggregate node2_aggr0: Aggregate came online after timeout. 
Apr 12 16:22:21 [node-02:mgmtgwd.rootvolrec.low.space:EMERGENCY]: The root volume on node "node-02" is dangerously low on space. Less than 10 MB of free space remaining. 
Apr 12 16:22:21 [node-02:callhome.root.vol.recovery.reqd:EMERGENCY]: Call home for ROOT VOLUME NOT WORKING PROPERLY: RECOVERY REQUIRED. 

  • バックアップログの増加により ルートボリュームのスペースが不足し、 ルートアグリゲートがオフラインになることがあります。

214G /mroot/etc/log/backup
96G /mroot/etc/log/backup.0

Sign in to view the entire content of this KB article.

New to NetApp?

Learn more about our award-winning Support

NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.