SSH経由でNdmpcopyを実行すると、一定の時間が経過すると必ず中止されます
環境
- ONTAP 9
- NDMPコピー
- DumpToNull
問題
ndmpcopy がSSH経由で実行された場合、再試行に関係なく、設定されたSSHタイムアウト期間(例:10分)が経過すると常に停止します:
- ソース側のコンソールでは、
Write to socket failedが報告されます。 - デスティネーション側のコンソールでは、
interrupted due to an abortが報告されます。 - ソース側
backup logでは、ダンプが正常に進行し、その後、Error (Write to socket failed)などの状況で中止されます。 バックアップ ログ内のPhase_change行とError行のタイム スタンプを調べると、これら2つのイベント間の経過時間は、複数回の試行で一貫した間隔になります。- たとえば、Phase_changeからエラー/中止までの経過時間は常に15分(またはその他の一般的なタイムアウト値)です。
- debugレベルのndmpdログ
0000001b.0129b5ad 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: DMA>>S V4 sequence=10 (0xa)
0000001b.0129b5ae 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: Time_stamp=0x691c23d4 (Nov 18 16:44:20 2025)
0000001b.0129b5af 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: message type=0 (NDMP4_MESSAGE_REQUEST)
0000001b.0129b5b0 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: message_code=0x902 (NDMP4_CONNECT_CLOSE)
0000001b.0129b5b1 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: reply_sequence=0 (0x0)
0000001b.0129b5b2 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: error_code=0 (NDMP4_NO_ERR)
0000001b.0129b5b3 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: service_terminate called
0000001b.0129b5b4 1a6b0aef Tue Nov 18 2025 16:44:20 +09:00 [kern_ndmpd:info:6733] [10948] DEBUG: received CLOSE command from [<node management LIF IP address>].37395