ONTAP 9.4以降では、SnapMirror関係の転送がハングします
のしんだ
環境
- ONTAP ONTAP 9.6を含む
- SnapMirror
問題
- 少量のデータを移動すると、SnapMirror関係は転送状態になります。
- この問題 は、次の条件をすべて満たしている場合に発生します。
- SnapMirrorソースクラスタでONTAP ONTAP 9.6が実行されている。この問題 はONTAP 9.7以降には影響しません。
- SnapMirrorソースクラスタで、問題 の開始時にSnapMirrorグローバルレプリケーションスロットルが有効になっています。
- SnapMirrorグローバルレプリケーションスロットル
options replication.*
は、ソースクラスタ上のコマンドを使用して表示できます。
- SnapMirrorグローバルレプリケーションスロットル
- この問題 は、特定のSnapMirrorソースノードに影響します。
- ハングした/スタックしたSnapMirrorには共通のソースノードがある可能性があり、同じクラスタ内の他のソースノードからのSnapMirrorは正常に動作する場合があります。
- クラスタ内のすべてのソースノードが影響を受ける可能性があります。
- にあるSnapMirrorソースノードのEMSログ
/etc/log/EMS
には、次の例のようなメッセージが表示されます。
Tue May 01 00:00:00 [ClusterA-01: repl_Handle_reg: repl.xfer.term.timed.out:error]: A component of a replication transfer with destination volume DSID '1234' or SnapMirror(R) tape ndmp session '' is taking a long time to terminate since it is busy performing some operation.
- にあるSnapMirrorソースノードのSKTraceログ
/etc/log/mlog/sktrace.log
には、次の例のようなメッセージが表示されます。
2019-05-01T00:00:00Z 34159448880650904 [5:0] REPL_0: repl_sender::NodeFactory::abortOrphanSenderNodes(): | Clearing orphan sender node with transfer uniq: 012345678-0123-0123-0123-0123456789ab
- このKBで解決策 を適用する前に、上記のすべての条件が満たされていること、および一致するエラーメッセージが検出されていることを確認してください。
- さまざまな形で作成された多くの問題により、SnapMirrorsがハングしたように見える場合があります。
- 同様の問題 が発生したにもかかわらず原因 が不明な場合は、ネットアップテクニカルサポートにケースをオープンしてください。