ONTAP 9.4以降では、SnapMirror関係の転送がハングします
環境
- ONTAP ONTAP 9.6
- SnapMirror
問題
- 少量のデータを移動すると、SnapMirror関係が転送状態で停止します。
- この問題は 、次のすべてに該当する場合に発生します。
- SnapMirrorソースクラスタで ONTAP ONTAP 9.6が実行されている。この問題はONTAP 9.7以降には影響しません。
- 問題の開始時に、SnapMirrorソースクラスタでSnapMirrorグローバルレプリケーションスロットルが有効になっていました。
- SnapMirrorのグローバルレプリケーションスロットルは
options replication.*
、ソースクラスタでコマンドを使用して表示できます。
- SnapMirrorのグローバルレプリケーションスロットルは
- この問題は、特定のSnapMirrorソースノードに影響します。
- 停止したSnapMirrorと停止したSnapMirrorには特定のソースノードが共通している可能性がありますが、同じクラスタ内の他のソースノードのSnapMirrorは正常に動作する可能性があります。
- クラスタ内のすべてのソースノードが影響を受ける場合があります。
- SnapMirrorソースノードの EMSログには、にある
/etc/log/EMS
次の例のようなメッセージが表示されます。Tue May 01 00:00:00 [ClusterA-01: repl_Handle_reg: repl.xfer.term.timed.out:error]: A component of a replication transfer with destination volume DSID '1234' or SnapMirror(R) tape ndmp session '' is taking a long time to terminate since it is busy performing some operation.
- にあるSnapMirrorソースノードのSKTraceログに、
/etc/log/mlog/sktrace.log
次の例のようなメッセージが表示されます。
2019-05-01T00:00:00Z 34159448880650904 [5:0] REPL_0: repl_sender::NodeFactory::abortOrphanSenderNodes(): | Clearing orphan sender node with transfer uniq: 012345678-0123-0123-0123-0123456789ab
- このKBの解決策を適用する前に、 上記の条件がすべて満たされていること、および一致するエラーメッセージが見つかったことを確認してください。
- さまざまな方法で発生する多数の問題があり、 SnapMirrorがハングしたように見える可能性があります。
- 同様の問題が検出されても原因が不明な場合は、NetAppテクニカルサポートにケースをオープンしてください。