CONTAP-64446: FlexGroup が CSM エージェント スレッドを過剰に使用すると、ローカル接続のパケットの配信に遅延が発生する可能性があります。
問題
- 構成にはFlexGroupが含まれています。
- ボリューム移動ジョブが実行中です。CSM
- 接続タイムアウトエラーがログに記録されています。
金曜日 1 月 19 日 XX:XX:XX -0X00 [XXXXX: CsmMpAgentThread: csm.createSessionFailed:debug]: Cluster Session Manager (CSM) は、トランスポート タイプ NULL、セッション タグ WAFL_REMOTE、レコード状態 ACTIVE、CSM エラー CSM_CONNABORTED、低レベル エラー UNKNOWN、ソケット エラー 0、および TLS エラー 0 でセッション (req=XXXXX:dblade、rsp=scc111n09a:dblade、uniquifier=11060f4e7cae0ff5) を作成できませんでした。 - ソフトウェアパニックによる予期せぬ乗っ取りが発生しました:
1月19日金曜日 XX:XX:XX -0X00 [XXXXX: nodewatchdog: nodewatchdog.monitor.history:debug]: mgwd null[mgwd] S0 0,5? -31,5? -61,5? -91,5? -121,5? -151,5? -211,0 -241,0 -270,0 -301,0 -331,0 -360,0 -391,0 -421,0 -451,0 -481,0 -511,0 -541,0 -571,0 -600,0
1月19日(金)XX:XX:XX -0X00 [XXXXX: nodewatchdog: nodewatchdog.node.panic:alert]: Data ONTAPで重大な内部エラーが発生しました: プロセスmgwdが225秒間応答しません(mgwd起動時: "(2357)")。これにより、問題が発生しているノードがデータアクセスに応答しなくなる可能性があります。この状態が継続するのを防ぐため、ノードはパニック状態になりました。
1月19日金曜日 XX:XX:XX -0X00 [XXXXX: send_boot_msg_thread: mgr.stack.string:notice]: パニック文字列: プロセス mgwd が 225 秒間応答しません (mgwd の起動: "(2357)") プロセス nodewatchdog、リリース 9.10.1P12 (C) - パニック後、ギブバックは成功し、ノードは正常です。