CONTAP-64446: FlexGroup の過度な CSM エージェントスレッドの使用により、ローカル接続のパケット配信が遅延する可能性がある
問題
- 構成に FlexGroup が含まれています。
- ボリューム移動ジョブが実行中です。
- CSM 接続タイムアウトエラーが記録されています:
Fri Jan 19 XX:XX:XX -0X00 [XXXXX: CsmMpAgentThread: csm.createSessionFailed:debug]: Cluster Session Manager (CSM) failed to create session (req=XXXXX:dblade, rsp=scc111n09a:dblade, uniquifier=11060f4e7cae0ff5) with transport type NULL, session tag WAFL_REMOTE, record state ACTIVE, CSM error CSM_CONNABORTED, low-level error UNKNOWN, socket error 0, and TLS error 0. - ソフトウェアパニックによる予期しないテイクオーバーが発生しています:
Fri Jan 19 XX:XX:XX -0X00 [XXXXX: nodewatchdog: nodewatchdog.monitor.history:debug]: mgwd null[mgwd] S0 0,5? -31,5? -61,5? -91,5? -121,5? -151,5? -211,0 -241,0 -270,0 -301,0 -331,0 -360,0 -391,0 -421,0 -451,0 -481,0 -511,0 -541,0 -571,0 -600,0
Fri Jan 19 XX:XX:XX -0X00 [XXXXX: nodewatchdog: nodewatchdog.node.panic:alert]: Data ONTAP has experienced a serious internal error: Process mgwd unresponsive for 225 seconds (mgwd startup: "(2357)").この問題が発生しているノードがデータアクセスに応答しなくなる可能性があります。この状態が継続するのを防ぐためにノードがパニック状態になりました。
Fri Jan 19 XX:XX:XX -0X00 [XXXXX: send_boot_msg_thread: mgr.stack.string:notice]: Panic string: Process mgwd unresponsive for 225 seconds (mgwd startup: "(2357)") in process nodewatchdog on release 9.10.1P12 (C) - パニック後、ギブバックは成功し、ノードは正常な状態です。