csm.ontapNoMemoryエラーは、原因遅延または完全にハングすることがあります
環境
- ONTAP 9.10.1、9.11.1
- AFF A400システムの大規模クラスタ(20ノード以上)
問題
- Cluster Session Manager(CSM)でメモリ不足エラーが発生し、ノード間通信を必要とするプロセスでレイテンシが発生したりハングしたりすることがあります
- EMSは、次のメッセージで問題を示します。
- csm.createSessionFailed: CSMが接続の作成に失敗 しました...transportType=RDMA_RoCEv2
- csm.ontapNoMemory: (非常に長いメッセージの詳細は含まれていません)
- csm.ctFallbackActiveOpen: クラスタセッションマネージャ(CSM)は、何度か再試行しても、セッション「0005face6e3a9d46」のRDMA接続を正常に作成できませんでした。CSMはTCP接続をデフォルトとして使用します(TCPフォールバックは実際には行われません)。