Mellanox(MLX5)ネットワーク ドライバの障害によるEシリーズ コントローラのフェイルオーバー
環境
- Eシリーズ
- E5724
問題
- コントローラA(またはB)でフェイルオーバー イベントが発生しました。
- アップロードされたコア ダンプは、最後に実行中のスレッドが
CPU2Sched1であったことを示しています。 - このフェイルオーバーは、Mellanox(mlx5)ネットワーク ドライバの障害によってトリガーされ、コントローラ間のミラー チャネル通信が中断されたことが原因です。
CPU2Sched1であったことを示しています。