CONTAP-169927:A800 / C800システムのオンボードChelsioポートに関する致命的なパリティエラーとリンクダウンの問題
問題
-ノードの電源再投入、リブート、またはアップグレード後、システムは部分的なギブバック状態になり、インターコネクトのステータスが「RDMA Interconnect is Down」-ストレージフェイルオーバーのステータスが「Storage failover interconnecterror」になり
ます。NVRAMログが同期されていません。disk inventory not exchanged」
- Console logs show:e0a/e0b:致命的なパリティエラー(0x10)
EMSログ:
[May 02 07:58:09 [node_name:netif.fatal.err:alert]:スロット0のネットワークデバイスで致命的なエラーe0a/e0bが発生しました。
May 02 07:58:09 [node_name:netif.fatal.err:alert]:スロット0のネットワークデバイスで致命的エラーe0a/e0bが発生しました。
May 02 22:49:05 [node_name:kernel:netif.linkDown:info]:イーサネットe0a:リンクが停止しています。ケーブルを確認してください。
May 02 22:49:05 [node_name:kernel:netif.linkDown:info]:イーサネットe0b:リンクが停止しています。ケーブルを確認してください。
May 02 22:49:05 [node_name:intr:rlib.ifconfig.linkEvent:notice]:params:{'ifname':'e0b'、'eventType':'down'}
May 02:49:05-0800 [node_name:vifmgr:vifmgr.portdown:notice]:ノードnode_name、ポートe0aでリンク停止イベントを受信しました。
May 02 22:49:05-0800 [node_name:nvmm_error:nvmm.mirror.offlined:debug]:params:{'mirror':'ha_partner'}
May 02:49:05-0800 [node_name:vifmgr:vifmgr.clus.linkdown:emergency]:node_nameのクラスタポートe0aが予期せず停止しました。
May 02 23:00:00-0800 [node_name:statd:IC.HAInterconnectDown:error]:HAインターコネクト:10分間のインターコネクト停止:link0 downMay 02:00:00-0800 [node_name:statd:callhome.hainterconnect.down
:alert]:link0 downによりHAインターコネクトが停止したことを示すコールホーム。]