FAS2xxxポートe0a、e0b、e0M、e0Pに「Invalid PCIe device detected」が含まれない
のしんだ
環境
- FAS25xx、FAS22xx、FAS2750
- クアッドギガビットイーサネットコントローラ82580
問題
- パニックメッセージなしでノードがリブートします。シャットダウン前に、次のメッセージが表示されることがあります。
Mon Jul 5 09:13:39 CEST [node_name:netif.hangDetected:warning]: Network interface e0b hung (PCIe RcvMstAdt). Resetting to recover. Driver: igb.
Mon Jul 5 09:22:13 CEST [node_name:netif.hangDetected:warning]: Network interface e0a hung (PCIe RcvMstAdt). Resetting to recover. Driver: igb.
- ノードは稼働したまま、ポート e0a 、 e0b 、 e0M を通じてネットワークで応答を停止します。
- コンソールログ(
system log
SP またはコンソール接続からのブートログ)から:
Mar 11 08:10:05 [XXX:pvif.allLinksDown:EMERGENCY]: ifgrp a0a: All links are down
kill: 85241: No such process
Terminated
.
Uptime: 311d17h23m44s
HALT: HA partner has taken over (ic) on Wed Mar 11 11:54:45 CET 2020
ugen0.2: <Micron Technology> at usbus0 (disconnected)
System rebooting... <==== the system rebooted, but didn't panic
================ Log #1 end time Wed Mar 11 10:54:44 2020
================ Log #2 start time Wed Mar 11 10:55:10 2020
Invalid PCIe device detected below PCIe Root Port(Bus/Dev/Func): 00/1C/00 <== the BIOS is not able to recognize some components
Actual Vendor ID and Device ID:FFFF/FFFF
Expected Vendor ID and Device ID:8086/150E
Mezzanine Card ID(02 - 10GbE, 03 - FC, 07 - No Dev, others - Resv):07
BIOS is resetting system...
- ノードがブートできる場合、ポート e0a 、 e0b 、 e0M 、 e0P が完全に見つからないか
Hardware Initialization Failed
sysconfig
、出力に報告されます。
slot 0: Internal 10/100/1000 Ethernet Switch Status: Unknown
slot 0: Quad Gigabit Ethernet Controller 82580
e0a MAC Address: 00:00:00:00:00:00 (Hardware Initialization Failed: IGB: 3)
e0b MAC Address: 00:00:00:00:00:00 (Hardware Initialization Failed: IGB: 3)
e0M MAC Address: 00:00:00:00:00:00 (Hardware Initialization Failed: IGB: 3)
e0P MAC Address: 00:00:00:00:00:00 (Hardware Initialization Failed: IGB: 3)
slot 0: Interconnect HBA: Mellanox IB MT25204