FAS2xxxポートe0a、e0b、e0M、e0Pに「Invalid PCIe device detected」が含まれない
のしんだ
環境
- FAS25xx、FAS22xx、FAS2750
- クアッドギガビットイーサネットコントローラ82580
問題
- パニックメッセージなしでノードがリブートします。シャットダウン前に、次のメッセージが表示されることがあります。
Mon Jul  5 09:13:39 CEST [node_name:netif.hangDetected:warning]: Network interface e0b hung (PCIe RcvMstAdt). Resetting to recover. Driver: igb.
 Mon Jul  5 09:22:13 CEST [node_name:netif.hangDetected:warning]: Network interface e0a hung (PCIe RcvMstAdt). Resetting to recover. Driver: igb.
- ノードは稼働したまま、ポート e0a 、 e0b 、 e0M を通じてネットワークで応答を停止します。
- コンソールログ(system logSP またはコンソール接続からのブートログ)から:
Mar 11 08:10:05 [XXX:pvif.allLinksDown:EMERGENCY]: ifgrp a0a: All links are down
kill: 85241: No such process
 Terminated
 .
 Uptime: 311d17h23m44s
HALT:  HA partner has taken over (ic) on Wed Mar 11 11:54:45 CET 2020
 ugen0.2: <Micron Technology> at usbus0 (disconnected)
System rebooting... <==== the system rebooted, but didn't panic
 ================ Log #1 end time Wed Mar 11 10:54:44 2020
 ================ Log #2 start time Wed Mar 11 10:55:10 2020
 
Invalid PCIe device detected below PCIe Root Port(Bus/Dev/Func): 00/1C/00 <== the BIOS is not able to recognize some components
Actual Vendor ID and Device ID:FFFF/FFFF
Expected Vendor ID and Device ID:8086/150E
Mezzanine Card ID(02 - 10GbE, 03 - FC, 07 - No Dev, others - Resv):07
BIOS is resetting system...
- ノードがブートできる場合、ポート e0a 、 e0b 、 e0M 、 e0P が完全に見つからないか Hardware Initialization Failedsysconfig、出力に報告されます。
slot 0: Internal 10/100/1000 Ethernet Switch     Status: Unknown
 slot 0: Quad Gigabit Ethernet Controller 82580
      e0a MAC Address:   00:00:00:00:00:00 (Hardware Initialization Failed: IGB: 3)
      e0b MAC Address:   00:00:00:00:00:00 (Hardware Initialization Failed: IGB: 3)
      e0M MAC Address:   00:00:00:00:00:00 (Hardware Initialization Failed: IGB: 3)
      e0P MAC Address:   00:00:00:00:00:00 (Hardware Initialization Failed: IGB: 3)
 slot 0: Interconnect HBA:   Mellanox IB MT25204