複数の環境センサーの読み取りの問題が報告されました、ノードがブートしません
環境
問題
- 新しく導入したコントローラの電源がオンになり、ファンに対するセンサーの読み取り値に関連する複数のエラーが発生する
callhome.c.fan.fru.fault: Call home for CHASSIS FAN FRU FAILED: Fan2_1
monitor.globalStatus.critical: Multiple fans has failed: SysFan4 F2, SysFan3 F1, SysFan2 F2, SysFan2 F1, SysFan1 F2, SysFan1 F1.
- マザーボードの電源を入れ直しても、問題が解決しない。
- マザーボードの交換後、環境センサーで次のエラーが発生します。
- NVBatteryエラーが確認された
WARNING: The battery is experiencing a critical failure:
- Internal error. Failed to communicate with the Environment Manager
Without a working battery, the system cannot retain data
during a power outage, which can result in data loss.
Power down the system and verify that the battery is
properly installed.
- 起動シーケンス中にセンサーおよびI2Cバスのスタックエラーが観察されます。
[Node01:netif.sfpEventErrorCode:error]: Unsupported or faulty transceiver or cable in port e0h. Error :Bus stuck(I2C or data shorted).
[Node01:netif.sfpEventErrorCode:error]: Unsupported or faulty transceiver or cable in port e0h. Error :Bus stuck(I2C or data shorted).
[Node01:monitor.power.unreadable:error]: A power sensor PVCCIN CPU0 in the controller module is not readable.
[Node01:monitor.power.unreadable:error]: A power sensor PVCCIN CPU1 in the controller module is not readable.
[Node01:monitor.power.unreadable:error]: A power sensor PVDDQ ABC in the controller module is not readable.
[Node01:monitor.power.unreadable:error]: A power sensor PVDDQ DEF in the controller module is not readable.
[Node01:monitor.power.unreadable:error]: A power sensor PVDDQ GHI in the controller module is not readable.
[Node01:monitor.power.unreadable:error]: A power sensor PVDDQ KLM in the controller module is not readable.
- BMCを最新バージョン(このKBの作成時までに13.10P1)にアップグレードすると、ノードはブートできますが、すぐに失敗します。