H610S - BMC セルフ テストに失敗しました
環境
- NetApp SolidFire
- NetApp HCI
- NetApp Element ソフトウェア 12.3 以上
問題
- 場合によっては、永続的なクラスタ障害が発生することがあります:
BMC Self Test failed. This may impact IPMI based services and a BIOS/BMC update may be recommended.
- sf-master.info では、次のエントリが表示されます
2021-11-22T00:14:03.084577Z hci-stg-06 master-1[26236]: [EXPERR-4] [Util] 28031 GlobalPool-0 serviceshared/IpmiComponentMonitor.cpp:272:CheckHealth|BMC Self Test failed. Postponing Fault. mBmcSelfTestFailureCount=1 cNumFailedSelfTestsForFault=10 2021-11-23T13:24:28.274373Z hci-stg-06 master-1[26236]: [EXPERR-4] [Util] 28027 GlobalPool-0 serviceshared/IpmiComponentMonitor.cpp:272:CheckHealth|BMC Self Test failed. Postponing Fault. mBmcSelfTestFailureCount=1 cNumFailedSelfTestsForFault=10 2021-12-16T15:25:16.921931Z hci-stg-06 master-1[57297]: [EXPERR-4] [Util] 55937 GlobalPool-0 serviceshared/IpmiComponentMonitor.cpp:272:CheckHealth|BMC Self Test failed. Postponing Fault. mBmcSelfTestFailureCount=1 cNumFailedSelfTestsForFault=10 2021-12-16T21:18:54.078117Z hci-stg-06 master-1[57297]: [EXPERR-4] [Util] 55937 GlobalPool-0 serviceshared/IpmiComponentMonitor.cpp:272:CheckHealth|BMC Self Test failed. Postponing Fault. mBmcSelfTestFailureCount=1 cNumFailedSelfTestsForFault=10- 「BMC Self Test failed」クラスタ障害に加えて、次の状況のいずれかまたはすべてが発生している可能性があります:
- BMC Web GUIにアクセスできない
- ノード オフライン イベント:
The SolidFire Application cannot communicate with node ID <#>Node Offline nodeID=<#>
- BMC の IP アドレスに ping または SSH で接続できない
- ファン、電源装置、システム センサーに関連した永続的なクラスタ障害。 例:
Fan1A RPM is failed or missing.Error checking sensor for Fan1B RPMError checking sensor for Inlet TempError checking sensor for Exhaust Temp- ipmitool コマンドは、次のようなエラーで失敗します:
Could not open device at /dev/ipmi0 or /dev/ipmi/0 or /dev/ipmidev/0: No such file or directoryGet SEL Info command failed: Invalid commandError sending Chassis Status command: Invalid commandGet Channel Info command failed: Invalid command