IPMI が応答せず、定期的な BMC コールドのあとに nodeOffline が繰り返し発生します リセットします
環境
- NetApp Element ソフトウェア11.x、12.0、および12.2
- NetApp SolidFire SF シリーズの製品ライン
問題
NodeOffline
BMC のリセット後すぐにアラートが生成されます- NetApp SolidFire Active IQ のエラーの可能性があります
nodeOffline - The SolidFire Application cannot communicate with node ID {ID}.
sensorReadingFailed - IPMI diagnostics are currently unresponsive. Please contact support if this problem persists.
unresponsiveService - A master service is not responding.
- Active IQ のイベント:
Beginning BMC cold reset and setting new reset date
Setting BMC cold reset date
- からエントリ
sf-master.info
master-1[30228]: [Event] 30325 GlobalPool-0 serviceshared/EventReporter.cpp:582:ReportEvent|Successfully reported event={id=569216 type=PlatformHardwareEvent nodeID=6 serviceID=107 message=[Beginning BMC cold reset and setting new reset date] details={"bmcResetDate":"2021-09-02T12:49:41","bmcResetDurationMinutes":20160} reported=2021-08-19T12:49:41.644056Z published=2021-08-19T12:49:41.644104Z} mNumEventsPublished=21
core.HangDetect
を生成できます