CPU の問題が原因でノードが停止しています
環境
- NetApp SolidFire SF-Series
- Element ソフトウェアバージョン 12.2.0.777
問題
- ノードは予期せず停止し、自動的にリブートされません
- iDRAC にエラーが表示されるCPU x(id) has an internal error (IERR)
- ipmitoolリモートサーバ(管理ノード VM など)から実行されたコマンドにより、プロセッサエラーがアサートされたことが確認されます。- コマンド:ipmitool -H BMC_IP_ADDRESS -U bmc_username -I lan sel list
- 出力例:ID | DATE | TIME | Processor #0x60 | IERR | Asserted
- コマンド:ipmitool -H BMC_IP_ADDRESS -U bmc_username -I lan sel list -v
- 出力例:
 SEL Record ID : ID
 Record Type : 02
 Timestamp : DATE TIME
 Generator ID : 0020
 EvM Revision : 04
 Sensor Type : Processor
 Sensor Number : 60
 Event Type : Sensor-specific Discrete
 Event Direction : Assertion Event
 Event Data : 00ffff
 Description : IERR
 
- コマンド: