複数のDIMMが警告しているためにAFF a700sがリブートしています
環境
- AFF a700sの略
- BMC FWバージョン1.89および1.91
問題
- DIMMで警告しきい値の下限が繰り返し報告されると、ノードがリブートします。
Wed Apr 20 19:19:39 -0700 [node1: env_mgr: monitor.chassisTemperature.cool:alert]: Chassis temperature is too cool: Dimm G0 Temp is warning low (16 C).
Wed Apr 20 19:25:39 -0700 [node1: env_mgr: monitor.chassisTemperature.cool:alert]: Chassis temperature is too cool: Dimm A1 Temp is warning low (16 C).
Wed Apr 20 19:25:39 -0700 [node1: env_mgr: monitor.chassisTemperature.cool:alert]: Chassis temperature is too cool: Dimm G1 Temp is warning low (16 C).
Wed Apr 20 19:26:39 -0700 [node1: env_mgr: monitor.chassisTemperature.cool:alert]: Chassis temperature is too cool: Dimm A0 Temp is warning low (16 C).
Wed Apr 20 19:27:38 -0700 [node1: env_mgr: monitor.chassisTemperature.cool:alert]: Chassis temperature is too cool: Dimm B0 Temp is warning low (16 C).
Wed Apr 20 19:45:39 -0700 [node1: env_mgr: monitor.chassisTemperature.cool:alert]: Chassis temperature is too cool: Dimm H0 Temp is warning low (16 C).
Wed Apr 20 19:59:39 -0700 [node1: env_mgr: monitor.chassisTemperature.cool:alert]: Chassis temperature is too cool: Dimm B1 Temp is warning low (16 C).
- 一時的でないノードがパニック状態になります。
Sun May 08 15:56:17 -0700 [node1: env_mgr: callhome.chassis.undertemp:EMERGENCY]: Call home for CHASSIS UNDER TEMPERATURE SHUTDOWN
- ASUPとシステムマネージャから報告されたパニックは、一時的に記録されます。
- ノードのシステムセンサーを確認しています他のすべてのセンサーはDIMMと同じ温度範囲を再割り当てしています。