センサーの読み取り値が正しくないため、ノードで複数のファン障害アラートが報告されました
環境
- ONTAP 9
- AFF / FASシステム
問題
- HAペアの一方のノードでのみ次のエラーが報告されます。
[Node-01: env_mgr: monitor.temp.unreadable:error]: The controller temperature (Midplane 4 Temp) is not readable.
[Node-01: env_mgr: monitor.temp.unreadable:error]: The controller temperature (Midplane 3 Temp) is not readable.
[Node-01: env_mgr: monitor.temp.unreadable:error]: The controller temperature (Midplane 2 Temp) is not readable.
[Node-01: env_mgr: monitor.temp.unreadable:error]: The controller temperature (Midplane 1 Temp) is not readable.
[Node-01: env_mgr: monitor.fan.warning:notice]: multiple fans have failed. Replace it to avoid overheating
[Node-01: monitor: monitor.globalStatus.critical:EMERGENCY]: Multiple fans has failed. Chassis temperature is too high..
[Node-01: env_mgr: callhome.c.fan.fru.fault:error]: Call home for CHASSIS FAN FRU FAILED: Multiple fans have failed
- エラーを報告するノードのSPセンサーの値は次のとおりです。
Sensor Name State Current Critical Warning Warning Critical
Reading Low Low High High
-------------------------------------------------------------------------------------------------
SNMP Bad Fan Count MULTI_FAILED
Chassis is Under Temp invalid --
Chassis is Over Temp YES
PSU2 Bad invalid --
PSU1 Bad invalid --
PSU2 invalid --
PSU1 invalid --
PSU2 ON invalid --
PSU1 ON invalid --
PSU1 INFO FAILED
PSU1 INFO FAILED
PSU1 FRU MULTIFAULT
PSU2 FRU MULTIFAULT
Partner Status failed --
Module B Expander Temp init_failed -- C -- -- -- --
Module A Expander Temp init_failed -- C -- -- -- --
Midplane 4 Temp failed -- C 0 C 5 C 47 C 52 C
Midplane 3 Temp failed -- C 0 C 5 C 47 C 52 C
Midplane 2 Temp failed -- C 0 C 5 C 47 C 52 C
Midplane 1 Temp failed -- C 0 C 5 C 47 C 52 C
Ambient Temp init_failed -- C -- -- -- --
Internal Shelf failed --
- SP / BMCファームウェアがすでに最新バージョンです。
- SPの平均トラフィック負荷は、影響を受けるノードで正常です。
- 問題 は、管理ポートに接続されているケーブルを取り外したあとも確認されます。
- マザーボードを取り付け直してもセンサーの値は変化しない