PSUモジュールを交換してもシステムから異音が発生する複数のファン障害アラート
環境
- AFF および FAS システム
- ONTAP 9
- ディスク シェルフ
問題
- 両方のノードからのイベントログでは、次のアラートが頻繁に報告されます。
[Node-01: statd: monitor.shelf.fault:debug]: Critical fault reported on disk storage shelf attached to channel 0a. Check fans, power supplies, disks, and temperature sensors.
[Node-01: statd: monitor.fan.failed:debug]: Multiple fans has failed.
[Node-01: env_mgr: monitor.fan.warning:debug]: multiple fans have failed. Replace it to avoid overheating
[Node-01: env_mgr: callhome.c.fan.fru.fault:debug]: Call home for CHASSIS FAN FRU FAILED: Multiple fans have failed
- の出力
storage show fault
から、いずれかの電源装置が検出されていないことがわかります。
::> system node run -node * -command storage show fault
Enclosure Status: unrecoverable
Channel: 0a
Shelf: 0
Shelf Type: DS224-12
Product Serial Number: 952240001855
Module Type: IOM12E
Power Supplies:
Element Status Status Bytes Status Descriptions
1: OK 01,00,00,20 RQSTED ON
2: NOT INSTALLED 05,00,00,20
Fans:
Element Status Status Bytes Status Descriptions
1: OK 01,02,EC,26
2: OK 01,02,EC,26
3: NOT INSTALLED 05,00,00,20
4: NOT INSTALLED 05,00,00,20
Input Power Monitor:
Element Status Status Bytes Status Descriptions
1: OK 01,00,29,07
2: NOT INSTALLED 05,00,00,00
Power Crest Factor:
Element Status Status Bytes Status Descriptions
1: OK 01,00,29,07
2: NOT INSTALLED 05,00,00,00
- PSUを交換しても、SPセンサーは読み取り値を報告できません。
Sensor Name State Current Critical Warning Warning Critical
Reading Low Low High High
-------------------------------------------------------------------------------------------------
SNMP Bad Fan Count MULTI_FAILED
Chassis is Under Temp NO
Chassis is Over Temp NO
PSU2 Bad invalid --
PSU1 Bad FALSE
PSU2 invalid --
PSU1 GOOD
PSU2 ON ON
PSU1 ON ON
PSU1 INFO FRU_AVAIL
PSU1 INFO FRU_AVAIL
PSU1 FRU GOOD
PSU2 FRU MULTIFAULT
Partner Status A_SIDE_PRESENT
PSU1 Present PRESENT
PSU2 Present not_available --
PSU2 5V not_available -- mV -- -- -- --
PSU2 12V not_available -- mV -- -- -- --
PSU2 5V Curr not_available -- mA -- -- -- --
PSU2 12V Curr not_available -- mA -- -- -- --
PSU2 Fan 1 not_available -- RPM -- -- -- --
PSU2 Fan 2 not_available -- RPM -- -- -- --
PSU2 Inlet Temp not_available -- C 0 C 5 C 57 C 62 C
PSU2 Hotspot Temp not_available -- C 0 C 5 C 90 C 100 C
PSU_FAN FAIL_2
- 一方のPSUファンが認識されないと、もう一方のPSUファンの回転速度が速くなり、異音が発生します。
- SP / BMCはすでに最新のファームウェアバージョンを実行しています。
- SP / BMCをリブートしてもアラートは停止しません。
- KBに記載されているように、e0Mポートのトラフィックは増加しません。 chassis fan fru failed:Multiple fans have failed even after upgrading SP/BMC
- ノードのテイクオーバー/ギブバックを1つずつ実行しても、問題は維持されます。