CONTAP-65772: Health Monitor が CriticalFruMultiFaultAlert プロセスに対して誤検出アラートを断続的に発行する問題
問題
- 一部のストレージシステムでは、技術的な問題によりセンサーの読み取り値の更新に時間がかかり、
CriticalFruMultiFaultAlert
、CriticalPSUFruFaultAlert
、およびその他の同様のプロセスで誤検出アラートが発生します。
- 影響を受ける可能性のあるモデル:
- FAS2520、FAS2552、FAS2554
- この問題が発生すると、次のエラーメッセージが表示されることがあります。
[?] Mon Jun 16 13:00:23 +0900 [Node-01: cphmd: hm.alert.raised:alert]: Alert Id = CriticalPSUFruFaultAlert , Alerting Resource = XXXXXXXXXXXXXXX raised by monitor chassis
[?] Mon Jun 16 13:03:29 +0900 [Node-01: mgwd: callhome.hm.alert.critical:alert]: Call home for Health Monitor process cphm: CriticalPSUFruFaultAlert[XXXXXXXXXXXXXXX].
[?] Mon Jun 16 13:10:23 +0900 [Node-01: cphmd: hm.alert.cleared:notice]: Alert Id = CriticalPSUFruFaultAlert , Alerting Resource = XXXXXXXXXXXXXXX cleared by monitor chassis