CONTAP-65772: ヘルスモニターがCriticalFruMultiFaultAlertプロセスに対して断続的に誤検知アラートを発行する
問題
- 一部のストレージシステムでは、技術的な問題によりセンサーの読み取り値の更新に時間がかかり、その結果、誤検知のアラートが発生します。
CriticalFruMultiFaultAlert
、CriticalPSUFruFaultAlert
、その他そのようなプロセスがあります。
- 次のモデルが影響を受ける可能性があります。
- FAS2520、FAS2552、FAS2554
- この問題が発生すると、次のエラー メッセージが表示される場合があります。
[?] Mon Jun 16 13:00:23 +0900 [Node-01: cphmd: hm.alert.raised:alert]: Alert Id = CriticalPSUFruFaultAlert , Alerting Resource = XXXXXXXXXXXXXXX raised by monitor chassis
[?] Mon Jun 16 13:03:29 +0900 [Node-01: mgwd: callhome.hm.alert.critical:alert]: Call home for Health Monitor process cphm: CriticalPSUFruFaultAlert[XXXXXXXXXXXXXXX].
[?] Mon Jun 16 13:10:23 +0900 [Node-01: cphmd: hm.alert.cleared:notice]: Alert Id = CriticalPSUFruFaultAlert , Alerting Resource = XXXXXXXXXXXXXXX cleared by monitor chassis