動的なしきい値を使用したONTAP バージョンでの修正可能なメモリエラーレポート
環境
ONTAP バージョン:
- 9.1P18以降のPリリース
- 9.3P11以降のPリリース
- 9.4P6以降のPリリース
- 9.5以降のメジャーリリース
プラットフォーム:
- AFF A900/FAS9500
- AFF A800
- AFF A700s
- AFF A700 / FAS9000
- AFF A400 / FAS8300 / FAS8700
- AFF A300およびFAS8200
- AFF A250/FAS500f
- AFF A220 / AFF C190 / FAS27x0
- AFF A200 / FAS26x0
- AFF80x0 / FAS80x0
- CriticalCECCCountMemErrAlert
注:その他のすべてのONTAP プラットフォームおよびONTAP バージョンについては、「 FAS およびAFF システムの修正可能なメモリエラーのトラブルシューティング方法」を参照してください
問題
- 健全性アラートAutoSupport メッセージ:
HA Group Notification (Health Monitor process nphm: CriticalCECCCountMemErrAlert[DIMM-16]) ALERT
- EMSレポート:
[Cluster-01: mgwd: callhome.hm.alert.critical:alert]: Call home for Health Monitor process nphm: CriticalCECCCountMemErrAlert[DIMM-16].
- Memory dimm showで、DIMMのステータスがdegradedと報告されます
Cluster::>memory dimm show
DIMM UECC CECC Alert CPU Slot Failure
Node Name Count Count Method Socket Channel Number Status Reason
------------- ------- ----- ----- ------ ------ ------- ------ ------- --------
Cluster-01
DIMM-1 0 0 bucket 1 0 0 ok none
DIMM-2 0 0 bucket 1 0 1 ok none
DIMM-3 0 0 bucket 1 1 0 ok none
DIMM-4 0 0 bucket 1 1 1 ok none
DIMM-5 0 0 bucket 1 3 1 ok none
DIMM-6 0 0 bucket 1 3 0 ok none
DIMM-7 0 0 bucket 1 2 1 ok none
DIMM-8 0 0 bucket 1 2 0 ok none
DIMM-9 0 0 bucket 0 2 0 ok none
DIMM-10 0 0 bucket 0 2 1 ok none
DIMM-11 0 0 bucket 0 3 0 ok none
DIMM-12 0 0 bucket 0 3 1 ok none
DIMM-13 0 0 bucket 0 1 1 ok none
DIMM-14 0 0 bucket 0 1 0 ok none
DIMM-15 0 0 bucket 0 0 1 ok none
DIMM-16 0 0 bucket 0 0 0 degraded none