NVDIMMBadHealthAlert理由:VPPが失われました(NVDIMM搭載システム)
環境
- ONTAP 9
- AFF A800、AFF A400、AFF A320
- FAS8700、FAS8300
- NVDIMM
- 正常性状態の説明:VPPが失われました
問題
EMSログ:
Tue Apr 11 13:53:17 -0400 [NetApp1: nphmd: hm.alert.raised:alert]: Alert Id = NVDIMMBadHealthAlert , Alerting Resource = /dev/nvdimm0:NetApp1 raised by monitor controller
AutoSupportログには、次の情報が表示されます。
- platform-sensors.xml
---------------------------------------------------------------
Sensor Name Sensor Type Sensor State
--------------------------------------------------------------
NVDIMM0 VPP discrete fault
NVDIMM0 Health discrete fault
- NVDIMMノステエタス
Total NVDIMM on this platform is 1
--------------------------------------------------
DIMM(/dev/nvdimm0) Page:0
--------------------------------------------------
0x0000: 00 0a 0a 01 01 00 21 3c 25 3c 25 34 34 00 00 00
0x0010: 1f 2e 00 00 03 15 03 0b 68 81 02 00 68 81 1e 80
0x0020: 05 80 78 80 05 00 00 40 1f ac 0d d0 07 a0 0f 90
0x0030: 33 08 08 dc 05 10 80 00 00 00 70 03 00 00 00 00
0x0040: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0x0050: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
-----------------------------------------------------
--------------------------------------------------
DIMM(/dev/nvdimm0):
--------------------------------------------------
Controller Ready: Yes
Controller Busy: No
Energy Policy managed by: HOST
Save_N Low During CSAVE: Yes
Save_N Enabled(ARMED): Yes
Data on the Flash: NotValid
Module is Health: No
Module Status(0x0004): VPP Lost
Flash Lifetime: 96%
Flash Lifetime Status: Normal
健全性アラート:
::>system health alert show
| ノード | node01 |
|---|---|
| Monitor | controller |
| Alert ID | NVDIMMBadHealthAlert |
| アラートのリソース | /dev/nvdimm0:Netapp1 |
| サブシステム | マザーボード |
| 通知時間 | 2023年4月11日(火)13:53:17 |
| 認識済みの重大度 | メジャー |
| 考えられる原因 | ハードウェアデグレード |
| 説明 | ノード「Netapp1」のNVDIMM「NVDIMM-N 0(DIMM-11)」はデグレードステータスを示しています。 |
| 対処方法 | NVDIMMモジュールの交換については、テクニカルサポートにお問い合わせください。 |
| 考えられる影響 | NVDIMMがデグレード状態になると、データが失われる可能性があります。 |
| 承認 | false |
| 抑制 | false |
| ポリシー | NVDIMMBadHealthPolicy |
| 追加情報 |
ノード:Netapp1 |
- ノードをリブートしても問題は修正されません。