FAS システムと AFF システムの修正可能なメモリエラーのトラブルシューティング方法
環境
- ONTAP 9
- Data ONTAP 8
- AFF / FASプラットフォーム
- DIMM交換ガイド
回答
Active IQをチェックして、CECCメモリがシステムに影響するかどうかを確認します。
プラットフォームとONTAPのバージョンに応じて適切なガイドを選択してください。
プラットフォーム | システムまたはNVRAM | ONTAP バージョン | ガイド |
---|---|---|---|
|
システムDIMM |
|
|
|
静的なしきい値を使用するONTAPバージョンでの修正可能なメモリエラーのレポート | ||
NVRAM DIMM |
9.1以降 |
EOS(サポート終了)
ONTAPプラットフォームでシステムの可用性とサポート終了日を確認する方法を教えてください。
プラットフォーム | システムまたはNVRAM | ONTAP バージョン | ガイド |
|
システムまたはNVRAM | 9.1以降 | ONTAPの62XX、32XX、25XX、および22XXシステムで修正可能なメモリエラー |
|
システムまたはNVRAM |
Data ONTAP 8 7-Mode |
|
追加情報
ONTAPストレージシステムはError-Correcting Code(ECC;エラー修正コード)メモリモジュール(DIMM)を使用します。このDIMMは、パフォーマンスにほとんど、またはまったく影響を与えずに実行中のメモリエラーを修正できます。修正可能なECC(CECC)エラーは、特に最新のメモリコントローラとDRAMでは、破壊的な修正不可能なECC(UECC)エラーの信頼性の高い予測因子ではありません。
- 以前は、ONTAPは前回のリブート以降のしきい値500エラーに基づいて、「過剰な」CECCエラーについて警告していました。
- これらのアラートは誤検出とみなされる可能性があり、重大な利点がなくても不要なハードウェアメンテナンスにつながる可能性があります。
NetApp が動的監視アルゴリズムに更新され、しきい値が大幅に高くなりました。
- CECCエラーは引き続き記録されますが、DIMMの交換が必要であることを示しているわけではありません。
- CECCメモリエラーがクリティカル状態になると、ONTAPは ヘルスモニタアラート 「CriticalCECCCountMemErrAlert」 および対応する「ヘルスモニタ」AutoSupportメッセージをトリガーします。
メモリ管理とUECCエラーに対する復元力を向上させるために、BIOSを最新バージョンにアップデートすることをお勧めします。これにより、ブート中にDIMMをマップアウトできるシナリオも削減されます。システムのBIOS / LOADER [1] の最新バージョンは、[System Firmware & Diagnostics Download]ページで確認できます。
注: JEDEC標準のNVDIMMモジュールは、AFF A800、AFF A400、AFF A320、FAS8700、FAS8300の各プラットフォームで使用されます。