メモリの信頼性と PPR 機能のための BIOS アップデート
環境
- AFFシステム
- ASAシステム
- FASシステム
- ポストパッケージ修復(PPR)
回答
どの製品にPPR機能が含まれていますか?
- ONTAPバージョンでサポートされている Post Package Repair(PPR)
BIOSアップデートおよびPost Package Repair(PPR)の機能強化は何のためにありますか?
最近のBIOSアップデートは、プラットフォームごとにさまざまなメモリイベント処理機能に対処しています。NetAppシステムは異なるIntel CPUチップセットを使用しているため、各プラットフォームには独自のBIOSアップデートコンテンツがあります。
NetAppは、全体的な操作エクスペリエンスを向上させるために、Post Package Repair(PPR)を製品に導入しています。PPRは、ONTAPに追加された新しく作成された機能と連携して動作する新しいメモリ機能です。これらの機能により、NetAppはPPR対応メモリを活用してメモリの問題にプロアクティブに対処でき、メモリエラーが検出された場合にDIMMを交換する必要を減らします。さらに、NetAppは、メモリ関連のエラー(修正可能および修正不能なECCエラー)の処理を改善するために、新しいBIOSアップデートも採用しています。
- NetAppのDDR4以降の新しいメモリ技術にはPPR機能が含まれています。
- PPR対応コントローラおよびオペレーティングシステムと組み合わせると、システムは不良メモリ行をマッピングし、DIMM上のスペア行を利用できます。
なぜこれらの更新が重要で、なぜアップグレードが必要なのですか?
NetAppの最新システムは、古いモデルよりもメモリ容量とメモリ速度が大幅に向上しています。NetAppの新しいシステムはDDR4メモリを使用しており、古いシステムの4倍から12倍のメモリを備えていますが、メモリ品質は安定したレベルにとどまっています。システム内のDIMMモジュールの数が増えると、システム平均故障間隔(MTBF)が短くなり、メモリの問題に対するシステムのメンテナンスレベルが高くなる可能性があります。
システムのBIOSをアップグレードすると、DIMMを交換する必要性が段階的に減り、システムのメモリ関連の障害に対処する必要性が減ります。
- インテルがBIOSをアップデートして追加のメモリーテストやメモリーエラー処理の修正を追加する際、NetAppはこれらの修正をテストし、NetApp Supportサイトで提供します。
- BIOSアップデートはプラットフォーム固有であり、各リビジョンには段階的な改善、修正、または新機能(PPR機能など)が含まれています。NetAppはシステム全体のエクスペリエンスを向上させるために定期的なアップデートを提供します。
- 初期PPR機能はプラットフォームに基づいて有効化されます(プラットフォーム固有の機能を参照)。今後のアップデートでは、追加の障害モード検出機能が追加され、DIMMの交換の必要性がさらに低減されます。
PPR 機能はシステムの動作をどのように変更しますか?
- 修正不能なメモリエラーが発生すると、システムはパニック状態になります。
- HA構成では、パートナーがテイクオーバーして引き続きサービスを提供します。
- システムがBIOSから再起動すると、PPRメモリテストが開始されます。
PPRテストは、システムがメモリをテストし、その結果をシステムコンソールに表示するまでに数分かかる場合があります。
PPRテストが完了した後、どのようなアクションが必要ですか?
- 交換は不要 - PPRが問題のあるメモリセグメントを検出できる場合、それを修復します。
- システムが回復できる場合は、イベントに関するメッセージが表示されます。
PPR:Sequence PASS. - これ以上の措置は必要ありません。
- システムが回復できる場合は、イベントに関するメッセージが表示されます。
- 交換が必要 - メモリに障害が発生したり、修復できない場合、システムはONTAPを起動せず、DIMMの交換が必要になります。
- もし同じDIMMで2回目のUECCエラーが発生してパニック状態になった場合、DIMMの交換を選択できます。DIMMの交換を注文するには、NetAppに連絡してください
今後のBIOS/PPRアップデートで何を計画していますか?
今後のアップデートでは追加の障害モード検出機能が追加され、メモリDIMMの交換の必要性がさらに低減されます。
ビデオリファレンス
追加情報
修正不能なECCメモリエラーのトラブルシューティングに関する一般的な情報については、 How to troubleshoot uncorrectable memory errors on AFF and FAS systemsを参照してください。