メモリの信頼性と PPR 機能のための BIOS アップデート
環境
- プラットフォーム:
- AFF A900 / FAS9500
- AFF A800 / AFF C800
- AFF A700 / FAS9000
- AFF A700s
- AFF A400 / AFF C400 / FAS8300 / FAS8700
- パッケージ修理後( PPR )
回答
PPR機能が含まれている製品はどれですか?
製品 | BIOS バージョン | ONTAP にバンドルされています | RFEレポート |
---|---|---|---|
AFF A700 、 FAS9000 | 10.9 | BIOS 10.9 以降では、 ONTAP のサポートも必要です : 9.5P15 、 9.6P12 、 9.7P8 、 9.8 以降 |
1278330 |
AFF A700s | 12.8 | 9.5P15 、 9.6P12 、 9.7P9 、 9.8 以降 | 1354656 |
AFF A800 | 13.10 | 9.5P18 、 9.6P15 、 9.7P14 、 9.8P4 以降 | 1371369年 |
AFF A400 、 FAS8700 、 FAS8300 | 16.3 | 9.7P12 、 9.8P2 以降 | 1373545です |
AFF A900、FAS9500 | 18.3 | 9.10.1RC2 、 9.10.1 以降 | N/A |
の BIOS アップデートおよびポストパッケージ修復( PPR )の拡張機能について教えてください。
最近の BIOS アップデートでは、プラットフォームごとにさまざまなメモリイベント処理機能が提供されています。ネットアップのシステムは、使用している Intel CPU チップセットが異なるため、プラットフォームごとに独自の BIOS アップデートコンテンツがあります。
ネットアップでは、全体的な運用エクスペリエンスを向上させるために、パッケージ修理後( PPR )を製品に導入しています。PPR は新しいメモリ機能で、 ONTAP に追加された新しく作成された機能と連携して機能します。これらの機能により、ネットアップは PPR 対応のメモリを活用して、メモリの問題にプロアクティブに対処し、メモリエラーが検出された場合に DIMM を交換する必要性を軽減します。また、メモリ関連エラー(修正可能な ECC エラーと修正不可能な ECC エラー)への対応を強化するために、新しい BIOS アップデートも採用しています。
- ネットアップでは、 DDR4 で始まる新しいメモリテクノロジの使用に PPR 機能が含まれています。
- PPR 対応のコントローラとオペレーティングシステムと組み合わせて使用すると、システムは不良メモリ行をマップし、 DIMM のスペア行を使用できます。
これらの更新が重要な理由と、アップグレードが必要な理由は何ですか。
NetApp の最新システムは、従来のモデルと比較してメモリ容量とメモリ速度が大幅に増加しています。ネットアップの新しいシステムは DDR4 メモリを使用し、従来のシステムのメモリを 4~12 分の 1 に拡張していますが、メモリ品質は安定した状態を維持しています。システム内の DIMM モジュールの数が多いほど、システム平均故障間隔( MTBF )が短くなり、メモリの問題に対するシステムメンテナンスレベルが高くなる可能性があります。
システムの BIOS をアップグレードすると、 DIMM の交換が必要になることが少なくなり、システムのメモリ関連の障害に対処する必要性が減少します。
- Intel が BIOS を更新してメモリテストやメモリエラー処理の修正を追加すると、ネットアップはこれらの修正プログラムをテストし、ネットアップサポートサイトで提供します。
- BIOS アップデートはプラットフォーム固有であり、各リビジョンには、 PPR 機能などの機能の強化、修正、または新機能が含まれています。ネットアップでは、システム全体のエクスペリエンスを向上させるために定期的に更新を行っています
- 初期 PPR 機能は、プラットフォームに基づいて有効になります(プラットフォーム固有の機能を参照)。今後のアップデートでは、障害モードの検出機能が追加され、 DIMM の交換が必要なくなります。
PPR 機能はシステムの動作をどのように変更しますか。
- 修正不可能なメモリエラーが発生すると、システムがパニック状態になります。
- HA 構成の場合、パートナーがテイクオーバーし、サービスの提供を継続します。
- システムが BIOS から再起動すると、 PPR メモリテストが開始されます。
PPR テストは、システムがメモリをテストし、システムコンソールに結果を表示するまでに数分かかることがあります。
PPR テストが完了したら、どのようなアクションが必要ですか。
- 置換は不要 です - PPR が問題のあるメモリセグメントを検出できる場合は、それを修復します。
- システムが復旧できる場合は、イベントに関するメッセージが表示されます。
PPR:Sequence PASS.
- これ以上の操作は必要ありません。
- システムが復旧できる場合は、イベントに関するメッセージが表示されます。
- 交換が必要 - メモリに障害が発生した場合、またはメモリを修復できない場合、システムは ONTAP を起動せず、 DIMM の交換が必要になります。
- 同じ DIMMで2つ目のUECCエラーが発生してパニック状態になった場合は、DIMMを交換することもできます。DIMMの交換を注文する場合は、ネットアップにお問い合わせください
今後の BIOS/PPR アップデートでは何が計画されていますか?
将来のアップデートでは、障害モード検出機能が追加され、メモリ DIMM の交換がさらに少なくなります。
追加情報
修正不可能なECCメモリエラーのトラブルシューティングに関する一般的な情報については、「 AFFおよびFASシステムで修正不可能なメモリエラーをトラブルシューティングする方法」を参照してください