複数のエラーを記録したあとにドライブで障害が発生しないのはなぜですか?
環境
NetApp EシリーズとEFシリーズ
回答
ドライブで障害が発生する原因はさまざまです。
- 書き込み要求が失敗すると、ドライブは常に障害状態になります。
- その他の障害理由は、NVSRAMの[Drive Exception Management]領域でドライブタイプごとに指定されたドライブエラーしきい値によって決まります。
- NVSRAMのバージョンによって、プライマリドライブとセカンダリドライブの設定が異なるため、さまざまなソリューションに対応できます。
- NVSRAMで設定されたエラーしきい値を超えると、ドライブが使用停止になります。
プライマリドライブタイプは次のとおりです。
- Fibre Channel(FC;ファイバチャネル)ドライブ
- Serial Attached SCSI(SAS)ドライブ。
- Non-Volatile Memory Express(NVMe)ドライブ。
セカンダリドライブのタイプは次のとおりです。
- Serial Advanced Technology Attachment(SATA)ドライブ。
- ニアラインSAS(NL SAS)ドライブ
ドライブエラーしきい値は
- 指定した数のイベント
- イヘントノタイフ
- 時間の窓
NVSRAMのドライブエラーしきい値の設定は 手動で変更できますが、変更しないことを強く推奨します。NVSRAMの現在の設定が目的の仕様と異なる場合は、別のバージョンのNVSRAMをロードすることを推奨します。このNVSRAMには目的の設定が事前にロードされています。
注:各コントローラには個別のPFAカウンタがあります。これは、過剰なトラフィックを防ぐための設計です。1台のコントローラでしきい値を超えていない場合、ドライブは使用停止になりません。
例:障害しきい値= 1時間に2つのハードウェアエラー。
1台のドライブで30分で2つのハードウェアエラーが記録されます。表面上では、これは明らかにしきい値制限を超えているように見えます。ただし、それぞれのエラーが別のコントローラ(1×A、1×B)によって記録されている場合、どちらのコントローラでもPFAしきい値を超えていないため、ドライブは障害状態になりません。
追加情報
AdditionalInformation_text