メインコンテンツまでスキップ

複数のエラーを記録したあとにドライブで障害が発生しないのはなぜですか?

Views:
39
Visibility:
Public
Votes:
0
Category:
disk-drives
Specialty:
esg
Last Updated:

環境

NetApp EシリーズとEFシリーズ

回答

ドライブで障害が発生する原因はさまざまです。

  • 書き込み要求が失敗すると、ドライブは常に障害状態になります。
  • その他の障害理由は、NVSRAMの[Drive Exception Management]領域でドライブタイプごとに指定されたドライブエラーしきい値によって決まります。
  • NVSRAMのバージョンによって、プライマリドライブとセカンダリドライブの設定が異なるため、さまざまなソリューションに対応できます。
  • NVSRAMで設定されたエラーしきい値を超えると、ドライブが使用停止になります。

プライマリドライブタイプは次のとおりです。

  • Fibre Channel(FC;ファイバチャネル)ドライブ
  • Serial Attached SCSI(SAS)ドライブ。
  • Non-Volatile Memory Express(NVMe)ドライブ。

セカンダリドライブのタイプは次のとおりです。

  • Serial Advanced Technology Attachment(SATA)ドライブ。
  • ニアラインSAS(NL SAS)ドライブ

ドライブエラーしきい値は

  • 指定した数のイベント
  • イヘントノタイフ
  • 時間の窓

NVSRAMのドライブエラーしきい値の設定は 手動で変更できますが、変更しないことを強く推奨します。NVSRAMの現在の設定が目的の仕様と異なる場合は、別のバージョンのNVSRAMをロードすることを推奨します。このNVSRAMには目的の設定が事前にロードされています。

注:各コントローラには個別のPFAカウンタがあります。これは、過剰なトラフィックを防ぐための設計です。1台のコントローラでしきい値を超えていない場合、ドライブは使用停止になりません。

例:障害しきい値= 1時間に2つのハードウェアエラー。

1台のドライブで30分で2つのハードウェアエラーが記録されます。表面上では、これは明らかにしきい値制限を超えているように見えます。ただし、それぞれのエラーが別のコントローラ(1×A、1×B)によって記録されている場合、どちらのコントローラでもPFAしきい値を超えていないため、ドライブは障害状態になりません。

 

追加情報

AdditionalInformation_text

 

NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.