FAQ :整合性ポイント
すべてのとおり
に適用されます
- Data ONTAP 7
- Data ONTAP 8
- ONTAP 9
回答
整合性ポイントとは何ですか。また、ネットアップが整合性ポイントを使用する理由は何ですか。
ストレージコントローラには、書き込みデータを格納するための 2 つのメモリバッファがあります。これらのバッファのサイズは、特定のシステムの NVRAM (不揮発性 RAM )の容量に基づいています。これは、スタンドアロンシステムの場合は NVRAM サイズの 1/2 、クラスタシステムの場合は NVRAM サイズの 1/4 、ノード MetroCluster の場合は NVRAM サイズの 1/8 として計算できます。ストレージコントローラへのすべての書き込みは、次の場所に同時に保存されます。
- ローカルメモリバッファ
- ローカル NVRAM/NVMEM
- リモート NVRAM (クラスタシステムのみ)
- DR パートナーのリモート NVRAM ( MetroCluster システムのみ)
NVRAM へのログプロセスが確認されると、コントローラはただちに書き込みが完了したことをクライアントマシン(アプリケーション、プロトコル)に確認します。事前に定義されたトリガーでは、このバッファされた書き込みデータは、ストレージコントローラメモリから Write Anywhere File Layout ( WAFL )および RAID レイヤを介して処理され、ディスクに書き込まれます。ディスク上のアクティブなファイルシステムポインタは、書き込みが完了するまで新しい場所を指すように更新されません。
ディスクへの書き込みが完了すると、 NVRAM の内容がクリアされ、着信書き込みデータの次のバッチの準備が整います。ディスクにデータを書き込んだり、アクティブなファイルシステムポインタを更新したりすることを、整合ポイント( CP )と呼びます。
1 つのメモリバッファの書き込みフェーズでは、 2 つ目のメモリバッファと NVRAM スペース(ローカルとリモートの両方)を使用して、着信書き込みの保存と確認が行われます。
コンシステンシ・ポイントと直接書き込みのメリットは何ですか
次の特性は、書き込みをディスクに直接渡す代わりに整合ポイントを使用する主なメリットの一部です。
- WAFL ファイルシステムの整合性:停電時でも、 WAFL ファイルシステムは一貫した状態のままです。コントローラによってクライアントに確認されたすべての操作は、一貫性があることが確認され、そのまま維持されます。WAFL ファイルシステムの整合性チェックが不要なため、ノードがどのように停止しても、迅速にブートできます。
- クライアントの書き込みパフォーマンスの向上:メモリは回転するメディアよりも大幅に高速であるため、エンドクライアントは書き込みの確認応答を高速で受け取り、次の書き込み要求の処理を続行できます。ディスクへの書き込み処理は、多数の小さなランダム書き込みではなく、より大きなシーケンシャル書き込みにグループ化できるため、ディスクサブシステムのパフォーマンスも向上します。
- 最適化されたデータレイアウト:ディスクへの書き込みは一括処理されるため、 WAFL サブシステムは、ディスク上の連続するスペースに、より大きなデータのスパスを割り当てることができます。これにより、データレイアウトのランダム化の可能性が最小限に抑えられ、データの再配置が不要になります。
- 不揮発性 RAM ( NVRAM ) / メモリバッファサイズの要件が減少しました。これは最初は明らかではありませんが、書き込み要求が到着すると、書き込み要求のロギングに必要なメモリ容量は、 Write Anywhere File Layout ( WAFL )および RAID レイヤで処理したあとにキャッシュを実行した場合よりも大幅に少なくなります。これにより、 NVRAM の障害によってファイルシステムが損傷し、通常のファイルシステム整合性チェックでは検出も修正もできないことも防止されます。
書き込み中断のシナリオ
書き込み処理中に電源障害やその他の障害が発生した場合でも、アクティブなポインタが変更前のデータを指しているため、ファイルシステムの整合性は維持されます。中断された書き込みは、次回のブート時にローカル NVRAM で引き続き使用できます。このデータはチェックされ、検出されるとローカルメモリバッファに再生され、 WAFL および RAID レイヤを使用して即座に再処理され、次の CP の実行中にディスクに書き込まれます。
この次回のブート期間は、電源が復帰したとき、ハードウェア障害が修正されたとき、またはクラスタ構成の場合、パートナーヘッドでのテイクオーバー時にブートするときに発生することがあります。1 つのノードのすべての書き込みデータはパートナーコントローラの NVRAM にも保存されるため、テイクオーバーが発生し、ダウンしたノードが仮想的にブートすると、 確認されたすべての書き込みは、 WAFL および RAID レイヤを介してメモリバッファに再生され、処理されてからディスクに書き込まれます。このクラスタ環境では、ギブバックが実行され、元のノードがブートすると、ノードがダウンした時点から NVRAM 内の内容が検出されます。ただし、このログをメモリに再生してディスクへの書き込み用に処理するのではなく、ノードは、ログがテイクオーバーされ、このデータがすでに処理されていることを認識しています。この認識が行われると、データはディスクに書き込まれているため、 NVRAM の内容は消去されます。
WAFL は、アクセスされる可能性のあるブロックをディスク上の近い場所に配置しようとします。これは、複数の書き込み要求をメモリにバッファリングし、変更を NVRAM にロギングすることで実現されます。一定の間隔(通常は 10 秒)が経過すると、バッファの内容から RAID ストライプが作成され、パリティが計算されて、ディスクにフラッシュされます。通常の間隔が経過する前にバッファがいっぱいになると、フラッシュも開始されます。
ONTAP 9 :アグリゲート CP ごと
ONTAP 9 では、整合性ポイントの影響を軽減するためにパフォーマンスが強化されています。ONTAP 9 には、すべてのアグリゲートに対して単一の整合ポイントを同時に処理する(グローバル)のではなく、各アグリゲートが互いに独立して CPS をコミットできる機能があります。
整合ポイントを元に戻すことは可能ですが、 1 つのアグリゲートのパフォーマンスが低下しても、他のアグリゲートには影響しません。これは、 ONTAP 9 を実行しているクラスタのパフォーマンスをトラブルシューティングする場合に注意する必要があります。
ONTAP 9 およびアグリゲート単位の CP では、 sysstat の CP 情報が変更されています。 個々の CP を表示する代わりに、 CP の概要が表示されるようになりました。
CP_Ty CP_Ph
[T--H--F--N--B--O--#--:] [n--v--p--f]
「 cp_ty 」列には、次の理由により CP がトリガーされた(または継続された)アグリゲートの数が表示されるようになりました。
CP_TY | 定義 |
T | タイマーによって発生した CP |
H | CP は、ハイウォーターマークが原因で発生します。ストレージシステムのメモリキャッシュ内の変更されたデータの量が十分に大きいため 、 CP を起動して強制的にディスクに出力するのが理想的です |
F | CP は、完全な nvlog が原因で発生します。ストレージシステムの NVRAM プールに記録されるデータの量は十分に大きいため 、 CP を起動して強制的にディスクに出力するのが理想的です |
N | NV ログが最大エントリ数に達したために発生した CP |
B | CP に戻る |
O | その他のすべてのタイプの CP |
# | 前のインターバルから CP を継続し、ストレージシステムは現在のデータ をディスクにコミットする必要があると判断しました(ウォーターマークに達しています)。これにより、次の CP はタイプ B になります |
: | 前のインターバルからの CP の継続 |
"CP_Ph"
この列は、次のフェーズのアグリゲートの数を表します。
CP_PH | 定義 |
n | 通常のファイルを処理しています |
v | 変更したスーパーブロックをディスクにフラッシュしています |
p | その他すべてのファイル処理 |
f | 変更されたデータをディスクにフラッシュします |
バックツーバック( B2B )整合ポイントのシナリオは何ですか。
詳細については、この記事を参照してください。NetApp ストレージコントローラには、書き込みデータの受け入れとロギングに使用する 2 つのバッファがあります。このバッファ書き込みシナリオのため、ストレージコントローラは一度に 1 つの整合ポイント( CP )パフォーマンスアグリゲートのみを処理できます。特定の状況では、 1 つの CP が処理されてディスクに書き込まれている間に、 2 つ目のメモリバッファがウォーターマークに到達し、前の CP が完了する前に新しい CP がトリガーされることがあります。整合ポイントプロセスはアグリゲートごとにグローバルであるため(このメカニズムを介してそのアグリゲートのすべての書き込みが行われることを意味します)、および Atomic (つまり、 CP の一部である変更されたすべてのデータをディスクにコミットして完了する必要があります)、 この状況では、ストレージコントローラは、前の CP が完了し、対応する不揮発性 RAM ( NVRAM )およびローカルメモリバッファがクリアされるまで、すべての着信書き込みデータ要求の確認応答を一時的に遅らせる必要があります。
この特定のシナリオのほとんどの場合、ストレージコントローラが受信書き込み要求を一時停止する必要がある時間はミリ秒単位で測定され、環境には大きな影響はありません。ただし、以下のいずれかまたは両方のカテゴリに分類されるストレージコントローラでは、全体的なパフォーマンスへの影響が望ましくない場合があります。
バックツーバックシナリオの状況の悪化:
- 着信ワークロード(連続またはバースト)は、ストレージアプライアンスが処理するように設定されているワークロードよりも大きくなります(通常、これには本番環境の負荷に低速のドライブを使用することも含まれます)。
- データレイアウトが非効率的で、内部システムのオーバーヘッドが過度に発生します(通常は、 LUN または VMDK ストレージオブジェクトの IO がアライメントされていないため)。上記のいずれかの状況が存在する場合は、ストレージコントローラの将来のパフォーマンスの問題を軽減するために、これらを必ず修正する必要があります。LUN または VMDK ストレージオブジェクトの IO がアライメントされていないことが問題の原因である場合は、パフォーマンスの問題を解決するための初期の焦点となります。
注'B'
'b'
sysstat
:バックツーバック CPS は、出力のまたは CP タイプ列で識別されます。 1 回完了した後の次のサンプルでは、単に CPS の開始が表示されるわけではありません。
ワークロード、スループット、レイテンシでパフォーマンスの問題が発生した場合は、ネットアップグローバルサポートでケースをオープンしてください。
レガシー CP 情報:
整合ポイントの種類と測定方法は何ですか。
整合ポイントはsysstat
、コマンドを使用して測定します。使用[1]可能なオプションと出力例の詳細については、 sysstat のマニュアルページを参照してください。整合ポイント( CP )タイプは、そのインターバルの間に開始された CP の理由です。CP Type カラムの最初の文字は、次に示す CP のタイプを示します。複数の CPS では、測定間隔内の CPS の数だけが原因文字として表示されません。CP のタイプは次のとおりです。
CPタイプ | 定義 |
「」。 | サンプリング間隔中に CP が開始されませんでした |
B | バックツーバック CPS ( CP によって生成された CP ) |
b | バック CPS に延期( CP によって生成された CP ) |
D | CP の発生原因が DataVecs の数が少ない(書き込み用に静的に割り当てられたバッファスペース) |
F | CP は、完全な nvlog が原因で発生します。ストレージシステムの NVRAM プールに記録されるデータの量は十分に大きいため、 CP を起動して強制的にディスクに出力するのが理想的です |
H | CP は、ハイウォーターマークが原因で発生します。ストレージシステムのメモリキャッシュ内の変更されたデータの量が十分に大きいため、 CP を起動して強制的にディスクに出力するのが理想的です |
L | CP は最低水準点が原因で発生します。日常的なハウスキーピングタスクに使用できるメモリの量が十分に少なく、 CP を起動してさらに解放するのに最適です |
M | CP は mbufs が低いことが原因で発生します。メモリ不足のバッファ状況を防ぐために、ディスクにデータを書き込みます |
N | NV ログが最大エントリ数に達したために発生した CP |
S | スナップショット操作によって発生した CP |
T | タイマーによって発生した CP |
U | フラッシュによる CP の問題。 非同期書き込みを発行している 1 つ以上のクライアント(つまり、クライアントプロトコルのルールに基づいて、すぐに永続ストレージにコミットする必要がない書き込み)が、コミットされていない未処理の I/O をすべて永続ストレージにコミットするように要求しました |
V | CP は仮想バッファの不足が原因です |
Z | 内部同期によって発生した CP 。ストレージシステムは、通常、スナップショット処理中にディスクの更新を強制しようとしています |
: | 前のインターバルからの CP の継続 |
# | 前のインターバルから CP を継続し、ストレージシステムは現在のデータをディスクにコミットする必要があると判断しました(ウォーターマークに達しています)。これにより、次の CP はタイプ B になります |
書き込み'B'
'b'
レイテンシに影響を与えるのは CP のタイプのみです。
タイプ文字の後には、サンプリング間隔の最後の CP のフェーズを示す 2 文字が続きます。サンプリング間隔中に CP が完了すると、この 2 文字目は空白になります。フェーズは次のとおりです。
- 0 初期化中です
- n 通常のファイルを処理しています
- 特殊なファイルを処理しています
- 変更したデータをディスクにフラッシュします
- 変更されたスーパーブロックをディスクにフラッシュします
- q クォータファイルを処理しています
追加情報
ここにテキストを追加します。