ONTAP での LUN の NVFAIL の処理
環境
- ONTAP 9
回答
概要
フェイルオーバーまたはスイッチオーバーを強制的に実行すると、データベースは大容量の内部キャッシュを維持するため、破損が発生する可能性があります。強制フェイルオーバーまたは強制MetroCluster スイッチオーバーが発生した場合、以前に確認された変更は放棄される可能性があります。ストレージアレイの内容は時間を後方に進め、データベースキャッシュの状態はディスク上のデータの状態を反映しなくなりました。この不整合が発生すると、データが破損する可能性があります
キャッシングは、アプリケーションレイヤまたはサーバレイヤで実行できます。たとえば、Oracle Real Application Cluster(RAC)の設定では、サーバがプライマリサイトとリモートサイトの両方でアクティブになっていると、Oracle SGA内にはd個のATAがキャッシュされます。データが失わ
れる強制的なスイッチオーバー処理では、データベースが破損する危険性があります。原因 SGAに格納されているブロックがディスクのブロックと一致しない可能性があります。キャッシュの使用は、OSファイルシステムレイヤではあまり明らかではありません。マウントされたNFSファイルsy stemのブロックは、OSにキャッシュされている可能性があります。また、LUNに基づくクラスタ化されたファイルシステムにより、プライマリサイトをリモートサイトのサーバにマウントし、データを再度キャッシュできます。このような状況でNVRAMの障害、強制テイクオーバー、強制スイッチオーバーが発生すると、ファイルシステムが破損する可能性があります。
ONTAP システムでは、NVFAILとそれに関連するパラメータを使用して、このシナリオからデータベースとオペレーティングシステムを保護します。
- LUNファイルシステムの問題を回避するために、LUNを含むすべてのボリュームではデフォルトでNVFAILが有効になります
- データベースをホストするNASボリュームでは、NVFAILを考慮する必要があります