ディスク書き込み検証でホストメモリのチェックサムが一致しません
環境
- FAS ストレージノード(AFF ノードに影響なし)
- ONTAP 9.8または9.9.1
- 同じノードにローカル階層とクラウド階層を使用するローカルFabricPool 構成
- ローカル階層をホストする1つのノードとクラウド階層をホストするHAパートナーノードがあるHAペアは、テイクオーバー時に影響を受けます
問題
-
none
以外の階層化ポリシーがボリュームに割り当てられており、クラウド階層への階層化がアクティブです。 -
ノードが予期せずリブートし、パニックメッセージが表示されました:
Host memory checksum mismatch on WRITE VERIFY: Disk <disk_ID>, Disk Block #XXXX: Volume <Volume_name>, FileId XXX,File Block #XXX: Expected 0xYYYYYYYY, Recomputed as 0xZZZZZZZZ in SK process disk_server_0 on release 9.X (C)
- テイクオーバーでクラウド階層とパフォーマンス階層が1つのノードに移動すると、テイクオーバーがパニック状態になる可能性があります。
- パートナーノードでHAテイクオーバーを実行した場合、同じリブートが発生してHAペアが停止する可能性があります。
- HAペアの各ノードがローカル階層とクラウド階層のどちらかのみを所有している場合は、テイクオーバーの実行後にのみパニックがトリガーされます。
- パニック発生後のRAIDスクラビングでパリティエラーが検出され、クラウド階層のアグリゲートを参照しています。
[node-02: raidio_thread: raid_rg_scrub_cksum_err_1:notice]: params: {'disk_rpm': '10000', 'vendor': 'NETAPP ', 'firmware_revision': 'NA01', 'shelf': '23', 'disk_info': 'Disk /<cloud_tier_aggregate>/plex0/rg1/0c.23.8 Shelf 23 Bay 8 [NETAPP X343_TA15E1T8A10 NA01] S/N [XXX] UID [5000039B:3840A21C:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000]', 'site': 'Local', 'bay': '8', 'carrier': '', 'serialno': 'XXX', 'owner': '', 'model': 'X343_TA15E1T8A10', 'disk_type': '4', 'blockNum': '17612'}
[node-02: raidio_thread: raid_rg_readerr_repair_cksum_stored_1:notice]: params: {'disk_rpm': '10000', 'vendor': 'NETAPP ', 'firmware_revision': 'NA01', 'shelf': '23', 'disk_info': 'Disk /<cloud_tier_aggregate>/plex0/rg1/0c.23.8 Shelf 23 Bay 8 [NETAPP X343_TA15E1T8A10 NA01] S/N [XXX] UID [5000039B:3840A21C:00000000:00000000:00000000:00000000:00000000:00000000:00000000:00000000]', 'site': 'Local', 'bay': '8', 'carrier': '', 'serialno': 'XXX', 'owner': '', 'model': 'X343_TA15E1T8A10', 'disk_type': '4', 'blockNum': '17612'}
- ローカル
<volume_name>
階層アグリゲート上のを参照しているため、一貫性のないユーザデータブロックが検出されました:
[node-01: wafl_exempt12: wafl.raid.incons.userdata:error]: WAFL inconsistent: inconsistent user data block at VBN XXX (vvbn:XXX fbn:XXX level:0) in public inode (fileid:XXX snapid:0 file_type:15 disk_flags:0x8402 error:120 raid_set:1) in volume <volume_name>@vserver:<Vserver_UUID>.