PANIC:プロセスmlogdのVA 0x20でページ障害(スーパーバイザの読み取りデータ、ページが存在しない)
環境
- ONTAP 9
- 自動無停止アップグレード(ANDU)
- パニック
問題
- バグ 1601173の修正なしで9.12.1より前のリリースからアップグレードすると、次のような結果になることがあります。
- 通常のテイクオーバー-テイクオーバー対象のノードでパニックが発生し、テイクオーバーが完了できる場合、停止は発生しません。リブートしているノードのテイクオーバー中にパニックが発生しただけです。
- PレベルパッチANDU -パッチの適用のためにテイクオーバーされたノードでは、古いONTAPバージョンが使用され、ANDUがエラー時に一時停止されます。
- メジャーバージョンANDU(9.9.1から9.10.1など)では、リブート(更新を適用するため)にテイクオーバーされたノードがパニック状態になり、テイクオーバーが失敗した場合、パニック状態になったノードがリブートされるまでデータは提供されません。
- ノードがシャットダウンを開始すると( ANDUによるテイクオーバーの実行中など)、次のようにパニック状態になります。
PANIC: page fault (supervisor read data, page not present) on VA 0x20 cs:rip 0x20:0xffffffff8069859e rflags 0x10046 in process mlogd onrelease 9.10.0P1 (C)
- ONTAPメジャーバージョンANDUの実行中(9.9.1から9.10.1など)のデータ停止:
LIFをホストできません:
Sat Apr 22 2023 10:33:01 GMT [Cluster1-n02: vifmgr: vifmgr.lifbeingremoved:NOTICE]: LIF lif_n01_mgmt (on virtual server 44), IP address 10.250.50.50, is being removed from node Cluster1-n02, port a0l-179.
パニック状態になったノードが再び稼働すると、LIFがホストされ、データアクセスがリストアされます。
Sat Apr 22 2023 12:45:57 GMT [Cluster1-n01: vifmgr: vifmgr.lifsuccessfullymoved:NOTICE]: LIF lif_ALE_n01_179_mgmt (on virtual server 44), IP address 10.251.42.97, is now hosted on node Cluster1-n01, port a0l-179.