storage stackmonにアップグレード後にノードでreconcileエラー状態が表示される
環境
- MetroCluster
- ONTAP(9.13.x/9.14.x)
問題
- イベント ログのEMSは以下を報告します:
Sat Aug 26 06:02:21 +0000 [node6: stackmon_thread: callhome.stackmon.recon.failed:alert]: Call home for STACKMON RECONCILE FAILED
- このメッセージは、システムが1つ以上のディスクシェルフに正しいスタックIDを割り当てなかった場合に表示されます
- シェルフ名やディスク名にストレージトポロジが正しく反映されていない可能性があります
- 複数のディスクで同じ名前が共有されている場合、シェルフとディスクの処理に失敗することがあります
- シェルフの装着とIDの競合に関するエラーが報告されることがあります。
[node6: dsa_disc: ses.config.shelfPopError:error]: Disk shelf population on channel Switch:10 is 16. Reduce the number of disk shelves on this channel to 10 or fewer.
[node6: stackmon_thread: stackmon.stack.id.conflict:error]: Stack ID of the Shelf 1 (S/N xxxxxxxxxxxxxx) on channel Switch:10 cannot be agreed on by all the nodes in the cluster.
- これにより、シェルフファームウェアの更新が一時的に失敗する可能性があります
[node6: dsa_sfu: sfu.downloadError:error]: [storage download shelf]: Error downloading firmware file IOM12A.0310.SFW on 0a.shelf6.Subenclosure status error.General firmware update error.
[node6: dsa_sfu: sfu.downloadError:error]: [storage download shelf]: Error downloading firmware file IOM12A.0310.SFW on 0a.shelf5.Subenclosure status error.General firmware update error.
[node6: dsa_sfu: sfu.downloadSummaryErrors:error]: Shelf firmware updated on 3 shelves, failed to update on 6 shelves.
[node6: dsa_sfu: sfu.firmwareDownrev:error]: Disk shelf firmware needs to be updated on 6 disk shelves.
[node6: dsa_sfu: sfu.downloadSummary:info]: Shelf firmware updated on 6 shelves.
storage stackmon show
調整に失敗した状態のノードを表示します:
cluster1::*> storage stackmon show
Node State Paused
----- ---------------- ------
node5 stable false
node6 failed-reconcile false
STORAGE-STACKMON-TOPO.XML
Autosupportセクションに「Reconcile State」が「unknown」または「failed」と表示される場合もある