AFF-A900ノードのMetroCluster IPの異常リブート
- Views:
 - 11
 
- Visibility:
 - Public
 
- Votes:
 - 0
 
- Category:
 - metrocluster
 
- Specialty:
 - MetroCluster<a>2009475055</a>
 
- Last Updated:
 
環境
- ONTAP 9
 - AFF-A900
 - MetroCluster IP
 - ノードのリブート
 
問題
- イベントログまたはBMCログに明確な理由/パニックが記録されずにノードが予期せずリブートする
 - システムログで異常リブートイベントが報告されます。
 
Record 1045: Wed Dec 13 11:54:07.700528 2023 [BMC.critical]: Filer Reboots
 Record 1046: Wed Dec 13 15 11:54:07.711401 2023 [Trap Event.critical]: SNMP abnormal_reboot (28)
- ハートビートの低下が原因でテイクオーバーが開始されたと報告しているHAパートナー:
 
Wed Dec 13 12:54:21 +0100 [Node_A: cf_main: cf.fsm.takeover.noHeartbeat:alert]: Failover monitor: Takeover initiated after no heartbeat was detected from the partner node.
- システム内のいずれかのT6カードのICLエラーを示すイベントログ
 
[?] Wed Feb 15 12:53:25 +0100 [Node_A: ICL error: pcie.stealth.errors:debug]: params: {'pcie_errors': 'IIO0: RPT(166,2,0): T62100-CR Dual 40/100G NIC in slot 5 on Controller, Dv[600d](169,0,0) in slot 5: DevStatus(Corr), CorrErr(Rcvr); Dv[600d](169,0,1) in slot 5: DevStatus(Corr), CorrErr(Rcvr); Dv[600d](169,0,2) in slot 5: DevStatus(Corr), CorrErr(Rcvr); Dv[600d](169,0,3) in slot 5: DevStatus(Corr), CorrErr(Rcvr); Dv[640d](169,0,4) in slot 5: DevStatus(Corr), CorrErr(Rcvr); Dv[650d](169,0,5) in slot 5: DevStatus(Corr), CorrErr(Rcvr); Dv[660d](169,0,6) in slot 5: DevStatus(Corr), CorrErr(Rcvr); '}