メモリリークが原因でBES-53248が予期せずリブートする
環境
- BES-53248クラスタスイッチ
- EFOS 3.11.1.2
問題
- BES-53248クラスタインターコネクトスイッチが 予期せずリブートし、電源の中断やメンテナンスが行われていません。
- 空きメモリは6~7か月の間に削減され、最終的に再起動されます。
------------------------ Print file - slog0.txt ------------------------
<185> Jun 4 05:42:17 0.0.0.0-1 SIM[Cnfgr_Thread_]: sim_util.c(4302) 12 %% ALRT Switch was reset due to power disruption or unexpected restart.(error[0x0]).
- パートナースイッチから次の「ISL down」アラートが報告されます。
[Node-01: cshmd: hm.alert.raised:alert]: Alert Id = ClusterIfIslDownWarn_Alert , Alerting Resource = CS2/Slot: 0 Port: 55 100G - Level raised by monitor ethernet-switch
[Node-01: cshmd: hm.alert.raised:alert]: Alert Id = ClusterIfIslDownWarn_Alert , Alerting Resource = CS2/Slot: 0 Port: 56 100G - Level raised by monitor ethernet-switch
[Node-01: mgwd: callhome.hm.alert.major:alert]: Call home for Health Monitor process cshm: ClusterIfIslDownWarn_Alert[CS2/ Link Aggregate 1].
- 接続されているONTAPノードから次のエラーメッセージが報告されました。
Sun Jan 19 05:33:39 +0800 [nodename: kernel: netif.linkDown:info]: Ethernet e0c: Link down, check cable.
Sun Jan 19 05:33:39 +0800 [nodename: cf_main: cf.fsm.takeoverOfPartnerDisabled:error]: Failover monitor: takeover of partnernode disabled (unsynchronized log).
ASUPが生成されました。 CLUSTER NETWORK DEGRADED , Reason Takeover not Possible
- ISLリンクは、スイッチがオンラインに戻ってアラートがクリアされると有効になります。