Active IQ Unified Managerでメモリの問題を解決する方法
環境
- Active IQ Unified Manager(AIQUM)
- OnCommand Unified Manager(OCUM)
回答
-
リザーブメモリの利用はフルまたはゼロにする必要があります。フラクショナルリザーブは問題を引き起こす可能性があります
AIQUMのメモリ推奨事項を確認する
ソフトウェア バージョン | システム要件 |
Active IQ Unified Manager 9.6以降 |
VMware OVA - 仮想インフラまたはハードウェアのシステム要件 |
Microsoft Windows- 仮想インフラまたはハードウェアシステム要件 | |
Red HatおよびCentOS Linux- 仮想インフラまたはハードウェアシステム要件 | |
OnCommand Unified Manager 9.5以前 | 仮想インフラまたはハードウェアシステム要件 |
- 10ページ「Unified Manager scalability」を参照してください
- 次の階層の半分以上に到達している場合は、成長に備えてリソースを次の階層に増やしてください。
例:ノードが30個ある場合、メモリを12GBから60GBに増やします - または、監視する各ノードごとに、開始時の12GBメモリに加えて1GBのメモリを追加します。
例:ノードが30個ある場合、メモリを12GBから42GBに増やします
必要に応じてメモリを調整します
- VMware Docs - メモリ構成の変更
- VMware Docs - VMware Host Client で仮想マシンにメモリリソースを割り当てる
仮想マシンでバルーニングやスワップが発生していないことを確認します。
- VMware Docs - Memory(Data Counters)
- VMware Docs - Memory(MB)
Linuxのみ - Linuxは、メモリを解放するためにUnified Managerプロセスを停止する場合があります
- Linuxプラットフォームでは、OOM("Out of Memory")killerがプロセスを終了してメモリを解放していないか確認します。
- まれに、Red HatおよびCentOSプラットフォームがUnified Managerサービス/プロセスをメモリ解放のために終了することがあります。
Dec 8 22:00:18 um-hostname kernel: Out of memory: Kill process 45678 (java) score 228 or sacrifice child
Dec 8 22:00:18 um-hostname kernel: Killed process 45988 (sh) total-vm:122868kB, anon-rss:260kB, file-rss:0kB, shmem-rss:0kB
Dec 8 22:00:19 um-hostname systemd: mysqld.service: main process exited, code=killed, status=9/KILL
Dec 8 22:00:19 um-hostname systemd: Unit mysqld.service entered failed state.
Dec 8 22:00:19 um-hostname systemd: mysqld.service failed.
Dec 8 22:00:20 um-hostname systemd: mysqld.service holdoff time over, scheduling restart.
Dec 8 22:00:20 um-hostname systemd: Stopped MySQL Server.
Dec 8 22:00:20 um-hostname systemd: Starting MySQL Server...
追加情報
一般的なメモリの問題には
- Unified Managerアプリケーションの動作が遅い
- サービスの稼働開始には時間がかかります。
- WebGUIは遅いです。
- バックアップには非常に長い時間がかかります(失敗する可能性があります)。
- Unified ManagerアプリケーションのCPUおよび/またはメモリ使用率が非常に高く、スワップ/ページファイルが使用されています。
- Unified Managerアプリケーションで一貫性のない動作が発生します:
- サービスがハングする。
- サービスが再起動する。
- サービスがまったく起動しない(特にアップグレード後)
- アラート通知に関する断続的な問題。
- インベントリ/パフォーマンス取得ポーリングが通常の15分/5分サイクル内に完了しない場合があります。
- 仮想環境で実行している場合のその他の異常(説明できない)で一貫性のない動作。
- VMware ESXiは、次のいずれかを表示します。
- メモリバルーニング
- スワッピング
- トランスペアレントページシェアリング
- 圧縮
- スケール監視メッセージ
- 「Unified Manager Server Low On Memory」
- 「Unified Manager Server Low On Memory」
- ログインジケータ:
- MySQL「
error.log
」ファイル:2020-04-12T04:02:10.036849Z 205 [Note] Aborted connection XXX to db: 'unconnected' user: 'jboss' host: 'localhost' (Failed on my_net_write())
2020-04-12T08:50:42.808598Z 450 [Note] Got timeout reading communication packets
- Unified Manager「
server_mega.log
」file:2020-04-12 06:11:01,221 ERROR [default task-4] c.n.s.s.a.OriginatorUpdateServlet (OriginatorUpdateServlet.java:82) - Transaction rolled back: javax.ejb.EJBTransactionRolledbackException: Transaction rolled back
- Unified Manager「
ocumserver.log
」ファイル:- 2019-06-06 02:49:49,566 INFO [oncommand] [pool-22-thread-4] [c.n.d.e.p.e.b.UnifiedManagerMemoryEventTypeController] スケールモニター: 新しいメモリエベントが作成されました: event id=128123,eventSeverity=low, thresholdValue=5.0, currentUsageValue=6.690000057220459, totalMemorySizeValue=1.365997568E10, jvm=AuJvm
2019-06-06 01:49:49,190 INFO [oncommand] [pool-22-thread-55] [c.n.d.e.p.e.b.UnifiedManagerMemoryEventTypeController] Scale Monitor: New Memory Event Created: event id=128094,eventSeverity=almostOut, thresholdValue=7.0, currentUsageValue=7.195000171661377, totalMemorySizeValue=1.365997568E10, jvm=AuJvm
- MySQL「
注:これは、メモリの問題を示すログの完全なリストではありません。ご注意ください、NetApp Supportは、メモリの問題を示す他のログ行も見つけることがあります。