StorageGRIDがノードと通信できない(NDDOWN)場合のトラブルシューティング方法
環境
- NetApp StorageGRID
- NetApp StorageGRID アプライアンス
- NetApp StorageGRID VMwareベースのノード
- NetApp StorageGRIDベアメタルベースのノード
概要
この記事は、StorageGRIDノードが停止した原因を特定するのに役立ちます。StorageGRIDノードが切断された状態になる原因としては、以下が複数考えられます:
- メンテナンス業務
- ネットワーク接続の問題(GRID ネットワーク)
- GRIDネットワークはノード間の通信に使用されます。
- これは、ノードとプライマリ管理ノードの間の接続です。
- ハードウェアの問題
- ファイルシステムの破損
- リソースの問題(CPU、メモリ、ディスクなど)リソースの問題の一般的な症状は、システムのシェル/cli/ssh内での応答が遅い/遅いことです。
- 運用停止
StorageGRID から次のエラーが報告される場合があります:
- StorageGRIDノードがGrid Managerで青色のアイコン
(切断 – 不明)の横に表示されます - StorageGRIDが
Unable to communicate with Nodeアラートを報告します - ノードが自動的にオンラインに戻った場合は
Unexpected node reboot - StorageGRIDが
NDDOWNレガシーアラームを報告します - AutoSupportが有効になっている場合は、
NDDOWNAutoSupportインシデントがオープンされます:CSTARS:StorageGRID Notification from <serial number> (NODE_DOWN-CRITICAL) ERROR