メインコンテンツまでスキップ

クラスタ内のすべての ONTAP ノードを正常にシャットダウンして電源をオンにする方法

Views:
745
Visibility:
Public
Votes:
1
Category:
ontap-9
Specialty:
hw
Last Updated:

環境

  • ONTAP 9
  • AFF モデル
  • FASモデル
  • MetroCluster を除く

説明

はじめに

いくつかのイベントでは、次のような ONTAP 機器の正常なシャットダウンが必要になる場合があります。

  • サイトの電源停止をスケジュールしました
  • データセンター全体のメンテナンス
  • 物理システムの移動
  • 将来的な機器の転用に備える
前提条件
  • この手順はMetroCluster 以外の 構成専用です
  • ONTAP 9 のローカル管理者パスワード
  • NetApp オンボードキー管理( OKM )を使用する場合は、クラスタ全体のパスフレーズを使用します 利用可能
  • 各コントローラの SP / BMC にアクセスできることを確認します
  • すべてのクライアントまたはホストからネットアップシステム上のデータへのアクセスを停止します
  • 外部バックアップジョブを一時停止
  • 物理的な機器作業を行うためのオンサイトの担当者
  • オンサイト保守の一般的な準備
ハードウェアコンポーネントの識別

ONTAP システムは、次の 1 つ以上のコンポーネントで構成されます。以下のリンクを使用して、オンサイトの担当者が機器の場所を特定し、識別する際に役立つ詳細情報と画像を参照してください。

手順

グレースフル・シャットダウンを実行して
重要:この手順はクラスタ内のすべてのノードをシャットダウンし、システムの電源が復旧するまでクラスタ上のデータにアクセスできなくなります。
  1. SSH を使用してクラスタにログインします。それ以外 Windows ホストでの micro-USB-USB コンソールケーブルの使用方法の場合は、ローカルコンソールケーブルを使用してクラスタ内の任意のノードからログインします。
  2. スケジュールされたメンテナンス期間中の自動ケース作成を抑制する方法 シャットダウンイベントの想定される期間と説明用のテキストについて、ケース抑制 AutoSupport を生成します。

cluster1::> system node autosupport invoke -node * -type all -message "MAINT=8h Power Maintenance"

  1. すべてのノードの SP / BMC IP アドレスを特定します。

cluster1::> system service-processor show -node * -fields address
node address
-------------- ------------
cluster1-01 10.10.10.10
cluster1-02 10.10.10.20
cluster1-03 10.10.10.30
cluster1-04 10.10.10.40

  1. クラスタシェルを終了します。

cluster1::> exit

  1. [1] 手順 3 のいずれかのノードの IP アドレスを使用して、 SSH 経由で SP / BMC に接続します。それ以外 Windows ホストでの micro-USB-USB コンソールケーブルの使用方法 の場合は、ローカルコンソールケーブルをノードに接続します。同じクラスタ管理者のクレデンシャルでログインします。 

SP / BMC プロンプトからアクセスする場合は system console、に切り替えてクラスタ管理者のクレデンシャルを入力します。

SP-login: login:
login as: admin
admin@10.10.10.10's password:
SP cluster1-01> system console
Type Ctrl-D to exit.
SP-login: admin
Password:
cluster1::>​​​​

メモ :この手順の説明に従って、すべての SP に対して SSH セッションウィンドウを開き、監視します。

  1. クラスタ内のすべてのノードを停止します。

ほとんどのクラスタ構成 -

cluster1::> system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true

StrictSync SnapMirror 関係を持つクラスタの場合 -

 cluster1::> system node halt -node * -skip-lif-migration-before-shutdown true -ignore-quorum-warnings true -inhibit-takeover true -ignore-strict-sync-warnings true 
  1. 各ノードのプロンプトに応答します。

Warning: Are you sure you want to halt node "cluster1-01"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-02"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-03"?
{y|n}: y

Warning: Are you sure you want to halt node "cluster1-04"?
{y|n}: y

4 entries were acted on.

  1. ノードが完全に停止するまで待機します。そのためには LOADER プロンプトを表示します。

LOADER-A/B>

  1. SP / BMC を使用 Windows ホストでの micro-USB-USB コンソールケーブルの使用方法 してクラスタ内の各ノードに接続する(まだ接続されていない場合)か、ローカルコンソールケーブルを使用して、各ノードが LOADER プロンプトに表示されていることを確認します(手順 8 を参照)。
  2. (オプション) SP / BMC プロンプトから各コントローラの電源をオフにします。

SP> system power off

How to perform graceful shutdown and power up of all ONTAP nodes in a cluster#Additional_Information 詳細および警告については、「追加情報」セクションを参照してください。

物理アクティビティ
ここでは、システムの電源がオフになっている間に機器が破損しないようにするための物理的なアクティビティを示します。また、起動後の機器の正しい順番での動作も保証されるため、イベントの完了後に ONTAP システムからデータを提供できるようになります。
  1. コントローラ、シェルフ、 IOM 、ディスク、 PSU のシステム黄色の LED に現在発生している障害をメモします。 など
  2. 各装置の PSU ロッカースイッチをオフの位置に切り替えます。

注:一部の PSU にはロッカースイッチがありません。

  1. 各 PSU を PDU に接続している電源ケーブルを取り外します。
  2. 各コンポーネントの電源が正常にオフになったことを目視で確認します。
  3. クラスタに関連付けられているすべてのコントローラ、ディスクシェルフ、およびスイッチの電源がオフになっていることを確認します。
システムの電源を入れます

電源投入手順は、次の順序で実行する必要があります。

  1. スイッチ(ネットワーク / FC/storage )
  2. ディスク シェルフ
  3. コントローラ
スイッチの電源をオンにします
  1. PDU から PSU に各電源ケーブルを接続し直します。
  2. 各ロッカースイッチをオンの位置に回します(該当する場合)。
  3. スイッチの電源がオンになるまで待ちます。
  4. スイッチ(前面と背面の両方)に障害ライトがあるかどうかを確認します。
  5. 管理 IP アドレスを使用してスイッチに接続します。
  6. スイッチのヘルスを確認する(詳細については、スイッチベンダーのマニュアルを参照)。
  7. すべての電源がオンになり正常に稼働するまで、各スイッチに対して上記の手順を繰り返します。
ディスクシェルフの電源がオンになります
  1. PDU から PSU に各電源ケーブルを接続し直します。
  2. 各ロッカースイッチをオンの位置に回します(該当する場合)。
  3. すべてのディスクシェルフの電源がオンになり、ドライブがスピンアップするまで待ちます。
  4. すべてのシェルフ ID の値が適切であることを確認します。
  5. シャットダウン前にディスクシェルフ(前面と背面の両方)に障害 LED がないかどうかを確認します。
コントローラの電源がオンになります
  1. PDU から PSU に各電源ケーブルを接続し直します。
  2. 各ロッカースイッチをオンの位置に回します(該当する場合)。同じシャーシにない HA ペアの電源を同時にオンにする必要があります。
  3. シャーシ内のコントローラの電源がオンになるまで待ちます。
  4. シャーシとコントローラ(前面と背面の両方)に障害 LED がないかどうかを確認します。
  5. すべての電源がオンになるまで、コントローラ / シャーシの各スイッチについて同じ手順を繰り返します。
  6. SSH 経由でクラスタ管理 IP アドレスに接続します。
  7. 追加の システムヘルスチェックを実行する。
  8. メンテナンスタスクの生成完了 (ステップ 4 ) AutoSupport 。

cluster1::> system node autosupport invoke -node * -type all -message MAINT=end

電源投入後のベストプラクティス
トラブルシューティング
スイッチの電源が入らない
  • [2] サードパーティサポートを参照して、障害が発生したスイッチのベンダーに問い合わせます。
  • 障害が発生したスイッチが修復されるまでは、電源投入手順を続行しないでください。
ディスクシェルフの電源がオンになりません
  • [3]シェルフのトラブルシューティングについて詳しくは、ネットアップテクニカルサポートにお問い合わせください。
  • 障害が発生したシェルフが修復されるまでは、電源投入手順を続行しないでください。
コントローラの電源が入らない

一方-inhibit-takeover true のコントローラの電源投入に失敗した場合(マザーボード障害など)、シャットダウン時にフラグを使用していたため、 HA パートナーがテイクオーバーしません。システムのステータスは次のようになります。

cluster1::*> storage failover show
Takeover
Node Partner Possible State Description
-------------- -------------- -------- -------------------------------------
cluster1-01 cluster1-02 - Unknown
cluster1-02 cluster1-01 false Waiting for cluster1-01. Waiting
for cluster applications to come
online on the local node. Offline
applications: mgmt, vldb, vifmgr,
bcomd, crs., Takeover is not
possible: Partner node halted after
disabling takeover, Disk inventory
not exchanged
2 entries were displayed.

コントローラをブートできない場合にこの状況からリカバリするには、次の手順を実行します。

  1. [4]障害のあるコントローラのトラブルシューティングについて詳しくは、ネットアップテクニカルサポートにお問い合わせのうえ、こちらの記事を参照してください。
  2. advanced 権限を入力します。

cluster1::> set -privilege advanced

  1. 障害ノードのテイクオーバーを強制的に実行します。

cluster1::*> storage failover takeover -option force -ofnode cluster1-01 -skip-lif-migration-before-takeover true

  1. 障害ノードの LIF は、最終的には使用可能なノードで稼働するようになります(使用可能なブロードキャストドメインポートがある場合)。
  2. 障害ノードが修復されたら、通常のギブバックを実行します。

追加情報

ヒント

コントローラの電源をリモートからオフにするには、次の手順

 SP> system power off This will cause a dirty shutdown of your appliance. Continue? [y/n] y SP> system power status Chassis Power is off 

この警告を無視できるのは、クリーンシャットダウン後にノードが LOADER プロンプトに表示された場合のみです。その他の用途では、原因によるデータ損失が発生する可能性があります。

同じシャーシ内の他の SP (該当する場合)から同じ手順を繰り返します。

 

CUSTOMER EXCLUSIVE CONTENT

Registered NetApp customers get unlimited access to our dynamic Knowledge Base.

New authoritative content is published and updated each day by our team of experts.

Current Customer or Partner?

Sign In for unlimited access

New to NetApp?

Learn more about our award-winning Support