メインコンテンツまでスキップ

ハイアベイラビリティ「テイクオーバー不能」イベントの一般的な原因は何ですか。

に適用されます

  • clustered Data ONTAP 8
  • Data ONTAP 7 以前

回答

テイクオーバーの試行が失敗する前にパートナーがテイクオーバーを判断できる場合、 Data ONTAP はパートナーテイクオーバーを試行しません。

この結果、 ASUP によって、「 Takeover impossible 」が「 Symptom 」フィールドに入力されたカスタマーサポートケースが自動的にオープンされます。  ケースの症状のテキストは次の形式になります。

CLTFLT: Cluster Notification from (PARTNER DOWN, TAKEOVER IMPOSSIBLE) ERROR

この資料では、テイクオーバーが不可能なイベントの 5 つの一般的な原因と、検出された問題を解決するために必要なアクションを診断する方法について説明します。  主にメッセージログとクラスタモニタログからのリモート診断に重点を置いています。

NetApp FAS3000 、 FAS3100 、 FAS6000 システムの約 70% が HA 構成として導入されています。  HA システムを適切に設定するには、必要な HA ハードウェアをすべてインストールし、クラスタソフトウェアライセンスを有効にし、 HA 関連オプションを設定する必要があります。

テイクオーバーの試行が失敗する前にパートナーがテイクオーバーを判断できる場合、 Data ONTAP はパートナーテイクオーバーを試行しません。   この結果、 ASUP によって、「 Takeover impossible 」が「 Symptom 」フィールドに入力されたカスタマーサポートケースが自動的にオープンされます。ケースの症状のテキストは次の形式になります。

CLTFLT: Cluster Notification from (PARTNER DOWN, TAKEOVER IMPOSSIBLE) ERROR 

HA システムが正しく設定されておらず、パートナーシステムによるテイクオーバーが不可能な場合、時間単位のアラートメッセージが多くの場合、コンソールに送信されます。  メッセージの形式は、「 statd :アラートクラスタのライセンスがありますが、パートナーのテイクオーバーは無効です」です。 この資料では、構成の問題を解決するために必要な一般的なメッセージとアクションについて説明します。  主にメッセージログとクラスタモニタログからのリモート診断に重点を置いています。

statd:ALERT一般的な 5 種類のメッセージを次に示します。

クラスタにライセンスが付与されていますが、パートナーのテイクオーバーが無効になっています
。 ASUP メッセージログには、次の形式の 1 時間ごとのメッセージが記録されます

[: statd:ALERT]: Cluster is licensed but takeover of partner is disabled.

システムがこのメッセージを報告する最も一般的な理由は、テイクオーバー機能がオペレータによって手動で無効にされていることです。  オペレータがコンソールコマンドラインから cf disable と入力しました。  cf enable を入力すると、テイクオーバーが再度有効になり、時間単位のアラートメッセージがクリアされます。

テイクオーバーがオペレータによって無効にされていることを確認するには、 ASUP クラスタモニタログを確認します。  ログの 5 番目のエントリは、「 takeoverbypartner 」で始まります。  テイクオーバーが手動で無効になっている場合、エントリには次のテキスト文字列が含まれます。

"NVRAM_DOWN,CLUSTER_DISABLE"


===== CLUSTER MONITOR =====
cf: Current monitor status (28Jun2009 00:00:02):
partner 'NetApp1' VIA Interconnect is up (link 0 up, link 1 up)
state UP, time 90788045660, event CHECK_FSM, elem ChkMbValid (12)
mirrorConsistencyRequired TRUE
takeoverByPartner 0x2041
: <<< ここを見る

クラスタにライセンスが付与されていますが、理由によりパートナーのテイクオーバーが無効になっています:インターコネクトエラー

ASUP メッセージログには、次の形式のエントリが 1 時間ごとに記録されます。 

[: statd:ALERT]: Cluster is licensed but takeover of partner is disabled due to reason : interconnect error 

インターコネクトリンクのステータスは、クラスタモニタログの 2 行目に表示されます。  次の例では、インターコネクトが存在しないか、両方のリンクがダウンしています。

===== CLUSTER MONITOR =====
cf: Current monitor status (28Jun2009 00:00:01):
partner 'NetApp1', Interconnect not present <<< look here

===== CLUSTER MONITOR =====
cf: Current monitor status (28Jun2009 00:00:02):
partner 'NetApp1', VIA Interconnect is down (link 0 down, link 1 down)   
<<< ここを見る

もう 1 つの一般的な異常状態は、「パートナー」が「不明」であることを示します。

===== CLUSTER MONITOR =====
cf: Current monitor status (28Jun2009 00:00:02):
partner 'unknown', VIA Interconnect is down (link 0 down, link 1 down)
   <<< ここを見る

インターコネクトケーブル / リンクが接続されていてアクティブであることを確認するために必要な対処方法です。  パートナーが「不明」と報告されたら、パートナーのファイラー / プラットフォームが存在し、アクティブであることを確認します。  パートナーシステムが存在しない場合は、システムが HA ペアの一部であり、スタンドアロンとして正しく再設定されていない可能性があります。  [1]クラスタを適切に分割し、「不明な」パートナーメッセージをクリアする方法の詳細については、マニュアル(アクティブ / アクティブ構成の削除)を参照してください。

クラスタにライセンスが付与されていますが、パートナーのテイクオーバーが無効になっています。理由:パートナーメールボックスディスクにアクセスできないか無効です

ASUP メッセージログには、次の形式のエントリが 1 時間ごとに記録されます。

[ statd:ALERT]: Cluster is licensed but takeover of partner is disabled due to reason : partner mailbox disks not accessible or invalid

メールボックスディスクのステータスは、クラスタモニタログの先頭から約 15 行表示されます。  通常のエントリでは、すべてのメールボックスディスクのディスクパスが表示されます。  以下に例を示します。  ディスク識別子(例では 4a.17 、 4a.29 、 8b.34 、 8b.35 )は、システム構成によって異なります。

mailbox disks:
Disk 4a.17 is a primary mailbox disk
Disk 4a.29 is a primary mailbox disk
Disk 8b.34 is a partner mailbox disk
Disk 8b.35 is a partner mailbox disk

2 つの一般的な異常状態:

  1. パートナーディスクエントリがありません。  代わりに、ログに「No partner disks attached!

    mailbox disks:
    Disk 8a.20 is a local mailbox disk
    Disk 8a.19 is a local mailbox disk
    No partner disks attached! 
    < 」が含まれています。 < < ここを参照してください 

  2. パスが「 ? 」と表示されているパートナーディスクがあります。

    mailbox disks:
    Disk 4a.17 is a primary mailbox disk
    Disk 4a.29 is a primary mailbox disk
    Disk ?.? is a partner mailbox disk
        <<< ここ
    Disk ?.? is a partner mailbox disk を見る <<< ここを見る

これらの障害状態を修正するには、まずパートナーシステムが存在し、アクティブであることを確認します。  次に、 Filer / プラットフォームの FC アダプタと、各メールボックス・ディスク・シェルフへのシェルフのケーブル接続を確認します。

If the problem continues, check if 'partner-sysid' shows a correct partner-sysid.

CFE> printenv
Variable Name        Value
-------------------- --------------------------------------------------
BOOT_CONSOLE         rlm0a
fcal-host-id         7
partner-sysid        0101183784


次に、両方の HA コントローラで次の手順を実行します。

  1. と入力してクラスタリングを無効cf disableにします。
  2. リブート
  3. Ctrl-C 起動シーケンス中にを押して、特殊な起動メニューに移動します。
  4. オプション 5 を選択Maintenanceしてモードに切り替えます。
  5. タイプ: mailbox destroy local
  6. タイプ: mailbox destroy partner
  7. タイプ: halt
  8. ヘッドをリブートします。
  9. タイプ: cf enable
  10. タイプ: ic stats error -v

[ds-dt01terra: fmmbx_instanceWorke:info]: missing lock disks, possibly stale mailbox:ローカル / リモートサイトで古いメールボックスインスタンスが存在する可能性があります。その結果、ストレージシステムに次のメッセージが表示されます。アップグレード中にドライブを再割り当てした後、メールボックスディスクが表示されませんでした。メールボックスディスクがありません。メールボックスディスクのローカルインスタンスとリモートインスタンスを再初期化する必要があります。上記の手順 1 ~ 10 を両方のノードで実行します。

ディスクパスの問題の診断に役立つ便利なツールとして、 Config Advisor ( Wiregauge の名前が変更されました)があります。このツールは NOW ツールチェストから入手できます。

Wiregauge は、 ASUP ID を入力することでリモートで実行できます。  ( ASUP ID を入力するには、 [ ファイル ]>[ ASUP の取得 ] を選択します)。  両方の HA パートナーの Wiregauge の結果を比較すると、メールボックスのディスクパスの問題の原因が示されることがよくあります。

クラスタにライセンスが付与されていますが、 CFO にライセンスが付与されていないため、パートナーのテイクオーバーが無効になっています

ASUP メッセージログには、次の形式のエントリが 1 時間ごとに記録されます。

[: statd:ALERT]: Cluster is licensed but takeover of partner is disabled due to reason : CFO not licensed

クラスタモニタログに次のメッセージが含まれている場合、クラスタライセンスは有効になっていません。

===== CLUSTER MONITOR =====
Clustered failover is now unlicensed
cf: option 'monitor' requires that cluster licensing is enabled

クラスタライセンスを再度有効にすると、このエラーは解消されます。  詳細については、「ライセンスの有効化」を参照してください

一般的な原因は、システムがかつてハイアベイラビリティペアの一部であり、スタンドアロンとして正しく再設定されていなかったことです。  [2]ハイアベイラビリティペアを適切に分割する方法の詳細については、「アクティブ / アクティブ構成の削除」を参照してください。

クラスタにライセンスが付与されていますが、パートナーのテイクオーバーが無効になっています。原因:ログが非同期です

ASUP メッセージログには、次の形式のエントリが 1 時間ごとに記録されます。

[: statd:ALERT]: Cluster is licensed but takeover of partner is disabled due to reason : unsynchronized log 

これは通常、インターコネクトのケーブル接続の問題に関連しています。

まず、相互接続ケーブルが相互接続されていないことを確認します。  FAS3000 および FAS6000 システムでは、 2 つのインターコネクトポートが NVRAM カードにあります。  HA ペアの各システムで、ポート 0 がポート 0 に、ポート 1 がポート 1 に接続されていることを確認します。

場合によっては、各インターコネクトケーブルを一時的に取り外して取り付け直すと、このエラーが解消されることがあります。  インターコネクトリンクを解除して再確立すると、ログが強制的に再同期されます。 

Data ONTAP 8.x のハイアベイラビリティ「テイクオーバー不能」イベントの変更

  1. テイクオーバーが不可能な理由を説明する EMS メッセージが追加されています。メッセージは「ha.takeoverImp」で始まります。
    ha.takeoverImpIC:warning]:相互接続エラーのため、パートナーノードのテイクオーバーは不可能です。
    ha.takeoverImpNotDef:warning]:バックアップメールボックスのステータスが不明なため、パートナーノードのテイクオーバーは不可能です。
    ha.takeoverImpNotDef:warning]:パートナーがブートした理由により、パートナーノードのテイクオーバーは不可能です。
    ha.takeoverImpUnsync:warning]:パートナーの NVRAM データがないため、パートナーノードのテイクオーバーは不可能です。
    ha.takeoverImpNotDef:warning]:パートナーがテイクオーバーモードで停止した理由により、パートナーノードのテイクオーバーは不可能です。
  2. Data ONTAP 8 では、「 Hourly Takeover Disabled 」というメッセージが変更されました。
    次のリンクを参照してください。 Syslog Translator
     
    • Controller Failover is licensed but takeover of partner is disabled due to reason : Controller Failover not initialized
    • Controller Failover is licensed but takeover of partner is disabled due to reason : Controller Failover not licensed
    • Controller Failover is licensed but takeover of partner is disabled due to reason : interconnect error
    • Controller Failover is licensed but takeover of partner is disabled due to reason : local halt in progress
    • Controller Failover is licensed but takeover of partner is disabled due to reason : NVRAM size mismatch
    • Controller Failover is licensed but takeover of partner is disabled due to reason : partner booting
    • Controller Failover is licensed but takeover of partner is disabled due to reason : partner halted in notakeover mode
    • Controller Failover is licensed but takeover of partner is disabled due to reason : partner mailbox disks not accessible or invalid
    • Controller Failover is licensed but takeover of partner is disabled due to reason : status of backup mailbox is uncertain
    • Controller Failover is licensed but takeover of partner is disabled due to reason : takeover disabled by partner
    • Controller Failover is licensed but takeover of partner is disabled due to reason : unsynchronized log
    • Controller Failover is licensed but takeover of partner is disabled due to reason : version mismatch
    • Controller Failover is licensed but takeover of partner is disabled due to reason : waiting for partner to recover
    • Controller Failover is licensed but takeover of partner is disabled: partner identification not accessible or invalid
  3. いずれかの ASUP ログの名前が 8.x で cf-monitor に変更されました。

 関連リンク:

追加情報

AdditionalInformation_Text :