メインコンテンツまでスキップ

ウォッチドッグリセット(WDR)の処理方法

Views:
2,093
Visibility:
Public
Votes:
3
Category:
fas-systems
Specialty:
HW
Last Updated:

すべてのとおり  

環境

  • ONTAP 9
  • watchdogリセット
  • HA Group Notification from node(reboot)アラート
    • パニック :CPUのウォッチドッグNMI

説明

ウォッチドッグのリセットとは何ですか?

ウォッチドッグは、 Data ONTAP を実行しているメインコントローラの進行状況を監視する独立したタイマーです。この機能は、システムで回復不能なシステムエラーが発生した場合に、サーバを自動的に再起動する機能です。

ネットアップが実装したウォッチドッグは、 2 レベルのタイマーを使用し、各レベルの時間に異なるアクションを関連付けます。

  • レベル 1 :タイムアウト:ストレージアプライアンスは、マスク不可能な割り込みに応答して、コアのパニックとダンプを試行します。L1 Watchdog が正常に発行されると、システムはサービスに戻り、コアファイルが書き込まれます。これにより、ネットアップはハングの根本原因を特定できます。タイマーが 1.5 秒以内にリセットされない場合は、 L1 ウォッチドッグが発行されます。
     
  • レベル 2 :リセット:ストレージアプライアンスは、タイマーから送信されたハードリセット信号によってリセットされます。L1 ウォッチドッグの 2 秒後にウォッチドッグタイマーがリセットされない場合、 L2 ウォッチドッグが発行されます。L2 ウォッチドッグはコアダンプを生成しません

ウォッチドッグタイムアウトまたはウォッチドッグリセットから「カバー」する必要はありません。これらの両方のイベントは、他の障害に対するリカバリメカニズムであるためです。代わりに、ウォッチドッグイベントの原因となった障害を特定します。

ウォッチドッグNMIパニックの識別方法

event log show -severity * -message-name panic*

テイクオーバーを実行した稼働ノード

Fri Nov 18 01:20:54 -0600 [NetApp01: cf_main: cf.fsm.takeover.panic:alert]: Failover monitor: takeover attempted after partner panic.
Fri Nov 18 01:21:37 -0600 [NetApp01: cf_main: callhome.sfo.takeover.panic:EMERGENCY]: Call home for CONTROLLER TAKEOVER COMPLETE PANIC

ハアトナアノオト、リブート後

Fri Nov 18 01:42:35 -0600 [NetApp02: splog_main: mgr.stack.string:notice]: Panic string: watchdog nmi on cpu 3, hang cpu is 0 in SK process wafl_scan_exempt on release 9.9.1P7 (C)

プラットフォーム 記事

FAS8020 / FAS8040 / FAS8060 / FAS8080 / AFF8020 / AFF8040 / AFF8060 / AFF8080

FAS8020 / FAS8040 / FAS8060 / FAS8080 / AFF8020 / AFF8040 / AFF8060 /でのL2ウォッチドッグリセットの処理 AFF8080

FAS2520 / FAS2552 / FAS2554

FAS2520 / FAS2552 / FAS2554でのL2ウォッチドッグリセットの処理
AFF A700 / FAS9000 AFF A700およびFAS9000プラットフォームでのL2ウォッチドッグリセットの処理

FAS2620 / FAS2650 / AFF A200

FAS2620 / FAS2650 / AFF A200でのL2ウォッチドッグリセットの処理

AFF A220 / AFF A150 / AFF C190 / FAS2750 / FAS2720

AFF A220 / AFF A150 / AFF C190 / FAS2750 / FAS2720でのL2ウォッチドッグリセットの処理

AFF A400 / AFF C400 / FAS8700 / FAS8300

AFF A400 / AFF C400 / FAS8700 / FAS8300でのL2ウォッチドッグリセットの処理
AFF A700s AFF A700sプラットフォームでのL2ウォッチドッグリセットの処理
AFF A300 および FAS8200 FAS8200およびAFF A300プラットフォームでのL2ウォッチドッグリセットの処理

AFF A800 / AFF C800

AFF A800およびAFF C800プラットフォームでのL2ウォッチドッグリセットの処理
AFF A320 AFF A320プラットフォームでのL2ウォッチドッグリセットの処理
AFF A900 / FAS9500 AFF A900およびFAS9500プラットフォームでのL2ウォッチドッグリセットの処理
AFF A250 / FAS500f / AFF C250 AFF A250 / FAS500f / AFF C250でのL2ウォッチドッグリセットの処理

のとう

追加情報

詳細[1]については、ネットアップのテクニカルサポートにお問い合わせください。収集したデータとともに、この記事を参照してください。

 

NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.