メインコンテンツへスキップ

ウォッチドッグリセット(WDR)の処理方法

Views:
2,275
Visibility:
Public
Votes:
3
Category:
fas-systems
Specialty:
hw
Last Updated:

 

環境

  • ONTAP 9
  • All FAS / AFFシステム
  • watchdogリセットリブートイベント
  • HA Group Notification from node(reboot(panic))アラート
    • パニック :CPUのウォッチドッグNMI
  • HA Group Notification(reboot(watchdog reset))アラート

説明

ウォッチドッグリセットとは何ですか?

ウォッチドッグ リセットは、回復不可能なエラーが発生した場合や応答しなくなった場合にシステムを自動的に再起動するために、ほとんどのコンピュータ システムで使用されるメカニズムです。

ウォッチドッグタイマーの概念は、コンピュータハードウェアおよびネットワーク業界で広く採用されており、特定の企業だけにとどまりません。これは、システムが予期せぬ問題から人間の介入なしに回復できるようにするため、標準的な手法となっています。 

ウォッチドッグ リセットが発生した場合は、以下にリストされている手順を使用して再起動の原因を把握することが重要です。利用可能なログ分析に基づいて根本原因がハードウェアの問題でない限り、ハードウェアを交換する必要はありません

  • この機能は、システムに回復不能なシステムエラーが発生した場合に、サーバを自動的に再起動する機能です。
  • NetAppによって実装されるウォッチドッグは、時間の各レベルに関連付けられた異なるアクションを持つ2レベルのタイマーを使用します。
  • レベル1 /レベル2ウォッチドッグ動作はNetApp独自のものではなく、ハードウェア業界全体で使用されています。
レベルタイプ 説明
レベル1:タイムアウト

マスク不可能な割り込みが発生すると、ストレージアプライアンスはパニック状態になり、コアがダンプされます。

  • タイマーが1.5秒以内にリセットされない場合、L1ウォッチドッグが発行されます。
  • L1ウォッチドッグが正常に発行されると、システムはサービスに戻り、コアファイルが書き込まれます。これにより、NetAppはハングのルート原因を特定できます。 
レベル2:リセット

ストレージアプライアンスは、タイマーから送信されたハードリセット信号によってリセットされます。 

  • L1ウォッチドッグの後2秒以内にウォッチドッグ・タイマーがリセットされない場合、L2ウォッチドッグが発行されます。
  • L2ウォッチドッグはコアダンプを生成しません。
  • ウォッチドッグタイムアウトまたはウォッチドッグリセットから「再検出」する必要はありません。どちらのイベントも、他の障害に対するリカバリメカニズムであるためです。
    • 代わりに、ウォッチドッグイベントの原因となった障害を特定することが目的です。
ウォッチドッグNMIパニックの識別方法

パニック メッセージは、以下のように Ontap イベント ログまたは SP/BMC の「システム ログ」コマンド出力に表示されます。

event log show -severity * -message-name panic*

  • テイクオーバーを実行した稼働ノード

Fri Nov 18 01:20:54 -0600 [NetApp01: cf_main: cf.fsm.takeover.panic:alert]: Failover monitor: takeover attempted after partner panic.
Fri Nov 18 01:21:37 -0600 [NetApp01: cf_main: callhome.sfo.takeover.panic:EMERGENCY]: Call home for CONTROLLER TAKEOVER COMPLETE PANIC

  • ハアトナアノオト、リブート後

Fri Nov 18 01:42:35 -0600 [NetApp02: splog_main: mgr.stack.string:notice]: Panic string: watchdog nmi on cpu 3, hang cpu is 0 in SK process wafl_scan_exempt on release 9.9.1P7 (C)

プラットフォーム 記事

FAS8020 / FAS8040 / FAS8060 / FAS8080 / AFF8020 / AFF8040 / AFF8060 / AFF8080

FAS8020 / FAS8040 / FAS8060 / FAS8080 / AFF8020 / AFF8040 / AFF8060 / AFF8080でのL2ウォッチドッグリセットの処理

FAS2520 / FAS2552 / FAS2554

FAS2520 / FAS2552 / FAS2554でのL2ウォッチドッグリセットの処理
AFF A700 / FAS9000 AFF A700およびFAS9000プラットフォームでのL2ウォッチドッグリセットの処理

FAS2620 / FAS2650  /  AFF A200

FAS2620 / FAS2650 / AFF A200でのL2ウォッチドッグリセットの処理

AFF A220 / AFF A150 / AFF C190 / FAS2750 / FAS2720

AFF A220 / AFF A150 / AFF C190 / FAS2750 / FAS2720でのL2ウォッチドッグリセットの処理

AFF A400 / AFF C400 / FAS8700 / FAS8300

AFF A400 / AFF C400 / FAS8700 / FAS8300でのL2ウォッチドッグリセットの処理
AFF A700s AFF A700sプラットフォームでのL2ウォッチドッグリセットの処理
AFF A300 / FAS8200 FAS8200およびAFF A300プラットフォームでのL2ウォッチドッグリセットの処理

AFF A800 / AFF C800

AFF A800およびAFF C800プラットフォームでのL2ウォッチドッグリセットの処理
AFF A320 AFF A320プラットフォームでのL2ウォッチドッグリセットの処理
AFF A900 / FAS9500 AFF A900およびFAS9500プラットフォームでのL2ウォッチドッグリセットの処理
AFF A250 / FAS500f / AFF C250 AFF A250 / FAS500f / AFF C250でのL2ウォッチドッグリセットの処理
FAS3250 FAS3250でのL2ウォッチドッグリセットの処理
FAS90 / FAS70 / ASA A1K / ASA A90 / ASA A70 / AFF A1K / AFF A90 / AFF A70 / AFF C80 FAS90 / FAS70 / ASA A1K / ASA A90 / ASA A70 / AFF / AFF A90 / AFF A70 / AFF A1K C80でのL2ウォッチドッグリセットの処理

のとう

追加情報

さらにサポートが必要な場合は、NetAppテクニカルサポートに連絡して、収集したデータとともにこの記事を参照してください。

 

 

NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.