メインコンテンツまでスキップ

NetApp_Insight_2020.png 

ウォッチドッグリセットの処理( WDR )

Views:
20
Visibility:
Public
Votes:
0
Category:
fas-systems
Specialty:
hw
Last Updated:

すべてのとおり  

に適用されます

ウォッチドッグのリセット

回答

ウォッチドッグのリセットとは何ですか?

ウォッチドッグは、 Data ONTAP を実行しているメインコントローラの進行状況を監視する独立したタイマーです。この機能は、システムで回復不能なシステムエラーが発生した場合に、サーバを自動的に再起動する機能です。

ネットアップが実装したウォッチドッグは、 2 レベルのタイマーを使用し、各レベルの時間に異なるアクションを関連付けます。

  • レベル 1 :タイムアウト:ストレージアプライアンスは、マスク不可能な割り込みに応答して、コアのパニックとダンプを試行します。L1 Watchdog が正常に発行されると、システムはサービスに戻り、コアファイルが書き込まれます。これにより、ネットアップはハングの根本原因を特定できます。タイマーが 1.5 秒以内にリセットされない場合は、 L1 ウォッチドッグが発行されます。
     
  • レベル 2 :リセット:ストレージアプライアンスは、タイマーから送信されたハードリセット信号によってリセットされます。L1 ウォッチドッグの 2 秒後にウォッチドッグタイマーがリセットされない場合、 L2 ウォッチドッグが発行されます。

ウォッチドッグタイムアウトまたはウォッチドッグリセットから「カバー」する必要はありません。これらの両方のイベントは、他の障害に対するリカバリメカニズムであるためです。代わりに、ウォッチドッグイベントの原因となった障害を特定します。

ウォッチドッグタイムアウト( L1 Watchdog イベント)に対する適切な応答は何ですか。

ウォッチドッグタイムアウトは、他のシステムパニックと同様に処理する必要があります。考えられる根本原因について、関連するバックトレースやコアを分析する必要があります。必要に応じてギブバックを実行します。

ウォッチドッグリセット( L2 ウォッチドッグイベント)に対する適切な応答はどれですか。

データ収集が必要なため、単にギブバックして監視しないでください

次のデータを収集して、ウォッチドッグリセットの原因を診断してください。

  • AutoSupportメッセージ
  • ウォッチドッグイベントの前、実行中、実行後にコンソールログが記録されます(可能な場合)。
  • SSRAM ログ( /etc/log/ssram/ssram.log または /mroot /etc/log/ssram/ssram.log )● FAS62xx 、 FAS80x0 のみ
  • サービスプロセッサを搭載したシステムの場合:
    • system sensors
    • system log
    • events all
    • sp status -d

メモ:使用可能なログやコアファイルの分析に基づいてハードウェアの問題が根本的な原因である場合を除き、ハードウェアを交換する必要はありません。

追加情報

詳細[1]については、ネットアップのテクニカルサポートにお問い合わせください。収集したデータとともに、この記事を参照してください。