FAS2620 / FAS2650 / AFF A200でのL2ウォッチドッグリセットの処理
環境
- FAS2620 / FAS2650 / AFF A200
問題
- ノードが突然リブートした場合
- 予期しないシャットダウン後にノードがリブートしない
- 影響を受けるノードのサービスプロセッサログには次の情報が表示されます。
Record 454: Mon Feb 08 11:49:20.924775 2021 [IPMI Event.critical]: L2 watchdog timeout hard reset
 Record 455: Mon Feb 08 11:49:20.984259 2021 [Trap Event.critical]: hwassist l2_watchdog_reset (29)
 Record 456: Mon Feb 08 11:49:23.000822 2021 [SP.critical]: Filer Reboot
- ノードがリブートすると、EMSログファイルに次のエラーが表示されることがあります
[cluster-01:mgr.boot.reason_abnormal:EMERGENCY]: System rebooted due to a watchdog reset.
- ノードを再起動できない場合system senors'SPからsenors unavailable(na)またはfaulted(Fault)と表示されることがあります
Sensor Name    | Current   | Unit     | Status    | LCR     | LNC     | UNC     | UCR
 -----------------+------------+------------+------------+-----------+-----------+-----------+-----------
 SYSTEM:
 System_FW_Status | na      | discrete   | na      | na     | na     | na     | na
 System_Watchdog  | 0x0     | discrete   |       | na     | na     | na     | na
 Wrench_Port_Up   | na      | discrete   | na      | na     | na     | na     | na
 CONTROLLER_A:
 PCM_Status     | 0x0     | discrete   | Fault    | na     | na     | na     | na
 Attn_Sensor1    | 0x0     | discrete   | Asserted   | na     | na     | na     | na
 CPU-1_DTS_Temp   | na      | degrees C  | na      | na     | na     | -10.000   | 0.000
 CPU-2_DTS_Temp   | na      | degrees C  | na      | na     | na     | -10.000   | 0.000
 CPU0_PVCCP     | na      | Volts    | na      | 1.580    | 1.670    | 1.920    | 2.010
 CPU1_PVCCP     | na      | Volts    | na      | 1.580    | 1.670    | 1.920    | 2.010