AFF A220 / AFF A150 / AFF C190 / FAS2750 / FAS2720 / FAS2820でのL2ウォッチドッグリセットの処理
環境
- AFF A220
- AFF A150
- AFF C190
- FAS2750, FAS2720, FAS2820
問題
- ノードが予期せずリブートする
- ノードが予期しないシャットダウン後にリブートしない
影響を受けたノードのBMCログには、次の情報が表示されます:
Record 402: Thu May 05 06:20:35.070000 2022 [ASUP.notice]: First notification email | (REBOOT (abnormal)) WARNING | Send failed
Record 403: Thu May 05 06:20:40.640000 2022 [IPMI.notice]: 0076 | 02 | EVT: 6fc302ff | System_Watchdog | Assertion Event, "Power cycle"
Record 404: Thu May 05 06:20:40.640000 2022 [IPMI Event.critical]: L2 watchdog timeout power cycle
- ノードがリブートすると、次のエラーがEMSログファイルに表示されます
Thu May 05 15:33:43 +0800 [netapp: splog_main: mgr.boot.reason_abnormal:EMERGENCY]: System rebooted due to a watchdog reset.
Thu May 05 15:33:43 +0800 [netapp: splog_main: callhome.reboot.watchdog:alert]: Call home for REBOOT (watchdog reset)
- ノードをリブートできない場合、
system senors
BMCからAttn_Sensor1
がAsserted
として表示されることがあります
PCI_SW1_Err | 0x0 | discrete | Deasserted | na | na | na | na
Wrench_Port_Up | 0x0 | discrete | Enabled | na | na | na | na
SysReset | 0x0 | discrete | | na | na | na | na
System_Watchdog | 0x0 | discrete | | na | na | na | na
Attn_Sensor1 | 0x0 | discrete | Asserted | na | na | na | na