ONTAP-170136:FAS8200およびAFF A300システムでCPUが応答しないと、複数のwatchdogコントローラが停止することがある
問題
- FAS8200およびAFF A300ストレージシステムでCPUが応答しなくなると、watchdogコントローラが停止する可能性があります。
例えば:
CPU 0 のウォッチドッグ nmi、プロセスアイドル状態で CPU 0 がハング: cpu0
レコード 1108: 2022年4月30日(土) 05:01:38 [IPMIイベント.クリティカル]: NMI
レコード 1109: 2022年4月30日(土) 05:01:38 [IPMI.notice]: e800 | 02 | EVT: 6fc824ff | System_Watchdog | アサーションイベント、「タイマー割り込み」
レコード 1110: 2022年4月30日(土) 05:01:39 [IPMIイベント.クリティカル]: L2ウォッチドッグタイムアウトのハードリセット
記録 1111: 2022年4月30日(土) 05:01:39 [トラップイベント.critical]: hwassist l2_watchdog_reset (29)
レコード 1112: 2022年4月30日(土) 05:01:45 [IPMI.notice]: e900 | 02 | EVT: 6fc104ff | System_Watchdog | アサーションイベント、「ハードリセット」
- このL2 WDGはx86 CPUコアによるもので、一時的なCPU問題が原因で発生する可能性があります。