ノードに接続されているコンソールケーブルだけで、ヘルスアラートが原因されたり、SPアクセスが妨げられたり、フェイルオーバーが妨げられたりすることがあります
環境
- AFFモデル
- FASモデル
- ONTAP 9
- コンソール接続
問題
次のような症状が見られます。
- どのアカウントを使用してもSPにSSH接続できない(応答なし)
- さまざまな誤ったヘルスアラートが報告されることがあり、ハードウェア障害が想定される原因となる可能性があります。
- ファン障害
- 高温/低温警告
- さまざまな"センサー読み取り不能"メッセージ
- バッテリーの故障など
Record 2508: Mon Apr 24 11:01:20 2023 [SP.notice]: SP load is high: 5.22 4.10 2.12 Record 2513: Mon Apr 24 11:03:16 2023 [IPMI.emergency]: triggered OS halt: Multiple fans failed
- SSH経由でコンソール出力が非常に遅い(「遅延」)、または応答しない
- テイクオーバーまたはギブバックの失敗
メモ :この問題は、115200ボーを実行している新しいシステムで発生する可能性が高くなります。
例:
Log Collection from: SERIALNUM=xxxxxxxxxxx SEQ=31 HOSTNAME=node01-1
================ Log #1 start time Thu Jan 1 00:00:56 1970
================ Log #1 truncated at Wed Apr 29 09:06:18 2020 ?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????!
????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????!
??????????????????????????????????????????????????????????????!
????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????!
???????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????
================ Log #1 end time Wed Apr 29 09:06:35 2020
Active IQダッシュボードのAutoSupportログを使用した検証
- CONSOLE.xml を使用して、上に表示されたごみ文字を検索します。
- sp-latest-runtime
"top"
サブセクションで、gettyプロセス( ONTAPのバージョンに応じてngettyまたはagettyになります)を探し、シリアルポートのアクティビティの兆候と考えられるシリアルポートの過負荷状態(CPU %の高さで示される)を探します。
PID PPID USER STAT VSZ %VSZ CPU %CPU COMMAND
993 1 root D 6304 2.2% 0 22.4% /sbin/ngetty 115200 parallel
2408 1 sysadmin S 1912 2.5 0 23.7% /sbin/agetty --nohostname -L console 115200 vt100
注意: 一部のONTAPバージョンでは、gettyが常にTopの下に表示されるとは限りません。
"top"
または"uptime"
のサブセクションで、の値を確認し"load average"
ます。
Load average: 5.22 4.10 2.12 13/218 26338 02:10:24 up 76 days, 5:07, 0 users, load average: 5.22, 4.10, 2.12
- 上記の3つの値は、過去1分、5分、15分のSPの負荷平均を表しています。