LustreファイルシステムでRHEL 7.9ホストのI/Oが長時間停止します
- Views:
- 15
- Visibility:
- Public
- Votes:
- 0
- Category:
- e-series-systems
- Specialty:
- esg<a>2009047183年</a>
- Last Updated:
環境
- RHEL 7.9
- 光沢
- Corosync
- ペースメーカー
- E5700
- SANtricity OS 11.70.1R1、11.70.2
問題
RedHat Enterprise Linux 7.9ホストでLustreファイルシステムでI/Oが120秒を超えると停止し、Pacemaker / CorosyncによってNMI(マスク不可割り込み)がトリガーされます。
ホスト
Recovered Error
messages or
syslog
ログファイルで大量の繰り返しが表示されています:1653449345 2022 May 25 03:29:05 hostname kern info kernel [ 5080.869325] sd 0:0:0:3: [sdc] tag#11 Sense Key : Recovered Error [current]
1653449345 2022 May 25 03:29:05 hostname kern info kernel [ 5080.869327] sd 0:0:0:3: [sdc] tag#11 Add. Sense: Select or reselect failure