SolidFireブロックドライブがクラスタから繰り返しイジェクトされる(交換用ドライブを含む)
環境
Elementソフトウェアのすべてのストレージノード
問題
- ドライブで障害が発生し、交換用ドライブをクラスタに再度追加したあともイジェクトされたままになり、再び使用可能になります。
- クラスタでブロックの同期に長時間(数百時間以上)が表示されますが、妥当な時間で終了します。(スクリーンショットの例は追加情報で確認できます)
blockServiceUnhealthy
[Alerts]セクションでアラートを生成しています。Unhealthy block service added
ドライブをクラスタに追加するときにすぐに[Events]セクションに表示されるイベント。- 場合によっては
lowDriveLife
アラートも表示されることがあります。 - kern.logに表示される次のエラー
2024-11-17T23:04:28.102407Z hci-stg-03 kernel: [1458248.977688] print_req_error: I/O error, dev sde, sector 480 2024-11-17T23:04:28.102409Z hci-stg-03 kernel: [1458248.977690] Buffer I/O error on dev sde, logical block 60, async page read 2024-11-17T23:05:11.847278Z hci-stg-03 kernel: [1458292.722559] sd 10:0:6:0: [sde] Unaligned partial completion (resid=1020, sector_sz=512) 2024-11-17T23:05:11.847286Z hci-stg-03 kernel: [1458292.722567] sd 10:0:6:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE 2024-11-17T23:05:11.847289Z hci-stg-03 kernel: [1458292.722570] sd 10:0:6:0: [sde] tag#0 Sense Key : Aborted Command [current] 2024-11-17T23:05:11.847292Z hci-stg-03 kernel: [1458292.722573] sd 10:0:6:0: [sde] tag#0 Add. Sense: Information unit iuCRC error detected 2024-11-17T23:05:11.847295Z hci-stg-03 kernel: [1458292.722576] sd 10:0:6:0: [sde] tag#0 CDB: Read(10) 28 00 00 00 00 08 00 00 08 00 2024-11-17T23:05:11.847297Z hci-stg-03 kernel: [1458292.722578] print_req_error: I/O error, dev sde, sector 8