Lenovo E-Series ストレージのシャーシ交換後、両方のコントローラーがダウン
環境
- Lenovo Eシリーズ ストレージ システム(OEM)
問題
シャーシ交換後、Lenovo Eシリーズ ストレージ システムの両方のコントローラーが動作不能になり、システムの完全な停止とデータへのアクセス不能が発生しました。以下の症状とログ出力が観察されました:
- コントローラA:ボードの不一致によるロックダウン状態になり、7セグメントコードOEL0が表示されています。これは、VPD/EEPROMの破損とハードウェアの検証不能を示しています。
- コントローラB:応答なし、7セグメントコードE8が表示され、DIMMスロット3でECCエラーが発生していることを示しています。
- シリアルログには、コントローラ間の通信確立の失敗、ハードウェアの継続的なロックダウン、およびSASエキスパンダ/ドライブのエラーが繰り返し発生していたことが示されていた。
- ログ出力例:
3/16/26-09:36:30 (tRAID): WARN: UWManager::initializeNvsramIWLog: foreign controller03/16/26-09:36:30 (tRAID): WARN: UWManager::initializeNvsramIWLog: IWLog invalidated03/16/26-09:36:30 (tRAID): NOTE: UWMgr findIWLogs: Found IW log drive. Devnum 0x010000 tray=99 slot=1 ssd=1 qos=0 controller=local03/16/26-09:36:30 (tRAID): NOTE: UWMgr findIWLogs: Found IW log drive. Devnum 0x010001 tray=99 slot=2 ssd=1 qos=0 controller=local03/16/26-09:36:32 (tRAID): ERROR: UWMgr: No DSM Region found for Drive 0x01000903/16/26-09:36:32 (tRAID): ERROR: UWMgr: No DSM Region found for Drive 0x01000e