Flash Cacheの障害が原因で複数のアグリゲートにCPSが長くなる
環境
- ONTAP 9
- NVMeベースのFlash Cacheを搭載したAll FASシステム
問題
- 複数のアグリゲート で CPが長くなる:
Mon Nov 21 18:55:17 CST [AI-A: wafl_exempt08: wafl.cp.toolong:error]: Aggregate SATA_03 experienced a long CP.
Mon Nov 21 18:57:32 CST [AI-A: wafl_exempt11: wafl.cp.toolong:error]: Aggregate SATA_02 experienced a long CP.
Mon Nov 21 18:58:43 CST [AI-A: wafl_exempt03: wafl.cp.toolong:error]: Aggregate SATA_01 experienced a long CP.
- 外部 キャッシュは、次のエラーを書き込みます。
Tue Nov 08 02:00:11 CST [AI-A: wafl_exempt07: ems.engine.suppressed:debug]: Event 'extCache.io.writeError' suppressed 77 times in last 457317 seconds.
Tue Nov 08 02:00:11 CST [AI-A: wafl_exempt07: extCache.io.writeError:notice]: WAFL external cache I/O write error: Insertq_save: unable to alloc context chain, code 0
- カードのステータスは
sysconfig -a
出力の障害です。
slot 3: Flash Cache NVMe
Serial Number: S3K6NX0M200744
Part Number: 119-00329
Hardware Revision: A0
Firmware Version: NA01
Model Name: X3311A
Capacity: 1024 GB
Vendor Name: Samsung
State: failed
- 高レイテンシは観察されません。