Flash Cacheの障害が原因で複数のアグリゲートにCPSが長くなる
環境
- ONTAP 9
- NVMeベースのFlash Cacheを搭載したAll FASシステム
問題
- 複数のアグリゲート で CPが長くなる:
Mon Nov 21 18:55:17 CST [AI-A: wafl_exempt08: wafl.cp.toolong:error]: Aggregate SATA_03 experienced a long CP.Mon Nov 21 18:57:32 CST [AI-A: wafl_exempt11: wafl.cp.toolong:error]: Aggregate SATA_02 experienced a long CP.Mon Nov 21 18:58:43 CST [AI-A: wafl_exempt03: wafl.cp.toolong:error]: Aggregate SATA_01 experienced a long CP.- 外部 キャッシュは、次のエラーを書き込みます。
Tue Nov 08 02:00:11 CST [AI-A: wafl_exempt07: ems.engine.suppressed:debug]: Event 'extCache.io.writeError' suppressed 77 times in last 457317 seconds.Tue Nov 08 02:00:11 CST [AI-A: wafl_exempt07: extCache.io.writeError:notice]: WAFL external cache I/O write error: Insertq_save: unable to alloc context chain, code 0- カードのステータスは
sysconfig -a出力の障害です。
slot 3: Flash Cache NVMeSerial Number: S3K6NX0M200744Part Number: 119-00329Hardware Revision: A0Firmware Version: NA01Model Name: X3311ACapacity: 1024 GBVendor Name: SamsungState: failed- 高レイテンシは観察されません。