FlexCacheを使用してクラスタを9.15.1にアップグレードすると、NFSアクセスが停止し、CLIコマンドの応答が遅くなる
環境
- ONTAP 9 .15.1以上
- FlexCache
- NFS
問題
- FlexCacheをホストしているノードを 9.15.1以降にアップグレードするとNFSアクセスが停止し、ほとんどのCLIコマンドがハングするか応答の受信に時間がかかる
- ログにも次の情報が記録されています。
- sktrace.logで、低速のSPINVFS_FILEOPS_SPINVFS_TIMEが「<OP> TIME =<val>」で 5000を超えると表示される
- SPINVFS_FILEOPS_WRITERPC:spin_writerpc end:tid=(123456:spiniod 3)vnode 0xfffff1234a5678b0 DSID 0xa12b34cd FID 12345、err=0、time=7227 ms
- mgwd.logは'sqlite mutex_trace: long delay in enter'をログに記録することがあります
- [kern_mgwd:info:3822] 0xabcdef01234:0:警告:sql_context:sqlite_mutex_leave_traced:src/sql_context.cc:609 sqlite mutex_trace:mutex 0x123a01234のenterでの長い遅延(6353ms)
- EMSが CTRAN 接続の終了をログに記録することがある
- CsmMpAgentThread:csm.connClose:debug ]:タグCTRANを使用したセッション(req=node:dblade、rsp=node:dblade、uniquifier=0b01234567890123):ローカルLIF 0からリモートIPへの接続が閉じています。
- CsmMpAgentThread:csm.connClose:debug ]:タグCTRANを使用したセッション(req=node:dblade、rsp=node:dblade、uniquifier=0b01234567890123):ローカルLIF 0からリモートIPへの接続が閉じています。
- sktrace.logで、低速のSPINVFS_FILEOPS_SPINVFS_TIMEが「<OP> TIME =<val>」で 5000を超えると表示される
- CPUコアが48個以上あり、 多数のリモートノードに対して多数のFlexCache関係が確立されているノードでは、この問題が使用される可能性が高くなります。