AFF A400からvifmgr.rpc.nblad.timeoutsが報告されました:スロット3のクラスタポートで致命的エラーが発生したため、エラーが発生しました
環境
- AFF A400
- ONTAP 9.7 - ONTAP 9.7P6
問題
- データサービスが影響を受け、クライアントおよびアプリケーションへのマウントの失敗が発生する可能性があります
- node1のEMSが、EMSおよびVIFMgrで多数のネットワーク関連エラーを報告しています
Sun Jun 14 23:59:05 -0700 [node1: vifmgr: vifmgr.rpc.nblade.timeouts:error]: The Logical Interface Manager (VIFMgr) is not receiving responses from the nblade.
- そのため、これらのエラーは毎日発生します。
- 最終的には、システム停止によってNFSが停止します
- メッセージがVIFMgrを参照しているため、VIFMgrログをチェックし、EMSで最初のエラーが表示されるまでにプロセスタイムアウトが長くないことに気付きました。
00000013.00ffb00c 020caea1 Tue Jun 30 2020 08:20:38 -07:00 [kern_vifmgr:info:6191] [0x813410700] [NbladeWriter::nitroPcpRpcCall] clnt_call idemp RPC timeout (elapsed time: 30s)
00000013.00ffb00d 020caea1 Tue Jun 30 2020 08:20:38 -07:00 [kern_vifmgr:info:6191] [0x813410700] [NbladeWriter::reportHungNblade] Nblade has not responded to nitro RPCs for 1326210 seconds
00000013.00ffb0cd 020caffd Tue Jun 30 2020 08:21:08 -07:00 [kern_vifmgr:info:6191] [0x813410700] [NbladeWriter::nitroPcpRpcCall] clnt_call idemp RPC timeout (elapsed time: 60s)
00000013.00ffb0ce 020caffd Tue Jun 30 2020 08:21:08 -07:00 [kern_vifmgr:info:6191] [0x813410700] [NbladeWriter::nitroPcpRpcCall] long-running operation: procNum=35; time=60024 ms
00000013.00ffb0d0 020caffd Tue Jun 30 2020 08:21:08 -07:00 [kern_vifmgr:info:6191] [0x80bf0dc00] [NbladeWriter::reportHungNblade] Nblade has not responded to nitro RPCs for 1326240 seconds