NetApp AFF-A400における高遅延と断続的なマルチパス経路損失
環境
- NetApp AFF-A400
- ONTAP 9.13.1P6
- iSCSI SAN環境
- マルチパスおよびPacemaker A-S構成を使用するLinuxベアメタルホスト
問題
特定のホストで断続的なマルチパス経路の損失と高いディスク待機時間が発生
マルチパスログには、パスの障害と復旧状況が表示されます:
Host1 multipathd[971]: 3600a098038314b646f2455514f435474: sdg - tur checker timed outHost1 kernel: device-mapper: multipath: 253:18: Failing path 8:96.Host1 pacemaker-controld[15153]: notice: High CPU load detected: 36.180000ONTAPパフォーマンス指標によると、特に「suspend other」カテゴリで高いレイテンシが示されています。
WAFL_SPINNP_WRITE-VOLUME_FENCED 109939242.50VOL_GET_WAFL_STATS-VOLUME_FENCED 102011041.50対応する時刻のEMSログには複数の
wafl.vol.snap_create.doneイベントが表示されます:[Filer1:wafl_exempt11:wafl.vol.snap_create.done:info]: params:{'vol':'...','run_time':'1144'}