CassandraデータベースによるStorageGRIDのCPU利用率が高いと、S3クライアントのレイテンシが増加します
環境
- NetApp StorageGRID
- ソフトウェアリリース11.6以降のバージョン
問題
- 以下に示す指標はすべて、StorageGRIDのグリッドマネージャの [Support] > [Metrics]で確認できます。
- ストレージノードでは、CassandraのCPU利用率が85%を超え、 I/O 待機時間が最小限に抑えられています。これは 、Node(Internal Use) Grafanaダッシュボードにあります。
- Cassandra ReadStageは一貫して最大レベルに達しています。これは 、Cassandra Node OverviewGrafanaダッシュボードで確認できます。

- 1つのCassandraテーブルでは、数百秒という非常に高いレイテンシが示されています。これは 、Cassandra Node Overview Grafanaダッシュボードで確認できます。
- 次の例は、このような高レイテンシのOBJECT_BY_VERSIONを示しています。 任意のテーブルである可能性があることに注意してください。
- 次のコマンドは、ノードのCassandraディレクトリに100を超えるエントリを返します。ローテーションされたログファイル(つまり
jstack.log.1
)を確認することを検討してください。
# cd /var/local/log/cassandra/jstack/
# grep -c Murmur3 jstack.log
8393