複数のストレージノードから報告されるインターフェイスのエラー
環境
NetApp Elementソフトウェア12.5以降。
問題
複数のストレージノードが イベントログに以下のメッセージを表示し、未解決の状態のエラーを報告していません。
Errors observed on interface ethxレポートされたノードが、指定されたethxインターフェイスで次のようにRXエラーを受信している場合
2021-06-09 04:05, RX errors 3529 dropped 9825690 overruns 0 frame 3529, RX errors 2980 dropped 9238332 overruns 0 frame 29802021-06-09 06:05, RX errors 3529 dropped 9825932 overruns 0 frame 3529, RX errors 2980 dropped 9238601 overruns 0 frame 29802021-06-09 08:05, RX errors 3529 dropped 9826174 overruns 0 frame 3529, RX errors 2980 dropped 9238859 overruns 0 frame 29802021-06-09 10:05, RX errors 3529 dropped 9826416 overruns 0 frame 3529, RX errors 2980 dropped 9239101 overruns 0 frame 29802021-06-09 12:05, RX errors 3529 dropped 9826665 overruns 0 frame 3529, RX errors 2980 dropped 9239343 overruns 0 frame 29802021-06-09 14:05, RX errors 3529 dropped 9826956 overruns 0 frame 3529, RX errors 2980 dropped 9239585 overruns 0 frame 2980以下のトラブルシューティング手順を試すことができます。
- 同じネットワークに接続されているノードの総数をメモします。
- 問題が発生しているノードと発生していないノードを特定します。これをActive IQイベントメッセージで検証します。
- すべてのストレージノード(eth0インターフェイスとeth1インターフェイス)を2つのスイッチに接続します。すべてのeth0インターフェイスはスイッチAに接続され、すべてのeth1インターフェイスはスイッチBに接続されます。
- 「Errors Observed on interface ethx」(ノードログのRXエラー)が表示されていないすべてのストレージノードについて、どのスイッチポートに接続されているかを確認します。問題を報告していないストレージノードに接続されたスイッチインターフェイスで、CRC/TX/RXエラーがないかスイッチログを確認します。
- 同じインターフェイスのスイッチログにCRC/TX/RXエラーが記録されている場合は、eth0インターフェイスケーブルを同じストレージノードのeth1と交換します。同じスイッチまたは別のスイッチでスイッチログにエラーが表示されていないかどうかを確認して、障害のあるハードウェア(SFPまたはケーブルに問題がある可能性があります)を特定します。