メインコンテンツまでスキップ

ストレージシステムとシェルフの温度しきい値の意味は何ですか。

Views:
110
Visibility:
Public
Votes:
1
Category:
fas-systems
Specialty:
hw
Last Updated:

環境

  • すべての FAS システム
  • すべての AFF システム
  • 環境チェック

回答

environment コマンドを使用すると、ストレージ・システムおよびシェルフ環境に関する情報を表示できます。この表示には、いくつかの値が表示されます。ディスプレイの上部には次の情報が表示されます。

PSU Status ok
Temperature ok
Voltage ok
System Fan Fru 1 ok
System Fan Fru 2 ok
PSU 1 Fan ok
PSU 2 Fan ok
NVRAM5-temperature-3 ok
NVRAM5-battery-3 ok.

この表示には ok ステータスが表示されますが、次のコマンドを使用して詳細情報を取得できます。

Data ONTAP 8 7-Mode

> environment chassis list-sensors temperature

ONTAP クラスタモード:

::> system node run -node <node name> -command environment chassis list-sensors

::> system node environment sensors show 

これにより、ストレージシステムのシャーシ内のすべての温度センサーが一覧表示されます。

例:

Temp_Unit_A, temperature, lm81_first, 0, normal, mon: Temperature, 27C, -1C, -1C, 48C, 50C

これは、このセンサーが正常であることを示しています。このセンサの電流値は 27 ° C です

重大度が低い警告と低い警告は -1C 、警告が 48C 、重大度が高い警告は 50C です

警告レベルに達すると、 AutoSupport が生成され、クリティカルレベルに達するとストレージシステムがシャットダウンします。これは、ストレージシステムの即時シャットダウンと電源オフになります。

アレイの電源喪失シナリオと同様に、 NVRAM に確認されていないクライアントの処理中データが失われることがあります。これは、システムの損傷を防ぐために行われます。

システムに搭載されているシェルフごとに、次のような表示が表示されます。

        Temperature Sensor installed element list: 1, 2, 3; with error: none
        Shelf temperatures by element:
         [1] 38 C (100 F) (ambient) Normal temperature range
         [2] 45 C (113 F) Normal temperature range
         [3] 44 C (111 F) Normal temperature range
        Temperature thresholds by element:
         [1] High critical: 50 C (122 F); high warning 40 C (104 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)
         [2] High critical: 63 C (145 F); high warning 53 C (127 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)
         [3] High critical: 63 C (145 F); high warning 53 C (127 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)

各シェルフには 3 つのセンサーがあります。センサー 1 はシェルフに、センサー 2 は A モジュールに、センサー 3 は B モジュールにあります。

これは、センサー 1 、 2 、 3 がインストールされており、エラー状態を示すセンサーがないことを示しています。エラーが発生した場合、センサーの番号は次のように表示されます。

Temperature Sensor installed element list: 1, 2, 3; with error: 2

これは、 A モジュールの温度センサーに何らかの障害があることを示します。正確な問題を特定するには、残りのディスプレイを分析する必要があります。

出力のこの部分には、各要素の現在の温度と、その温度が正常範囲内にあるかどうかが表示されます。

        Shelf temperatures by element:
         [1] 38 C (100 F) (ambient) Normal temperature range
         [2] 45 C (113 F) Normal temperature range
         [3] 44 C (111 F) Normal temperature range


表示のこの部分には、特定のアクションが発生したしきい値が表示されます。

        Temperature thresholds by element:
         [1] High critical: 50 C (122 F); high warning 40 C (104 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)
         [2] High critical: 63 C (145 F); high warning 53 C (127 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)
         [3] High critical: 63 C (145 F); high warning 53 C (127 F)
         Low critical: 0C (32 F); low warning 10 C (50 F)

警告しきい値に達すると、警告 AutoSupport が生成されます。シェルフの重大しきい値に達すると、電源はオフになりません。  シェルフセンサーの動作は、シャーシセンサーとは異なります。 

  • センサーに問題がある場合、シェルフの電源はオフになりません
  • シェルフのセンサーの問題が原因で、ストレージシステムがシャットダウンされることはありません

ストレージシステムシャーシおよび各シェルフのしきい値が設定されており、変更できません。センサーがレポートしていない場合は、ファームウェアのバージョンを確認する必要があります。ファームウェアが最新の場合は、センサーに障害がある機器の電源を再投入するか、交換する必要があります。これは、マザーボード、電源、シェルフ、 ESH 、またはエクスパンダモジュールのいずれかです。

追加情報

Common AutoSupport Callhomes の略

callhome.chassis.hitemp
callhome.chassis.overtemp
callhome.chassis.undertemp

 

Scan to view the article on your device