メインコンテンツまでスキップ
Effective December 3 - NetApp adopts Microsoft’s Business-to-Customer (B2C) identity management to simplify and provide secure access to NetApp resources. For accounts that did not pre-register (prior to Dec 3) access to your NetApp data may take up to 1 hour as your legacy NSS ID is synchronized to the new B2C identity. To learn more, Read the FAQ and Watch the video.

MetroCluster 構成での Solaris ホストのサポートに関する考慮事項

Views:
29
Visibility:
Public
Votes:
0
Category:
metrocluster
Specialty:
metrocluster
Last Updated:

環境

  • MetroCluster 構成での Solaris ホストのサポートに関する考慮事項
  • MetroCluster
  • ONTAP 9

回答

デフォルトでは、 Solaris OS は、「 All Path Down 」( APD )を最大 20 秒維持できます。これは、 fcp_offline_delay パラメータで制御されます。  parameter.
ネゴシエートスイッチオーバー、スイッチバック、予期しないスイッチオーバーのタイブレーカ、計画外のスイッチオーバーの自動化など、すべての MetroCluster ワークフローで Solaris ホストを中断せずに継続するには、 fcp_offline_delay を 120 秒に設定することを推奨します。

MetroCluster のサポートに関する重要な考慮事項:

ローカル HA フェイルオーバーへのホスト応答

fcp_offline_delay の値を大きくすると、
ローカル HA フェイルオーバー中にアプリケーションサービスの再開時間が長くなります(ノードパニックが発生したあと、パニック状態にあるノードのテイクオーバーが正常に行われます)。たとえば、 fcp_offline_delay = 120 s のようになります。 Solaris クライアントでは、アプリケーションサービスを再開するのに最大 120 秒かかることがあります。

FCP エラー処理

デフォルト値の fcp_offline_delay を使用すると、イニシエータポートの接続に失敗した場合、 FCP ドライバは 110 秒を要して上位レイヤ( MPxIO )に通知します。fcp_offline_delay を 120 秒に増やすと、ドライバが上位レイヤ( MPxIO )に通知するためにかかる合計時間は 210 秒になります。これにより、 I/O 遅延が発生する可能性があります。Oracle 文書 ID : 1018952.1 を参照してください。ファイバチャネルポートに障害が発生すると、デバイスがオフラインになるまでに 110 秒の遅延が発生することがあります。

サードパーティ製アレイとの共存

fcp_offline_delay パラメータはグローバルパラメータであるため、 FCP ドライバに接続されているすべてのストレージとの相互作用に影響を与える可能性があります。

fcp_offline_delay の設定を変更する方法

Solaris 10u8 、 10u9
、 10u10 、 10u11 の場合: fcp_offline_delay は /kernel/drvfcp.conf ファイルで設定できます。次の行を追加すると、タイマーが 120 秒に変更されます。
fcp_offline_delay = 120 。
設定を有効にするには、ホストをリブートする必要があります。
ホストが起動したら、カーネルにパラメータが設定されているかどうかを確認します。
# mdb -k
> fcp_offline_delay/D
fcp_offline_delay:
fcp_offline_delay:      120
>Ctrl_D

Solaris 11
では、 /etc/driver/drv/fcp.conf ファイルに fcp_offline_delay を設定できます。次の行を追加すると、タイマーが 120 秒に変更されます。
fcp_offline_delay = 120 。
設定を有効にするには、ホストをリブートする必要があります。
ホストが起動したら、カーネルにパラメータが設定されているかどうかを確認します。
# mdb -k
> fcp_offline_delay/D
fcp_offline_delay:
fcp_offline_delay:      120
>Ctrl_D

ホストのリカバリの例:

災害によるフェイルオーバーまたは予期しないスイッチオーバーが発生し、ホスト原因アプリケーションが失敗する可能性がある異常な時間( 120 秒を超える)が発生した場合は、ホストアプリケーションを修復する前に、次の例を参照してください。

zpool Recovery :

すべての LUN がオンラインであることを確認します。

次のコマンドを実行します。

# zpool list
NAME             SIZE  ALLOC   FREE  CAP  HEALTH  ALTROOT
n_zpool_site_a  99.4G  1.31G  98.1G   1%  OFFLINE  -
n_zpool_site_b   124G  2.28G   122G   1%  OFFLINE  -
 
Check the individual pool status:
# zpool status n_zpool_site_b
  pool: n_zpool_site_b
 state: SUSPENDED ==============è>>>>>>>>>>>>>> POOL SUSPENDED
status: One or more devices are faulted in response to IO failures.
action: Make sure the affected devices are connected, then run 'zpool clear'.
see: http://www.sun.com/msg/ZFS-8000-HC
scan: none requested
config:
 
        NAME                                     STATE     READ WRITE CKSUM
        n_zpool_site_b                           UNAVAIL      1 1.64K     0  experienced I/O failures
          c0t600A098051764656362B45346144764Bd0  UNAVAIL      1     0     0  experienced I/O failures
          c0t600A098051764656362B453461447649d0  UNAVAIL      1    40     0  experienced I/O failures
          c0t600A098051764656362B453461447648d0  UNAVAIL      0    38     0  experienced I/O failures
          c0t600A098051764656362B453461447647d0  UNAVAIL      0    28     0  experienced I/O failures
          c0t600A098051764656362B453461447646d0  UNAVAIL      0    34     0  experienced I/O failures
          c0t600A09805176465657244536514A7647d0  UNAVAIL      0 1.03K     0  experienced I/O failures
          c0t600A098051764656362B453461447645d0  UNAVAIL      0    32     0  experienced I/O failures
          c0t600A098051764656362B45346144764Ad0  UNAVAIL      0    34     0  experienced I/O failures
          c0t600A09805176465657244536514A764Ad0  UNAVAIL      0 1.03K     0  experienced I/O failures
          c0t600A09805176465657244536514A764Bd0  UNAVAIL      0 1.04K     0  experienced I/O failures
          c0t600A098051764656362B45346145464Cd0  UNAVAIL      1     2     0  experienced I/O failures
 
The above pool has degraded.

次のコマンドを実行してプールステータスをクリアします。

#zpool clear n_zpool_site_b                    

プールを再度確認します。

# zpool status n_zpool_site_b
  pool: n_zpool_site_b
 state: ONLINE
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://www.sun.com/msg/ZFS-8000-8A
 scan: none requested
config:
 
        NAME                                     STATE     READ WRITE CKSUM
        n_zpool_site_b                           ONLINE       0     0     0
          c0t600A098051764656362B45346144764Bd0  ONLINE       0     0     0
          c0t600A098051764656362B453461447649d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447648d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447647d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447646d0  ONLINE       0     0     0
          c0t600A09805176465657244536514A7647d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447645d0  ONLINE       0     0     0
          c0t600A098051764656362B45346144764Ad0  ONLINE       0     0     0
          c0t600A09805176465657244536514A764Ad0  ONLINE       0     0     0
          c0t600A09805176465657244536514A764Bd0  ONLINE       0     0     0
          c0t600A098051764656362B45346145464Cd0  ONLINE       0     0     0
 
errors: 1679 data errors, use '-v' for a list
 

プールのステータスを再度確認します。プール内のディスクがデグレード状態になっています。

[22] 05:44:07 (root@host1) /
# zpool status n_zpool_site_b -v
cannot open '-v': name must begin with a letter
  pool: n_zpool_site_b
 state: DEGRADED
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://www.sun.com/msg/ZFS-8000-9P
 scan: scrub repaired 0 in 0h0m with 0 errors on Fri Dec  4 05:44:17 2015
config:
 
        NAME                                     STATE     READ WRITE CKSUM
        n_zpool_site_b                           DEGRADED     0     0     0
          c0t600A098051764656362B45346144764Bd0  ONLINE       0     0     0
          c0t600A098051764656362B453461447649d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447648d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447647d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447646d0  ONLINE       0     0     0
          c0t600A09805176465657244536514A7647d0  DEGRADED     0     0     0  too many errors
          c0t600A098051764656362B453461447645d0  ONLINE      0     0     0
          c0t600A098051764656362B45346144764Ad0  ONLINE       0     0     0
          c0t600A09805176465657244536514A764Ad0  ONLINE       0     0     0
          c0t600A09805176465657244536514A764Bd0  ONLINE       0     0     0
          c0t600A098051764656362B45346145464Cd0  ONLINE       0     0     0
 
errors: No known data errors

次のコマンドを実行して、ディスクエラーを解消します。

# zpool clear n_zpool_site_b c0t600A09805176465657244536514A7647d0
 
[24] 05:45:17 (root@host1) /
# zpool status n_zpool_site_b -v
cannot open '-v': name must begin with a letter
  pool: n_zpool_site_b
 state: ONLINE
 scan: scrub repaired 0 in 0h0m with 0 errors on Fri Dec  4 05:44:17 2015
config:
 
        NAME                                    STATE     READ WRITE CKSUM
        n_zpool_site_b                           ONLINE       0     0     0
          c0t600A098051764656362B45346144764Bd0  ONLINE       0     0     0
          c0t600A098051764656362B453461447649d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447648d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447647d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447646d0  ONLINE       0     0     0
          c0t600A09805176465657244536514A7647d0  ONLINE       0     0     0
          c0t600A098051764656362B453461447645d0  ONLINE       0     0     0
          c0t600A098051764656362B45346144764Ad0  ONLINE       0     0     0
          c0t600A09805176465657244536514A764Ad0  ONLINE       0     0     0
          c0t600A09805176465657244536514A764Bd0  ONLINE       0     0     0
          c0t600A098051764656362B45346145464Cd0  ONLINE       0     0     0
 
errors: No known data errors
 
or export and import the zpool.
 
# zpool export n_zpool_site_b
# zpool import n_zpool_site_b

プールは現在オンラインです。
上記の手順でプールをリカバリできない場合は、ホストを再起動します。

Storage Virtual Machine ( SVM
)( Metaset )すべての LUN がオンラインであることを確認し、システムを再起動してから、 Storage Virtual Machine ( SVM )をマウントします。

追加情報

ここにテキストを追加します。