メインコンテンツまでスキップ

fchosts3 コマンド( supportData コレクションの一部)を使用してフロントエンド SAN の問題をトラブルシューティングする方法

Views:
10
Visibility:
Public
Votes:
0
Category:
fc-series
Specialty:
esg
Last Updated:

のとう

のとう

に適用されます

Fibre Channel

説明

はじめに

この資料fcHosts 3では、受信した不良 FC フレームが多すぎる場合に、フロントエンド SAN でシェルコマンドを使用して不良コンポーネントを検出する方法について説明します。このような場合、コントローラは次のいずれかのイベントをメジャーイベントログ( MEL )に記録します。

0x1207 Fibre channel link errors - threshold exceeded
or
0x1206 Fibre channel link errors continue

しきい値は、オフセット 0x38 の NVSRAM で定義されます。経験則では、上記のイベントがイベントログに記録されている場合は、影響を受けるサーバにも影響があるため、問題を調査する必要があります。

概要

fcHosts 3シェルコマンドは非常に古いが便利なコマンドです。statecapturedata.txtFC ホスト接続が検出された場合は、 SupportData コレクション(でキャプチャ)に含まれます。出力には、 FC HBA と HBA が記録されているコントローラポート間の通信履歴が表示されます。50 個のイベントが表示されるイベントの最大数です。このコマンドの欠点は、出力には時刻だけが表示され、日付は表示されないため、イベントが発生するまでの日数があることです。ただし、問題が発生した場合は、通常、短時間で多くのイベントがログに記録されます。ほとんどの場合、 SupportData がキャプチャされた現在の日付から記録されます。

例:

次に、表示される情報の例を示します。

Executing fcHosts(3,0,0,0,0,0,0,0,0,0) on controller A:

<-snip->

=============== HOST 10 =====================

Hst-Role(Ch) PortId       PortWwn            NodeWwn      DstNPort  CmdRecv Label
10-Host( 2)  0e0000  10008c7c-ff2057ba  20008c7c-ff2057ba 0eaabf80   195719 SRV-MDC2-HBA-P0

PERMITS: 0x00000008 HsdPort
FLAGS:   0x00001406 Plogi Prli LoginRcvd Analyze
LastActivity: 11/19/13-17:15:47 (GMT)

HOST LOG==> logCtl:0eab1540  logIndex:   5  goodIoCount:88836
            dstNPort:0eaabf80  maxIndex:  50   logIoCount:1

                                        RepeatCounts -- IO Types
                                   (R=read,W=write,O=other,N=nonScsi)
Num Time       LogCode  Qualifier   LogCode     GoodIo      Outstand
                                    Cnt Type    Cnt Type    Cnt Type
  1 11:58:40     First   00000000     1 ---- >100K RWO-      1 ----
  2 13:45:47  RscnRecv   000e0000     1 ----      1 ----      1 ----
  3 13:45:47    Logout    RscnMis     1 ----      1 ----      1 ----
  4 13:49:51     Login   ff2057ba     1 ----  <100 R---      1 ----
  5 13:49:51   ChkCond  06290400  <10 R---  <100 R---      1 R---
  6 13:49:51  RscnRecv   000e0000     1 ---- <100K RWO-      1 ----

説明

10-Host  : 10 は、同じコントローラの TDITNALL 出力の ITN 番号と同じです
Ch(X)     2 は、 HBA がログインしているチャネル(ホストポート)です。ホストポート
PortId   を調べるには、 fcall/chall を使用します。 0e0000 は、 HBA が接続されているスイッチポートの 24 ビットアドレス
PortWwn  です。 10008c7c-ff2057ba は HBA の FC ポート WWN
NodeWwn   です。 20008c7c-ff2057ba は HBA の FC ノード WWN
CmdRecv   です。 195719 は、この HBA から受信した SCSI コマンドの数
Label    を示しています。 SRV-MDC2-HBA-P0 は、 SANtricity で定義
Time     された HBA のエイリアスです。イベントが発生した時刻(日付がありません)。
LogCode  :発生したイベント
Qualifier :チェック条件( Chkcond )の場合にイベントを修飾するイベントは、センスデータ:
LogCodeCntこの LogCode イベントの連続発生回数
GoodIo Cntです。 1 回目の発生後にステータスが「 Good 」になって返された IOS の数
Outst. Cnt: 1 回目の発生がログに記録された未処理の IOS の数

上記の例からは、次のようになります。

WWPN 10008C7C-FF2057BA を持つ HBA は、 FC スイッチポート 0x0E0000 に接続されています。チャネル 2 を介してコントローラに接続さfcAll/challれている(実際のホストポートを見つけるために使用)。ユーザーが SANtricity のホストマッピングセクションで HBA にエイリアス SRV-MDC2-HBA-P0 を割り当てました。履歴から、 HBA が問題なく複数の IOS を送信し、 FC ポートのログアウトログイン後に再スキャンを送信することが確認できます(キャプチャの開始)。コントローラは、「デバイス内部リセット」にデコードされる Sense Key 06 ASC29 ASCQ04 を使用して、ログアウト / ログインを確認しました。次に HBA から再スキャンが送信されました。全体的に、 HBA とコントローラ間の通信の問題は示されません。ログイン / ログアウトは、通常は問題ではありません。

ログコードと資格のリスト

ログコード:

AbtsRecv = セッションの中断を受信しました(パスの問題を示しています)
ChkCond  = コントローラが SCSI チェック条件(センスデータ)を HBA に送信しました (詳細については、「 Qualifier 」
First   を参照) = キャプチャの開始
GoodIo   = HBA Send Good IO
Login    = HBA did a port login into the controller=
Logout   HBA logged out of the controller=
LinkDown HBA への接続がダウン
Qfull   している = キューがいっぱいになっている条件が満たされて
ResvCon いる = コントローラが HBA に予約の競合を返しました (クラスタ構成では正常)
RscnRecv = HBA が再スキャン
ScsiStat を送信 = その他の SCSI ステータスが発生しました

修飾子(最も一般的なもののみ)

Count   = count (低レベル FC エラー)パスの問題の兆候)
Discnct  = 切断
FreezeTO = フリーズタイムアウト
Logo     = ログアウト
Observed = イベント監視
ReplyTO  = リプレイタイムアウト (パスの問題を示す
RscnMis ) = デバイスの再スキャンが見つかりません

次に、 HBA がコントローラと通信する際の問題の例を 2 つ示します。

 RepeatCounts -- IO Types (R=read,W=write,O=other,N=nonScsi) Num Time LogCode Qualifier LogCode GoodIo Outstand Cnt Type Cnt Type Cnt Type42 15:20:40 GoodIo 00000000 1 ---- <100 -W-- 1 -W-- 43 15:21:16 SetError ReplyTO 1 -W-- <100 -W-- 1 -W-- 44 15:21:21 ChkCond 0b470000 <5 -W-- <100 -W-- <5 -W-- 45 15:21:26 SetError ReplyTO 1 -W-- <10 RW-- 1 -W-- 46 15:21:28 ChkCond 0b470000 <5 -W-- <100 -W-- 1 -W-- 47 15:22:36 AbtsRecv 00000000 1 -W-- <1K RW-- 1 -W-- 48 15:22:42 ChkCond 0b470000 <10 -W-- <1K RW-- 1 -W-- 49 15:23:11 GoodIo 00000000 1 ---- <10 -W-- 1 -W-- 50 15:23:12 ChkCond 0b470000 <10 -W-- <1K RW-- 1 -W-- 
 The sense 0b/47/00 decodes to "SCSI Parity Error". In a FC work this means that the the controller received a FC frame with incorrect CRC. 

および

 42 17:13:11 SetError ReplyTO <5 -W-- <1K -W-- <5 -W-- 43 17:13:14 GoodIo 00000000 1 ---- <1K -W-- <10 -W-- 44 17:13:14 SetError ReplyTO <5 -W-- <1K -W-- <5 -W-- 45 17:13:16 GoodIo 00000000 1 ---- <1K -W-- <5 -W-- 46 17:13:19 SetError ReplyTO 1 -W-- <100K RW-- 1 -W-- 47 17:13:55 SetError Count <5 -W-- <1K -W-- 1 -W-- 48 17:13:56 GoodIo 00000000 1 ---- <1K -W-- <5 -W-- 49 17:14:05 SetError ReplyTO <5 -W-- <100 R--- <5 -W-- 50 17:14:12 GoodIo 00000000 1 ---- <100K RW-- 1 R--- 

メモ:上記のエラーが多い HBA がある場合、 HBA に障害があることを自動的に示すわけではありません。これは、 FC フレームが破損しているか、この HBA とコントローラの間のどこかでドロップされていることを意味します。問題の原因となっている可能性があるのは、 HBA が不良であることだけです。

CUSTOMER EXCLUSIVE CONTENT

Registered NetApp customers get unlimited access to our dynamic Knowledge Base.

New authoritative content is published and updated each day by our team of experts.

Current Customer or Partner?

Sign In for unlimited access

New to NetApp?

Learn more about our award-winning Support