メインコンテンツまでスキップ

複数のディスク障害が発生した場合にアグリゲートがオフラインになるのはなぜですか

Views:
18
Visibility:
Public
Votes:
0
Category:
fas-systems
Specialty:
HW
Last Updated:

環境

  • ONTAP 9
  • AFF
  • FAS

回答

複数のディスク障害の数が RAID 許容範囲のしきい値を超えています
  • RAID 4 の場合は 2 つ以上
  • RAID-DP で 3 つ以上
  • RAID-TEC では 4 つ以上

RAID-DP の例:

Cluster::> run -node Node-01 sysconfig -r

  • バックアップ前:
RAID group Aggr1/plex0/rg1 (normal, block checksums)

RAID Disk    Device      HA  SHELF BAY CHAN Pool Type  RPM  Used (MB/blks)    Phys (MB/blks)
---------    ------      ------------- ---- ---- ---- ----- --------------    --------------
dparity     0a.12.16    0a    12  16  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
parity      0a.12.17    0a    12  17  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
...
data        0a.11.6     0a    11  6   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.7     0a    11  7   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.8     0a    11  8   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.9     0a    11  9   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.10    0a    11  10  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.19    0a    11  19  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.12    0a    11  12  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.13    0a    11  13  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.14    0a    11  14  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.15    0a    11  15  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
...
  • 2つのディスクの障害:
RAID group Aggr1/plex0/rg1 (double degraded, block checksums)

RAID Disk    Device      HA  SHELF BAY CHAN Pool Type  RPM  Used (MB/blks)    Phys (MB/blks)
---------    ------      ------------- ---- ---- ---- ----- --------------    --------------
dparity     0a.12.16    0a    12  16  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
parity      0a.12.17    0a    12  17  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
...
data        0a.11.6     0a    11  6   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data   FAILED          N/A                        857000/ -
data        0a.11.8     0a    11  8   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.9     0a    11  9   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.10    0a    11  10  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.19    0a    11  19  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.12    0a    11  12  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.13    0a    11  13  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data   FAILED          N/A                        857000/ -
data        0a.11.15    0a    11  15  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
...
 
  • 3つ以上のディスク障害:

Aggregate Aggr1 (failed, raid_dp, partial) (block checksums)
  Plex /Aggr1/plex0 (offline, failed, inactive)
    RAID group /Aggr1/plex0/rg1 (normal, block checksums)

RAID Disk    Device      HA  SHELF BAY CHAN Pool Type  RPM  Used (MB/blks)    Phys (MB/blks)
---------    ------      ------------- ---- ---- ---- ----- --------------    --------------
dparity     0a.12.16    0a    12  16  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
parity      0a.12.17    0a    12  17  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
...
data        0a.11.6     0a    11  6   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data    FAILED          N/A                        857000/ -
data        0a.11.11    0a    11  11  SA:B   0   SAS 15000 857000/1755136000 858483/1758174768 (reconstruct stalled)
data        0a.11.9     0a    11  9   SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.10    0a    11  10  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data    FAILED          N/A                        857000/ -
data        0a.11.12    0a    11  12  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data        0a.11.13    0a    11  13  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
data    FAILED          N/A                        857000/ -
data        0a.11.15    0a    11  15  SA:B   0   SAS 10000 857000/1755136000 858483/1758174768
...
Raid group is missing 3 disks.

追加情報

AdditionalInformation_Text
NetApp provides no representations or warranties regarding the accuracy or reliability or serviceability of any information or recommendations provided in this publication or with respect to any results that may be obtained by the use of the information or observance of any recommendations provided herein. The information in this document is distributed AS IS and the use of this information or the implementation of any recommendations or techniques herein is a customer's responsibility and depends on the customer's ability to evaluate and integrate them into the customer's operational environment. This document and the information contained herein may be used solely in connection with the NetApp products discussed in this document.