2ノードから4ノードへのクラスタ拡張時にVMがリブートされる
環境
- ONTAP 9
- Cisco Nexus 3232C
問題
- クラスタを2ノードから4ノードに拡張する際にVMがリブートされた(スイッチレスからスイッチ経由への変換)。
- 2ノードスイッチレスクラスタからCisco Nexus 3232Cクラスタスイッチ 手順を使用するクラスタに移行する。
- ポートe0aを新しいスイッチに接続したあと、クラスタネットワークがデグレード状態になる原因となるCRCエラーが多数報告されることがありました。
ポートをスイッチに移動する前:
-- interface e0a (244 days, 0 hours, 9 minutes, 21 seconds) --
RECEIVE
Total frames: 257g | Frames/second: 12224 | Total bytes: 276t
Bytes/second: 13104k | Total errors: 0 | Errors/minute: 0
Total discards: 0 | Discards/minute: 0 | Multi/broadcast: 1777k
Non-primary u/c: 0 | CRC errors: 0 | Runt frames: 0
ポートをスイッチに移動したあと:
-- interface e0a (244 days, 0 hours, 32 minutes, 51 seconds) --
RECEIVE
Total frames: 257g | Frames/second: 12223 | Total bytes: 276t
Bytes/second: 13107k | Total errors: 46094 | Errors/minute: 0
Total discards: 0 | Discards/minute: 0 | Multi/broadcast: 1777k
Non-primary u/c: 0 | CRC errors: 43246 | Runt frames: 0
EMS
[Node2-02: vifmgr: vifmgr.cluscheck.hwerrors:alert]: Port e0a on node tenali-02 is reporting a high number (at least 1 per 1000 packets) of observed hardware errors (CRC, length, alignment, dropped).
[Node2-02: vifmgr: callhome.clus.net.degraded:alert]: Call home for CLUSTER NETWORK DEGRADED: CRC Errors Detected - High CRC errors detected on port e0a node Node2-02
- Vifmgrがオフラインになるのが見えました。
Vifmgr
[kern_vifmgr:info:7049] [0x80c13b200] [FailoverMgr::localNodeDown] VifMgr on node tenali-01 is now out of quorum.
[kern_vifmgr:info:6866] [0x80c140700] [FailoverMgr::localNodeDown] VifMgr on node tenali-02 is now out of quorum.