증상

중복제거와 함께 VMware vSAN을 사용할 경우 디스크 장애가 발생하여 전체 디스크 그룹에 장애가 발생한다. 모든 디스크가 고장난 상태로 나타나므로 고장난 특정 디스크를 식별하기 위해 추가 조사가 필요하다.

중복 제거 지원 클러스터에서 디스크 장애가 발생한 후 vSphere Web Client의 vSAN 상태 서비스 및 vSAN 디스크 보기에는 전체 디스크 그룹이 오프라인 상태임을 반영한다:

vSAN Health Service
vSAN Disk Management

UI를 사용하면 vSAN UUID로 장애가 발생한 디스크를 식별할 수 있지만 디바이스 이름이나 위치는 표시되지 않는다.

목적

중복제거와 함께 VMware vSAN을 사용하는 경우 Disk 장애가 발생하면 전체 Disk 그룹에 장애가 발생한다. 이 문서는 특정 고장 디스크를 식별하기 위한 정보를 제공한다.

원인

vSAN 중복 제거는 디스크 그룹 수준에서 수행된다. 중복 제거가 사용 중일 때 구성 요소와 관련된 데이터는 디스크 그룹의 모든 디스크에 존재할 수 있다. 이렇게 하면 디스크 그룹의 모든 디스크 간에 상호 종속성이 생성된다. 그 결과 디스크 그룹에서 단일 디스크가 고장나면 전체 디스크 그룹에 장애가 발생한다. UI는 이 디스크 그룹 장애를 반영하지만 디스크 그룹 장애를 트리거한 장치에 대한 정보를 식별하는 장치는 공개하지 않는다.

해결

장애를 일으킨 특정 장치를 식별하려면:

  1. SSH 또는 KVM/물리적 콘솔을 통해 해당 ESXi 호스트에 로그인한다.
  2. 다음 명령을 사용하여 vSAN 디스크 리스트:
# esxcli vsan storage list
  1. 출력을 검사한다. 장치 중 하나에 연결된 UUID가 표시되지 않고 온디스크 포맷 버전이 <Unknown>으로 보고된다.
    예를 들면 다음과 같다:
naa.6000c29c53fc02afe598901871729854
Device: naa.6000c29c53fc02afe598901871729854
Display Name: naa.6000c29c53fc02afe598901871729854
Is SSD: false
VSAN UUID:
VSAN Disk Group UUID:
VSAN Disk Group Name:
Used by this host: false
In CMMDS: false
On-disk format version: <Unknown>
Deduplication: false
Compression: false
Checksum:
Checksum OK: false
Is Capacity Tier: false
  1. 이 상태의 장치는 고장난 장치이므로 교체해야 한다.

참고: 디스크 그룹은 먼저 No Data migration 옵션으로 폐기한 다음(디스크 그룹이 손실되었으므로), 장애가 발생한 디스크를 교체하고 디스크 그룹을 다시 생성한다.

관련 정보

필요한 경우, 고장난 장치에 대한 경로 정보를 입수하여 식별에 더욱 도움을 줄 수 있다.
ESXi Shell에서 다음 명령을 실행한다:

# esxcfg-mpath -bd <device>

해결 섹션의 예에서 명령과 예제 출력은 다음과 같다.

# esxcfg-mpath -bd naa.6000c29c53fc02afe598901871729854
naa.6000c29c53fc02afe598901871729854 : VMware Serial Attached SCSI Disk (naa.6000c29c53fc02afe598901871729854)
vmhba1:C0:T1:L0 LUN:0 state:active sas Adapter: 5005056f7c188c11 Target: 5000c29c53fc02af

디바이스는 vmhba1의 대상 #1입니다.

디스크 위치에 대한 자세한 내용은 VMware Virtual SAN 관리 가이드(6.5, 6.0)의 Enable and Disable Locator LEDs 섹션을 참조한다.

Spread the love

Leave a Reply