[기계번역] vSAN Express Storage Architecture를 사용하는 RAID-1의 성능을 갖춘 RAID-5/6

An Introduction to the vSAN Express Storage Architecture“라는 게시물에서는 VMware가 vSAN 8에 혁신적인 옵션 아키텍처를 도입한 주요 동인에 대해 자세히 설명했습니다. 이 새로운 아키텍처의 가치는 궁극적으로 고객에게 제공하는 이점을 기반으로 합니다. ESA가 제공하는 가장 주목할 만한 기능 중 하나는 성능 저하 없이 RAID-5/6 삭제(erasure) 코딩을 사용하여 공간 효율적인 방식으로 복원력이 뛰어난 데이터를 제공하는 것입니다. 이제 고객은 RAID-1 미러링에 비해 최적의 예측 가능한 공간 절약 수준을 제공하는 삭제 코딩 체계를 사용하여 RAID-1 수준의 성능을 달성할 수 있습니다.

이를 실현하는 방법과 이를 통해 관리자가 해결해야 할 과제를 살펴보겠습니다.

성능/공간 효율성의 균형을 제거

삭제 코딩은 복원력과 공간 효율적인 방식으로 데이터를 저장하는 일반적인 방법입니다. 일반적으로 이러한 방식으로 데이터를 저장하는 데 더 많은 노력과 리소스가 필요하기 때문에 이러한 복원력 있는 데이터 배치 방식을 사용하는 것은 드문 일이 아닙니다. OSA(Original Storage Architecture)를 사용하는 이전 버전의 vSAN은 삭제 코드의 효율성을 높이는 데 큰 진전을 이루었지만, 여전히 이러한 차이는 있었습니다. 관리자는 지정된 워크로드에 대해 성능 또는 공간 효율성 중 무엇이 더 중요한지를 기준으로 스토리지 정책 규칙을 결정해야 했습니다. 스토리지 정책을 통해 비교적 쉽게 조정할 수 있었지만, 이와 같은 변수를 제거할 수 있다면 vSAN을 훨씬 쉽게 사용할 수 있습니다.

vSAN ESA가 성능 저하 없이 성능을 달성한 방법

성능/공간 효율성에 대한 절충은 부분적으로 vSAN ESA의 새로운 특허 로그 구조 파일 시스템(vSAN LFS)과 최적화된 데이터 구조를 통해 이루어집니다. “로그 구조 파일 시스템(log-structured file system)”에 대한 참조는 NTFS, ext4 등과 같은 전통적인 파일 시스템을 참조하지 않습니다. 이 일반적인 업계 용어는 스토리지 서브시스템에서 데이터와 메타데이터를 유지하는 방법을 의미합니다.

그림 1에서는 RAID-6를 사용하여 FTT=2의 복원력이 할당된 VM에 대한 단순화된 데이터 경로를 보여 줍니다. vSAN LFS는 들어오는 쓰기를 수집하여 병합한 후 메타데이터로 패키징한 다음 해당 개체에 연결된 내구성 있는 로그에 씁니다. 내구성 로그가 패키지 데이터를 수신하면 게스트 VM에 쓰기 확인 응답을 반환하여 지연 시간을 최소화합니다.

이 내구성이 뛰어난 로그는 “성능 다리(performance leg)”로 알려진 객체의 데이터 구조의 새로운 분기에 존재합니다. 이 내구성 있는 로그의 데이터는 둘 이상의 호스트에서 미러링된 방식으로 구성 요소로 저장됩니다. RAID-5를 사용하여 FTT=1이 할당된 개체의 경우 양방향 미러를 생성합니다. RAID-6의 경우 3방향 미러가 생성됩니다.

그림 1에 이어 내구성 로그의 데이터가 축적되면 LFS는 이러한 대규모 데이터 덩어리를 가져와 “용량 다리(capacity leg)”라고 하는 객체 데이터 구조의 다른 분기에 기록함으로써 새로운 들어오는 I/O를 위한 공간을 확보하게 됩니다. 데이터를 개체(RAID-5 또는 RAID-6)에 할당된 스토리지 정책을 반영하는 전체 정렬된 전체 스트라이프 쓰기로 전송합니다. 다른 접근 방식에서 찾을 수 있는 읽기/수정/쓰기 프로세스를 방지합니다. 그 결과 CPU 및 I/O 증폭을 최소화하면서 매우 효율적이고, 크고, 완전히 정렬된 전체 스트라이프 쓰기가 가능합니다.

vSAN LFS는 용량 레그의 전체 스트라이프 쓰기에만 데이터 페이로드를 씁니다. 해당 데이터 청크와 연결된 메타데이터는 메타데이터 로그로 전환되어 빠르게 액세스하고 더 오랜 기간 동안 보존할 수 있습니다. LFS에는 B-Tree라고 하는 여러 데이터 트리 구조를 사용하여 메타데이터를 더 오래 보존할 수 있는 다른 메커니즘이 있습니다.

그림 2에서는 클러스터의 vSAN 호스트 간에 이 RAID-6 개체가 배치되는 방법을 보여 줍니다. 개체의 성능 레그에 있는 구성 요소는 항상 동일한 개체의 용량 레그에 있는 구성 요소와 동일한 호스트에 있습니다. 구성 요소는 vSAN의 구현 세부 정보일 뿐이므로 관리자는 아무것도 다르게 관리할 필요가 없습니다.

이 성능 레그가 얼마나 많은 추가 용량을 소비하는지 궁금할 수 있습니다. 개체별로 존재하지만, 영구 스토리지 영역에 데이터를 파이프라인화할 수 있을 정도로 매우 작습니다. 이렇게 세분화된 수준에서는 ESA를 사용하여 vSAN 클러스터 설계에 추가 사이징을 고려할 필요가 없습니다. 이는 vSAN 8의 ESA를 통해 요청된 스토리지 디바이스가 용량에 기여하는 방법을 보여 주는 좋은 예입니다.

또한 RAID-5를 사용하는 FTT=1에는 특히 새롭고 고유한 특성이 몇 가지 있지만, 이는 다른 블로그 게시물에서 설명합니다.

권장 사항: 클러스터에서 vSAN ESA를 사용하는 경우 데이터 배치 체계를 지원하는 모든 클러스터 유형 및 크기에 대해 RAID-5/6 삭제 코딩을 사용하도록 안내합니다. 스트레치드 클러스터의 사이트 레벨 허용 오차에는 RAID-1 미러링이, 2-노드 클러스터의 경우 호스트 레벨 허용 오차에는 여전히 필요합니다. 그러나 이러한 토폴로지의 2차 복원력은 RAID-5/6 삭제 코딩의 좋은 후보입니다.

의미

위에서 설명한 개선 사항은 대부분 사용자에게 투명하므로 Original Storage Architecture를 사용하여 vSAN을 관리하는 사용자는 다음과 같은 추가 이점을 제공하더라도 이전과 동일한 방식으로 vSAN을 운영할 수 있습니다.

  • 단순화된 관리입니다. RAID-5/6과 RAID-1 사이의 성능 상충을 없애면 vSAN이 더 간단해집니다.
  • 모든 표준 클러스터 크기에 대해 공간 효율성이 보장됩니다. RAID-5/6 소거 코딩은 RAID-1 미러링과 비교하여 미리 결정된 용량 절감 효과를 제공합니다. 지금이 바로 용량을 절약하고 TCO를 절감할 수 있는 기회입니다. RAID-6를 사용하는 FTT=2는 RAID-1을 사용하는 FTT=2의 3배와 비교하여 1.5배만 소비합니다.
  • 복원력이 높아집니다. 높은 수준의 복원력을 보호하고자 했지만 RAID-1을 사용하는 FT=2의 용량 저하를 초래하거나 RAID-6를 사용하는 FT=2의 성능 저하를 초래하고 싶지 않은 워크로드가 있다면 이 솔루션이 가장 적합합니다. RAID-6를 사용하는 FTT=2는 RAID-1 미러링(2배)을 사용하는 FTT=1을 사용하는 경우보다 복원력이 떨어지고 용량(1.5배)도 적게 소비합니다.

권고. 기본 스토리지 정책을 RAID-1로 유지하고 새로운 스토리지 정책을 사용하여 RAID-5 및 RAID-6를 활용합니다. 스토리지 정책은 vCenter Server의 엔티티이며, RAID-5/6이 적절하지 않거나 지원되지 않는 vSAN OSA(Original Storage Architecture)를 실행하는 많은 클러스터를 담당할 수 있습니다.

요약

VMware의 중요한 목표는 성능과 효율성을 향상시키는 동시에 관리를 간소화하는 것이었습니다. vSAN ESA 덕분에 고객은 이제 모든 워크로드에 대해 RAID-5/6을 선택할 수 있으므로 성능 저하 없이 향상된 공간 효율성을 얻을 수 있습니다.

참조 : https://core.vmware.com/blog/raid-56-performance-raid-1-using-vsan-express-storage-architecture

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like
Read More

vSAN SSD Class

vSAN에서 SSD 선택과 관련해서 Class D, Class F 등의 등급을 선택하라는 내용이 나옵니다. 정확히 어느 정도인지 한번 찾아…
Read More

Using the Perennially Reserved Flag for WSFC RDMs

출처 : https://blogs.vmware.com/virtualblocks/2020/07/31/using-perennially-reserved-flag-wsfc-rdms/ 고객이 환경에서 수많은 pRDM을 사용하는 경우 호스트 부팅 시간이나 스토리지 재스캔에 오랜 시간이 걸릴 수…