ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • VDI 데이터 절감율이 낮은 이유
    스토리지 지식 2020. 12. 27. 21:21

    VDI (Virtual Desktop Infrastructure) 환경의 스토리지 Data Reduction Ratio (데이터 절감율)은 작게는 5:1, 많게는 15:1, 또는 그 이상으로 다양하다. 물론 이 수치는 전체 스토리지 공간을 그만큼 (예를 들면, 10분의 1) 줄여주는 것이므로 용량 절감 효과가 매우 크다고 할 수 있다.

    그러나, 하나의 Master Image를 Full Clone으로 수백~수천개 생성하는데 겨우 x:1에서 1x:1 가량의 데이터 절감율 (중복 제거 및 압축률)을 보고 의아하다고 생각한 적은 없는가? 물론, VM을 대량 생성한 직후에는 100:1 이상의 절감율을 기록하기도 한다.

    그러면, 실제로는 우리가 기대했던 것보다 데이터 절감 효과가 낮게 나오는 이유가 무엇인지, 데이터 절감율을 떨어뜨리지 않고 꾸준히 유지하는 방법은 무엇인지 알아보자.

     

     

    데이터 절감율을 떨어뜨리는 요인

    대량의 VM을 클론으로 생성한 초기에는 모두 동일한 파일이 복제된 것이므로 중복 제거가 잘 될 수 밖에 없다. 그러나, VM을 기동하고 로그인하게 되면 각각의 VM은 개별 사용자 환경으로 바뀌게 된다.

     

    • 중복 제거가 잘 되지 않는 파일

    Big Files on C:

    Windows 운영체제가 설치된 C드라이브 (과거 필자의 PC-Windows 7)에는 상기와 같이 가상 메모리, 메모리 덤프, 아웃룩, 임시 파일 등 사이즈가 큰 파일들이 존재하는데, 이는 대부분 중복 제거와 압축이 잘 되지 않는 바이너리 파일들이다. 또한, 사용자별 로그인을 한 후에는 가상 메모리 파일 (pagafile.sys)이나 임시 파일은 해당 사용자 환경에 따라 독립적인 내용으로 구성되므로 사용자별 고유한 데이터가 된다. 사용자가 MS Outlook을 사용한다면 그 데이터 파일 (.ost)도 마찬가지다. 그리고 이러한 파일들은 C드라이브 전체의 상당 부분을 차지한다. 그러므로 동일한 OS의 사용자 VM이 수백개 이상이라 하더라도 수백대 일이 아닌 그보다 훨씬 낮은 중복 제거와 압축률을 나타내게 된다.

     

    • OS 영역에 사용자 데이터 저장

    VDI를 운영하면서 스토리지 중복 제거 및 압축률이 지속적으로 하락하는 이유는 C드라이브에 사용자들이 작업하는 문서나, 필요한 파일을 저장하기 때문이다. 사용자들의 개인 데이터들은 제각기 다르므로 중복 제거될 확률이 아주 낮을 수 밖에 없기에, 그 양이 점차 늘어나면 당연히 중복 제거율을 낮추는 요인으로 작용한다. 또, 개인이 저장하는 데이터는 매우 다양하며, 일반 문서 외에 그림 또는 미디어 (jpg, mp3, mpg ...), 설치 이미지 파일 등이 포함되면 이 파일들의 특성 상 (이미 압축되어 있음) 압축률이 매우 낮으므로, 이러한 개인 데이터의 비중이 높아지면 압축률은 떨어질 수 밖에 없다.

     

    데이터 절감율을 유지하는 방법

    • OS 영역과 DATA 영역의 명확한 분리

    대부분의 VDI 환경은 OS 영역과 DATA 영역을 구분하여, 주로 OS용으로는 고성능을 위해 올플래시 스토리지를, DATA용으로는 용량에 포커싱하기에 비용 효율적인 NAS로 구성한다. 각기 용도를 정해두고 만들었지만, OS 영역의 성능이 훨씬 좋은 것을 알기에 여기에 사용자 데이터를 저장하는 일이 흔하게 일어난다. 이를 방지하기 위해서는, Third party 툴을 이용하여 사용자 파일을 데이터 영역 (D드라이브)에 저장하도록 강제하거나, Active Directory의 정책으로 통제할 수 있다. 이렇게 되면 스토리지 운영 측면에서도 용량 관리가 보다 수월해지고 예측하기가 쉬워진다.

    OS 영역의 통제가 이루어지지 않으면, 스토리지 업체에서도 그들이 제시하는 중복 제거율을 개런티하기 어려우므로 초기 구축 시 충분한 검토가 필요하다.

     

    시스템별 데이터 절감율이 다른 이유

    같은 스토리지로 VDI를 구축하였다 하더라도, 고객사에 따라 DRR (Data Reduction Ratio)은 천차만별이다. 이는, 사용자들이 사용하는 어플리케이션이 다르기 때문이다. 예를 들면, R&D 부서의 사용자들은 CAD 프로그램, UX 디자인 사용자들은 그래픽 편집 프로그램, 그룹웨어로는 Outlook이나 Notes 등을 사용할 수 있다. 이들 프로그램은 전사에서 동일하게 사용될 수도 있고, 사용자 부서마다 다르게 또는 추가적으로 설치하여 사용할 수도 있다. 각 프로그램들은 파일 형식이 다르기에 중복 제거 및 압축 상황도 다를 수 밖에 없다. 일례로, 웹브라우저로 자체 개발된 포탈을 통해 업무를 보는 환경의 중복 제거 및 압축률은 아주 높게 (15:1 전후) 나타난다. 왜냐하면, 기본 OS 외 특별히 사용하는 프로그램이 없기 때문이다.

     

     

    댓글

Designed by Tistory.