스토리지 성능 이야기

HCI로 가상화 전환 후 VM 성능 이슈

성능 이슈 2020. 12. 20. 23:21

물리 서버 환경에서 신규 구축한 HCI (Hyper Converged Infrastructure)로 업무 이관 후 서비스 오픈 시, SQL Server VM의 CPU가 100%까지 사용되는 이슈에 대해 공유한다. 시스템 환경 가상화 : VMware vSphere 6.7 노드 자원 : Gold 6242 x 2ea (16C, 2.8GHz), 192GB Memory, Hyperthreading On VM 자원 : 24vCPU (12vCPU x 2ea), 12GB Memory 이상 현상 업무 이관 직후 (10시)부터 17시까지 지속적으로 DB VM 및 해당 호스트에서 CPU 사용률이 100%까지 사용됨 아래 서버 CPU 사진 참조 (일부 CPU는 평균값이 30~40% 수준이나, 대부분 Fully 사용 중) DB..

NAS 스토리지 간 파일 복제 시 inode 변경?

성능 이슈 2020. 12. 19. 23:40

NAS (Network Attached Storage)에 접근하여 파일을 Scan 하는 솔루션을 구축하던 중, Storage가 파일의 고윳값인 inode를 매일 바꾸는 작업을 한다는 개발업체의 의견을 통해 고객이 원인 분석 요청해 온 사례를 공유한다. 시스템 환경 File Storage 2대로 Replication 구성되어 있고 10분 단위로 복제 수행 이 중, 복제된 스토리지에 접근하여 파일을 스캔하는 솔루션 구축 중, 이는 NAS의 파일 현황을 모니터링하기 위함 기 NAS 환경은 윈도우 기반, 개발 솔루션 OS는 Linux 이기에, 윈도 공유 파일 시스템을 mount.cifs 명령으로 마운트 하여 액세스하고 있음 이상 현상 스토리지 Daily scan 결과 확인 시, 파일시스템에서 부여하는 파일의 고..

올플래시 스토리지로 교체 후 DB 성능 저하 현상

성능 이슈 2020. 12. 17. 23:54

구형 스토리지를 새로운 AFA (All-Flash Array)로 교체 후 발생한 DB 성능 저하 이슈에 대한 해결 사례를 공유한다. 시스템 환경 Platform : AIX-Based Systems (64-bit) CPU : 40 (10Cores) Memory : 40GB Database : Oracle 11g R2 이상 현상 스토리지 교체 (HDD → SSD) 후 DB (Oracle) 성능이 좋아진 것을 잘 모르겠으며, 오히려 더 느려진 업무도 있다는 고객 피드백 원인 분석 스토리지 교체 전과 후의 Oracle AWR 분석 SGA 크기 : 8800M (sga_target) 교체 전 교체 후 Buffer cache 5728M 3360M Shared pool 2848M 5216M Buffer Hit % 98..

처리량과 응답시간, 어느 것이 더 중요한가?

성능 이론 2020. 12. 16. 23:12

사람들은 흔히 "성능 = 짧은 응답시간" 으로만 여기는 경향이 있다. 응답시간은 업무 유형이 다양하여 동일 기준을 적용하기 어려우므로 업무별 응답시간이 다를 수 밖에 없고, 부하 수준에 따른 변동성을 내포하고 있어 시점에 따라 그 판단이 다를 수 있다. 그러기에 성능의 척도는 빠른 처리보다는 단위 시간당 처리한 트랜잭션량을 우선시한다. 물론, 응답시간과 처리량은 밀접한 상관 관계를 가지고 있지만 이 둘은 엄연히 구분되어야 한다. 다음의 예를 살펴보자. 김해공항에는 5개의 입국 심사대가 있어 5명이 동시에 입국 심사를 받을 수 있다고 가정하자. 한 사람당 심사에 걸리는 시간은 30초라고 한다. 이 때, 입국 심사 시스템의 성능은 무엇으로 평가하고 또 어떻게 개선될 수 있을까? 심사원의 개별 심사 시간일까?..

컴퓨터 시스템의 처리량 곡선

성능 이론 2020. 12. 15. 17:49

일반적인 컴퓨터 시스템의 처리량 (Throughput)은 부하가 증가하면서 선형적으로 증가하다 그 증가세가 서서히 완화되면서 결국엔 한계에 이르게 된다. 부하는 사용자가 시스템에 전달하는 요청 (Request)으로 정의할 수 있다. 아래 그림에서 보듯, Light load zone에서는 부하 증가 시, 처리량 역시 일정하게, 두드러지게 증가하는 모습을 볼 수 있다. 이 때는 시스템의 처리 능력에 부족함이 없기에 일정한 응답시간을 유지할 수 있기 때문이다. (By Little's law) 그러나, 임계점 (Saturation point) 이후부터는 부하가 증가하여도 처리량이 더 이상 증가하지 못하고 일정한 수준으로 유지된다. 이 때는 시스템이 낼 수 있는 최대 성능치에 이른 것이며, 병목 현상이 나타나게 ..

동시사용자와 부하 분석

성능 이론 2020. 12. 14. 23:35

일반적인 Web based system을 사용하는 사용자 용어에 대해 알아보자. 아래와 같이 4가지 사용자 유형으로 구분할 수 있으며, 뜻을 잘 못 알고 사용하는 사례도 많으므로 의미를 정확하게 알고 사용할 필요가 있다. 이 중, 가장 흔히 들어본 사용자는 아마도 동시 사용자 (Concurrent user)일 것이다. 말 그대로 동시에 시스템을 사용 중인 사용자다. 그러나 시스템에 접속되어 있는 Connected user로 생각하는 이들도 많으므로 정확한 뜻을 살펴보고자 한다. Named user는 해당 시스템에 존재하는 모든 사용자이다. 즉, Named user 수는 DB에 존재하는 계정의 총 합이다. 이는 성능 관점에서 볼 때 그리 중요한 지표가 아니다. 왜냐하면 모든 사용자들이 그 시스템을 사용한다..

IOPS와 지연시간

성능 이론 2020. 12. 13. 23:21

이 글을 읽기 전에 아래 글 (TPS와 응답시간)을 읽어보길 권한다. performance.tistory.com/4 스토리지의 대표적인 성능 지표 역시 처리량 (Throughput)이다. 그리고 응답시간 대신 지연시간 (Latency)이라는 용어를 사용한다. 1. IOPS IOPS (Input Output Operations per Second)는 스토리지에서 사용되는 용어다. 정보시스템에서 사용하는 TPS와 마찬가지로, 스토리지의 대표적인 성능 지표로서 처리량을 나타내는 단위이며, 해당 스토리지 시스템의 성능을 평가하는 KPI이다. IOPS 초당 발생하는 IO Operations (건/sec) IOPS = 총 IO Operation 처리건수 / 단위시간 (sec) 스토리지의 주요 성능 Factor 2...

TPS와 응답시간

성능 이론 2020. 12. 12. 23:44

정보시스템의 대표적인 성능 지표는 처리량 (Throughput)과 응답시간 (Response Time)이다. 1. 처리량 처리량은 시스템 측면의 대상 시스템에 대한 성능을 평가하는 KPI이며, 단위로는 주로 TPS (Transactions per Second)를 사용한다. 이는, 단위 시간당 대상 시스템에서 처리되고 있는 요청 건수를 의미하며, 일반적으로 처리량을 일컬을 때 각 대상 리소스별로 호칭하는 용어가 별도로 존재한다. 처리량 단위 CPU : MIPS, MFLOPS Network : BPS, pps Server : tpmC C/S, TP-Monitor, Mainframe : TPS Storage : IOPS TPS (Transactions per Second) 초당 발생하는 Business Tra..

ABOUT ME

스토리지 성능 이야기 스토리지 성능 이야기

티스토리툴바

ABOUT ME

전체 글

티스토리툴바