라이젠 5 2400G(레이븐릿지) 메모리 벤치마크 메모리 클록에 따른 3D 게임 성능 차이는? 안녕하세요. 퀘이사존벤치입니다. AMD의 새로운 APU(Accelerated Processing Unit), 레이븐릿지의 성능 엠바고가 드디어 해제되었습니다. 또한 레이븐릿지는 과거의 APU들이 쭉 그랬던 것처럼, 메모리 클록이 3D 게임 성능에 굉장히 중요한 변수로 작용합니다. 즉 메모리 클록에 따라 확연한 성능 차이를 보여준다는 뜻인데요. 본 칼럼에서는 과연 이런 현상이 왜 일어나고, 테스트를 통해 실제 성능 차이는 얼마나 발생하는지 자세히 알아보도록 하겠습니다.
먼저 메모리 클록에 따라 성능이 크게 차이나는 APU의 특성을 이해하기 위해서는 대역폭(Bandwidth) 개념을 알아야 합니다. 외장형 그래픽카드의 경우 HBM2, GDDR5X, GDDR5와 같은 형식의 그래픽카드 전용 메모리가 탑재되어 있는데요. 해당 메모리는 VRAM이라는 약칭으로 불리기도 합니다. 여기서 VRAM은 GPU 연산 작업에 필요한 데이터를 상주시키는 역할을 하고, 대역폭은 VRAM과 GPU가 통신을 할 때 한 번에 얼마나 많은 데이터를 주고받을 수 있는지를 뜻합니다. 즉 GPU 성능이 높으면 높을수록 대역폭도 더 좋아야겠죠. 반대로 GPU 성능이 좋아도 대역폭 수치가 낮으면 병목 현상(bottleneck)이 일어나 GPU 본연의 성능을 오롯이 발휘할 수 없습니다. 그렇다면 대역폭은 어떤 요소로 인해 결정되는지 알아볼 필요가 있겠네요. 현세대의 그래픽카드 대역폭은 일반적으로 'GB/s(Gigabyte per second)' 단위로 표기하며, 해당 수치는 메모리 클록과 메모리 인터페이스의 곱셈으로 결정됩니다. 이렇게 말로만 풀면 감이 오지 않을 수 있으니까 레이븐릿지의 3D 게임 성능과 자주 비교되는 지포스 GT 1030의 스펙을 예시로 설명하겠습니다. ※ 엔비디아 지포스 GT 1030 메모리 스펙 - 메모리 종류: GDDR5
- 메모리 인터페이스(버스): 64-bit - 메모리 클록: 1,502 MHz(유효 클록: 6,008 MHz) - 대역폭: 48.06 GB/s 메모리 클록을 보면 유효 클록이라는 표기를 발견할 수 있는데요. GDDR5는 Quad Data Rate(QDR)로 작동하기 때문에 실제 클록의 4배에 달하는 유효 클록을 갖게 됩니다. 그리고 메모리 인터페이스는 64-bit로 이제 이 둘을 곱해주면 대역폭 값을 구할 수 있게 됩니다. ※ 6,008(MHz) x 64(bit) = 384,512 Mb/s 하지만 여기서 384,512라는 숫자는 bit 단위로 계산되었기 때문에 Byte로 변환 과정을 거쳐야 합니다. 대역폭 단위인 'GB/s'의 'B'는 bit가 아닌 Byte 단위이기 때문입니다. 따라서 1 Byte는 8 bit이므로 384,512를 Byte로 변환하기 위해서는 8로 나누어야 합니다.(일반적으로 대문자 B는 Byte를 소문자 b는 bit를 의미합니다) ※ 384,512(Mb/s) / 8 = 48,064 MB/s = 48.06 GB/s 8로 나누어 Byte 단위로 통일하고 다시 MB(MegaByte)를 GB(GigaByte)로 변환하면 스펙 상의 48.06 GB/s와 동일한 값을 얻을 수 있습니다. 결국 그래픽카드의 대역폭을 결정짓는 핵심 요소는 메모리 클록과 메모리 인터페이스인 것을 알 수 있죠? 간혹 메모리 인터페이스의 bit 수만 가지고 대역폭이 좋다는 말을 하는 경우도 있는데, 이것은 정확하지 않은 표현입니다. 대역폭은 어디까지나 메모리 클록과 인터페이스의 곱셈으로 나타난 결과이기 때문입니다. 따라서 그래픽카드의 bit 수가 높아도 메모리 클록이 현저하게 낮으면, bit 수는 낮지만 메모리 클록이 높은 그래픽카드에 비해 대역폭이 낮은 경우도 생길 수 있습니다.
이제 대역폭의 개념을 알았으니 다시 APU로 넘어가 볼까요? 일반적으로 외장형 그래픽카드는 GPU 성능에 맞는 메모리 클록과 인터페이스를 갖추고 적당한 대역폭을 확보할 수 있도록 전용 메모리의 스펙을 설계합니다. 하지만 APU는 3D 연산을 위한 전용 메모리가 없기 때문에 시스템 메모리를 활용하여 대역폭을 확보합니다. 즉 시스템 메모리 클록이 높으면 높을수록 더 넓은 대역폭을 확보할 수 있다는 뜻입니다. 레이븐릿지의 맏형, 라이젠 5 2400G에 탑재된 베가(Vega) 11의 경우 메모리 인터페이스는 128-bit로 작동합니다. 여기에 가장 많은 소비자가 구매하는 DDR4 메모리인 2,400 MHz 모델을 장착한다고 가정하면, 대역폭은 38.4 GB/s가 됩니다. 이는 지포스 GT 1030의 48.06 GB/s에 비하면 꽤나 낮은 수치이고, 베가 11의 연산 성능에 비추어보면 높은 확률로 병목 현상이 발생할 것이라는 추측을 가능하게 합니다. 따라서 APU를 테스트함에 있어 메모리 클록에 따른 성능 차이를 살펴보는 것이 굉장히 중요한 정보가 될 수 있겠죠. 외장형 그래픽카드의 경우 애초에 해당 그래픽카드의 성능에 어느 정도 적합한 메모리 스펙으로 구성되어 메모리 오버클록을 하더라도 성능 향상이 크지 않은 경우가 많지만, APU는 상대적으로 메모리 클록에 의한 성능 차이가 훨씬 크게 나타납니다. 과거에도 그랬고, 이번 레이븐릿지는 3D 성능이 더욱 강화되었기 때문에 메모리 클록은 더욱더 중요한 요소가 될 수밖에 없습니다. 메모리 클록별 성능 테스트의 당위성을 설명하기 위한 서론이 참 길었네요. 그렇다면 이제 한 발 더 나아가 벤치마크 시스템 사양과 상세한 설정 내용을 알아보겠습니다. 벤치마크 테스트 시스템 설정
테스트 시스템 사양입니다. 메인보드 UEFI는 레이븐릿지를 위해 배포된 버전 중 가장 최신 버전인 'T20h'를 사용하였습니다. 그리고 가장 중요한 메모리입니다. 순수하게 메모리 클록별 성능을 측정하기 위해 램 타이밍은 건드리지 않고 고정 값으로 진행하였습니다. 즉 테스트를 위해 설정된 전 영역의 메모리 클록(2,133 MHz ~ 3,466 MHz)이 동일한 램 타이밍으로 설정되었다는 뜻입니다. 그리고 또 하나 중요한 것이 있는데요. 레이븐릿지는 반드시 듀얼 채널 메모리로 구성해야 한다는 것입니다. 즉 8 GB 메모리를 구성하고자 할 때, 8 GB 메모리 한 개를 꼽는 것보다 4 GB 메모리 두 개를 꼽는 것이 좋다는 뜻입니다. 만약 8 GB 메모리 한 개로 구성하게 되면 싱글 채널로 작동하여 대역폭이 반 토막 수준으로 떨어집니다. APU에게는 대역폭 확보가 가장 중요한데 이것을 반 토막 내버리면 3D 게임에서의 성능 저하가 극심하게 나타나기 때문에 무조건 피해야겠죠. "레이븐릿지는 반드시 듀얼 채널 메모리로 구성해야 한다" 일반적인 중저가 CPU + 외장형 그래픽카드 조합에서는 싱글 채널과 듀얼 채널의 성능 차이가 크지 않은 경우가 대다수지만, 적어도 APU 시스템에서는 반드시 듀얼 채널로 구성해야 한다는 것을 꼭 염두에 두시길 바랍니다. 장치 드라이버는 AMD 측에서 미디어를 대상으로 배포한 최신 버전(323860C)을 사용하였습니다.
▲ GIGABYTE GA-AB350N-Gaming WIFI 램 타이밍 설정 화면 램 타이밍의 세부 설정입니다. 레이븐릿지의 경우 출시 초기인 탓인지 UEFI의 메모리 설정과 관련하여 성능 변화가 굉장히 민감하게 반응하여 기준값을 찾는데 애를 많이 먹었습니다. 단적인 예로 램 타이밍을 조여도 성능이 갑자기 떨어지는 상황이 발생하여 오히려 적당히 램 타이밍을 풀어줘야 성능이 제대로 나오는 등 들쑥날쑥한 특성들이 발견되었기 때문입니다. 위 램 타이밍은 테스트에 적용된 모든 메모리 클록에서 안정된 성능을 발휘하는 값을 찾아낸 것으로 참고해주시기 바랍니다. 이제 테스트 결과로 넘어가겠습니다. 3DMark Fire Strike v1.1 - Default Preset
일명 '파스' 혹은 '불공격'이라 불리는 3DMark Fire Strike의 그래픽 점수 결과입니다. GT 1030의 경우 대역폭은 그래픽카드에 달린 전용 메모리에 의지하고 있기 때문에 시스템 메모리 클록이 변한다고 해서 성능에 큰 영향은 없습니다. 반면, 라이젠 5 2400G에 내장된 라데온 Vega 11은 메모리 클록에 따른 그래픽 점수 차이가 굉장히 크게 나타나고 있습니다. 2,133 MHz에서는 2,972점이던 점수는 메모리 클록이 높아질수록 꾸준히 상승하여 3,466 MHz에서 무려 4,000점에 육박하게 됩니다. GT 1030과 비교하면 2,933 MHz 설정부터 라데온 Vega 11의 성능이 더 높게 나타납니다. 다음은 3DMark 11 테스트 결과를 살펴보겠습니다. 3DMark 11 v1.0.132.0 - Performance Preset
3DMark 11은 3DMark Fire Strike 결과와 사뭇 다른 양상입니다. 물론 레이븐릿지 2400G의 경우 메모리 클록이 높을수록 성능이 꾸준히 향상되고 있다는 것은 동일하지만, GT 1030에 비해 2,133 MHz 상황에서조차 높은 점수를 기록하고 있다는 것이 특이사항으로 꼽을 수 있습니다. 해당 원인을 어디에서 찾을 수 있을까요? 그것은 바로 3DMark 11 테스트가 대역폭에 의한 성능 차이를 높게 반영하지 않는다는 특성에서 꼽을 수 있습니다. 이를 증명하는 것이 3DMark Fire Strike의 경우 2,133 MHz와 3,466 MHz의 성능 차이는 무려 33.1%에 달하지만, 3DMark 11은 고작 18.1%의 성능 차이만이 발생한다는 것이죠. 즉 3DMark 11 자체가 현시점에서는 구세대 벤치마크 프로그램이고, 현세대에서 요구하는 대역폭의 수준을 요구하지 않으며, 결과적으로 레이븐릿지 입장에서 대역폭으로 인한 병목현상이 심하지 않아 GT 1030에 비해 높은 성능을 기록한 것으로 추론할 수 있습니다. 둠 2016 - 1920x1080 + Low 프리셋
필자가 가장 좋아하는 게임, 둠(DOOM, 2016)입니다. Vulkan API로 구동되는 둠은 최신 그래픽카드별 성능 편차를 비교적 정확하게 반영합니다. 레이븐릿지의 경우 저클록 메모리에서는 병목현상이 심하게 나타납니다. 또한, 메모리 클록이 높아지면 꾸준히 성능 향상이 이루어지는 걸로 보아 베가 11의 성능을 모두 끌어내기 위해서는 매우 높은 메모리 클록이 요구된다는 것을 알 수 있습니다. 대략 3,000 MHz 수준의 클록이 적용되면 GT 1030과 동급의 성능을 발휘합니다. 파이널 판타지 15 PC판 - 1280x720 + Lite Quality
3월 6일 출시 예정인 파이널 판타지 15 PC판의 벤치마크 프로그램 구동 결과입니다. 시스템 요구 사양이 높은 게임이기 때문에 가장 낮은 프리셋 1280x720 Lite Quality를 적용했는데요. 앞선 둠의 테스트 결과와 크게 다르지 않은 모습입니다. 오버워치 - 1920x1080 + 중간 옵션
블리자드의 FPS 게임, 오버워치입니다. 이제껏 수많은 테스트 자료가 증명하듯 지포스 그래픽카드에서 좀 더 좋은 결과를 보여주는 게임입니다. 본 테스트에서도 GT 1030이 좋은 모습을 보여주었으며, 레이븐릿지의 경우 GT 1030 급의 성능을 달성하기 위해서는 무려 3,200 MHz 이상의 메모리 클록이 요구됐습니다. 3,466 MHz를 적용하면 GT 1030을 소폭 앞서게 됩니다. 플레이어 언노운스 배틀그라운드 - 1920x1080 + 커스텀 옵션
현재 가장 큰 인기를 끌고 있는 배틀그라운드입니다. 별다른 수식어가 필요 없는 게임이죠. 시스템 요구 사양이 높기 때문에 적잖은 옵션 조절을 거쳤습니다.(안티-낮음, 텍스처-중간, 거리 보기-울트라, 화면 스케일-80%, 나머지 옵션 매우 낮음) 해당 옵션에서 전반적으로 30~40 프레임에 해당하는 성능을 얻을 수 있었는데요. 무엇보다 레이븐릿지의 준수한 성능이 돋보였습니다. 2,666 MHz 클록 정도만 되어도 GT 1030의 성능을 넘어서며, 3,466 MHz 급으로 가면 평균 44 프레임 수준을 달성하는 기염을 토했습니다. 레인보우 식스 시즈 - 1920x1080 + 중간 프리셋
마지막으로 꾸준하게 인기를 끌고 있는 레인보우 식스 시즈의 테스트 결과입니다. 레이븐릿지가 굉장히 좋은 모습을 보여주네요. 2,400 MHz만 되어도 GT 1030의 성능을 넘어섭니다. 또한 1920x1080 중옵에서 평균 60 프레임 이상도 바라볼 수 있기 때문에 상옵~풀옵션을 고집하는 분이 아니라면 레이븐릿지로도 충분히 재밌게 즐길 수 있는 게임입니다. 레이븐릿지 메모리 클록 벤치마크 결론
5종 게임 테스트 결과의 평균값을 백분율로 나타낸 그래프입니다. GT 1030의 경우 앞서 언급한 것처럼 외장형 그래픽카드이기 때문에 전용 메모리와 대역폭을 가지고 있어, 시스템 메모리 클록에 따른 게임 성능 차이는 미미한 수준입니다. 그에 반해 레이븐릿지는 3D 렌더링 작업 시, 전용 메모리가 없기 때문에 시스템 메모리에 의존하게 됩니다. 결과적으로 메모리 클록이 곧 2400G가 품고 있는 베가 11의 대역폭을 결정하며, 이러한 구조적 특성은 베가 11이 가지고 있는 성능에 적지 않은 제약을 가하고 있습니다. 이를 반증하는 것이 2,133 MHz부터 3,466 MHz에 이르기까지의 성능 향상이 지치지 않고 지속된다는 것입니다. 어느 정도 수준에서 성능 향상이 점점 줄어든다면, 적절한 수준의 메모리 클록을 산정할 수 있겠지만, 3,200 MHz 이상에서도 적지 않은 성능 향상이 관측됩니다. 이것은 베가 11의 성능을 최대한 끌어내기 위해서는 상당히 높은 클록의 메모리가 필요하다는 것을 말해줍니다. 하지만, 현실적인 관점에서 가격을 고려해야 하기 때문에 무작정 높은 메모리를 추천할 수 없겠죠. 배보다 배꼽이 더 커질 수 있기 때문입니다. 제 판단으로는 최소 2,666 MHz, 권장으로는 3,000 MHz 이상의 메모리를 사용하는 게 레이븐릿지의 3D 게임 성능 발휘에 좋은 환경으로 꼽을 수 있습니다. 그리고 바로 이 대목이 가장 아쉬운 부분입니다. 레이븐릿지의 진정한 매력과 정체성이 합리적인 가격에 CPU+GPU 양 측면에서 적당한 성능을 달성한다는 것에 있는데, 정작 게임 성능 부문에서 제대로 힘을 발휘하기 위해서는 값비싼 고클록 메모리가 요구된다는 것이 세그먼트 성격과 잘 맞지 않다는 것입니다. 고클록의 메모리를 사느니 외장형 그래픽카드를 사는 것이 더 합리적일 수도 있기 때문이죠. 따라서 레이븐릿지의 진정한 힘을 끌어내고 싶은 파워유저라면 시스템 메모리 오버클록을 통해 최대한 높은 클록을 확보하는 것이 현실적인 대안일 수 있습니다. 물론, 이런 아쉬움을 감안하더라도 레이븐릿지의 매력은 여전합니다. 이 정도의 가격대에서 CPU와 GPU로 양분되는 사용처를 일정 수준 이상 만족시키는 제품은 없기 때문이죠. 또한 실질적으로 레이븐릿지의 특성에 정확히 대항할 수 있는 가격대의 제품이 경쟁사에는 존재하지 않습니다. 프로세서 하나로 4 코어 CPU 환경과 GT 1030과 비교되는 GPU 성능을 만족시킨다는 건 분명 레이븐릿지만의 특별한 매력일 것입니다. 정리하면 레이븐릿지 역시 과거의 AMD APU가 그랬던 것처럼 3D 게임 성능 부문에서 메모리 클록의 영향력이 막강합니다. 어떤 메모리와 조합하느냐에 따라서 클록 차이만으로도 한 체급 이상의 성능 차이가 발생하기 때문입니다. 이와 같은 특성은 대부분의 게임에서 동일하게 나타났고, 또 꾸준했습니다. 현실적으로 고클록 메모리는 가격이 걸림돌로 작용하기 때문에, 레이븐릿지 시스템을 고려하고 있는 유저라면 이런 부분까지 염두에 두시길 바랍니다. ※ 참고: 전체 테스트 자료 DB(클릭 시 원본 크기) |