▲ 3DMark Port Royal 공식 테크 데모 영상
3DMark Port Royal(포트로열) 벤치마크 새로운 좌절마크의 등장 안녕하세요. 퀘이사존벤치입니다. 3D 게임 성능을 대변하는 툴로서 가장 유명한 프로그램을 꼽으라면, UL Benchmarks(구: Futuremark)의 3DMark일 것입니다. DirectX 11 API를 사용하는 게임은 Fire Strike(파이어스트라이크, 일명 파스), DirectX 12 API는 Time Spy(타임스파이, 일명 타스)가 존재하죠. 현재 대부분의 3D 게임이 사용하는 API 역시 DirectX 11과 DirectX 12입니다. 하지만, 지포스 20 시리즈가 지포스 RTX라는 새로운 브랜드로 태어났고, 실시간 레이트레이싱(Ray tracing)을 지원하게 되면서 3D 게임 업계는 엔비디아가 던진 기술적 화두인 '레이트레이싱'에 집중하고 있습니다. 이를 위해 마이크로소프트는 2018년 10월, 윈도 10 업데이트에 레이트레이싱을 지원하는 DirectX Raytracing(DXR)을 포함하였습니다. 또한, 밀리터리 FPS 게임인 배틀필드 V(Battlefield V)에서도 DXR API를 사용하여 레이트레이싱을 구현할 수 있게 되었습니다. 그러나, 현존하는 모든 그래픽카드가 DXR를 사용할 수 있는 건 아닙니다. 현재까지는 엔비디아의 지포스 RTX 제품군과 TITAN V에 한정되어 있으며, 레이트레이싱 적용 시의 높은 GPU 연산 부하도 아직은 레이트레이싱 게이밍 보급화에 시간이 더 필요하다는 것을 말해줍니다. 그러나 IT 업계의 속성은 새로운 기술을 미래지향적으로 추구하기 때문에 점차 더 많은 그래픽카드와 게임에서 레이트레이싱이 적용될 것입니다. 레이트레이싱은 3D 게임의 비주얼 혁신을 일으킬 수 있는 핵심 기술이기 때문이죠.
▲ 실시간 레이트레이싱 게임 성능을 측정하는 3DMark Port Royal 이러한 시장 상황에서 UL Benchmarks는 새로운 3DMark를 출시하였습니다. 바로 3DMark Port Royal(이하 포트로열)입니다. 포트로열은 DirectX 12 API에 새롭게 추가된 DXR을 활용하여 실시간 레이트레이싱(Real-time ray tracing)을 구현합니다. 앞으로 DXR 그리고 레이트레이싱을 활용한 게임 성능을 대변하게 될 툴이라는 뜻입니다. 따라서 DXR, 레이트레이싱을 지원하지 않는 그래픽카드는 구동할 수 없죠. 아래 시스템 요구 사항에서 자세히 알아보도록 하겠습니다.
▲ 3DMark Port Royal의 시스템 요구 사항 먼저 윈도 10 v1809 업데이트 버전이 필요하며, DX12 및 DXR을 지원하는 그래픽카드가 요구됩니다. 위 표에 나와있는 바와 같이 RTX 그래픽카드와 TITAN V 정도가 있습니다. 본 벤치마크에서는 포트로열이 지원하는 모든 그래픽카드를 동원하여 테스트를 진행하였습니다. 다음은 테스트가 어떤 과정을 거쳐 이루어지는 살펴보도록 하겠습니다.
▲ 3DMark 포트로열 실행 시 마주하는 화면 3DMark 포트로열 실행 화면입니다. RUN으로 표기된 주황색 버튼을 누르면 바로 벤치마크가 실행되며, 실시간 레이트레이싱 렌더링 데모가 종료되면 점수가 산출됩니다. 기존 3DMark와 테스트 방식이 동일하기 때문에 3DMark를 구동해보셨던 분들이라면 어렵지 않을 것입니다.
▲ 3DMark 포트로열 커스텀 설정 화면 벤치마크 항목에서 커스텀 설정(Custom Run) 버튼을 눌렀을 때 나타나는 화면입니다. 여기서 세부적인 그래픽 설정이 가능하죠. 렌더링 출력 해상도와 비동기 연산(Async compute) 활성화 유무, 반사(Reflection) 품질, 반사 방식 선택(레이트레이싱 또는 기존의 방식인 Screen Space Reflection), 텍스처 필터링 등을 설정할 수 있습니다. 사용자가 해당 항목들을 임의로 설정한다면, 테스트는 가능하나 점수 인증이 불가합니다. 점수 인증은 기본(Default) 설정에서만 가능하기 때문입니다.일반적인 사용자라면 최초 벤치마크 화면에서 Run 버튼만 눌러주시면 됩니다. 만약 자동으로 실행되는 테크 데모 감상이 지겨우시다면, 시간 절약을 위해 커스텀 설정에서 Include demo 항목을 꺼주시면 됩니다.
▲ 3DMark 포트로열 테스트 종료 후 화면 테스트가 완료되었을 때의 화면입니다. 포트로열은 CPU/Physics/Combined와 같은 테스트 없이 오로지 그래픽 성능만 측정합니다. 따라서 그래픽 점수(Graphics score)가 그대로 종합 점수로 산출됩니다. 점수 하단에는 테스트가 이루어지는 동안의 평균 FPS를 확인하실 수 있습니다. 위 예시 이미지는 TITAN RTX의 테스트 결괏값이며 점수는 8,637점, 평균 FPS는 39.99로 측정되었습니다. 약 40 프레임 수준으로 볼 수 있는데 1440p 해상도인 것을 감안해도 GPU 연산 능력을 매우 높게 요구하는 것을 알 수 있습니다. 새로운 좌절마크로서 손색이 없군요. 이제 실제 테스트 결과를 살펴보도록 하겠습니다. 벤치마크 테스트 시스템 사양
3DMark Port Royal v1.0 테스트 결과 역시 좌절마크입니다. TITAN RTX라도 통곡의 벽, 1만 점을 넘지 못하고 겨우 8,637점에 그치게 됩니다. 그 뒤를 이어 RTX 2080 Ti가 약 8천 점을 기록하고 있으며, 나머지 하위 그래픽카드는 줄어든 GPU 유닛 개수에 비례하며 성능이 낮아지고 있습니다. 어떻게든 더 높은 점수를 달성해보기 위해 TITAN RTX 및 RTX 2080 Ti에 오버클록을 적용해보았으나, 9,400점 정도가 한계였습니다. 즉 일반적인 시스템 환경에서 단일 그래픽카드로 1만 점을 넘기기란 불가능에 가깝습니다. 반면, TITAN V의 경우 RTX 2060보다도 낮은 성능을 기록하게 되는데요. 그 이유는 아래 데이터 정리표를 통해 설명하도록 하겠습니다. ▲ 3DMark Port Royal v1.0 벤치마크 결과 데이터 정리 포트로열에서 산정된 점수 + 평균 FPS를 토대로 각 그래픽카드의 성능을 분석해보았습니다. 먼저 1 FPS 당 몇 점이 할당되는지 알고 싶었는데요. 수식은 간단합니다. 점수를 평균 FPS로 나누어주면 1 FPS 당 할당 점수가 결과로 나타나기 때문입니다. 결과는 위 표와 같이 1 FPS 당 약 216점이 할당됩니다. 즉 평균 60 FPS로 구동할 수 있는 그래픽카드가 출시된다면, 포트로열 점수는 60 x 216 = 12,960, 약 13,000점이 될 것입니다. 그렇다면 1만 점을 돌파하기 위해서는 어느 정도의 성능이 필요할까요? 10,000 / 216 = 46.3, 평균 46.3 FPS 이상의 성능을 내주어야 1만 점을 돌파할 수 있을 것입니다.
▲ 튜링의 SM 아키텍처 개요 다음은 튜링(Turing) GPU 아키텍처에 포함된 RT(레이트레이싱) 코어와 효율에 대해서 알아보고자 합니다. 각 그래픽카드별 RT 코어는 표에 모두 표기되어 있습니다. 반면, TITAN V의 경우 볼타(Volta) GPU 아키텍처이기 때문에 RT 코어가 존재하지 않습니다. RT 코어는 없지만, DXR API는 지원하기 때문에 포트로열 구동이 가능한 것이죠. 결과적으로 구동은 가능하나 레이트레이싱 성능은 RTX 2060에도 미치지 못합니다. TU102 GPU를 탑재한 TITAN RTX와 RTX 2080 Ti는 각각 72/68 RT 코어를 탑재하고 있으며, 1 RT 코어 당 점수 배율은 약 118~120점 정도로 나타났습니다. 반면 TU104 GPU의 RTX 2080은 130점 가량, TU106 GPU의 RTX 2070과 RTX 2060은 각각 136.2/127.7점으로 계산됩니다. 최상위 그래픽카드 대비 하위 등급의 그래픽카드가 더 높은 점수 배율을 보여주는데요. 이는 GPU의 코어 클록 주파수 및 효율 차이로 인한 결과로 추측됩니다.
▲ 3D 게임의 미래, 실시간 레이트레이싱 이렇게 각 그래픽카드별로 다소 효율 차이가 존재하기는 하지만, 전반적으로 그래픽카드 본연의 스펙(유닛 구성)과 레이트레이싱 성능이 비례하는 것을 알 수 있습니다. 그리고 이미 적용되어 있는 EA의 배틀필드 V는 물론이고, 앞으로 마이크로소프트의 DXR API를 활용하는 게임이 점차 증가한다면, RT 코어 또는 레이트레이싱을 위한 아키텍처 설계가 가미된 그래픽카드가 반드시 필요합니다. 특히 3D 게임의 발전 로드맵에서 레이트레이싱은 시기의 문제일 뿐, 대세가 될 확률이 높죠. 이미 게임이 아닌 타 3D 분야에서는 레이트레이싱 연산 작업이 필수로 적용되고 있기도 합니다. 따라서 RTX 그래픽카드를 시발점으로 차후 그래픽카드 세대는 레이트레이싱 성능의 중요성이 점점 더 높아질 것입니다. 한 가지 아쉬운 점이라면, RT 코어가 없더라도 기존의 파스칼(Pascal) GPU 아키텍처의 지포스 10 시리즈 또는 AMD 라데온 그래픽카드 구동이 가능하다면 극단적인 성능 비교가 가능했을 것이라는 점입니다. 아예 구동조차 안 되는 점은 상당히 아쉽네요. 이상, 퀘이사존벤치였습니다. |