퀘이사존 지포스 RTX 3070 벤치마크 $499로 출시하는 RTX 3070, RTX 2080 Ti 성능을 넘보다
안녕하세요. QM벤치입니다.
엔비디아가 최초 발표한 지포스 30 시리즈 3개 모델 중 아직까지도 성능 엠바고(Embargo)가 해제되지 않았던 녀석이 있습니다. 바로 지포스 RTX 3070인데요. 현재 RTX 3080이 절대적인 가격 자체가 상당한 수준임에도 불구하고 큰 인기를 끌게 되면서, 상대적으로 RTX 3070에 대한 관심도가 작아 보이기도 합니다. 이렇게 RTX 3080이 큰 인기를 끌게 된 이유는 이전 세대 대비 큰 폭의 성능 향상도 꼽을 수 있겠으나, 무엇보다 RTX 3090이 성능 차이에 비해 너무 높은 가격대를 형성하면서 RTX 3090을 고려하던 유저들도 RTX 3080으로 선회하는 움직임도 있습니다.
▲ 위에서부터 차례로 RTX 3090 FE, RTX 3080 FE, RTX 3070 FE
어쨌든 RTX 3080은 수요에 비해 공급이 부족한 상황과 맞물리면서 유례없는 화제의 주인공이 된 것이 사실이지만, 가격이 무려 100만 원 이상입니다. 따라서 이보다 낮은 가격대 그래픽카드에 대한 수요층은 여전히 남아 있겠죠. 또한 예전보다 그래픽카드 지출에 대한 심리적 가격 마지노선이 높아졌다고 해도, 100만 원 이상의 돈을 가뿐히 내어줄 사람들은 시장 전체를 놓고 봤을 때 많지 않습니다. 이런 분들은 RTX 3070을 주목할 필요가 있습니다. RTX 3080 대비 $200 낮은 가격 그리고 전 세대 하이엔드 그래픽카드 RTX 2080 Ti와 비견되는 성능으로 알려진 모델이기 때문이죠. 그리고 오늘 이 벤치마크에서 RTX 3070의 진정한 성능을 확인하실 수 있습니다.
▲ 형들보다 작아진 덩치가 사뭇 귀여운 느낌, RTX 3070 Founders Edition
지포스 RTX 3070 8GB. 우리는 이미 지포스 스페셜 이벤트를 통해 가격을 알고 있습니다. US $499! 이전 세대와 비교하면 RTX 2070 시작 가격(FE 버전은 $100이 높은 $599)과 그 후에 나온 개선판 RTX 2070 SUPER와 동일한 가격입니다. 당연히 GPU 아키텍처 및 세대가 바뀐 만큼 더 높은 성능을 제공해 줄 것이고요. 또한 형들(RTX 3090/RTX 3080)보다 상대적으로 작은 크기 GPU, GA104를 탑재하면서 여러모로 암페어 아키텍처 효율의 진면목을 기대하게 만듭니다. 최상급 라인은 최고 성능을 위해 전성비나 가성비에 한계가 있기 때문입니다.
▲ RTX 2080 Ti와 성능을 비교하는 패기 넘치는 RTX 3070
지포스 스페셜 이벤트에서 엔비디아는 매우 중요한 메시지를 던졌습니다. RTX 2080 Ti보다 빠르다고 말이죠. 물론 이것이 엄청난 사건이라거나 유례가 없다든가 수준의 일은 아닙니다. 과거 GTX 1070도 GTX 980 Ti보다 좋은 성능이었고, GTX 970은 출시 당시 GTX 780 Ti에 뒤지는 성능이었으나 최신 게임에서는 GTX 780 Ti를 앞서기도 했으니까요. 하지만 이런 전통은 RTX 2070에 와서 깨지게 됩니다. RTX 2070은 GTX 1080 Ti에 비해 앞서기는커녕 명백한 차이로 낮은 성능을 보였기 때문이죠. 최신 게임에서 성능 격차를 좁히긴 했으나 여전히 RTX 2070은 GTX 1080 Ti를 넘어서지 못합니다. 애초에 튜링(Turing) 아키텍처 기반 지포스 20 시리즈가 전반적으로 성능 향상이 크지 않기도 했고요.
이런 사실을 누구보다 엔비디아는 잘 알고 있습니다. 이번만큼은 다르다는 것을 확실히 보여주고 싶었나 봅니다. 공식 슬라이드 이미지에서 RTX 3070은 RTX 2080 Ti보다 빠르다는 것을 확실히 명시하고 있군요. 그러나 이런 공식 자료는 항상 한 걸음 뒤로 물러서서 받아들일 필요가 있습니다. 대부분의 게임에서 모두 이긴다는 것인지 아니면 특정 조건에서 이긴다는 것인지 우리로서는 검증하기 전까지 알 수 없기 때문이죠. 저 역시 무척이나 궁금했습니다. '정말 빠를까?' '수십 종 게임 테스트 평균 성능에서도 더 좋을까?' 이런 질문이 머리를 가득 메웠습니다. 여러분 역시 많이 궁금하셨을 텐데요. 본 벤치마크에서 해답을 얻으실 거라 생각합니다.
▲ RTX 3070 FE 8GB 및 주요 그래픽카드 상세 스펙
지포스 RTX 3070 FE 상세 스펙입니다. 이번 FE 버전은 엔비디아가 새롭게 설계한 고성능 쿨링 설루션을 갖추고 있습니다. 단 RTX 3070은 상위 버전과 달리 V형 PCB 레이아웃이 아닌 일반적인 형태를 가집니다. 지포스 30 시리즈에서 이전 세대와 차이를 보이는 중요한 요소라면 스펙(부스트 클록 등)과 MSRP 정책이 일반 모델과 동일하다는 것입니다. 전 세대 지포스 20 시리즈가 부스트 클록/TDP/가격까지 일반 모델과 FE 버전에 차이를 두었기 때문에 이는 큰 변화입니다.
▲ 고급스럽고 단단한 외형의 RTX 3070 FE, 그러나 형들과 달리 측면 LED가 점등되지 않는다
GPU는 삼성 8 나노(8N NVIDIA Custom) 공정으로 탄생한 코드명 GA104-300-A1을 탑재하고 있습니다. CUDA 코어는 5,888개로 RTX 3080의 약 68% 수준입니다. 그러나 성능이 RTX 3080 대비 68%일 것이라 추측하는 것은 오류를 범할 수 있습니다. 실제 게임 성능은 물리적인 스펙 차이가 100% 효율로 발현되기 어렵기 때문입니다. 단 상위 모델과 확실한 격차를 두고 있는 요소가 있는데요. 바로 메모리입니다. GDDR6X가 아닌 GDDR6를 탑재하였습니다. 이로 인해 메모리 속도가 14 Gbps에 머무르게 됩니다. 메모리 속도는 메모리 대역폭을 결정짓는 핵심 요소이기 때문에 다소 아쉬운 부분이죠. 그러나 메모리 속도 자체가 근본적인 렌더링 성능을 말하는 것은 아니기에 GPU 성능에 해가 되지 않는 수준이면, 큰 문제는 아닙니다.
▲ GA104-300-A1 블록 다이어그램(비활성화를 뜻하는 빨간색 영역은 임의 지정)
위 이미지는 RTX 3070에 탑재된 GA104 GPU 블록 다이어그램(Block Diagram)입니다. GA104 풀칩 구성은 48 SM 구성에 6,144 CUDA 코어를 갖추고 있지만, RTX 3070은 여기서 SM 2개로 구성된 TPC 1개가 비활성화되어 46 SM 구성에 5,888 CUDA를 가지고 있습니다. 일명 ‘컷칩’ 구성인 것이죠. 따라서 차후 GA104 풀칩 기반 그래픽카드가 나올 가능성도 있으나 유닛 구성만으로는 성능 차이가 매우 미미한 수준일 것입니다. 물론 메모리를 GDDR6X로 바꾸고 메모리 용량을 증설한 버전이라면 활용 가치 면에서 차별성을 기대할 수 있겠습니다.
▲ 퀘이사존 지포스 RTX 3070 벤치마크 시스템 사양
RTX 3070은 RTX 2080 Ti에 비견되는 게이밍 성능을 보여주기 때문에 시스템 역시 CPU 병목현상을 최소화할 수 있도록 구성하였습니다. 이전 RTX 3080 벤치마크에서 입증한 바와 같이 비록 PCIe 4.0을 지원하지 못하고 PCIe 3.0에 머무르고 있긴 하나, 최강 게이밍 CPU인 인텔 코어 i9-10900K OC 5.0 GHz 설정입니다. 각 그래픽카드 성능 편차를 가늠함에 있어 이상적인 시스템입니다.
이번 벤치마크는 리뷰어를 대상으로 배포된 최신 버전, 456.96 드라이버를 설치하여 전체 게임에 대한 재테스트를 실시하였습니다. 특이사항으로는 단, 배틀그라운드는 대규모 업데이트가 이루어져 파라모 맵에서 테스트를 실시하였으며, 오버워치(업데이트마다 리플레이 초기화) 그리고 호라이즌 제로 던(1.05->1.06) 역시 업데이트가 이루어진 관계로 이전 데이터와 수치를 비교하는 것은 적절하지 않습니다.
인텔공인대리점: 인텔 코어 i9-10900K 어벤져스 에디션(기사 링크)
게임이 포함되어 있지 않은 인텔 코어 i9-10900K 어벤져스 에디션입니다. 사실 냉정하게 말하면 단순히 패키지 껍데기가 바뀐 수준으로 볼 수도 있겠지만, 마블 코믹스를 좋아하는 분들이라면 구미가 당길 수 있는 매력적인 컬래버레이션 제품이죠. 자세한 내용은 QM슈아의 퀘이사리포트를 참고해 주시기 바랍니다.
인텍앤컴퍼니: ASUS ROG MAXIMUS XII APEX 인텍앤컴퍼니(기사 링크)
ROG 그리고 APEX. 마법의 조합과도 같은 두 단어입니다. 특히나 메모리 오버클록에 있어서는 기능성과 성능을 이미 입증한 제품이기도 하고요. 실제로 퀘이사존 자체 테스트 결과 메모리 오버에서 최고 클록을 뽑아냄에 있어 이 녀석을 능가하는 제품은 아직 경험해보지 못했습니다. 퀘이사존 기사를 놓쳤던 분들은 링크를 통해 확인해 보시기 바랍니다.
서린씨앤아이: G.SKILL TRIDENT Z ROYAL DDR4-3,200 CL14 16GB x2(기사 링크)
일명 보석 메모리로 통하는 지스킬 트라이던트 Z 로열 시리즈. 이제는 모르는 분들을 찾기 힘들 정도로 유명한 제품입니다. 최초 해당 제품이 등장했을 때는 특유의 고급스러운 디자인에 녹아든 화려한 보석 RGB LED가 충격적이기까지 했죠. QM슈아의 가장 최신 트라이던트 Z 로열 칼럼을 통해 성능과 외형의 진면목을 확인해 보시기 바랍니다.
서린씨앤아이: PATRIOT VIPER VPN100 M.2 NVMe 2TB(기사 링크)
벤치마크 시스템은 수십종 게임을 한꺼번에 테스트해야 하기 때문에, 고용량 SSD는 필수입니다.(특히 콜옵 이 xxx) 그래서 준비한 SSD가 바로 PATRIOT 바이퍼 게이밍(VIPER GAMING) 저장장치, VPN100 NVMe 2TB 모델입니다. 용량도 용량이지만, 알루미늄 방열판을 기본 장착하고 있다는 점에서 발열로 인한 스로틀링 걱정을 한시름 놓게 됩니다. 또한, 해당 제품은 QM달려가 냉철한 시각으로 분석한 칼럼도 등록되었으니 참고해 주시기 바랍니다.
▲ RTX 3090 벤치마크에 동원된 게임 목록
RTX 3070 벤치마크는 3D 게임 성능을 다방면으로 알아보기 위해 게임 타이틀 역시 수십 종으로 구성하였습니다. 소위 '깡성능'을 측정하기 위해 20종 게임을, 레이트레이싱(Ray Tracing)과 DLSS(Deep Learning Super Sampling)로 대표되는 RTX 게임 성능 측정을 위해 4종 게임을 마련하였습니다. 깡성능 테스트를 위한 게임들은 그래픽카드 성능 벤치마크로 상징성이 높은 게임 타이틀, 게이머들에게 인기가 높은 게임, GPU 최적화가 좋은 게임 등 다양한 기준을 통해 선정한 결과입니다. 덕분에 게임 렌더링 API 종류도 다양성을 띠게 되었습니다. 기본적으로 3종 해상도(FHD/QHD/UHD) 조건에서 테스트를 진행하며, RTX 게임 성능은 기술 구현에 따른 성능 변화 파악에 우선순위를 두어 QHD 해상도 한정으로 테스트를 진행하였습니다.
※ 아래 내용부터는 벤치마크 테스트 결과로 이어집니다. 항목별 구체적인 테스트 결괏값은 세부 페이지에서 확인해 주세요.
RTX 3070은 파이어스트라이크에서 과연 RTX 2080 Ti 점수를 넘어설 수 있을까? 아쉽지만 FE 버전보다는 살짝 낮은 34.8K를 기록하였습니다. 그러나 레퍼런스 클록 버전 RTX 2080 Ti보다 미세하게 높다는 것이 재밌습니다. 엔비디아가 넘어선다는 것은 FE 버전이 아닌 레퍼런스였을까요? 타임스파이에서 계속 확인해보죠.
DX12 API 기반 게임 성능을 대변하는 3DMark Time Spy 일명 '타스' 점수입니다. 13.7K로 측정되었습니다. RTX 2080 Ti FE 대비 약 95%에 해당하는 성능이며, RTX 2070 SUPER FE와 비교 시 약 38% 높은 성능입니다. 파스와 달라진 점이라면 RTX 2080 Ti FE 버전은 물론이고, 레퍼런스 버전보다도 성능이 떨어진다는 것입니다. 상당히 아쉬운 결과입니다.
타스 기본 설정 외에도 DX12 API + 4K/UHD 해상도 성능을 측정하는 타임스파이 익스트림을 테스트에 포함하였습니다. 익스트림 옵션에서는 다시 레퍼런스와 FE 버전 사이 점수를 기록하였습니다. 전반적인 게임 성능도 이와 크게 다르지 않을 것으로 예상되네요. 다음은 DLSS 테스트 결과입니다.
마이크로소프트 DirectX Raytracing, 줄여서 DXR입니다. DXR은 DX12 API 확장 기능으로써 실시간 레이트레이싱 연산을 위한 윈도우 10 표준이기도 합니다. 3DMark Port Royal은 DXR로 레이트레이싱을 구현하며, RTX 지포스 그래픽카드의 실시간 레이트레이싱 연산 능력을 측정할 수 있습니다. 성능 측정은 2종 옵션으로 나누어 진행하였는데요. 첫 번째는 기본 설정 점수이고 두 번째는 레이트레이싱 관련 옵션 비활성화 시 점수입니다. 점수 차이가 작을수록 레이트레이싱 연산 부담이 작다는 뜻이고 동시에 실시간 레이트레이싱을 염두에 둔 미래지향적 아키텍처라는 뜻도 가집니다.
RTX 3070 FE 포트로열 점수는 8.2K를 기록하며, RTX 2080 Ti 대비 소폭 낮은 점수를 기록하였습니다. 그리고 레이트레이싱 적용 시의 성능 하락은 더 작습니다. 이와 같은 특징은 RTX 3080 FE와 동일합니다.
RTX 핵심 기술 중 하나인 DLSS 성능 테스트입니다. 3DMark에서는 DLSS 기능 테스트를 위해 DLSS 적용 유무에 따른 성능 차이를 보여주는데요. 본 벤치마크는 QHD 해상도를 기준으로 합니다. RTX 30 시리즈 출시에 맞춰 DLSS 2.0 업데이트가 적용되었으며, Performance/Quality 옵션에 따른 성능 향상을 살펴볼 수 있습니다. RTX 3070은 타 모델 대비 DLSS에 대한 성능 향상이 상대적으로 크게 나타납니다.
해당 그래프는 각 게임에서 RTX 2080 Ti FE 성능(평균 FPS)을 100% 두었을 때, 나머지 그래픽카드 상대 성능을 계산하고 이를 20종 게임으로 확장하여 평균값을 도출한 그래프입니다. RTX 게임 성능을 제외했기 '깡성능'으로 이해하시면 됩니다. 결과를 보면 3DMark 테스트에서 보여줬던 양상과 크게 다르지 않습니다. RTX 3070은 RTX 2080 Ti FE 버전과 레퍼런스 클록 버전 사이에 위치하며, 각 그래픽카드 성능 차이는 매우 미미한 수준입니다. 크게 봐서 동급이라 해도 무리가 없는 수준이죠.
“거짓말은 하지 않았다.” 여기서 엔비디아가 애초에 주장했던 “RTX 3070은 RTX 2080 Ti보다 빠르다”라는 말을 다시 떠올려보게 됩니다. 2080 Ti는 FE 버전과 레퍼런스 버전이 클록과 TDP 모두 다릅니다. 즉 FE가 뛰어날 수밖에 없는 것이죠. 그러나 대부분의 하드웨어 커뮤니티/매체가 FE 버전을 기준으로 삼고 있고, 또 대표성을 가지기 때문에 많은 사람들은 FE 버전보다 뛰어나다는 말로 받아들였을 것입니다. 하지만 결과는 FE 버전보다는 소폭 낮고 레퍼런스 클록보다는 소폭 높은 성능으로 나왔습니다. 즉 거짓말은 아니었으나 엔비디아 마케팅 메시지가 매우 세심한 전략으로 탄생되었다는 것을 알 수 있는 대목입니다.
다음은 RTX 게임 성능입니다. 테스트 게임 종류가 깡성능 테스트 대비 많지 않기 때문에 데이터 신뢰도는 상대적으로 떨어집니다. 물론, 그럼에도 불구하고 참고 가치가 있습니다. 결과에서는 RTX 3070이 RTX 2080 Ti FE 버전보다도 높은 성능을 보여줬지만, 앞서 말씀드렸듯이 그 차이가 미미하고 테스트 샘플이 적기 때문에 큰 의미를 부여하는 것은 부적절합니다. 여전히 크게 보면 동급 성능으로 해석하는 것이 적절합니다. 단, 차후 RTX 기술이나 최신 게임들이 지속적으로 출시되면 늘 그랬듯이 최신 그래픽카드가 상대적인 성능이 높아질 가능성이 존재합니다.
또한, 이전 세대 그래픽카드가 워낙 고가였다는 것이 이유기도 하나 어쨌든 RTX 3070은 $499 가격에 $999~$1,199 가격으로 책정됐던 RTX 2080 Ti와 동급 성능을 가졌습니다. 암페어 아키텍처 기반 지포스 30 시리즈의 우수한 성능 향상이 여전히 유효하다는 말이죠. RTX 3080 대비 확실히 저렴한 가격 그리고 RTX 2080 Ti 급 성능을 원하셨던 분들에게는 메리트가 큽니다.
▲ 오버클록이 적용된 RTX 3070 FE GPU-Z 화면
오버클록 잠재력도 확인해 보았습니다. 3DMark Stress Test 및 QHD 해상도 게이밍 반복 테스트를 실시한 결과, 달성 가능한 최고 오버클록 수치는 코어 오프셋 +125 MHz, 메모리 오프셋 +1250 MHz(14 Gbps -> 16.5 Gbps) 수준이었습니다. 오버클록 마진은 RTX 3080/RTX 3090에 비해 컸습니다. 전력 제한 레벨은 RTX 3070 파운더스 에디션 기준, 기본 220W에서 최대 +9%가 향상된 약 240W 수준까지 확장 가능합니다. 해당 기능을 통해 커스텀 수랭 또는 본인만의 고성능 쿨링 대책을 강구할 수 있다면, 더 높은 실제 부스트 클록을 기대할 수 있습니다.
|