GTX 1660 Ti 게임 테스트 결과 종합 25종 게임 성능 백분율 그래프
25종 게임 테스트 결과를 종합한 그래프입니다. GTX 1660 Ti 구매를 고려하고 있는 사용자라면 FHD/QHD 환경이 대다수일 텐데요. 해당 해상도에서 GTX 1070과 동급의 성능을 보여줍니다. 이러한 특성은 전 해상도에 걸쳐 나타나기 때문에 그냥 GTX 1070 급이라 생각하면 속 편하겠죠. GTX 1060과 비교해보면 FHD/QHD/UHD 해상도에서 각각 34.6%/39.2%/40.7% 높은 성능을 보여줍니다. 게임마다 다르겠지만, GPU를 잘 사용하는 게임이라면 약 1.4배의 성능을 보여준다고 볼 수 있겠죠. 엔비디아의 최대 1.5배 성능 주장이 허언이 아니라는 것을 방증합니다. RX 590과의 비교는 어떨까요? 같은 MSRP를 가진 RX 590과 비교해보면 GTX 1660 Ti의 성능이 확실히 더 뛰어나다는 것을 알 수 있습니다. 속된 말로 RX 590이 비빌 수 있는 상대가 아니란 뜻이죠. 또한, GTX 980 Ti는 GTX 1070의 87~89% 성능에 머물고 있는 걸로 보아, GTX 1660 Ti는 지포스 GTX TITAN X보다도 소폭 뛰어날 것으로 예상할 수 있습니다. 물론, GTX TITAN X의 VRAM이 2배 더 많다는 장점은 남아있겠지만요. 25종 게임 성능 백분율 그래프 - 2560x1080(21:9)
21:9 화면비의 2560x1080 해상도 테스트 결과입니다. 전반적으로 FHD/QHD 해상도 결과와 유사한 양상입니다. GTX 1070과 동급이며 RX Vega 56에는 미치지 못합니다. 최대 오버클록 적용 시에는 GTX 1070 Ti에 근접하지만 넘어서지는 못합니다. RTX 2060도 마찬가지죠. 따라서 일반적인 환경에서의 오버클러킹으로 RTX 2060 성능을 바라보는 건 불가능에 가깝습니다. 25종 게임 성능 백분율 그래프 - 3440x1440(21:9)
2560x1080 대비 약 1.8배의 픽셀 렌더링 부하를 주는 3440x1440 테스트 결과입니다. QHD와 UHD 중간에 해당하는 특성을 보여줍니다. GTX 1660 Ti vs. GTX 1070 - 25종 게임 성능 분석
앞서 살펴본 종합 결과에서 GTX 1660 Ti는 GTX 1070과 1%도 차이 나지 않는 동급 성능을 기록한 바 있습니다. 하지만, 각 게임별 성능 차이는 달리 나타날 수 있죠. 결과를 보면 API 종류에 따라 혹은 게임 특성에 따라서는 10% 이상의 차이도 발생하는 것을 확인했습니다. 이러한 결과는 아키텍처의 차이에 기인합니다. 특히 에이펙스 레전드(Apex Legends), 배틀그라운드(PlayerUnknown's Battlegrounds), 레인보우 식스 시즈(Tom Clancy's Rainbow Six Siege), 울펜슈타인 2(Wolfenstein II: The New Colossus) 등에서 차이가 더 크게 벌어지는데요. 튜링 아키텍처의 특성으로 인한 게임 성능은 잠시 후 좀 더 세부적인 내용을 통해 말씀드리도록 하겠습니다. GTX 1660 Ti vs. RX 590 - 25종 게임 성능 분석
다음은 라데온 RX 590과의 비교입니다. RX 590은 RX 580의 개선판 모델로 작년 11월에 출시되었습니다. MSRP는 $279로 GTX 1660 Ti와 같기 때문에 비교를 피할 수 없죠. 결과를 보면 스트레인지 브리게이드를 제외한 모든 게임에서 GTX 1660 Ti가 뛰어난 성능을 제공해줍니다. 그 격차 또한 무시 못 할 수준이라 급이 다른 그래픽카드로 정의할 수 있습니다. 반면 AMD가 강점을 보이는 DX12/Vulkan API 게임에서는 성능 차이가 좀 줄어드는 것을 볼 수 있습니다. 튜링 아키텍처의 효과가 두드러지는 게임은? ▲ 튜링 아키텍처에 유리한 5종 게임 성능 양상 튜링 아키텍처가 좋은 모습을 보여주는 게임 5종을 선정하여 그 성능 차이를 살펴보도록 하겠습니다. 위 그래프는 QHD 해상도에서의 3종 그래픽카드별 평균 프레임 수치를 나타낸 것으로 GTX 1060의 성능을 1로 두었을 때, GTX 1070/GTX 1660 Ti의 상대 성능값도 포함하였습니다.
GTX 1060과 비교하여 무려 1.7배의 성능을 보여준 울펜슈타인 2는 튜링 아키텍처의 이점을 톡톡히 본 케이스입니다. 바로 튜링의 적응형 셰이딩(Adaptive Shading) 기술이 적용되었기 때문이죠. 그렇다면 적응형 셰이딩이란 무엇일까요? 적응형 셰이딩이란 쉽게 말해서 렌더링 되는 영역의 픽셀과 다음 렌더링 할 프레임의 컬러값을 고려하여 셰이딩 비율을 다르게 적용하는 것을 말합니다.
▲ 적응형 셰이딩의 적용 예 - 픽셀 셰이딩 연산 부담을 40% 절감 이렇게 말로만 풀어놓으면 이해가 쉽지 않을 수 있는데요. 적응형 셰이딩은 완전히 같지 않지만, 이미지 압축 알고리즘과 유사합니다. 시간적 흐름(프레임)에 따라 컬러값이 변하지 않는 영역이라면 최저 비율로 셰이딩이 이루어지고, 동적으로 계속 변하는 영역이라면 셰이딩 비율을 그대로 유지하여 화면에 보이는 비주얼 품질은 차이가 없으면서도 GPU 연산 부담은 낮추는 것으로 설명할 수 있습니다. 따라서 화면 전환이 급격한 상황이 지속된다면 성능 개선 효과는 낮아지겠지만, 반대의 상황이라면 성능 개선 효과가 극대화되겠죠. 이러한 기술이 울펜슈타인 2에 적용되어 있으며, GTX 1660 Ti는 날개를 단 듯 엄청난 성능을 보여주게 됩니다. 무려 GTX 1070과 비교해도 20% 높은 성능으로 말이죠.
다음은 섀도 오브 더 툼레이더(Shadow of the Tomb Raider, 이하 섀오툼)입니다. 섀오툼에서의 GTX 1660 Ti 성능은 튜링 아키텍처의 새로운 워크로드 모델로 설명할 수 있습니다. 일반적으로 3D 게임 성능 개선을 위해서는 부동소수점(floating point) 연산 능력이 가장 중요합니다. CUDA 코어와 같은 유닛들이 바로 부동소수점 연산, 즉 FP32 연산 능력을 위해 존재하는 것들이죠. 하지만 현대의 게임들은 부동소수점은 물론 정수(Integer) 연산 명령이 혼합되어 있는 형태를 갖고 있습니다. 이전의 파스칼 세대 셰이더 아키텍처는 이러한 비FP 산술 명령이 내려지면, 부동소수점 연산을 위한 데이터 경로가 유휴 상태로 머무르게 됩니다.(즉 비FP 산술 명령이 떨어지면 FP 연산에 손을 놓아버리는 상황)
▲ 튜링 아키텍처의 워크로드 모델 예시 하지만, 튜링 아키텍처는 위 이미지와 같이 모든 CUDA에 두 번째의 병렬 실행 단위를 추가하여 이러한 연산(FP+비FP/INT) 명령을 동시에 수행할 수 있게 된 것이죠. 섀오툼의 경우 100개의 명령 당 62 단위의 FP 연산과 38 단위의 INT 연산이 이루어지는데, GTX 1060의 경우 병렬 처리가 불가하므로 총 100개의 명령을 순차적으로 실행하지만, GTX 1660 Ti는 병렬 처리로 인해 62로 감축이 가능하여 더 효율적인 셰이딩 연산 처리가 가능합니다. 결국 이러한 아키텍처 차이로 인해 이론적인 스펙 차이를 뛰어넘는 성능 차이를 보여줄 수 있게 됩니다.
마지막으로 콜 오브 듀티: 블랙 옵스 4입니다. 튜링의 통합 캐시 아키텍처(Unified Cache Architecture)로 최적의 성능을 발휘할 수 있다고 엔비디아가 주장합니다. GTX 1060의 1.4배 성능을 보여줄 수 있다고 하는데, 실제 테스트 결과에서는 이를 뛰어넘는 1.54배 성능을 보여주었고요.
▲ 튜링 SM의 새로운 통합 L1 데이터 캐시와 메모리 아키텍처 튜링 아키텍처의 TU116 GPU는 SM 단위에서 L1 캐시와 텍스처 캐싱을 위한 새로운 통합 아키텍처를 도입했습니다. 이 통합 설계를 통해 L1 캐시와의 레이턴시(Latency)가 낮아지고, L1 캐시 크기 및 활용도가 크게 증가하게 되었습니다. 커진 단위만큼 그대로 성능 향상으로 귀결되지는 않겠지만, 데이터 입출력 과정에서 더 효율적인 처리가 가능하기 때문에 최종 결과물에서도 더 좋은 성능을 내어줄 수 있습니다. 그 외 배틀그라운드, 에이펙스 레전드에서의 좋은 성능 역시 앞서 언급한 튜링 아키텍처의 이점이 적용된 결과입니다. 물론, 울펜슈타인 2의 적응형 셰이딩과 같이 특별한 기술들은 게임에서의 지원이나 업데이트가 요구되는 부문이기 때문에 많은 게임에서 기대하기란 어렵지만, 그 외에도 튜링 아키텍처의 이점을 통해 특출난 성능을 발휘할 수 있는 게임들은 앞으로도 많아질 수 있겠죠. 즉 대부분의 그래픽카드가 그랬던 것과 같이 지금 당장의 상대 성능보다 앞으로의 성능에서 GTX 1070 대비 더 좋은 성능을 내어줄 가능성이 크다 할 수 있습니다. |