지포스 RTX 8800 ULTRA 48GB 프리뷰
2022년 10월, 엔비디아는 RTX 4090을 필두로 한 RTX 40 시리즈를 출시했습니다. 그로부터 1년 반이 흐른 지금, 그래픽카드 시장은 여전히 지포스 시리즈가 압도적 우위를 점하고 있습니다. 특히 엔비디아의 2년 주기 아키텍처 로드맵에 따르면 올해 하반기에는 어쩌면 RTX 50 시리즈를 만나게 될지도 모르겠습니다. 물론, 제조사 상황에 따라 이러한 계획은 변경될 수도 있지만, 늦어도 내년 초까지는 무조건 등장할 것이라는 관측이 지배적이죠.
그런데! 이런 시장 상황에서 전혀 예상할 수 없었던, 충격적인 물건이 퀘이사존 사무실에 도착했습니다. 사실상 정규 세대에 포함되지 않는 스페셜 성격의 그래픽카드인데요. 모델명부터 심상치 않습니다. 바로 오펜하이머Oppenheimer 아키텍처로 탄생한 지포스 RTX 8800 ULTRA입니다.
▲ 줄리어스 로버트 오펜하이머(출처: 위키피디아)
대체 이건 무슨 물건인 걸까요? 엔비디아가 그동안 얼마나 보안에 철저했는지 그 흔한 루머 한번 나오지 않았던 제품입니다. 엄연히 지포스 브랜드로 편승한 모델이니, 조그마한 소식이라도 들렸을 법한데, 퀘이사존 하드웨어 뉴스 게시판에서도 관련 소식은 단 한 건도 올라온 적이 없습니다.
▲ 퀘이사존이 긴급 입수한 ELSA社의 RTX 8800 ULTRA 레퍼런스 모델. 정책상 비레퍼 모델은 허용되지 않는다.
그래서 그런지 저 역시 하드웨어 마니아로서 또 컴덕후로서 충격과 함께 놀라운 마음으로 가득 찼습니다. 무엇보다 스펙과 가격만 봐도 말도 안 되는 괴물임이 확실하기 때문이죠. 또한, 이례적으로 제품 공개와 동시에 엠바고 해제가 풀리는 바람에 아직 벤치마크 데이터도 준비하지 못한 상황입니다. 하지만 조금이라도 회원분들의 궁금증을 풀어드리기 위해, 제품 외형과 구조 그리고 간단한 성능 테스트를 준비해 봤습니다.
충격에 충격을 더한 압도적 스펙
먼저 공식 스펙입니다. RTX 8800 ULTRA는 오펜하이머Oppenheimer 아키텍처로 명명된 GO100 풀칩 구성의 GPU를 탑재했습니다. 공정이 매우 놀라운데 TSMC가 비밀리에 가동하고 있는 2.5 nm 공정을 사용했습니다. 해당 공정은 엔비디아 빅칩 GPU 전용 공정이며 2 nm도 아니고 3 nm도 아닌 전례가 없는 애매한 수치, 바로 2.5 nm입니다. GO100 GPU 전용 공정으로써 오로지 RTX 8800 ULTRA 제품을 위해서만 가동됩니다.
또한, 거대한 다이 사이즈의 풀칩 GPU를 탑재했기 때문에 현재 웨이퍼 수율이 매우 좋지 않다는 카더라가 있습니다. 그래서 그런지 가격도 상상을 초월하는데요. 특별한 성격의 제품으로서 엔비디아의 미래 게이밍 성능을 엿볼 수 있다는 측면에서 비싼 가격을 감내할 가치가 있을지 궁금합니다.
CUDA 코어는 36,864개입니다. 기존 RTX 4090과 비교 시 코어 규모 차이만 2.25배에 달합니다. 여기에 더해 TSMC 2.5 nm 공정에 힘입은 3,285 MHz 부스트 클록과 맞물려 FP32 성능은 무려 242.2 테라플롭스를 가지게 됩니다. 해당 수치는 RTX 4090 대비 약 2.9배이며, 콘솔 게임기 중 가장 강력한 성능을 가진 엑스박스 시리즈 X(12.15 TFLOPS) 대비 약 20배에 달하는 괴물 같은 수치죠.
▲ 통합 아키텍처(Unified Architecture)로 설계된 오펜하이머 GPU/RTX 8800 ULTRA
스펙만 보고 성능을 유추하기 전에 반드시 확인해야 할 것이 바로 오펜하이머 아키텍처입니다. 엔비디아 내부 문서, 아키텍처 백서(Whitepaper)에 따르면, 엔비디아 최초로 통합 아키텍처(Unified Architecture)로 설계되어 CUDA 코어 내 FP32/INT32 전환 및 병행 워크로드 효율을 극대화했습니다. 여기에 더해 최신 게임에서 더욱 높은 효율을 보여주는 L2 캐시 메모리가 대폭 증가하여 실제 게임 성능은 단순 FLOPS 차이 이상이라고 주장합니다.
▲ RTX 8800 ULTRA와 함께 공개된 엔비디아 테크 데모, Human Head 실시간 렌더링 영상
최고 사양 GDDR7 메모리 그리고 미친 소비전력과 가격 ▲ 32Gb(4GB) 모듈 12개로 구성된 GDDR7 메모리, 48 Gbps로 작동한다
메모리는 GDDR7 최고 스펙을 자랑합니다. 48 Gbps 속도로 작동하는 GDDR7 메모리는 384-bit 버스로 메모리 대역폭은 약 2.3 TB/s에 달합니다. 메모리 버스가 512-bit였다면 더 좋지 않았을까 아쉬움이 들지만, 전반적인 칩 규모와 소비전력 등 다양한 요소를 고려한 설계로 판단됩니다. 이러한 스펙상 아쉬움을 극복하기 위해 엔비디아는 데이터 컬러 압축 기술을 대폭 업그레이드하여 이전 세대 대비 3배 효율을 가집니다. 메모리 대역폭의 의의는 결국 VRAM 데이터를 효율적으로 빠르게 처리하기 위함인데, 데이터 컬러 압축 기술이 이 정도로 좋아지면 아쉬운 메모리 스펙에 대한 상쇄 효과는 충분할 것입니다.
▲ 평범한 6핀 2개로 보이지만, 해당 커넥터는 12VHPWRTX8800-X2 인터페이스다. 6핀 하나에 500 W 공급 가능
그렇다면 소비전력은 어떨까요? 소비전력조차 괴물 같은 모습입니다. 사실 TGP 600 W 숫자는 아무리 성능이 좋더라도 시대착오적 수치임이 분명합니다. 2.5 nm 공정이 생각보다 누설전류가 심하거나 혹은 무리하게 클록을 끌어올리다 보니 스위트 스팟을 지나친 게 원인일 수 있습니다. 엄청난 성능의 물건인 만큼 언더볼팅을 통해 400 W대로 사용하는 것이 효율적일 것입니다.
결과적으로 괴물 같은 소비전력 덕분에 권장 PSU는 1200 W입니다. 하지만 출력만 만족한다고 해서 해결되는 게 아닙니다. RTX 8800 ULTRA에 장착된 파워 커넥터는 12VHPWRTX8800-X2 규격으로, 해당 규격은 변환 젠더가 아닌 반드시 PSU에서 네이티브로 지원해야 합니다. 만약 젠더 사용 시 순식간에 커넥터가 손상될 수 있으니 주의해 주시길 바랍니다. 어쨌든 RTX 8800 ULTRA를 노리고 계신 분들이라면, 파워서플라이 업그레이드가 반드시 필요합니다.
한국 시간 기준, 4월 1일 오후 10시부터 판매 시작
마지막으로 가격입니다. 기존 플래그십 모델이었던 RTX 4090 스펙을 아득히 뛰어넘는 만큼 가격은 매우 상당히 아주 개같이 비쌉니다. MSRP $6,974로 책정되었으며, 국내 시장가는 현실적으로 1천만 원이 넘을 것이라는 관측이 지배적입니다. 게이밍 그래픽카드가 천만 원이라니... 격세지감이 느껴집니다. 일부 파트너사에서는 출시 기념 999만 원 한정 수량 특가도 준비 중이라고 하니, 관심 있으신 분들은 퀘이사존 타세요(링크) 게시판을 주목해 주시기 바랍니다.
아무쪼록 RTX 8800 ULTRA는 한국 시간 기준, 4월 1일 오후 10시 세일즈 엠바고 해제 즉시 판매가 이루어지며, 다양한 파트너사에서 물량을 확보했다는 소식이 들려옵니다. 엔비디아 공식 홈페이지에서는 판매하지 않으며, 비레퍼런스 모델 역시 허용하지 않습니다. 오로지 레퍼런스 모델만 판매되며, 제조사 입장에서 유일한 재량 요소는 쿨링팬 중앙부 스티커입니다. 퀘이사존은 ELSA의 8800 ULTRA를 확보했는데, 해당 모델은 쿨링팬 중앙부에 ELSA 로고를 수줍게 부착했습니다.
ELSA 지포스 RTX 8800 ULTRA 레퍼런스 살펴보기
본래 독일 브랜드였던 ELSA는 현재 일본지사에서 인수한 상태로 패키지에서부터 일어가 발견됩니다. 해당 제품은 ELSA 본사에서 직접 샘플을 보냈기 때문에, 한국 현지화 요소는 전혀 찾아볼 수 없습니다. 그러나 국내 유통 버전에서는 패키지 디자인이 다소 변경될 수 있다고 하니, 참고해 주시기 바랍니다.
인상적인 요소라면 상단 작은 텍스트에는 RTX 8800 ULTRA라고 선명하게 각인되어 있지만, 아래 큼지막한 로고에서는 RTX가 제외되었다는 것입니다. 해당 부분에 대해 본사 문의 결과, 현재 샘플 버전인 관계로 크고 작은 오류가 있을 수 있다고 합니다. 최종 리테일 버전에서는 수정 예정인 요소입니다.
패키지 뒷면에는 제품 외형과 함께 주요 특징 및 기술 설명이 가미되어 있습니다. 자꾸 왜 철 지난 다이렉트X10 문구가 등장하는지 알 수 없으나, 샘플 버전이라는 점을 참고해 주시기 바랍니다. 최종 버전에서는 꼭 고칠 것이라고 거듭 강조한 바 있습니다.
패키지 내용물 전체 구성품입니다. 클래식 감성을 위해 ODD 용 설치 디스크를 동봉하고 있으며, 각종 매뉴얼과 젠더, 케이블을 포함하고 있습니다.
지포스 RTX 8800 ULTRA의 레퍼런스 디자인은 매우 인상적입니다. 엔비디아 로고를 형상화하여 마치 조각하듯이 쿨러 덮개에 새겨놓았습니다. 또한, 플라워형 팬 구조가 아닌 블로워팬을 탑재하고 있는데, 이는 케이스 내부 온도 상승을 최소화할 수 있어 살신성인 정신을 달성했습니다.
그동안 엔비디아가 늘 자사 제품의 성능만 신경 쓰면서, RTX 30 시리즈 FE 모델부터 적용된 독특한 쿨링 구조는 케이스 내부 온도 상승 주범으로 지목되며 많은 비판을 받아왔습니다. 블로워팬 구조는 이에 대한 반성의 모습으로도 해석할 수 있습니다.
다만 600 W TGP에 어울리지 않게 2 슬롯으로 디자인되어 걱정이 앞섭니다. 그 많은 발열을 다 어떻게 처리할 수 있을까요? 이러한 우려는 현실이 되고 말았는데, GPU 온도 테스트는 본 기사 말미를 확인해 주시기 바랍니다.
특이하게도 백플레이트는 존재하지 않습니다. 2024년에 나온 그래픽카드라고는 믿어지지 않는 특징인데요. 엔비디아 설명에 따르면 커스텀 백플레이트 장착 시 AS 거부 사유가 된다고 하니 참고해 주시기 바랍니다. 백플레이트를 탑재하지 않은 이유에 대해서는 노코멘트라는 답변을 보내왔습니다.
출력 포트는 DVI(Digital Video Interface)로 명명된 차세대 규격 포트를 장착했습니다. 8K 고주사율을 위해 듀얼링크 대역폭 버전으로 구성하였으며, 기존 DP/HDMI 포트와는 호환성이 전혀 없습니다. 따라서 RTX 8800 ULTRA 구매를 염두에 두고 계신 분들이라면, DVI 지원 디스플레이가 필수입니다.
그래픽카드 한 장만 해도 무려 천만 원이 넘어가는데, 2장~3장을 추가로 장착해 게임 성능을 향상시키는 SLI 기술도 지원합니다. RTX 8800 ULTRA에는 SLI 커넥터가 마련되어 있어, 돈만 있다면 RTX 8800 ULTRA를 여러 개 구성하여 압도적인 성능을 즐길 수 있도록 하였습니다. 그러나 SLI 기술은 결국 게임에서도 지원해야 한다는 것이 한계입니다.
이와 관련하여 현재 엔비디아는 게임사가 SLI를 지원하지 않아도, 드라이버 제어판에서 강제로 SLI 활성화 및 성능 향상이 가능하도록 하는 기능을 마련했다고 하니, 이 부분은 차후 검증해 보도록 하겠습니다.
골드핑거 상단 바코드 스티커에서도 모델명 표기 오류가 발견됩니다. GeForce 다음에 와야 할 'RTX'가 빠져 있습니다.
다음은 PCB 기판과 쿨러를 분해한 모습을 살펴보도록 하겠습니다. 거대한 GPU 다이가 눈에 들어오는데요. 그 주위를 메모리가 감싸고 있고, 우측에는 전원부 및 전원 커넥터가 자리 잡고 있습니다. 참고로 GPU는 너무 거대해서 자칫 GPU를 히트스프레더로 감싼 것 아닌가? 하는 의심이 들 수도 있지만, 놀라지 마세요. 저 네모가 GPU 다이입니다. 2,724억 개의 트랜지스터가 집적되어 CUDA 코어 36,864개 위용을 자랑합니다.
전원부는 외견 상 썰렁하게 느껴질 수 있습니다. 그러나 RTX 8800 ULTRA에는 특수한 부품으로 이루어진 전원부 부품들이 탑재되어 있고, 페이즈 당 880 A 스펙을 자랑하니 겉모습만 보고 판단해서는 안 됩니다.
깡성능 측정! 3DMark Time Spy & Time Spy Extreme
타임스파이 점수입니다. 일반 타스 점수는 약 8만 점에 가까운 놀라운 성능을 보여주기는 했으나, 가시적인 스펙 차이 3배에는 크게 미치지 못합니다. 이는 전적으로 CPU 병목 현상에 기인합니다. 실제로 타스 구동 시 RTX 8800 ULTRA의 GPU LOAD는 60%~90% 범위로 가동되는 것을 확인했습니다. 일반 타스로는 현존 CPU 성능 제약으로 인해 RTX 8800 ULTRA의 진정한 힘을 발휘할 수 없는 것이죠. 그러나 4K 해상도를 사용하는 타스 익스트림은 어떨까요?
타임스파이 익스트림 점수입니다. 일반 타스 대비 RTX 4090과의 점수 격차가 훨씬 커졌습니다. 점수는 약 55K에 달하며, 이는 RTX 4090의 2.8배입니다. 그러나 테스트 시스템 사양이 7950X3D를 사용했음에도 GPU LOAD 99%를 유지하지는 못했습니다. 종종 90% 이하로 떨어지는 구간이 있는데, 이는 4K 해상도조차 RTX 8800 ULTRA 입장에서는 너무 가벼운 부하라는 것을 방증합니다.
레이트레이싱 성능은? 3DMark Port Royal
레이트레이싱 게이밍 성능을 엿볼 수 있는 3DMark Port Royal 성능입니다. 여기서 놀라운 반전이 일어나는데요. RTX 8800 ULTRA는 약 85.7K를 기록하며, RTX 4090의 3.3배 성능을 달성했습니다. 깡성능보다 레이트레이싱 성능에서 더 큰 격차를 보인 것인데, 이는 오펜하이머 아키텍처의 특징이자 장점인 통합 RT 코어에 있습니다.
▲ BVH 알고리즘 개요
엔비디아가 따로 해당 RT 코어에 세대를 부여하진 않았습니다만, 오펜하이머의 RT 코어는 기존 RT 코어가 BVH(Bounding Volume Hierachy) 알고리즘에 의존한 것과 달리 매 렌더링 신마다 필요한 알고리즘 연산량을 유동적으로 조절합니다. 즉 비교적 단순한 광원에서는 알고리즘도 단순화하여 비효율적인 연산을 피하는 것인데, 문제는 품질일 것입니다. 엔비디아 설명에 따르면 렌더링 결과물은 100% 동일하다고 하니, 참으로 엄청난 기술임이 분명합니다.
둠 이터널 4K/8K 성능
신적화라 불리는 둠 이터널 4K/8K 테스트 결과입니다. RT 게이밍 성능까지 측정하면 좋았겠지만, 주말에 입수한 터라 테스트 시간 자체가 부족하여, 일단 깡성능만 살펴보도록 하겠습니다. 사실 둠 이터널은 Vulkan 로우레벨 API에 GPU 최적화가 엄청난 게임으로 유명하여, 벤치마크 테스트 시 매우 유용합니다. 해상도별 렌더링 성능 격차도 매우 균일한 편이며, GPU 연산 능력을 확실히 반영하는 효율적인 게임 엔진을 자랑하기 때문이죠. 무엇보다 CPU 병목 현상이 거의 없어 출시 4년이 지난 지금까지도 최신 그래픽카드 테스트에 전혀 문제없는 특성을 가지고 있습니다.
4K는 이미 RTX 4090에서도 충분한 성능이 나오기 때문에, 8K 성능을 확인해 보도록 하겠습니다. 둠 이터널 최적화가 워낙 훌륭하다는 점을 감안해야겠으나, 그럼에도 불구하고 RTX 8800 ULTRA는 무려 247 FPS라는 충격적인 성능을 기록했습니다. RT+DLSS 조합이라면 8K + 고주사율 디스플레이에서도 충분한 성능을 내어줄 것이 자명합니다.
호라이즌 포비든 웨스트 4K/8K 테스트
최신 PC 게임, 호라이즌 포비든 웨스트 테스트 결과입니다. 4K 해상도에서 무려 200 FPS에 가까운 성능입니다. 호포웨가 최적화가 잘 되었다고 해도 워낙 그래픽이 좋은 만큼 절대적인 사양이 낮은 게임은 결코 아닙니다. 이런 점을 감안하면 참으로 충격적인 성능이죠.
내친김에 8K 해상도도 적용해 보았습니다. 해당 성능은 DLSS와 같은 업스케일을 전혀 사용하지 않은 순수 네이티브 8K/7680x4320 해상도입니다. 사실 8K 해상도는 4K의 4배에 달하는 해상도인 만큼, RTX 4090도 30 FPS 대를 기록하며 힘을 쓰지 못합니다. 그러나 RTX 8800 ULTRA는 2.3 테라 메모리 대역폭 + 향상된 데이터 컬러 압축 기술에 힘입어 90 FPS를 상회합니다. 이는 RTX 4090 대비 약 2.6배 성능으로 3DMark 타임스파이 익스트림 결과와 상당히 유사합니다.
미친 성능의 이면, 심각한 GPU 온도
TGP 600 W 그래픽카드에 달랑 블로워팬 구조의 쿨러는 보는 이로 하여금 불안에 떨게 합니다. 그리고 그 불안은 현실이 되었습니다. 시간 관계상 정확히 측정은 하지 못했으나, 약 6천 RPM으로 회전하는 쿨링팬으로도 용암처럼 뜨거운 RTX 8800 ULTRA GPU를 식히기엔 역부족이었습니다. 풀로드 시 평균 GPU 온도는 100도를 가볍게 넘겼으며, 피크치 온도는 무려 110도 근처까지 갑니다.
사실상 GPU가 녹아내리는 건 아닐까 걱정스럽습니다. 그런데 여러분, 걱정하지 않으셔도 됩니다. 엔비디아에 따르면 GPU 온도 임곗값은 130도라고 합니다. 즉 110도라는 온도는 설계상 허용 수치라는 것이죠. 정신 나간 온도가 분명한데, 허용 수치라는 것이 믿기지가 않습니다. 정말 계속 써도 되는 물건일까요? 판단은 구매자 여러분께 맡기겠습니다.
지포스 RTX 8800 ULTRA 프리뷰 요약 |