윈도우 10 1903 업데이트, 정말 성능 향상 있나? 라이젠 CCX 구조에 최적화된 스레드 운용 안녕하세요. 퀘이사존벤치입니다. 하드웨어 커뮤니티를 중심으로 퍼져나간 재밌는 인터넷 밈 중에 ‘성장형 그래픽카드’란 말이 있습니다. 주로 AMD 라데온 그래픽카드에 국한되어 쓰이는데요. 최초 공개 시점의 성능보다, 시간이 지날수록 경쟁사에 비해 상대 성능이 지속적으로 향상된 것에 빗대어 탄생된 말입니다. 이런 일이 발생하게 된 원인은 여러 가지를 꼽을 수 있겠지만, 대표적으로 드라이버/애플리케이션 차원의 최적화가 있고, 경쟁사에 비해 미래지향적 구조를 가졌던 아키텍처 특성도 꼽을 수 있습니다. 따라서 성장형이란 말은 양면성을 가질 수밖에 없겠죠. 일단, 출시 당시의 성능이 제품에 대한 첫인상을 강하게 결정한다는 점에서는 불리하고, 출시 후 나중에서야 최적화가 되어봤자 이미 시장 상황은 많이 달라졌을 가능성도 큽니다. 반면, 교체 주기가 긴 유저 입장에서는 지속적인 최적화로 쓸만한 성능을 오랜 시간 동안 보장받는다는 느낌을 받기도 합니다. 결국, 성장형이란 말은 결코 좋은 의미만 가진 것이 아닙니다. 처음부터 성숙된 최적화와 성능을 제공해주는 것이 가장 좋기 때문이죠. AMD에게 이러한 말이 더 체감적으로 와닿는 것은 어쩌면 그들이 그래픽카드나 CPU 분야에서 늘 2등의 위치에 있었다는 게 가장 큰 이유인지도 모르겠습니다. 특히 CPU 쪽은 심각한 상황이었습니다. AMD 라이젠이 세상에 나오기 전까지 말이죠. 실제로 비교가 민망할 정도의 점유율 차이가 존재했고, 이런 시장 상황은 수많은 애플리케이션 나아가 OS까지 AMD 하드웨어 최적화에 시간과 노력을 투자해야 하는 명분을 희미하게 만들어갔습니다.
그러나, 이제는 상황이 달라졌습니다. 특히 데스크톱 유저를 중심으로 한 라이젠의 인기와 시장 점유율은 점점 높아져 갔고, 현재 라이젠 3000 시리즈의 정보가 공개되면서 그 인기는 절정으로 치닫고 있습니다. 하드웨어 시장 상황이 변하게 되면 소프트웨어 분야에서도 변화가 일어나게 되죠. 실제로 출시 초기의 라이젠은 가격 대비 많은 코어를 탑재함으로써 유저들의 관심을 얻어내는 데는 성공했으나, 메모리 호환성 이슈나 최적화의 여지를 증명하듯 균일하지 못한 성능을 보여주는 등 개선점이 많아 보였습니다. 하지만 시간이 흐르면서 라이젠 아키텍처를 무시할 수 없게 되었고, 라이젠 로고가 박힌 또는 최적화 업데이트가 이루어진 많은 하드웨어와 소프트웨어가 나타나면서 라이젠의 위상은 높아져 갔습니다. 여기에 더해 최근 윈도우 10의 v1903 5월 업데이트에서 라이젠 CCX 스케줄러 최적화까지 적용되어 이제는 CPU까지도 성장형이란 밈이 더욱 적극적으로 따라붙게 되었습니다. 1903 업데이트, 정말 성능 향상이 있는 걸까? 예, 저도 무척 궁금했습니다. 각종 게임에서의 성능 향상 제보글, 특히 하드웨어 마니아들이라면 친구와도 같은 3DMark 파이어스트라이크의 콤바인 점수(Combined score) 항목에서 드라마틱한 점수 향상이 있었다는 제보가 가장 많았습니다. 그렇다면 1903 업데이트에 어떤 변경점이 있었길래 성능 변화가 생길 수 있었던 걸까요? 그 이유는 라이젠 프로세서가 많은 코어를 담아낼 수 있었던 구조적 비결과 밀접한 관계가 있습니다.
대표적으로 8코어 16스레드의 라이젠 7 2700X를 예로 들어보겠습니다. 2700X는 하나의 다이에 2개의 CCX(CPU Complex)가 존재하고, 하나의 CCX에는 4개의 코어가 탑재되어 CCX 간의 인터커넥트 기술, 인피니티 패브릭(Infinity Fabric)으로 연결되는 구조입니다. 이제는 많은 사람들이 아는 내용이죠. 하지만 이러한 구조적 특성은 CCX를 연결하는 인피니티 패브릭 단계에서 병목현상을 야기하게 되었습니다. 작업을 수행함에 있어 하나의 CCX에서 처리되면 문제가 없으나, 이것이 다른 CCX를 통해서 함께 처리하게 되면, 각 CCX를 연결하는 인피니티 패브릭의 상대적으로 낮은 대역폭(램클록과 동기화되어 클록이 높을수록 대역폭 증가)으로 인해 레이턴시 증가와 성능 발휘에 불리 요소로 작용하는 것이죠. 흔히 라이젠 시스템에는 램클록이 높아야 좋다는 말도 여기에서 나온 것입니다.
하지만, 1903 업데이트에는 라이젠의 CCX 구조 맞춤형 스레드 운용(Topology Awareness) 내용이 포함되었습니다. 즉 다른 CCX가 요구될 만큼의 CPU 부하가 발생하기 전까지는 최대한 단일 CCX 내의 코어에서 작업을 처리하도록 하는 내용입니다. 기존에는 윈도우 10이 OS 차원에서 CCX 구조를 무시하고 최대한 많은 코어에 부하를 나누는 방향을 가졌던 것이고요. 결국 업데이트를 적용하면, 애플리케이션에 따라 정도는 다르겠으나, 스레드를 많이 요구하지 않는 환경에서 개선된 성능을 기대할 수 있게 됩니다. CCX의 구조상 당연한 것이죠. 물론, 애플리케이션에 따라서는 성능 향상이 없을 수도 있지만, 중요한 건 좀 더 최적화된 하드웨어 운용으로 개선되었다는 점입니다. 퀘이사존 역시 명실 상부한 하드웨어 커뮤니티/매체로서 현 상황을 그냥 두고 볼 수 없었습니다. 철저한 변인 통제와 함께 반드시 검증해보고 넘어야 할 대목이라 생각했습니다. 3DMark는 물론이고, 게임 성능까지도 말이죠. 특히 게임 성능 테스트는 그래픽카드 성능과 게임 타이틀에 따라 그 양상이 얼마든지 달라질 수 있기 때문에 신중한 접근이 필요했습니다. 아무리 CPU 최적화가 개선되었다고 하더라도 낮은 그래픽카드에 고사양 게임을 구동하여 GPU 병목이 일어나는 조건에서는 CPU 최적화에 따른 성능 변화를 짚어낼 수 없기 때문이죠. 따라서 다양한 시나리오를 준비해야만 했습니다. 테스트에 투입된 CPU와 그래픽카드는? AMD는 8C/16T의 라이젠 7 2700X와 6C/12T의 라이젠 5 2600X 그리고 인텔 CPU에서도 변화가 있는지 알아보기 위해 8C/16T의 코어 i9-9900K, 6C/6T의 코어 i5-9600K를 준비했습니다. 그래픽카드는 RTX 2080 Ti FE와 RTX 2060 FE를 준비했고요. 그래픽카드를 2개로 테스트 한 까닭은 CPU 성능 차이를 논함에 있어 일반적으로 그래픽카드 성능이 높을수록 더 선명한 차이를 보여주기 때문입니다. 그래픽카드 성능이 높으면 초당 생성 프레임이 많아지게 되고, 이는 결국 CPU에 대한 부담으로 이어지게 되죠. 종종 CPU 벤치마크에서 1280x720 수준의 저해상도가 등장하는 것도 비슷한 맥락입니다. 하지만, 시간은 한정되어 있으므로 모든 해상도를 테스트할 수 있는 여건이 안 된다면 실제 사용자의 환경에 가까운 조건을 대표적으로 내세워야 한다고 생각합니다. 따라서 테스트 해상도는 1920x1080과 4K 해상도인 3840x2160으로 제한하여 진행하였습니다. 변인 통제가 엄청나게 중요한 테스트 서로 다른 성능을 가진 부품을 테스트하는 것이 아닌, 동일 부품을 대상으로 드라이버/OS 업데이트에 따른 성능 차이를 분석하는 것은 굉장히 정밀한 테스트에 속합니다. 일반적으로 그 성능 차이가 매우 미세하게 나타나기 때문에, 이것이 과연 드라이버/OS 차이에 의한 것인지 아니면 다른 요인에 의해 발생되는 것인지 분석하기 쉽지 않습니다. 따라서 그 어떤 테스트보다도 변인 통제가 데이터 신뢰성에 중요한 변수가 됩니다. 사실, 테스트 규모 대비 당초의 예상보다 많은 시간이 소요된 이유도 바로 여기에 있는데요. 퀘이사존이 변인 통제를 위해 적용한 작업은 아래와 같습니다. 1. 테스트룸은 항상 같은 실내 온도를 유지(24도) -> 최신 CPU/그래픽카드는 클록 주파수가 유동적인 특성이 있어 온도에 따라 클록이 달라지고 결국 성능이 달라질 수 있습니다. 2. OS 빌드를 제외한 모든 소프트웨어/드라이버는 동일 버전 -> 당연한 조치입니다. 본 테스트는 OS 업데이트/빌드 버전에 따른 성능 차이를 알아보기 위한 것이기 때문에 칩셋/그래픽카드 드라이버 버전은 절대적으로 같아야 합니다. 3. 윈도우 10 프로세스 최적화 -> 1903 업데이트와 같은 대규모 패치는 사용자의 윈도우 프로세스를 초기화하는 과정을 거칩니다. 이 과정에서 기존 OS와 메모리에 상주되는 프로세스가 달라질 수 있는데, 추가되는 필수 프로세스 외에 최대한 동일한 프로세스 상태를 유지해야 합니다. 4. 그래픽카드의 웜업(warm up) -> 지포스/라데온 모두에게 해당되는 사안으로 1번 항목과 관계가 있습니다. 부스트 기술이 적용된 최신 그래픽카드는 초기 구동 시, 충분히 달궈지지 않은 GPU 온도로 인해 소비전력이 다소 낮게 측정됩니다. 낮은 소비전력은 결국 더 높은 클록과 전압으로 이어지게 되고요. 따라서 테스트를 반복할수록 점점 더 성능이 떨어지는 상황이 연출됩니다. 크게는 3~5% 정도까지도 성능 차이가 발생하고요. 따라서 이렇게 정밀한 테스트를 진행할 때는 항시 비슷한 수준의 클록이 유지되도록 GPU LOAD가 어느 정도 지속된 상황에서 테스트를 진행해야 합니다. 퀘이사존에서는 매 테스트마다 10분간 GPU LOAD를 높게 유지한 후 성능 측정을 시작하였습니다. 5. 게임 테스트는 3회 테스트 후 평균값 도출 -> 이렇게 테스트를 반복하는 까닭 역시 데이터 신뢰성을 높이기 위한 것인데요. 실제로 매 테스트마다 편차가 큰 결과를 보여주는 게임도 있고, 비교적 균일한 결과를 보여주는 게임도 있습니다. 주원인은 메모리 로드와 캐싱 작업을 꼽을 수 있습니다. 6. 해상도 테스트 순서는 항시 동일하게 -> 예를 들어 A 게임의 성능을 테스트할 때 먼저 FHD 해상도를 테스트하고, 두 번째는 4K 해상도를 테스트했다면, 다른 대조군에서도 동일한 순서를 유지하였습니다. 이 역시 5번과 유사한 맥락의 이유인데요. 해상도를 테스트하는 순서에 따라 VRAM에 상주되는 데이터가 달라지는 특성에 기인한 조치입니다. 특히 VRAM을 많이 요구하고, 프로세스 설계가 부족하여 메모리 누수가 발생하는 게임에서는 테스트 해상도 순서에 따라 판이하게 다른 데이터를 뱉어내기도 합니다. 7. VRAM 병목 현상이 발생되지 않는 수준의 게임 옵션 적용 -> 6번 항목과 밀접한 관계가 있습니다. VRAM이 부족한 상황에서는 예측 불가의 균일하지 못한 데이터가 도출됩니다. 본 테스트에서는 RTX 2060 VRAM에 맞추어 게임 옵션을 적용하였습니다. 사실, 변인 통제를 위한 조치들은 더 많지만, 대표적인 내용들을 나열해 보았습니다. 이런 이유로 인해 개인 사용자 차원의 테스트 결과와 본 벤치마크는 조금 양상이 다른 결과를 보여줄 수 있습니다. 특히나 퀘이사존의 테스트 시스템은 순수 벤치마크 용도로써 관리되어, 필수로 요구되는 프로그램 외에는 굉장히 클린한 OS 상태를 유지하고 있습니다. 따라서 이러한 변수와 특성을 감안하시고, 벤치마크 결과를 참고해주시기 바랍니다. 그럼, 지금부터 별다른 언급 없이 테스트 결과를 공개하도록 하겠습니다. 벤치마크 시스템 사양
주요 벤치마크 툴 테스트 결과
▲ 시네벤치 R20/R15, 블렌더 2.79b 테스트 결과
▲ 3DMark Fire Strike 1.1 테스트 결과 벤치마크툴 테스트 정리 그래프 #1 - AMD 라이젠 7 2700X
벤치마크툴 테스트 정리 그래프 #2 - AMD 라이젠 5 2600X
벤치마크툴 테스트 정리 그래프 #3 - 인텔 코어 i9-9900K
벤치마크툴 테스트 정리 그래프 #4 - 인텔 코어 i5-9600K
게임 5종 FHD/4K 테스트 결과
게임 테스트 정리 그래프 #1 - R7 2700X + RTX 2080 Ti FE
게임 테스트 정리 그래프 #2 - R5 2600X + RTX 2080 Ti FE
게임 테스트 정리 그래프 #3 - i9-9900K + RTX 2080 Ti FE
게임 테스트 결과 그래프 #4 - i5-9600K + RTX 2080 Ti FE
벤치마크 결과 종합 정리 3DMark에서의 놀라운 성능 향상 입증 현재 퀘이사존에서 많은 유저분들이 제보해주신 바와 같이 3DMark 파이어스트라이크, 특히 콤바인 점수(Combined score) 항목에서는 엄청난 성능 향상을 확인할 수 있었습니다. 결과적으로 총점도 높아지게 되었죠. 참고로 3DMark의 콤바인 점수는 CPU 연산과 GPU 연산이 동시에 이루어지는 작업 성능을 말합니다. CPU 연산 능력을 높게 요구하는 3D 게임에서의 성능을 대변한다고 볼 수 있죠. 반면 GPU 연산 중심의 그래픽 점수(Graphics score)는 거의 변화가 없습니다. 이번 업데이트는 CCX 운용에 관한 것이니 자연스러운 결과입니다. 반면, CPU 연산 중심의 피직스 점수(Physics score)는 미세한 성능 향상이 보였습니다. 결국 유독 콤바인 점수에 한정하여 특출난 성능 향상을 보여주는 것인데, 이것이 과연 CCX 운용에 관한 업데이트의 실질적인 효과를 대변할 수 있는 것이냐 물어본다면, 회의적입니다. 업데이트 전의 점수가 오히려 비정상적 결과일 가능성이 있다고 보입니다. 그도 그럴 것이 2700X가 2600X보다도 낮은 점수를 보여주었고, 곧이어 언급할 실제 게임 성능과 비교해보면 그 격차가 너무 크게 나타났기 때문입니다. 이제 게임 성능입니다. 게임에서도 성능 향상 확인! 그러나... 사실, 최신 게임들은 비교적 다중 스레드를 잘 지원하고 있기 때문에, 윈도우 업데이트로 인한 라이젠 프로세서의 성능 향상 효과가 그렇게 크지 않을 것이라는 예상을 하고 있었습니다. 물론, 콤바인 점수의 충격이 워낙 컸기 때문에 혹시나 하는 호기심은 있었죠. 테스트 결과를 보면, 결과적으로 드라마틱한 성능 차이를 보여주지는 못했습니다만, 전반적으로 몇몇 게임에서 소폭의 성능 향상을 보였습니다. 개인적으로 다중 스레드 활용 능력이 최저 수준인 스타크래프트 2에서 높은 성능 향상을 보여줄 수 있겠다고 예상했지만, 기대 이하의 결과를 보여주었습니다. 그나마 유의미한 성능 차이를 보여준 게임이라면, 어쌔신 크리드 오디세이와 레인보우 식스 시즈를 꼽을 수 있는데요. 어쌔신 크리드 오디세이는 다른 게임에 비해 매 테스트에 따른 결괏값 균일성이 다소 불량한 게임에 속하기 때문에 레인보우 식스 시즈를 참고해보도록 하겠습니다. RTX 2080 Ti FE + FHD 조건에서 약 3~4%의 성능 향상을 확인하였습니다. 변인 통제의 수준을 감안할 때 오차 범위 이내의 차이라고 보기는 힘들고 실제로 성능 향상이 발생한 것으로 봐도 무방합니다. 물론, 그 차이가 크지 않은 것은 맞습니다만, 업데이트의 효용성이 작게나마 입증되었다는 의미가 있겠습니다. 또한, 게임마다 조금씩 다른 양상을 보여줄 수 있다는 가능성도 남아 있습니다. 1903 업데이트의 가치 즉 우리가 3DMark 파이어스트라이크의 콤바인 점수나 레인보우 식스 시즈에서 발견한 것처럼 윈도우 10 1903 업데이트를 통해 CCX 운용에 변화를 주는 것은 실제로도 효과가 있다고 볼 수 있습니다. 하지만, 실질적이고 체감적인 영역에서의 게임 성능 향상 여부로 접근하면, 명확한 차이로 말하기엔 다소 부족합니다. 물론, 미세한 끊김이 개선되었다는 체험기도 존재하기 때문에 이를 입증하기 위해 프레임타임과 같은 그래프 분석까지 포함되었다면 더 좋았을 것입니다. 하지만, 현재 제가 마련한 조건 하에서는 발견하기 어렵다는 뜻입니다. 그렇다면 1903 업데이트는 효용성이 없는 것이냐? 그렇지 않습니다. CCX 구조에 맞춘 변화가 맞고, 좀 더 최적화된 성능을 보여주는 것도 맞지만, 그 차이가 크지 않을 뿐입니다. 물론, CPU와 그래픽카드의 조합에 따라 본 테스트 결과보다 더 명확한 차이가 나타날 가능서도 배제할 수 없겠습니다만, 너무 큰 기대가 실망으로 이어질 수도 있습니다. 기대치만 낮춘다면 충분히 만족스러운 업데이트입니다. 또한, 본 테스트에서 다루지 않은 분야에서 더 큰 폭의 성능 향상이 존재할 가능성도 남아있고요. 반면, 인텔의 경우 애초에 CCX 구조가 아니기 때문에 성능 향상은 발견할 수 없었습니다. 오히려 3DMark 항목에서 아주 미세한 성능 하락이 발생하기도 하였습니다. 테스트에 대한 해석은 여기까지입니다. 여기에 더해 곧이어 시장에 등장할 라이젠 3000 시리즈에는 1903 업데이트를 통해 클록 반응 향상(Faster Clock Ramping)의 이점까지 적용된다고 합니다. 기존 아키텍처에 비해 IPC 향상 및 클록 향상과 더불어 더욱 유리한 상대 성능을 기대해볼 수 있는 대목이죠. 개인적으로는 이번 테스트를 통해 라이젠에 대한 OS 그리고 애플리케이션 생태계까지 이제서야 본격적인 바탕이 마련되기 시작했다고 느꼈습니다. 차후 출시될 라이젠 3000 시리즈에서도 그동안 그랬던 것처럼 CPU 시장에 기분 좋은 파동을 불러와주길 바랍니다. 이상, 퀘이사존벤치였습니다. ※ 후속 칼럼 등록 안내 많은 분들의 문의로 평균 FPS/최소 FPS에서 더 나아가 프레임타임 데이터를 활용한 1%/0.1% low framerate 데이터 분석, 마이크로스터터링을 다룬 후속 칼럼이 등록되었습니다. 자세한 내용은 아래 링크를 참고해주시기 바랍니다. 윈도우 1903 업데이트 2부: 라이젠 미세 끊김 분석 |