하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] VEGA 리뷰 프리퀄을 가장한 GTX 1070 Ti 성능 예측

Dr.Lee | 조회 2677 | 추천 10 | 2017.10.02. 13:29 http://drmola.com/pc_column/239688

안녕하세요 여러분. 저는 연휴를 맞아 무려 한달을 끌어온 VEGA 리뷰를 열심히 작성하고 있습니다.

 

(급 반말로 전환) 그동안 잼아저씨를 쥐어짜며 + 직접 실측한 벤치마크 데이터들을 정리하며, 성능 분석에 인사이트를 줄 수 있는 재미있는 자료를 뽑게 되어 간단히 소개해본다. 바로 그래픽카드별 평균 및 최대 부스트클럭. 이들은 비단 공식 스펙과 차이가 있을뿐만 아니라, 때로 공식 스펙에 표기된 숫자의 서열마저 무시하고 재정의되기 일쑤인데 아래 표를 일단 보도록 하자.

 

스크린샷 2017-10-02 오후 3.08.43.png

 

GTX 970은 스펙상 GTX 980보다 평균 부스트클럭이 낮지만 (1178 VS 1216) 실제로는 평균/최대 부스트클럭 모두 980과 동일한 수준이다. 또한 GTX 980 Ti는 스펙상 GTX TITAN X보다 클럭이 낮지만 (1075 VS 1089) 실제로는 평균 부스트클럭이 1150 VS 1126으로 오히려 더 높다.

 

스크린샷 2017-10-02 오후 3.08.58.png

 

비슷한 사례는 계속 이어진다. GTX 1070과 1080의 관계에서도 관찰되는데 스펙상으로는 GTX 1070의 평균 부스트클럭이 1683MHz, GTX 1080이 1733MHz로 후자가 더 높지만 실제로는 1777MHz VS 1759MHz로 전자가 더 높은 것. 나아가 GTX 1070/1080/1080 Ti 모두 최대 부스트클럭은 1898MHz 언저리로 동일하기까지 하다. 단, 여기서의 평균 부스트클럭은 스펙상의 정의와 관계없이 실제 벤치마크시 측정된 클럭의 평균값이므로 이것이 실제 성능을 결정짓는 클럭이 될 것.

 

일반적으로 스펙상의 평균 부스트클럭이 성능과 동떨어져 있고, 차라리 최대 부스트클럭이 더 가깝다는 인식이 생겨날 정도였으니 얼마나 공식 스펙이란 것이 제 역할을 못 하고 있는지 보여주는 한 단면이라 하겠다.

 

이게 끝이 아니다. 상자를 조금 더 열자면... AMD의 VEGA의 경우, VEGA Frontier Edition (FE) 보다 RX VEGA64의 스펙상 클럭이 낮아졌는데 성능은 소폭 오른 것으로 나타나 각종 매체 / 리뷰어들을 혼란스럽게 한 적 있다는 사실을 익히 알고 있을 것이다. 모 매체에서는 이를 두고 단순히 클럭으로 설명할 수 없는 모종의 개선이 있다는 뉘앙스로 결론을 내리기도 했다. 하지만 실측 결과 VEGA FE의 클럭은 실제로 RX VEGA64보다 낮은 것으로 드러나, 정확히 클럭에 따른 성능 차이였을 뿐이라는 것이 드러났다. 아래의 표를 보자.

 

스크린샷 2017-10-02 오후 12.48.03.png

(더 자세한 설명은 정식 기사를 위해 아껴두겠다...)

 

구체적으로 VEGA FE Air-Cooled는 스펙상 1600MHz의 작동클럭을 갖지만 실제로는 1347-1442MHz 이내로 작동한다. Liquid-Cooled의 경우 두 개의 BIOS 모드가 존재하는데 클럭은 Air-Cooled보다 개선되어 300W BIOS 하에서는 1442-1527MHz, 350W BIOS 하에서는 1527-1602MHz 이내로 작동하나 이들 모두 RX VEGA64보다는 낮다. 반면 RX VEGA64 Air-Cooled는 평균 1513MHz, Liquid-Cooled는 평균 1663MHz로 동작해 스펙상의 클럭에 거의 근접한 모습을 보인다.

 

이것은 AMD가 RX VEGA를 개발하며 특별한 기술을 적용해서가 아니다. 단지 VEGA FE와 RX VEGA의 클럭 표기 규칙이 바뀌었기 때문이다. 라데온 소프트웨어의 와트맨 메뉴에 진입해 RX VEGA의 클럭 프로파일을 보면 총 0-7단계로 구성되어 있는데, 이중 최고인 7단계는 공식 스펙에는 언급되지 않는다. RX VEGA64 Air-Cooled의 경우 해당 클럭이 1630MHz, Liquid-Cooled는 1750MHz로 설정되어 있고 이들의 공식 스펙상 클럭은 그보다 한단계 아래인 6단계째의 값이다.

 

반면 VEGA FE는 7단계째의 최고 클럭을 그대로 공식 스펙에 반영하고 있는 것. 즉 어떤 것을 공식 스펙에 기록할 것이냐의 문제였을 뿐 RX VEGA는 처음부터 VEGA FE보다 고클럭으로 만들어졌고, 딱 그만큼 성능이 오른 것이다. 한편 지금까지의 언급에서 빠져 있던 RX VEGA56 역시 클럭 표기 규칙이 괴랄한데, VEGA FE와 다른 것은 물론 심지어 같은 RX 라인업의 RX VEGA64들과도 다르다. 이 녀석은 최고 단계보다 두 단계 아래의 5단계째 클럭을 공식 스펙에 표기하고 있다!

 

RX VEGA56의 경우 5-7단계 클럭 프로파일이 순서대로 1474-1537-1592MHz로 설정되어 있고 공식 스펙은 5단계와 거의 유사한 1471MHz. 거꾸로 말해, VEGA FE 유저들에게 스펙상의 클럭이란 거의 신화속 동물 여자친구와 같은 존재감(=null)을 가졌었고 RX VEGA64도 쿨링을 빡세게 해주거나 언더볼팅을 하는 등 온갖 *꼬쇼를 거쳐야 스펙상의 클럭을 구경할 수 있던 반면 RX VEGA56은 상대적으로 스펙상의 클럭에 가깝거나 심지어 더 높은 실제 클럭을 갖는다는 것이지. 왜 그렇게 했는지는 알 수 없지만 짐작컨대 마케팅적 이유로 상위 모델의 클럭을 부풀려 말한 것이 아닐까 싶다.

 

아무튼. 이 글에서 더 이상의 VEGA 이야기를 하는 건 적절치 않으니 정식으로 발행될 기사를 위해 아껴두고, 정작 이 글을 쓰기 시작한 이유는 요즘 화제가 되고 있는 GTX 1070 Ti 이야기를 하기 위함. GTX 1070 Ti는 매체별로 2304 또는 2432 쿠다코어를 가질 것이라고 보도되고 있다. 결론부터 말하자면 둘 중 어떤 스펙을 골라잡든 성능 차이는 미미할 것이다. 좀더 자세히 말하자면 2304코어든 2432코어든, 지금 GTX 1070의 1920코어보다 단 하나만 더 많아지더라도 GTX 1070보다 GTX 1080에 훨씬 근접한 성능으로 단번에 뛰어오를 것이다. 그 이유를 설명하기 위해 아래 그림을 준비했다.

 

스크린샷 2017-10-02 오후 12.48.04.jpg

 

앞서 이 글에서 설명한 바 있지만, GTX 1070이 탄생한 배경은 그간의 GTX x70 모델들의 파생과 약간 결이 다르다. 그동안은 여러 GPC에 걸쳐 한두 개의 SM을 비활성화하기는 했어도 GPC 하나를 통째로 비활성화한 적은 없었다. 그 이유는 GPC가 단순히 SM의 집합체 그 이상이기 때문. 구체적으로 GPC는 3D 그래픽 구현의 핵심인 ‘래스터라이징’ 작업 중 전반부를 담당하는 ‘래스터 엔진’을 내장하고 있다. (이 작업의 후반부는 GPC 밖에 위치한, 메모리컨트롤러와 융합되어 있는 ‘ROP’가 담당한다.)

 

모든 GPU는 래스터라이징 작업의 전/후반이 합을 맞추도록 하기 위해 래스터 엔진과 ROP의 비율을 일치시켜 놓고 있다. GP104의 풀 칩은 4개의 래스터 엔진과 64개의 ROP가 서로 대응되는 구조. 시간을 거슬러 보면 GM104의 경우도 4개의 GPC와 64개의 ROP로 구성되었고, GM104의 컷다운된 버전을 사용한 GTX 970 역시 SM 3개를 비활성화했지만 GPC 단위로는 4개가 그대로 보존되어 있었음. GM104는 총 16개의 SM이 4개씩 4개의 GPC에 나뉘어 있으므로, 비둘기집의 원리에 따라 GTX 970이 어떤 구성을 취하더라도 3 GPC 이하가 되는 것은 불가능하다는 점을 유념하자.

 

반면, GTX 1070을 파생시키며 엔비디아는 GP104의 4개의 GPC 중 하나를 완전히 비활성화하는 것을 택했다. 그에 따라 래스터 엔진 역시 풀 칩의 4분의 3으로 감소되었고, 유저들이 중요하게 지켜보는 수치인 (특히 이전 세대 GTX 970 스캔들을 겪으며 기술요소의 마케팅적 영향이 얼마나 중요한지 실감했을 것이다) ROP 개수를 64개로 유지하면서도 래스터라이징에 관여하는 ‘유효 ROP’ 수를 48개로 줄이는 효과를 얻은 것이다.

 

마찬가지의 전략(?)은 GTX 1060에도 적용되어 있다. GTX 1060은 외견상 & 공식 스펙상 48 ROP를 갖지만 GPC가 2개에 불과해 ‘유효 ROP’는 32개가 된다. 오늘날 3D 게이밍에서 ROP는 래스터라이징에'만' 관여하는 것이 아니라, MSAA 등 ROP 자원을 활용하는 효과에도 사용되므로 MSAA를 빡세게 걸고 게임을 즐기는 경우라면 ‘네이티브 32 ROP’ 인 경우보다는 ‘네이티브 48, 유효 32 ROP’ 인 경우가 성능유지율이 더 좋을 것이다. 그렇더라도 일반적인 경우는 그렇지 않다는 것.

 

1070ti_est_01.jpg

(아래의 그림은 계산기로 계산한 값의 해석을 돕기 위한 TechPowerUp의 실측값들)

 

각 요소별 성능 기여도를 관찰할 수 있는 닥터몰라의 VGA 계산기로 돌려 보면 더욱 명확해진다. GTX 1060과 GTX 1070 모두, 표기상의 ROP 개수보다 유효 ROP 개수를 대입한 것이 본래의 성능을 정확히 겨냥하고 있다 :

 

GTX 1060은 GTX 980과, GTX 1070은 GTX TITAN X와 ±10% 내외의 사실상 동급임을 기억하자. 공식 스펙을 있는 그대로 대입한 GTX 1060 48ROP / GTX 1070 64ROP는 현실과 매우 동떨어진 결과를 보인다. 반면 GTX 1080의 경우 스펙대로 64 ROP를 모두 대입한 경우 GTX TITAN X 대비 130%의 성능으로 계산되어, 두번째 그림의 TechPowerUp의 벤치마크 결과로 산출된 128% (= 1.18÷0.92) 와 거의 일치하는 결과를 보이고 있다.

 

앞서 GTX 1070 Ti의 최종 스펙이 무엇이 되든 간에, 지금의 GTX 1070보다 코어 수가 단 하나라도 많아지는 즉시 GTX 1080쪽에 훨씬 가까운 성능이 될 것이라는 이유가 바로 여기에 있다. GTX 1070이 가진 1920코어는 3 GPC가 온전히 활성화되어 있어야만 얻을 수 있는 것이기 때문이다. 여기서 SM을 단 하나만 더 늘리려 하더라도 상술한 비둘기집의 원리에 따라 GPC는 4개가 되어야 한다. 이는 곧 GTX 1070 Ti의 ‘유효 ROP’ 수가 필연적으로 48개에서 64개로 증가함을 의미한다. (GTX 970처럼 ROP 자체를 인위적으로 제한하지 않는다면 말이다. 다만 그 경우는 돌고 있는 스펙상의 256bit 메모리 인터페이스설을 기각하는 것이 되므로...)

 

자, 서론이 길었다. 이제 모두가 궁금해할 GTX 1070 Ti의 성능을 살펴보자. 매체마다 조금씩 다르지만 GTX 1070 Ti의 스펙은 베이스 클럭이 1080과 같고 평균 부스트과 메모리 클럭이 1070과 같다는 등, 1070과 1080를 혼합한 것쯤으로 전해지고 있다. 앞서 이 글 초반, 나는 GTX 1070과 GTX 1080의 평균/최대 부스트 클럭이 공식 스펙상의 차이에 불구하고 거의 같다는 사실을 언급했었다. 따라서 둘을 어떻게 섞든, GTX 1070 Ti의 클럭 역시 이들 모두와 같다고 보아도 틀리지 않을 것이다.

 

1070ti_est_04.jpg

 

위 그래프를 얻기 위해 가정한 스펙은 아래와 같다.

 

GTX TITAN X : 1126MHz / 메모리 384bit 7.0Gbps

GTX 1070 : 1777MHz / 메모리 256bit 8.0Gbps

GTX 1070 Ti : 1777MHz / 메모리 256bit 8.0Gbps

GTX 1080 : 1759MHz / 메모리 256bit 10.0Gbps

 

GTX 1070은 GTX TITAN X 대비 107%, GTX 1080은 130%의 성능을 보이는 가운데 GTX 1070 Ti는 쿠다코어 수의 베리에이션에 따라 124-126%의 성능을 보일 것으로 추정된다. 이는 RX VEGA56의 115%를 넉넉히 넘어서는 것이며 RX VEGA64 Air-Cooled의 126%를 정확히 직격한다.

 

무엇보다 엔비디아 자신의 GTX 1080마저 저격할 가능성을 배제할 수 없는데, 풀 칩에 기반해야 하는 GTX 1080의 생산이 엔비디아에게 부담이라면 훨씬 수율을 높일 수 있는 (3 GPC가 온전히 살아 있어야 하는 GTX 1070보다도, 모든 GPC가 SM 한두 개씩 불량이더라도 괜찮은 GTX 1070 Ti쪽이 수율이 더 좋을지 모른다.) GTX 1070 Ti로 아예 대체해 버리는 것도 괜찮은 경영상 판단일 수 있다.

 


 

프리퀄까지 탈고했으니 이제 빼박 VEGA 리뷰에 전념해야겠단 각오를 불태우며... 스틸컷 한장을 던지고 저는 이만 물러갑니다. 즐거운 연휴 보내세요!

 

20170826_213317.jpg

 

땅, 불, 바람, 물, 마음, 다섯가지 베가를 하나로 모으면!

 

Dr.Lee's Signature

* 적용중인 트로피 :

  1. 20170826_213317.jpg (File Size:3.93MB/Download:1)
  2. 스크린샷 2017-10-02 오후 3.08.43.png (File Size:173.5KB/Download:1)
  3. 스크린샷 2017-10-02 오후 3.08.58.png (File Size:190.1KB/Download:1)
facebook twitter google plus pinterest kakao story band
Profile image [게임미식가] 잼아저씨 2017.10.02 13:40

땅, 불, 바람, 물, 마음, 다섯가지 베가를 하나로 모으면!

-> 1070Ti 발매까지 탈고를 미룰 수 있다.

Profile image Dr.Lee 2017.10.02 13:49
빼애애애액!!!!!!!!!!!!!!
Profile image [게임미식가] 잼아저씨 2017.10.02 16:21

https://flic.kr/p/LmuZef
GPC를 온전히 비활성화 해도 모양은 온전하게 남아 있네요.

Profile image upaya 2017.10.03 08:49
흐음... 가격은 어찌될런지 ㅎ
물론 국내로 오면 무시무시한 용프가 붙겠지만... ㅠㅜ
Profile image Olorin 2017.10.12 17:50

대근님의 신들린 스펙저격은 진짜 예외가 없네요;

 

1070ti 공식 스펙이 2432 Cuda코어 / 메모리 256bit 8gbps.... 

  • [비교해봅시다] 2018 아이패드 9.7 vs 2017 아이패드 프로 10.5 [모바일] [비교해봅시다] 2018 아이패드 9.7 vs 2017 아이패드 프로 10.5 file

    27일(현지 시각) 애플 펜슬을 지원하는 새로운 9.7인치 아이패드가 등장했습니다. 애플은 새로운 아이패드를 교육용 시나리오에 맞춰 어제 발표를 진행했기에 많은 일반 소비자인 우리의 경우 혼란스러운 부분이 있었습니다. 특히 이벤트 이후 백투더맥 페이스북 그룹이나 소셜 미디어 타임라인에서 둘의 차이점이 정확히 무...

  • 아이맥 프로에 대한 진실과 오해 : 워크스테이션의 가치 [etc] 아이맥 프로에 대한 진실과 오해 : 워크스테이션의 가치 [14] file

    사진 : 애플 2013년, 애플은 한동안 업데이트가 없던 맥 프로 라인업에 충격적인 변화를 주었다. 새로 공개된 맥 프로는 이전까지의 데스크톱 컴퓨터와는 판이하게 달랐다. 게다가 이 제품은 소비자를 대상으로 하는 제품이 아니라 전문가를 대상으로 하는 워크스테이션이었기에 시장에 던져진 충격은 더 컸다. 이 제품은 디...

    • iMola |
    • 18.03.10 |
    • 조회 수 2695 |
  • [Live] AMD 라이젠 2000G 시리즈 APU 런칭 파티 [etc] [Live] AMD 라이젠 2000G 시리즈 APU 런칭 파티 [2] file

    닥터몰라 X MNA 대피소는 추첨으로 선발된 회원 8분을 모시고 여의도 콘래드서울에서 개최된 AMD 라이젠 2000G 시리즈 APU 런칭 파티에 참석하고 있습니다. 아래의 라이브 블로깅 세션을 통해 행사를 중계하니 재미있게 봐 주시기 바랍니다 :) 이날 행사에서 사용된 영상 자료를 많은 회원분들과 함께 보기 위해 공유합니다....

    • Dr.Lee |
    • 18.02.13 |
    • 조회 수 1188 |
  • [카드뉴스] BATTLEFRONT : 뒤늦게 APU 시장에 상륙한 레이븐 릿지 [CPU] [카드뉴스] BATTLEFRONT : 뒤늦게 APU 시장에 상륙한 레이븐 릿지 [6] file

    * 닥터몰라 서버 오류로 약 30분 지연 업로드된 점 양해를 부탁드립니다. 엠바고 해제시각부터 F5 새로고침을 누르셨을 분들을 생각하면 눈물이... (아아아...)

    • Dr.Lee |
    • 18.02.12 |
    • 조회 수 3864 |
  • Samsung Gear IconX (2018) 음향리뷰 [음향기기] Samsung Gear IconX (2018) 음향리뷰 file

    장비지원 : B&P 인터내셔널, 이신렬 박사님 측정수행 : STUDIO51 데이터 검증 : 이신렬 박사님 최대 출력 (0dBFS, 500Hz, sine wave) 정격 출력 (-15.5dBFS, 500Hz, sine wave) 비보정 주파수 응답 (20Hz-20kHz, sine sweep, -15.5dBFS, 1/24smoth) Diffuse field(DF) 보정 주파수 응답 (20Hz-20kHz, sine sweep,-15.5dBFS, ...

    • STUDIO51 |
    • 18.01.29 |
    • 조회 수 1064 |
  • 삼성 엑시노스 M3: 더 넓어진 아키텍처로 50% 이상의 IPC 증가를 달성 [모바일] 삼성 엑시노스 M3: 더 넓어진 아키텍처로 50% 이상의 IPC 증가를 달성 [6] file

    이 글은 아난드텍의 'The Samsung Exynos M3 - 6-wide Decode with 50%+ IPC Increase(링크)'를 전문 번역한 글입니다. 엑시노스 9810의 발표는 2018년의 첫 번째로 쏟아져나온 굵직한 소식들 중 하나이고 매우 흥분되는 소식이다. 싱글 스레드 성능이 두 배로 증가했다는 소식은 모두의 눈길을 사로잡았다. 엑시노스 9810은...

    • iMola |
    • 18.01.29 |
    • 조회 수 2905 |
  • 아이폰 X 리뷰: 용감한 신세계 [모바일] 아이폰 X 리뷰: 용감한 신세계 [4] file

    2007년에 등장한 이후, 아이폰은 세계를 바꿨다. 아이폰만큼 애플이 세상에 엄청난 영향을 준 제품도 드물다. 플립폰이나 슬라이더폰을 쓰던 사람들은 점점 앞이 화면으로 채워진 손 안의 컴퓨터를 들고 다니기 시작했다. 아이폰이 다시 만들어낸 스마트폰을 통해 트위터, 인스타그램, 카카오톡과 같은 모바일에 최적화된 서...

  • AMD, 경영진 재정비 및 조직개편 : EESC는 더 이상 없다 [etc] AMD, 경영진 재정비 및 조직개편 : EESC는 더 이상 없다 [3] file

    돌이켜보면 라자 쿠드리가 영영 돌아오지 않을 휴가(...)를 쓴 날로부터 모든 이들의 관심은 단 하나, 그 후임자가 누가 되는지에 쏠려 있었을 것이다. 지금은 경쟁사 인텔에서 비슷한 보직을 맡고 있는 쿠드리는 ATI를 거쳐 AMD에서까지 그래픽 부문에서 강력한 리더십을 발휘해 온 바 있다. 2015년 자사의 여러 부문에 나...

    • Dr.Lee |
    • 18.01.25 |
    • 조회 수 2063 |
  • 암호화폐 대 PC방 : 지포스 GTX 1060 5GB 모델 투입의 의미 [VGA] 암호화폐 대 PC방 : 지포스 GTX 1060 5GB 모델 투입의 의미 [7] file

    지난 연말, 엔비디아는 중국의 인터넷 카페 (PC방) 수요에 대응하고 암호화폐 채굴 용도로의 전용을 막기 위한 양수겸장의 패를 뽑아들었다. 바로 PC방 / 채굴머신 양쪽으로 인기가 높은 지포스 GTX 1060에 소폭의 리뉴얼을 가하는 것이었다. 현존하는 3GB / 6GB 모델의 중간쯤을 포지셔닝한 '지포스 GTX 1060 5GB' 가 바로 ...

    • Dr.Lee |
    • 18.01.11 |
    • 조회 수 2634 |
  • 애플, 아이맥 프로 판매 개시 [etc] 애플, 아이맥 프로 판매 개시 [3] file

    사진 : 애플 애플이 지난해 12월 출시된 아이맥 프로를 한국 애플 온라인 스토어를 통해 판매하기 시작했습니다. 아이맥 프로는 지난 WWDC에서 공개된 애플의 프로용 데스크탑 제품으로 2013년 이후 업데이트가 없던 맥 프로 라인을 보완하는 제품인 동시에 컨슈머 제품인 아이맥의 외장 디자인을 거의 그대로 채용하여 애플...

    • iMola |
    • 18.01.10 |
    • 조회 수 1582 |