하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] VEGA 리뷰 프리퀄을 가장한 GTX 1070 Ti 성능 예측

Dr.Lee | 조회 1817 | 추천 9 | 2017.10.02. 13:29 http://drmola.com/pc_column/239688

안녕하세요 여러분. 저는 연휴를 맞아 무려 한달을 끌어온 VEGA 리뷰를 열심히 작성하고 있습니다.

 

(급 반말로 전환) 그동안 잼아저씨를 쥐어짜며 + 직접 실측한 벤치마크 데이터들을 정리하며, 성능 분석에 인사이트를 줄 수 있는 재미있는 자료를 뽑게 되어 간단히 소개해본다. 바로 그래픽카드별 평균 및 최대 부스트클럭. 이들은 비단 공식 스펙과 차이가 있을뿐만 아니라, 때로 공식 스펙에 표기된 숫자의 서열마저 무시하고 재정의되기 일쑤인데 아래 표를 일단 보도록 하자.

 

스크린샷 2017-10-02 오후 3.08.43.png

 

GTX 970은 스펙상 GTX 980보다 평균 부스트클럭이 낮지만 (1178 VS 1216) 실제로는 평균/최대 부스트클럭 모두 980과 동일한 수준이다. 또한 GTX 980 Ti는 스펙상 GTX TITAN X보다 클럭이 낮지만 (1075 VS 1089) 실제로는 평균 부스트클럭이 1150 VS 1126으로 오히려 더 높다.

 

스크린샷 2017-10-02 오후 3.08.58.png

 

비슷한 사례는 계속 이어진다. GTX 1070과 1080의 관계에서도 관찰되는데 스펙상으로는 GTX 1070의 평균 부스트클럭이 1683MHz, GTX 1080이 1733MHz로 후자가 더 높지만 실제로는 1777MHz VS 1759MHz로 전자가 더 높은 것. 나아가 GTX 1070/1080/1080 Ti 모두 최대 부스트클럭은 1898MHz 언저리로 동일하기까지 하다. 단, 여기서의 평균 부스트클럭은 스펙상의 정의와 관계없이 실제 벤치마크시 측정된 클럭의 평균값이므로 이것이 실제 성능을 결정짓는 클럭이 될 것.

 

일반적으로 스펙상의 평균 부스트클럭이 성능과 동떨어져 있고, 차라리 최대 부스트클럭이 더 가깝다는 인식이 생겨날 정도였으니 얼마나 공식 스펙이란 것이 제 역할을 못 하고 있는지 보여주는 한 단면이라 하겠다.

 

이게 끝이 아니다. 상자를 조금 더 열자면... AMD의 VEGA의 경우, VEGA Frontier Edition (FE) 보다 RX VEGA64의 스펙상 클럭이 낮아졌는데 성능은 소폭 오른 것으로 나타나 각종 매체 / 리뷰어들을 혼란스럽게 한 적 있다는 사실을 익히 알고 있을 것이다. 모 매체에서는 이를 두고 단순히 클럭으로 설명할 수 없는 모종의 개선이 있다는 뉘앙스로 결론을 내리기도 했다. 하지만 실측 결과 VEGA FE의 클럭은 실제로 RX VEGA64보다 낮은 것으로 드러나, 정확히 클럭에 따른 성능 차이였을 뿐이라는 것이 드러났다. 아래의 표를 보자.

 

스크린샷 2017-10-02 오후 12.48.03.png

(더 자세한 설명은 정식 기사를 위해 아껴두겠다...)

 

구체적으로 VEGA FE Air-Cooled는 스펙상 1600MHz의 작동클럭을 갖지만 실제로는 1347-1442MHz 이내로 작동한다. Liquid-Cooled의 경우 두 개의 BIOS 모드가 존재하는데 클럭은 Air-Cooled보다 개선되어 300W BIOS 하에서는 1442-1527MHz, 350W BIOS 하에서는 1527-1602MHz 이내로 작동하나 이들 모두 RX VEGA64보다는 낮다. 반면 RX VEGA64 Air-Cooled는 평균 1513MHz, Liquid-Cooled는 평균 1663MHz로 동작해 스펙상의 클럭에 거의 근접한 모습을 보인다.

 

이것은 AMD가 RX VEGA를 개발하며 특별한 기술을 적용해서가 아니다. 단지 VEGA FE와 RX VEGA의 클럭 표기 규칙이 바뀌었기 때문이다. 라데온 소프트웨어의 와트맨 메뉴에 진입해 RX VEGA의 클럭 프로파일을 보면 총 0-7단계로 구성되어 있는데, 이중 최고인 7단계는 공식 스펙에는 언급되지 않는다. RX VEGA64 Air-Cooled의 경우 해당 클럭이 1630MHz, Liquid-Cooled는 1750MHz로 설정되어 있고 이들의 공식 스펙상 클럭은 그보다 한단계 아래인 6단계째의 값이다.

 

반면 VEGA FE는 7단계째의 최고 클럭을 그대로 공식 스펙에 반영하고 있는 것. 즉 어떤 것을 공식 스펙에 기록할 것이냐의 문제였을 뿐 RX VEGA는 처음부터 VEGA FE보다 고클럭으로 만들어졌고, 딱 그만큼 성능이 오른 것이다. 한편 지금까지의 언급에서 빠져 있던 RX VEGA56 역시 클럭 표기 규칙이 괴랄한데, VEGA FE와 다른 것은 물론 심지어 같은 RX 라인업의 RX VEGA64들과도 다르다. 이 녀석은 최고 단계보다 두 단계 아래의 5단계째 클럭을 공식 스펙에 표기하고 있다!

 

RX VEGA56의 경우 5-7단계 클럭 프로파일이 순서대로 1474-1537-1592MHz로 설정되어 있고 공식 스펙은 5단계와 거의 유사한 1471MHz. 거꾸로 말해, VEGA FE 유저들에게 스펙상의 클럭이란 거의 신화속 동물 여자친구와 같은 존재감(=null)을 가졌었고 RX VEGA64도 쿨링을 빡세게 해주거나 언더볼팅을 하는 등 온갖 *꼬쇼를 거쳐야 스펙상의 클럭을 구경할 수 있던 반면 RX VEGA56은 상대적으로 스펙상의 클럭에 가깝거나 심지어 더 높은 실제 클럭을 갖는다는 것이지. 왜 그렇게 했는지는 알 수 없지만 짐작컨대 마케팅적 이유로 상위 모델의 클럭을 부풀려 말한 것이 아닐까 싶다.

 

아무튼. 이 글에서 더 이상의 VEGA 이야기를 하는 건 적절치 않으니 정식으로 발행될 기사를 위해 아껴두고, 정작 이 글을 쓰기 시작한 이유는 요즘 화제가 되고 있는 GTX 1070 Ti 이야기를 하기 위함. GTX 1070 Ti는 매체별로 2304 또는 2432 쿠다코어를 가질 것이라고 보도되고 있다. 결론부터 말하자면 둘 중 어떤 스펙을 골라잡든 성능 차이는 미미할 것이다. 좀더 자세히 말하자면 2304코어든 2432코어든, 지금 GTX 1070의 1920코어보다 단 하나만 더 많아지더라도 GTX 1070보다 GTX 1080에 훨씬 근접한 성능으로 단번에 뛰어오를 것이다. 그 이유를 설명하기 위해 아래 그림을 준비했다.

 

스크린샷 2017-10-02 오후 12.48.04.jpg

 

앞서 이 글에서 설명한 바 있지만, GTX 1070이 탄생한 배경은 그간의 GTX x70 모델들의 파생과 약간 결이 다르다. 그동안은 여러 GPC에 걸쳐 한두 개의 SM을 비활성화하기는 했어도 GPC 하나를 통째로 비활성화한 적은 없었다. 그 이유는 GPC가 단순히 SM의 집합체 그 이상이기 때문. 구체적으로 GPC는 3D 그래픽 구현의 핵심인 ‘래스터라이징’ 작업 중 전반부를 담당하는 ‘래스터 엔진’을 내장하고 있다. (이 작업의 후반부는 GPC 밖에 위치한, 메모리컨트롤러와 융합되어 있는 ‘ROP’가 담당한다.)

 

모든 GPU는 래스터라이징 작업의 전/후반이 합을 맞추도록 하기 위해 래스터 엔진과 ROP의 비율을 일치시켜 놓고 있다. GP104의 풀 칩은 4개의 래스터 엔진과 64개의 ROP가 서로 대응되는 구조. 시간을 거슬러 보면 GM104의 경우도 4개의 GPC와 64개의 ROP로 구성되었고, GM104의 컷다운된 버전을 사용한 GTX 970 역시 SM 3개를 비활성화했지만 GPC 단위로는 4개가 그대로 보존되어 있었음. GM104는 총 16개의 SM이 4개씩 4개의 GPC에 나뉘어 있으므로, 비둘기집의 원리에 따라 GTX 970이 어떤 구성을 취하더라도 3 GPC 이하가 되는 것은 불가능하다는 점을 유념하자.

 

반면, GTX 1070을 파생시키며 엔비디아는 GP104의 4개의 GPC 중 하나를 완전히 비활성화하는 것을 택했다. 그에 따라 래스터 엔진 역시 풀 칩의 4분의 3으로 감소되었고, 유저들이 중요하게 지켜보는 수치인 (특히 이전 세대 GTX 970 스캔들을 겪으며 기술요소의 마케팅적 영향이 얼마나 중요한지 실감했을 것이다) ROP 개수를 64개로 유지하면서도 래스터라이징에 관여하는 ‘유효 ROP’ 수를 48개로 줄이는 효과를 얻은 것이다.

 

마찬가지의 전략(?)은 GTX 1060에도 적용되어 있다. GTX 1060은 외견상 & 공식 스펙상 48 ROP를 갖지만 GPC가 2개에 불과해 ‘유효 ROP’는 32개가 된다. 오늘날 3D 게이밍에서 ROP는 래스터라이징에'만' 관여하는 것이 아니라, MSAA 등 ROP 자원을 활용하는 효과에도 사용되므로 MSAA를 빡세게 걸고 게임을 즐기는 경우라면 ‘네이티브 32 ROP’ 인 경우보다는 ‘네이티브 48, 유효 32 ROP’ 인 경우가 성능유지율이 더 좋을 것이다. 그렇더라도 일반적인 경우는 그렇지 않다는 것.

 

1070ti_est_01.jpg

1070ti_est_02.jpg1070ti_est_03.jpg

(아래의 그림은 계산기로 계산한 값의 해석을 돕기 위한 TechPowerUp의 실측값들)

 

각 요소별 성능 기여도를 관찰할 수 있는 닥터몰라의 VGA 계산기로 돌려 보면 더욱 명확해진다. GTX 1060과 GTX 1070 모두, 표기상의 ROP 개수보다 유효 ROP 개수를 대입한 것이 본래의 성능을 정확히 겨냥하고 있다 :

 

GTX 1060은 GTX 980과, GTX 1070은 GTX TITAN X와 ±10% 내외의 사실상 동급임을 기억하자. 공식 스펙을 있는 그대로 대입한 GTX 1060 48ROP / GTX 1070 64ROP는 현실과 매우 동떨어진 결과를 보인다. 반면 GTX 1080의 경우 스펙대로 64 ROP를 모두 대입한 경우 GTX TITAN X 대비 130%의 성능으로 계산되어, 두번째 그림의 TechPowerUp의 벤치마크 결과로 산출된 128% (= 1.18÷0.92) 와 거의 일치하는 결과를 보이고 있다.

 

앞서 GTX 1070 Ti의 최종 스펙이 무엇이 되든 간에, 지금의 GTX 1070보다 코어 수가 단 하나라도 많아지는 즉시 GTX 1080쪽에 훨씬 가까운 성능이 될 것이라는 이유가 바로 여기에 있다. GTX 1070이 가진 1920코어는 3 GPC가 온전히 활성화되어 있어야만 얻을 수 있는 것이기 때문이다. 여기서 SM을 단 하나만 더 늘리려 하더라도 상술한 비둘기집의 원리에 따라 GPC는 4개가 되어야 한다. 이는 곧 GTX 1070 Ti의 ‘유효 ROP’ 수가 필연적으로 48개에서 64개로 증가함을 의미한다. (GTX 970처럼 ROP 자체를 인위적으로 제한하지 않는다면 말이다. 다만 그 경우는 돌고 있는 스펙상의 256bit 메모리 인터페이스설을 기각하는 것이 되므로...)

 

자, 서론이 길었다. 이제 모두가 궁금해할 GTX 1070 Ti의 성능을 살펴보자. 매체마다 조금씩 다르지만 GTX 1070 Ti의 스펙은 베이스 클럭이 1080과 같고 평균 부스트과 메모리 클럭이 1070과 같다는 등, 1070과 1080를 혼합한 것쯤으로 전해지고 있다. 앞서 이 글 초반, 나는 GTX 1070과 GTX 1080의 평균/최대 부스트 클럭이 공식 스펙상의 차이에 불구하고 거의 같다는 사실을 언급했었다. 따라서 둘을 어떻게 섞든, GTX 1070 Ti의 클럭 역시 이들 모두와 같다고 보아도 틀리지 않을 것이다.

 

1070ti_est_04.jpg

 

위 그래프를 얻기 위해 가정한 스펙은 아래와 같다.

 

GTX TITAN X : 1126MHz / 메모리 384bit 7.0Gbps

GTX 1070 : 1777MHz / 메모리 256bit 8.0Gbps

GTX 1070 Ti : 1777MHz / 메모리 256bit 8.0Gbps

GTX 1080 : 1759MHz / 메모리 256bit 10.0Gbps

 

GTX 1070은 GTX TITAN X 대비 107%, GTX 1080은 130%의 성능을 보이는 가운데 GTX 1070 Ti는 쿠다코어 수의 베리에이션에 따라 124-126%의 성능을 보일 것으로 추정된다. 이는 RX VEGA56의 115%를 넉넉히 넘어서는 것이며 RX VEGA64 Air-Cooled의 126%를 정확히 직격한다.

 

무엇보다 엔비디아 자신의 GTX 1080마저 저격할 가능성을 배제할 수 없는데, 풀 칩에 기반해야 하는 GTX 1080의 생산이 엔비디아에게 부담이라면 훨씬 수율을 높일 수 있는 (3 GPC가 온전히 살아 있어야 하는 GTX 1070보다도, 모든 GPC가 SM 한두 개씩 불량이더라도 괜찮은 GTX 1070 Ti쪽이 수율이 더 좋을지 모른다.) GTX 1070 Ti로 아예 대체해 버리는 것도 괜찮은 경영상 판단일 수 있다.

 


 

프리퀄까지 탈고했으니 이제 빼박 VEGA 리뷰에 전념해야겠단 각오를 불태우며... 스틸컷 한장을 던지고 저는 이만 물러갑니다. 즐거운 연휴 보내세요!

 

20170826_213317.jpg

 

땅, 불, 바람, 물, 마음, 다섯가지 베가를 하나로 모으면!

 

  • |
  • |
  1. 20170826_213317.jpg (File Size:3.93MB/Download:0)
  2. 스크린샷 2017-10-02 오후 3.08.43.png (File Size:173.5KB/Download:0)
  3. 스크린샷 2017-10-02 오후 3.08.58.png (File Size:190.1KB/Download:0)
facebook twitter google plus pinterest kakao story band

서명

Profile image

Dr.Lee

(level 30)

* 적용중인 트로피 :

Profile image [게임미식가] 잼아저씨 2017.10.02 13:40

땅, 불, 바람, 물, 마음, 다섯가지 베가를 하나로 모으면!

-> 1070Ti 발매까지 탈고를 미룰 수 있다.

Profile image Dr.Lee 2017.10.02 13:49
빼애애애액!!!!!!!!!!!!!!
Profile image [게임미식가] 잼아저씨 2017.10.02 16:21

https://flic.kr/p/LmuZef
GPC를 온전히 비활성화 해도 모양은 온전하게 남아 있네요.

Profile image upaya 2017.10.03 08:49
흐음... 가격은 어찌될런지 ㅎ
물론 국내로 오면 무시무시한 용프가 붙겠지만... ㅠㅜ
Profile image Olorin 2017.10.12 17:50

대근님의 신들린 스펙저격은 진짜 예외가 없네요;

 

1070ti 공식 스펙이 2432 Cuda코어 / 메모리 256bit 8gbps.... 

  • 전조의 마지막 왕 : 아이폰 8 시리즈 리뷰 [모바일] 전조의 마지막 왕 : 아이폰 8 시리즈 리뷰 [8] updatefile

    스티브 잡스는 2007년 최초의 아이폰을 공개하면서 스마트폰 시장을 뒤흔들 새로운 왕조를 출범시켰습니다. 처음에는 그리 크지 않던 왕조는 점점 세력을 확장해 나갔고, 스마트폰 시장에서 가장 강력한 힘을 가진 나라가 되었습니다. 그 사이에 기존 핸드폰 시장을 호령하던 많은 나라들이 스러지고, 새로운 나라들이 생겼...

    • iMola |
    • 17.10.13 |
    • 조회 1695 |
  • [카드뉴스] CPU WARS : EPISODE X - THE EMPIRE STRIKES BACK AGAIN [CPU] [카드뉴스] CPU WARS : EPISODE X - THE EMPIRE STRIKES BACK AGAIN [13] file

    업계의 관심을 한몸에 받던 인텔의 8세대 데스크탑 코어 프로세서, 커피레이크의 엠바고가 공개된지 어느덧 3일차를 맞고 있는 오늘입니다. 닥터몰라는 앞서 작성해오던 인텔 코어 X-시리즈 프로세서 리뷰와 커피레이크 리뷰를 병합해 하나의 카드뉴스로 선보이게 되었는데요. 아무쪼록 재미있게 봐 주시길 바랍니다. :) * ...

    • Dr.Lee |
    • 17.10.09 |
    • 조회 3706 |
  • VEGA 리뷰 프리퀄을 가장한 GTX 1070 Ti 성능 예측 [VGA] VEGA 리뷰 프리퀄을 가장한 GTX 1070 Ti 성능 예측 [5] file

    안녕하세요 여러분. 저는 연휴를 맞아 무려 한달을 끌어온 VEGA 리뷰를 열심히 작성하고 있습니다. (급 반말로 전환) 그동안 잼아저씨를 쥐어짜며 + 직접 실측한 벤치마크 데이터들을 정리하며, 성능 분석에 인사이트를 줄 수 있는 재미있는 자료를 뽑게 되어 간단히 소개해본다. 바로 그래픽카드별 평균 및 최대 부스트클럭...

    • Dr.Lee |
    • 17.10.02 |
    • 조회 1817 |
  • KudoCast Special: 10살짜리 아이폰 [모바일] KudoCast Special: 10살짜리 아이폰 file

    제가 원래는 KudoCast라는 이름의 팟캐스트를 매주 했었는데, 요즘은 워낙 바빠서 애플 이벤트 이후에만 하고 있습니다. 그러니 이번 아이폰 10주년을 기념하는 이번 이벤트를 놓칠 수 없죠. 그래서 이번에도 준비했습니다. 이번 방송은 아이몰라님과, IT 칼럼니스트인 최호섭님과 함께 진행했습니다. 재밌게 들어주세요! 들...

  • 삼성 갤럭시 노트8 성능 리뷰: 다음 달리기를 위한 숨고르기? [모바일] 삼성 갤럭시 노트8 성능 리뷰: 다음 달리기를 위한 숨고르기?

    삼성은 하반기 플래그십 스마트폰으로 갤럭시 노트 8을 선보였습니다. 작년 이맘때 갤럭시 노트 7이 폭발하고 노트 시리즈의 존폐 자체를 걱정하던 때와는 분위기가 꽤 많이 반전되었죠. 삼성은 갤럭시 노트 8을 출시함으로써 갤럭시 노트 시리즈가 여전히 플래그십 삼성 스마트폰으로써 우뚝 서 있음을 과시했습니다. 갤럭...

    • iMola |
    • 17.09.30 |
    • 조회 1033 |
  • 4K의 세계에 어서오세요 [etc] 4K의 세계에 어서오세요 file

    만약 4K모니터로 넘어오실 계획이 있는데 몇가지 인터넷에 떠 도는 일부 소문 때문에 교체를 망설이고 계신 분들을 위해 작성했습니다. 목차 Windows는 가능하다면 Windows 8.1이상을 사용하세요. 나에게 맞는 모니터의 크기는 최적 DPI스케일링 Windows 의 HiDPI문제는 전적으로 Windows의 문제인가 지원 하지 않는 프로그...

    • Archost |
    • 17.09.28 |
    • 조회 1563 |
  • 코어 i9-7980XE / 7960X 벤치마크 Part 1 (아난드텍 기사 번역) [CPU] 코어 i9-7980XE / 7960X 벤치마크 Part 1 (아난드텍 기사 번역) [6] file

    1. 서론 : 코어 i9-7980XE / 7960X 파헤치기 인텔이 프로슈머용 18코어 데스크탑 CPU를 출시하겠다고 밝힌 지난 5월부터 그들의 긴박함은 이미 금방이라도 만져질 듯 명확해져 있었다. 모두가 이 제품이 인텔 역사상 가장 빠른 CPU가 될 것이라 믿었고, AMD의 16코어 라이젠 스레드리퍼와의 맞대결을 고대했다. 비록 가격이 ...

    • Dr.Lee |
    • 17.09.26 |
    • 조회 2690 |
  • Mythbuster : 흔히 믿는 잘못된 속설들을 파헤쳐보자 [etc] Mythbuster : 흔히 믿는 잘못된 속설들을 파헤쳐보자 [5] file

    오늘은 조금 캐주얼하게 준비해 보았습니다. (바로 뒤에 개빡센 글이 기다리고 있기 때문에...) 바로 시장에서 흔하게 믿어지고 있는, 그러나 사실이 아닌 속설들을 파헤쳐보는 시간입니다. 서론이 길어봐야 의미없으니 거두절미하고 바로 들어가 볼까요? 인텔편 1. 베이스 클럭은 인텔이 보증하는 최소의 클럭이다 : False ...

    • Dr.Lee |
    • 17.09.26 |
    • 조회 1782 |
  • 인텔, 커피레이크-S 기반 데스크탑 8세대 코어 프로세서 공개 [CPU] 인텔, 커피레이크-S 기반 데스크탑 8세대 코어 프로세서 공개 [3] file

    일반 소비자 시장을 겨냥한 인텔의 8세대 코어 프로세서가 오늘 공개되었습니다. 당초 오는 10월 5일 정식으로 출시될 예정이었으나 해외에서 누군가 엠바고를 깬 덕분에 모든 매체가 부랴부랴 후속기사를 준비하는 해프닝이 있었습니다. 지난 8월 21일 인텔은 8세대 코어 프로세서를 한 차례 발표한 바 있습니다. 그때와 지...

    • Dr.Lee |
    • 17.09.25 |
    • 조회 1275 |
  • 아이폰 8 핸즈온: 마지막 핏줄 [모바일] 아이폰 8 핸즈온: 마지막 핏줄 [2] file

    지난주 아이몰라님이 애플의 스페셜 이벤트에 다녀오겠다는 말을 했을 때, 저는 이 지령을 반복적으로 보냈습니다. “거기선 아이폰 X 핸즈온만 써 오세요.” 어차피 많은 사람들은 디자인 변화가 많지 않은 아이폰 8보다는 아이폰 10년의 역사에서 가장 큰 변화를 가져올 아이폰 X에 더 관심이 많을 거라 예상했고, 그 예상은...