기타 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] 지포스 GTX 1080 성능 분석 : 게임에 올인한 '가벼운' GP104

IYD | 조회 429 | 추천 1 | 2016.05.12. 20:19 http://drmola.com/etc_column/49857

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)

 

 

 

한달여 전 이 글을 통해 파스칼 아키텍처의 특징과 대략적인 성능에 관해 점쳐 본 바 있다. 그때로부터 오늘에 이르는 시간 동안 엔비디아는 파스칼의 차상위 라인업 GP104를 공식 출시했으며 이 칩셋을 사용한 지포스 GTX 1080 / 1070은 각각 이번 달 말 / 다음 달 초 출시가 예정되어 PC 게임 매니아들의 가슴을 뛰게 하는 중이다. GP104 풀 칩을 사용한 플래그십 그래픽카드 GTX 1080은 단일 카드로써 전세대 GTX 980 SLI의 성능을 뛰어넘는다고 선전되어 뭇 사용자들을 기함하게 했는데, 작동 속도도 무려 1733MHz에 달해 그래픽카드의 역사를 새로 쓰게 되었다. 그러면서도 8핀 PCI-E 보조전원 커넥터 하나만을 달고 있는 모습을 보여 전력대 성능비 역시 큰 폭으로 개선되었음을 과시한 바 있다. (이상은 이 글 참조)

 

 

이제 정말 출시까지 얼마 남지 않은 GTX 1080이지만, 단 하루라도 제대로 된 성능을 살펴보고 싶은 이들에게 단서가 될 수 있는 정보를 제공하는 것은 언제나 가치있는 일일 것이다. 지난 분석의 방법론에 그대로 기초하여, 그때로부터 지금까지 달라진 몇몇 사실관계들 (주로 GPU의 작동 속도에 관해) 을 반영한 업데이트를 제공할 목적으로 이 글을 쓰게 되었다. 언제나처럼, 여기서 시도되는 방법론이 실제 결과와 달라질 수 있음을 감안하고, 재미삼아 보는 것 이상으로 의존하지 않도록 하자. 우선 지난 글에서 살펴본 성능 예측치는 아래와 같았다.

 

 

당시 GTX X80 Ti라는 이름으로 가정되었던 GP104 풀 칩 그래픽카드의 성능은, 해상도에 따라 달리 계산되지만 대체로 타이탄 X보다는 9~10%가량, GTX 980보다는 39~51% 향상된 성능을 보여 줄 것으로 예측되었다. 이때 GTX X80 Ti의 작동 속도로 간주된 1580MHz라는 숫자는, 당시 막 공개되었던 GP100 칩셋 기반 '테슬라 P100'의 작동 속도 1480MHz에, 타이탄 X와 GTX 980의 작동 속도 차이인 100MHz를 더한 것이다. 맥스웰 세대에서도 GM200(타이탄 X)과 GM204(GTX 980)의 작동 속도가 차등화되어 있었기에, 파스칼 역시 GP100보다 GP104쪽이 아무래도 더 고클럭으로 작동하리라는 심증을 반영한 것이었다.

 

그리고 지난 주. 텍사스 오스틴에서 개최된 '에디터스 데이' 행사에서 정식 공개된 GTX 1080의 작동 속도는 베이스클럭이 1607MHz, 평균 부스트클럭은 무려 1733MHz에 달했다. 위 그래프에 표시된 것 중 GTX X80 Ti의 1580MHz라는 작동 속도는 베이스클럭으로써 간주된 것이지만, 나머지 대조군 모두 평균 부스트클럭에 근거해 성능값을 산출했으며 당시 GTX X80 Ti 홀로 베이스클럭을 취한 까닭 역시 단지 '얼마나 부스트될지 알 수 없어서' 였기 때문에, 새롭게 정보가 주어진 이상 재차 계산해보지 않을 이유가 없다. 이에 따른 최종 성능 예상은 아래와 같다.

 

 

맨 오른쪽이 "진짜" GTX 1080의 성능을 나타내며, 오른쪽에서 두 번째는 지난 달의 글에서 살펴본 최초 예상값을 나타낸다. GP104는 배정밀도 성능을 전세대보다 대폭 강화했던 GP100과 달리, 맥스웰과 마찬가지로 배정밀도 연산을 위한 하드웨어를 특별히 확충하지 않은 것으로 짐작되는데, 이에 따라 쿠다코어 갯수 대비 트랜지스터 수가 GP100보다 상당히 경량화된 편이다. (GP100은 170억 개의 트랜지스터와 3840 쿠다코어를, GP104는 70억여 개의 트랜지스터와 2560 쿠다코어를 내장하고 있다.) 페르미 이래로 취해 온, 전통적인 '투 트랙' 체제를 부활시킨 것으로 평가할 수 있다.

 

한편 그래프 오른쪽 세 번째 및 네 번째는 GTX 1070과 1065의 성능을 가정한 것인데, 잠시 이들의 스펙을 어떻게 가정했는지 - 그 '가정'을 위해 어떤 논리로 접근했는지- 를 설명하고 넘어가겠다.

 

 

엔비디아는 에디터스 데이 행사에서 GTX 1070을 예고하며 6.5 테라플롭스의 단정밀도 연산성능, 8Gbps 전송속도의 8GB GDDR5 메모리를 장착했다는 것 외에 다른 정보를 제공하지 않았다. 그러나 이것으로 충분했다. 왜냐면 플롭스 값이 정해진 이상, '그럴듯한' 클럭과 쿠다코어 갯수 조합은 한정될 수밖에 없기 때문이다. 아래의 단계를 밟아 보자.

 

1. 파스칼의 최소 단위인 SM, 즉 스트리밍 멀티프로세서 클러스터는 64개씩의 쿠다코어로 구성된다. 즉 GP104의 풀 스펙인 2560 쿠다코어에서 한 단계 낮아진 것은 2496이지, 2550이나 2500개가 될 수 없다. 마찬가지로 64를 한 단위로 하지 않는 어떤 숫자도 GP104 기반 그래픽카드의 스펙으로 기술될 수 없다.

 

2. 6.5 테라플롭스라는 값은 다음과 같이 얻어진다 : 쿠다코어 갯수(N) x 작동 속도(Freq) x 쿠다코어당 FP32 파이프라인 갯수(2개)

 

3. GTX 1080의 작동 속도가 1733MHz였고(평균 부스트클럭 기준), 전세대의 GTX 980과 970의 작동 속도 차이는 약 50MHz였다. (1216MHz vs 1178MHz) 이 갭이 준수된다고 가정하자.

 

4. 2번과 3번에 의해, 쿠다코어의 범위는 다음으로 좁혀진다 : 최대 6500 ÷ (2 x 1683 x N), 최소 6500 ÷ (2 x 1783 x N) → 1822개~1931개

 

5. GTX 980보다 970의 작동 속도가 높지 않았던 것과, 1번에서 언급한 "64의 배수 룰" 을 적용할 경우 가능한 단 하나의 수치쌍은 1920 쿠다코어 / 1690MHz가 된다.

 

따라서, GTX 1070은 다른 모든 스펙이 GTX 1080과 같되 쿠다코어 갯수를 1920개로 약 25% 줄이고, 작동 속도를 1690MHz로 소폭 하향한 것으로 가정하였다. 여기에 더해 GTX 1060 Ti 등의 이름으로 알려졌던 '더 깎아낸 버전'의 이름이 가장 최근 루머에서 GTX 1065로 언급되었던 관계로, 이것을 과거 GTX 670과 660 Ti 등의 관계를 준용해 '다른 모든 스펙이 GTX 1070과 같되 메모리와 ROP만 깎여나간" 것으로 설정해 보았다.

 

위 그래프에 나타난 바에 따르면 GTX 1070은 FHD 및 QHD 해상도에서 타이탄 X를 소폭 앞서며 UHD에서 다소 뒤처지는 모습을 보인다. 종합적으로 거의 동급이라고 봐도 좋을 것이다. 엔비디아 스스로 "GTX 1070이 타이탄 X보다 빠르다"고 밝혔었는데, 구체적으로 어떤 조건을 거명하지 않았기에 적어도 거짓말은 아닌 게 된 셈이다. GTX 1065는 과거 GTX 660 Ti의 전례를 감안하면 300달러 초반대 혹은 200달러 후반대의 '스윗 스팟'을 공략할 것으로 여겨지는데, 모든 해상도에서 GTX 980을 8~13% 차이로 앞서며 FHD 성능은 GTX 980 Ti의 94%에 달해 매우 좋은 FHD 게이밍 솔루션이 될 것으로 보인다.

 

 

마지막으로, GTX 1080이 980 SLI보다 빠르다고 했던 주장의 진위를 (추정으로) 검증해 보는 것으로 이 글을 맺겠다. 그래프에 나타난 정보에 따르면 FHD 해상도에서 GTX 1080의 성능은 타이탄 X 대비 117% (이하 "%p" 로 언급하겠다), 980 SLI의 성능은 124%p로 일견 엇비슷하게 볼 수 있다. 또한 시뮬레이션에 사용된 모델이 멀티 VGA를 잘 지원하는 게임 위주로 구성되어 있는 점을 감안할 때, 최근 멀티 VGA 효율이 점차 나빠지는 추세 (이 글 참조) 를 감안하면 오늘날 980 SLI의 성능은 124%p에 미치지 못할 가능성이 있고, 이 경우 GTX 1080이 실제로 그 성능을 따라잡았을 가능성이 높다. 즉 이것 역시, 적어도 FHD 한정으로만큼은 엔비디아의 주장이 사실일 가능성이 높다. 원래 '~과 동급'이면 '~를 꺾었다'로, '~에 박빙 열세'면 '~와 동급'으로 한끗씩 과장하는 게 기업의 생리다.

 

종합적으로, GTX 1080은 타이탄 X보다 15~17% 더 높은 성능으로 데뷔해 타이탄 블랙 / GTX 780 Ti를 엇비슷한 마진으로 앞섰던 GTX 980과 비슷한 전철을 밟을 것으로 예상해볼 수 있다. 가격은 599달러. 신제품이 사용자들을 설레게 하는 것은 플래그십의 위용만큼이나 거기서 파생될 '낙수효과'에 대한 기대 때문이리라. GTX 1070과 1065, 추후 등장할 1060 / 1050까지, '파스칼 지포스'의 모든 라인업에 걸쳐 가성비의 은총이 끼얹어지길 바라 본다.

 


 

페이스북, 트위터에서 IYD를 팔로우하시면 저희가 놀아드립니다!
 
http://facebook.com/insideyourdevice
http://twitter.com/iyd_twit

 

 

IYD's Signature

적용중인 트로피가 없습니다.

DR.MOLA

레벨 Lv. 3 (0%)
포인트 816 p
출석 11 일 (개근 0 일)

IYD'님의

  1. iyd_nvidia_pascal_gp104_018.jpg (File Size:179.9KB/Download:1)
  2. pascal_1.jpg (File Size:141.2KB/Download:2)
  3. iyd_nvidia_pascal_gp104_032.jpg (File Size:156.5KB/Download:0)
  4. iyd_nvidia_pascal_gp104_020.jpg (File Size:0Byte/Download:1)
facebook twitter google plus pinterest kakao story band
Profile image 준앤준 2016.05.12 21:32
잘 봤습니다. 쿨엔애서 가볍게, 여기서 풀로 봅니다 ㅋ
수정 삭제
Profile image IYD 2016.05.13 02:40
ㅋㅋ 감사합니다. 자주 들러 주세요!
Profile image 킹대근 2016.05.12 21:54
킹대근은 인정합니다
수정 삭제
Profile image 잼아저씨 2016.05.12 22:32
먼저 연산성능으로부터 쿠다캣수, 클럭을 유추가 가능한 점이 놀랍습니다. 과연 배우신 분... 乃 더불어 이번에는 L2 캐시, ROP 컷다운하고 사기치는 짓은 하지 않았으면 좋겠네요.

EVGA 측 기술 관계자가 포럼에 남긴 "HB SLI로 연결하지 않고, 기존의 핑거 1쌍만을 사용한 연결 방식으로 연결해도 2 Way는 가능하지만, 어떤 방식을 취하더라도 3 way SLI는 불가능하다." 라는 발언으로 보았을 때 1080은 3 Way 이상의 SLI 는 불가능해 보입니다. 개인적으로 궁금한 것은 어차피 DX12 가면 핑거를 쓰지 않고도 멀티 GPU 구성이 가능하니까 이런 선택을 한건지 아니면 애초에 게임업계의 멀티 GPU 경시(?) 풍조를 고려한건지 약간 당황스럽습니다. HB SLI를 지원하지 않을 것 처럼 보이는1070도 3 Way SLI를 제한할지도 궁금하네요. 파스칼은 MSRP/ FE 가격도 그렇고 뭔가 좀 이해하기 어려운 행보를 보이고 있네요.

더불어 980SLI 보다 강력하다는 건 인게임에서 2114MHz(베이스 클럭 대비130%+), 67도로 동작하는 것에서 뭔가 유추가 가능할지도 모르겠습니다. 980과 1080 모두 평균 부스트 클럭은 108%정도로 표기했죠. 레퍼런스 980은 실제로 1240MHz(베이스 클럭 대비 110%) 에서 81도로 동작하는 사진이 있던데 ( fudzilla.com/images/stories/Reviews/Graphics/Nvidia/Maxwell/GTX_980/Reference/gtx_980_temp_in_battlefield.gif )이에 반해 1080은 더욱 효율적인 전압제어와 더불어 온도/TDP에 여유가 더 있어서 표기된 평균 부스트 클럭보다 더 높은 클럭에서 동작할지도 모르겠습니다. 뭐 그보다는 엄밀히 말해 거의 동급인 카드에 대해서 립서비스 성으로 그렇게 얘기해줬을 확률이 높지만요.

더불어 14/16nm FF 공정으로 이행되면서 달성한 고클럭, 게이머 입장에서 볼때 '연산용 뭐시기'들을 버리면서 얻은 이득 등을 보았을 때 게이머들에게는 분명 큰 기쁨을 줄만할 것 같습니다. 개인적으론 궁극적으로 GP100의 풀칩을 쓴 타이탄의 후속작이 아닌, 980Ti의 후속작인 GP 100 컷다운 버전이 나올까와 나오면 어떨까가 가장 궁금합니다.
수정 삭제
Profile image IYD 2016.05.13 02:35
읽어 주셔서 감사합니다! 일단 1070 관련해서는 누차 비슷한 톤으로 얘기하고 있지만, 한번 한 실수를 또 하겠느냐는 심정으로 지켜보고 있습니다 ㅋㅋ

2.1GHz라는 수치는 최대 부스트클럭이 아니라 오버클럭된 수치로 알고 있습니다. 아마 최대 부스트클럭은 그보다는 낮지 싶은데, 물론 게임 구동시 실측된 부스트 클럭의 평균이 "평균 부스트클럭"인 1733MHz보다 높다면 1080 = 980 SLI설이 성립할 것 같습니다. 아마 이 이야기를 하고 싶으셨던 것이리라 생각해 봅니다 :)

저도 GP100을 사용한 지포스가 기다려지는데 엊그제 해외에서 돌기 시작한 루머를 보면 아예 별도의 GP102라는 칩이 나올 가능성도 있는 모양이더군요. 쿠다코어는 GP100보다 많지만 GDDR5X를 쓰고, 아마 배정밀도를 쳐낸 버전이지 싶습니다. 어쨌든 당장은 1080의 성능이 실제로 어떻게 나올지가 정말 궁금합니다 ㅋㅋ

늘 여기 들러 좋은 의견 주셔서 감사합니다 :)
Profile image 잼아저씨 2016.05.13 11:57
DG님과 함께하는 건 늘 즐겁습니다. 감사합니다.

모든 궁금증의 해결은 5월 17일에 달렸네요 ㅋㅋㅋ 그 때 과연 어떤 진실이 또 밝혀질지 기대되네요.
수정 삭제
Profile image 내이름은정대만포기를모르는자지 2016.05.13 01:42
p100 부스트 클럭으로 1480에 980하고 타이탄X의 클럭차로 100을더해서 1580mhz로 계산하셨다는데...

980하고 타이탄x하고의 클럭차는 베이스던 터보던 100이넘게 차이가 나고 (126과 141)

보통 예측을하실때 1480+126과 141의 수치를 보이면 약간 뭉뚱그려서 1600으로 계산을하거나 정확하게 1621로 하지 1580이라는 어중간한 수치로 계산하신게 신기하네요;
m40 베클하고 p100베클의 40%차이를 보고
g204 베클*1.4 하면 딱 1580이나오는데 이렇게 계산하신거라고 당연히 생각했는데 ㅋㅋㅋ


이러다 실벤치에서 다시 예측하신 115~117%보다 전에109%가 더맞다거나
훨씬 뛰어넘는 성능나오면 우짜요 ㅋㅋ

수정 삭제
Profile image IYD 2016.05.13 02:31
읽어 주셔서 감사합니다! :) 아무래도 클럭이 부스트되는 메커니즘을 단일한 한 수치로 뭉뚱그리기엔 어려운 점이 많습니다. 새로 나온 아키텍처의 여러 특성 (특히 thermal character) 을 모르는 상황이기 때문에 섣불리 '어느 정도 부스트될 것이다'를 점치는 건 베이스 클럭을 점치는 것보다 훨씬 많은 변수가 작용하고 틀려지기 쉽습니다.

대표적으론 공정이 미세화되어 다이 면적이 작아지면서 오히려 열 발산에 나쁘게 작용하는 사례가 있기 때문입니다. 애플 A9 TSMC vs 삼성 떡밥도 큰 틀에서는 이 연장선 위에 있습니다. 또한 같은 28nm 공정에서도, 엔비디아는 780 Ti를 출시할 당시 "하와이보다 큰 면적이 열 발산에 도움을 준다"는 슬라이드를 발표한 적 있습니다. (이에 관해서는 iyd.kr/565 이 글을 참고하시구요!)

여튼, 공정이 오랜만에 바뀌는지라 thermal characteristic이 어떻게 달라질지 알 수 없어, 가령 소비전력 자체는 줄더라도 방열면적이 줄어 열밀도(W/mm2)가 오히려 늘 가능성을 배제할 수 없었습니다. 무슨 의미냐면, 베이스클럭이 확정되었고 심지어 최대 부스트클럭이 알려졌더라도 평균적으로 어느 선까지 클럭을 유지할 수 있는지가 불명확했단 얘깁니다. 보수적으로 베이스클럭 기준의 성능 계산치를 제시하는 게 당연한 순서였지요.

더 나아가자면, 아직까지 GTX 1080 / 1070이 실제 테스트된 결과가 공개되지 않았기에 위의 모든 내포된 위험성은 아직도 완전히 제거되지는 않았습니다. 어쩌면 정말, 처음 베이스클럭 기준 예상치에 더 가까워질 수도 있고, 어쩌면 부스트클럭이 평균 부스트클럭보다 더 높게 발현되어 새로운 예상치를 뛰어넘는 성능이 나올 수도 있습니다.

그러나 어느 쪽이 되었든, 조건(클럭)만 맞게 입력한다면 실측과 맞아 떨어지는 추정치를 뽑아 주는 '수학적 모델'로서의 가치는 충분히 입증되는 것이죠. 파스칼이 맥스웰보다 얼마나 더 좋아졌는지를 추적해볼 수 있게끔 결과가 크게 빗나가도 재미있을 것 같습니다.

아무쪼록 부스트클럭 발현 메커니즘에 대한 이해에 장문의 댓글이 조금이라도 도움이 되었길 바랍니다. 부스트클럭은 하나의 단일한 "모드"로써 작동하지 않는다는 게 핵심입니다.

앞으로도 변함 없이 지켜봐 주시고, 자주 뵙길 바라겠습니다 :)
Profile image 갓갓갓 2016.05.13 06:55
GTX 1080발표 후 부터 여기에 언제 분석글이 올라올지 기다리고 있었습니다.
수정 삭제
Profile image 주님사랑합니다. 2016.05.13 10:01
기왕하시는거 부스트 2000일때 2500일때도 넣어서 해주시지.......

가쉽성은 아니지만 발표때 레퍼로 2.1기가를 넘겼다면 비래퍼들의 오버클럭은 2.5를 넘기도 할겁니다.

그런 유저를 생각해서 번외편으로 말미에 오버된 클럭수치에대한 성능도 언제한번 넣어주세요

유저들 시선끌기에도 좋잖아요...

언제나 기본보단 뭔가 오버된게 흥분된 기대를 갖으니 말입니다.
ㅡ..ㅡ
수정 삭제
Profile image 히이이잌 2016.05.13 11:12
흥미롭게 잘 읽었습니다

약 2년전 300번대와 900번대 소식을 보면서 느꼇던 흥미진진함이 다시 재현되는 기분입니다
그땐 300번대가 초라한 성적표를 들고 나왔지만, 이번 400번대는 뭔가 좀 보여줬으면 좋겠네요 ㅠ
수정 삭제
Profile image 수치해석 2016.05.13 11:23
1.
GTX 1080의 작동 속도가 1733MHz였고(평균 부스트클럭 기준), 전세대의 GTX 980과 970의 작동 속도 차이는 약 50MHz였다. (1216MHz vs 1178MHz) 이 갭이 준수된다고 가정하자.
//
클럭 차이보다는 클럭 비율을 따르는 게 나을 겁니다. 970/980 SM 비율도 함께 쓸 수 있고요. 다만, 970은 980에서 ROP/멤콘 부분이 잘렸는데 (숨겼지요), 이번엔 안 자른다고 치면 쉐이더 차이가 더 클 수 있습니다.

2. 퓨리X -> 나노 관계처럼 클럭만 낮을 가능성은 어떻게 보십니까?

3. 1080 기본 클럭인 1607 MHz에서는 8.23 TFLOPS 밖에 안 나옵니다. 평균 부스트 클럭 1733에서도 8.87 TFLOPS 밖에 안 됩니다. 9.00 TFLOPS 가 되려면 1758 MHz 가 필요합니다.

4. 1070이 6.5TF 찍는 데 필요한 쉐이더 갯수 * 클럭 조합을, 1080 최고 부스트 클럭인 2114 이하라는 조건에 맞는 경우만 계산해 봤습니다. 1070 클럭이 1080 클럭인 1758 이하라는 조건은 선 위 쪽입니다.

SM SP SP 비율 TFLOPS MHz 클럭 비율
--------------------------------------------------
40 2560 1.00 6.5 1270 0.72
39 2496 0.98 6.5 1302 0.74
38 2432 0.95 6.5 1336 0.76
37 2368 0.93 6.5 1372 0.78
36 2304 0.90 6.5 1411 0.80
35 2240 0.88 6.5 1451 0.83
34 2176 0.85 6.5 1494 0.85
33 2112 0.83 6.5 1539 0.88
32 2048 0.80 6.5 1587 0.90
31 1984 0.78 6.5 1638 0.93
30 1920 0.75 6.5 1693 0.96
29 1856 0.73 6.5 1751 1.00
..................................................
28 1792 0.70 6.5 1814 1.03
27 1728 0.68 6.5 1881 1.07
26 1664 0.65 6.5 1953 1.11
25 1600 0.63 6.5 2031 1.16
24 1536 0.60 6.5 2116 1.20

여기서 클럭이 980-970 = 1216-1178 = 38 = 1080-1070 이라고 보면, 1070 클럭은 1758-38 = 1720 정도가 되니, 제일 가까운 건 SM 29,30인 SP 1856,1920 입니다. (29,1856이 더 가깝습니다.) (계산해보니, 980 - 970 클럭은 50이 아닌 38입니다.) 하지만, SM 29에 1751MHz는 1080과 (거의) 같은 클럭이니, 가능성이 낮습니다. 왜냐하면, 1080 못 되는 불량칩 재활용한 1070 클럭은 더 낮을 테니까요. 따라서, SM30 = SP 1920 쪽이 더 그럴듯 합니다.
한편, 클럭 차이가 아닌 비율로 보면 970/980 = 1178/1216 = 1070/1080 = 1758*0.969 = 1703 입니다. 제일 가까운 건 SM 30 = SP 1920이 됩니다. 클럭이 많이 올랐으니, 차이보다는 비율이 더 나은 추측이라고 봅니다.
클럭이 아닌 SM(SP) 갯수로 추측하면, 970/980 = 13/16 = 1070/1080 = 40*0.8125 = 32.5 입니다. SM 32,33 = SP 2048,2112가 됩니다. 하지만, 28nm 끝물 맥스웰2에 비해 16nm 개시하는 파스칼은 불량이 많이 나올 겁니다. 따라서 불량 SM 비율도 높아서, 말짱한 SM 비율은 맥스웰2 시절보다 낮아질 겁니다. 그러니 SM은 33보다는 32 일 가능성이 높아 보입니다.
정리하면, SM 30~32 = SP 1920~2048 정도가 가능성이 높아 보입니다. 가능성 높은 경우만 정리한 표입니다.

SM SP SP 비율 TFLOPS MHz 클럭 비율
--------------------------------------------------
32 2048 0.80 6.5 1587 0.90
31 1984 0.78 6.5 1638 0.93
30 1920 0.75 6.5 1693 0.96

5. 3* SLI는 GP100에서만 되는 걸수도 있습니다. 황회장은 싼 GP104 묶어서 비싼 GP100 넘는 꼴을 못 볼 겁니다.

6.
아예 별도의 GP102라는 칩이 나올 가능성도 있는 모양이더군요. 쿠다코어는 GP100보다 많지만 GDDR5X를 쓰고, 아마 배정밀도를 쳐낸 버전이지 싶습니다.
//
가능성 있습니다. GP100에서 DP 날린 자리에 SP 더 넣으면 게임 성능은 더 좋을 겁니다. GP104 294mm^2, GP100 610mm^2 이니, GP102가 450~600mm^2 정도라고 가정하지요. SM 갯수가 면적에 비례한다고 가정하면, SM 60~80 정도가 되어서, 게임 (FP32) 성능이 GP104의 1.5~2배까지 나올 겁니다. (실제로는 GP104보다 다이가 커지면서 클럭이 내려서, 이 정도는 안 나올 겁니다만.) FP32 성능이 13~17 TFLOPS 정도 될텐데, (심지어 450mm^2인 경우에도) GP100의 10.6보다 훨씬 높습니다.
필요한 대역폭도 GP104의 1.5~2배 (480~640GB/s) 정도 될텐데, GDDR5X라면 10Gbps 384~512 비트를 쓰면 됩니다. 마이크론에서 샘플 단계에 있는 11~12Gbps GDDR5X를 쓰면, 대역폭이 더 오릅니다. HBM을 쓴다면, 퓨리와 같은 4*HBM1 1Gbps = 512GB/s, GP100과 같은 4*HBM2 1.4Gbps = 720GB/s 등이 가능합니다. HBM은 프리패치 단위가 커서 효율이 GDDR5X보다 나쁜 걸 생각하면, GDDR5X와 실제 대역폭 차이는 별로 없을 겁니다.
수정 삭제
Profile image 수치해석 2016.05.13 12:57
6. 지포스 ROP 갯수는 버스폭에 비례하니, 384비트면 96개, 512비트면 128개가 될 겁니다. HBM을 쓴다면 128개가 되겠고요.
수정 삭제
Profile image 여우비 2016.05.13 16:03
오랜만에 IYD에 들렀네요.
잘 봤습니다.
수정 삭제
Profile image 13월의 이야기 2016.05.13 23:31
지포스 GTX 1080은 저에게 눈물을 남겨주는 물건입니다.
2개월전 이미 970을 구매하여서 중고로 팔고 넘어가기에는 중고가가 너무 내려갔더군요! 이미 장터에는 물량이 넘쳐나는 현상이 벌어졌습니다. 바로 지포스 GTX 1080때문에 ㅜㅜ
포스팅 잘보고 갑니다!
수정 삭제
Profile image 퓨리X3 2016.05.14 09:49
GP104는 맥스웰의 후속작이나 다름없다는 이야기이군요.
어쩌면 GP100에서 FP64 비율을 크게 줄이고 칩 사이즈도 GK110 아래 정도로 한, GP102 따위의 칩이 나올지도...ㄷㄷ
수정 삭제
Profile image ddasdf 2016.05.16 10:19
포스트 내용 잘보았습니다. 결국 gp104는 gm204랑 비슷한 전략으로 나온 칩이라는거군요!
혹시 시간이되신다면 폴라리스 10과 베가 10 폴라리스11에 대한 성능 예측 분석도 해주실 수 있으신가여?
언제나 좋은 포스팅 잘 보고있습니다 좋은글 감사합니다.
수정 삭제
Profile image 날아라냉장고 2016.05.17 08:04
궁금한게 하나 있는데..
'게임에 올인한 가벼운'이라는 말씀이.. 혹시 맥스웰이랑 똑같은 연산부분을 쳐내서 만들었다는 말씀이신가요? ㅇ.ㅇ?
수정 삭제
Profile image 2016.05.19 11:11
방금 스펙표 보고 왔는데
쿠다코어 1920개 1680Mhz 클럭입니다 ㅋㅋ 정확히 맞추셨네요 소름
수정 삭제
  • 고독한 스타를 관음하다 : GP102 파헤치기 [VGA] 고독한 스타를 관음하다 : GP102 파헤치기 [6] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 고독한 스타를 관음하다 : GP102 파헤치기 스포트라이트가 채 잦아들기도 전 쏟아지는 내외의 의뭉스러운 시선을 견뎌야 하는 것. 스타의 숙명이다. 3일 전 세상을 놀래키며 화려하게 데뷔...

    • IYD |
    • 16.07.26 |
    • 조회 수 573 |
  • GP102를 둘러싼 진실 혹은 오해 : 차기 왕의 묘연한 행방 [VGA] GP102를 둘러싼 진실 혹은 오해 : 차기 왕의 묘연한 행방 [17] file

    News Curator : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) GP102를 둘러싼 진실 혹은 오해 : 차기 왕의 묘연한 행방 엔비디아가 테슬라 P100을 공개했던 지난 4월 초만 하더라도 그와 쌍둥이인 지포스의 등장은 단지 시간 문제일 것으로 여겨...

    • IYD |
    • 16.05.25 |
    • 조회 수 657 |
  • 지포스 GTX 1080 성능 분석 : 게임에 올인한 '가벼운' GP104 [VGA] 지포스 GTX 1080 성능 분석 : 게임에 올인한 '가벼운' GP104 [19] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 한달여 전 이 글을 통해 파스칼 아키텍처의 특징과 대략적인 성능에 관해 점쳐 본 바 있다. 그때로부터 오늘에 이르는 시간 동안 엔비디아는 파스칼의 차상위 라인업 GP104를 공식 출시했...

    • IYD |
    • 16.05.12 |
    • 조회 수 429 |
  • 파스칼 아키텍처 분석 : 맥스웰 대비 20% 향상된 IPC [VGA] 파스칼 아키텍처 분석 : 맥스웰 대비 20% 향상된 IPC [15] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 파스칼 아키텍처 분석 : 역대 최고 넓이의 프론트엔드, IPC 15~20% 가량 개선 전망 엔비디아의 차세대 GPU '파스칼'이 마침내 윤곽을 드러냈다. 최상위 칩셋인 GP100은 3840개의 쿠다코어...

    • IYD |
    • 16.04.06 |
    • 조회 수 407 |
  • 폴라리스, 라데온 9700을 꿈꾸다 : 9000 시절의 재림 노리는 AMD [VGA] 폴라리스, 라데온 9700을 꿈꾸다 : 9000 시절의 재림 노리는 AMD [12] file

    News Curator : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 폴라리스, 라데온 9700을 꿈꾸다 : 9000 시절의 재림 노리는 AMD 올해는 그래픽카드 업계에 대단히 의미있는 한 해가 될 것이다. 단 둘뿐인 독립 GPU 제조사 AMD와 엔비디아 모두 만 ...

    • IYD |
    • 16.03.26 |
    • 조회 수 193 |
  • 이 친구는 Fury X2가 아니다 : 그렇다면? [VGA] 이 친구는 Fury X2가 아니다 : 그렇다면? [2] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 일주일 전, 로이 테일러 AMD 상무(Corporate Vice President)의 트위터에 빨간색 PC의 사진이 올려졌고 이내 해당 트윗은 '모습을 드러낸 제미니'라는 제하로 전 세계 언론을 통해 기사화...

    • IYD |
    • 16.03.04 |
    • 조회 수 133 |
  • 크파, SLI, VR의 삼각관계와 "라데온 Gemini" 의 운명 [VGA] 크파, SLI, VR의 삼각관계와 "라데온 Gemini" 의 운명 [6] file

    Translator : Daeguen Lee(※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.)AFR과 VR의 상관관계, 그리고 Gemini의 운명오늘은 좀 색다르게 서문을 열어 보자. 지난 10월 우리는 첫 DX12 게임인 Ashes of Singularity 리뷰를 통해 현행 SLI, 크로스파이어, 교대 프레임 렌더링 (AFR : Alternate Frame Rendering) 기...

    • IYD |
    • 15.12.23 |
    • 조회 수 230 |
  • SLI와 크로스파이어의 비밀 : 판도라의 상자를 열다 [VGA] SLI와 크로스파이어의 비밀 : 판도라의 상자를 열다 [13] file

    Author : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)고성능으로 게임을 즐기고 싶으면 어떻게 해야 할까요? 당연히 더 좋은 그래픽카드를 사야 합니다. 하지만 돈이 흘러넘쳐 주체할 수 없을 지경이라도 현존하는 그래픽카드 중 여러분의 기대...

    • IYD |
    • 15.09.28 |
    • 조회 수 499 |
  • 테슬라는 지포스의 미래다 : 전문가용 그래픽카드로 엿보는 차기 지포스 라인업 [VGA] 테슬라는 지포스의 미래다 : 전문가용 그래픽카드로 엿보는 차기 지포스 라인업 [7] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 안녕하세요 독자 여러분. 저는 이번달 초부터 열심히 GAMER'S CHOICE 8/9월 통합본을 쓰고 있습니다만 오늘은 잠시 다른 글로 여러분을 찾아뵙게 되었습니다. 새 글이 뜬 걸 보고 GAMER'S ...

    • IYD |
    • 15.09.17 |
    • 조회 수 230 |
  • 현미경 들이대기 : 라데온 R9 나노의 실체 [VGA] 현미경 들이대기 : 라데온 R9 나노의 실체 [15] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 안녕하세요 독자 여러분. 요즘 날씨가 정말 덥습니다. 원래 여름은 무슨 일에도 흥미가 안 생길 계절이 아닌가 생각해보게 됩니다. 이런 여름을 맞아 독자 여러분 앞에 새 글이랍시고 내놓...

    • IYD |
    • 15.07.17 |
    • 조회 수 319 |
  • 피지 다시보기 : (1) Fury에 분노한 이들을 위하여 [VGA] 피지 다시보기 : (1) Fury에 분노한 이들을 위하여 [40] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) AMD가 지난주 공식적으로 출시한 라데온 R9 Fury X에 대한 국내 여론이 썩 좋지 않다. 비교적 이른 시기에 해당 제품을 만져 볼 기회를 가졌던 한 사람으로써, 그리고 나름대로 오랜 시간 ...

    • IYD |
    • 15.07.01 |
    • 조회 수 342 |
  • 케플러, 맥스웰 : 그들의 이면 [VGA] 케플러, 맥스웰 : 그들의 이면 [18] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) (※ OCLAB에 게시된 것 또한 공동 정본입니다 : http://oclab.itenjoy.co.kr/49588) 그래픽카드 라인업에 조금만 관심을 가져 보면 이내 GPU의 풍부한 유닛을 다 사용하지 못하는 사례가 비...

    • IYD |
    • 15.02.04 |
    • 조회 수 366 |
  • GTX 970 : 의도된 기만? [VGA] GTX 970 : 의도된 기만? [9] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) (※ OCLAB에 게시된 것 또한 공동 정본입니다 : http://oclab.itenjoy.co.kr/49581) 얼마 전 지포스 GTX 970이 출시 당시 알려졌던 것보다 축소된 하드웨어 사양을 가졌다는 것이 엔비디아...

    • IYD |
    • 15.02.04 |
    • 조회 수 108 |
  • AMD의 또다른 수 : 버뮤다, 피지 - 두개의 빅 칩? [VGA] AMD의 또다른 수 : 버뮤다, 피지 - 두개의 빅 칩? [2] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy or the original source is strictly prohibited) (※ 이 글은 http://iyd.kr/706 글 후단의 외전격으로 쓰여졌습니다.) AMD가 ATI를 인수한 2006년. AMD의 인수 일성은 "스윗 스팟을 공략하겠다" 는 것으로 요약된다. 인수 직전까지 ATI가 ...

    • IYD |
    • 15.01.29 |
    • 조회 수 91 |
  • 엔비디아와 AMD의 다음 수 [VGA] 엔비디아와 AMD의 다음 수 [2] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 1. 앞서 링크의 글 (http://iyd.kr/688) 에서 엔비디아와 AMD의 차세대 GPU의 성능을 예상해본 바 있다. 해당 글이 작성된 이후로 상당한 시간이 경과했고, 그 사이 양사의 차세대 제품에 ...

    • IYD |
    • 15.01.26 |
    • 조회 수 134 |
  • VGA 계산기 리뉴얼 비하인드 스토리 : 뜻밖의 천기누설 [VGA] VGA 계산기 리뉴얼 비하인드 스토리 : 뜻밖의 천기누설 [9] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) GTX 960 리뷰를 공개하며 VGA 계산기가 리뉴얼된 경위를 간단히 소개한 바 있다. (아래 링크 참조) 이 글에서는 외전격으로 거기 얽힌 비하인드 스토리 하나를 적어 보려 한다. - 맥스웰의...

    • IYD |
    • 15.01.25 |
    • 조회 수 344 |
  • GM200, Fiji XT 성능 예측 [VGA] GM200, Fiji XT 성능 예측 [6] file

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 최근 며칠 간격으로 해외 웹사이트에 GM200 / Fiji XT의 추정 스펙이 올라와 화제가 되고 있습니다. 아시다시피 현재 GTX 970 / 980이란 이름으로 출시된 GM204는 과거 GK104가 그러했듯 해당 세대의 최상위 칩이 ...

    • IYD |
    • 14.11.13 |
    • 조회 수 86 |
  • 지포스 GTX 960 성능 예상 : 2세대 맥스웰 예측을 바탕으로 [VGA] 지포스 GTX 960 성능 예상 : 2세대 맥스웰 예측을 바탕으로 [6] file

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 지난달 중순, 아래 글을 통해 엔비디아가 맥스웰 아키텍처를 도입하며 이뤄 낸 성과를 계량화하려는 시도를 한 바 있는데, 마침 엔비디아의 공식 발표자료를 통해 예측이 거의 정확했음이 증명된 바 있습니다. (이...

    • IYD |
    • 14.09.19 |
    • 조회 수 115 |
  • 2세대 맥스웰 (GM204 : GTX 870/880) 성능 예측 [VGA] 2세대 맥스웰 (GM204 : GTX 870/880) 성능 예측 [3] file

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 어제의 Tonga 예측에 이어 이틀 연속 예측 2연타를 날리게 됐습니다. 오늘은 아마 모든 분들이 궁금해하실 2세대 맥스웰, 바로 지포스 GTX 880 / 870의 성능을 예측해 보고자 합니다. 우선 이 글의 영감이 된 WCCF...

    • IYD |
    • 14.08.12 |
    • 조회 수 143 |
  • GTX TITAN Z 가격의 숨겨진 진실 [VGA] GTX TITAN Z 가격의 숨겨진 진실 [13] file

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 약 일주일쯤 전, 엔비디아의 CEO가 한 매체와의 인터뷰에서 TITAN Z의 비싼 가격을 옹호하며 대충 이런 요지의 논리를 폈다. "TITAN Z가 겨냥한 해상도는 지원하는 모니터부터가 수천만원을 호가한다. 이런 모니터...

    • IYD |
    • 14.05.28 |
    • 조회 수 259 |