지포스 꼬리표를 떼다 : "엔비디아 타이탄 X" 8월 2일 출시 예고

by IYD on 2016년 07월 23일 01시 34분 (3년 전) 조회: 317

News Curator : Daeguen Lee

(※ 이 글은 AnandTech의 원문을 초월번역(...)한 것입니다)

 

 

 

지포스 꼬리표를 떼다 : "엔비디아 타이탄 X" 8월 2일 출시 예고

 

 

그간의 경험칙에 따르면 엔비디아는 신 아키텍처를 최초로 출시한 때로부터 대체로 6개월의 시차를 두고 해당 아키텍처의 '빅 뷰티' 칩을 공개해 왔었다. 2014년말 2세대 맥스웰 아키텍처가 등장한 때로부터 2015년초 지포스 GTX 타이탄 X가 출시되기까지의 시차 역시 이 공식에 충실했다. 그러나 파스칼 세대에 접어들며 엔비디아의 경영진은 한층 속도를 내기로 결심한 것이 분명해 보인다. 파스칼 아키텍처 기반의 지포스 GTX 1080 / 1070이 출시된지 채 두 달이 되지 않은 지금, 벌써 빅 칩에 기반한 타이탄 X가 공개되었기 때문이다. 바로 오늘, 스탠포드 대학교에서.

 

엔비디아의 CEO인 젠슨황 사장이 직접 주재한 프리젠테이션에 따르면 이 새로운 그래픽카드는 GP102 GPU를 탑재하고 있으며, 놀랍게도 정식 출시까지는 채 2주도 남지 않았다고 한다. 앞서 존재 여부 자체가 초미의 관심사로 떠올랐던 GP102 칩셋이 진정 파스칼 세대의 '빅 뷰티'가 맞는지, 제품명에서 '지포스 GTX'를 빼고 "엔비디아 타이탄 X"로 명명법을 재정립한 것이 어떤 심경 변화에 따른 것인지 등은 다소 의문으로 남지만 어쨌든 지엽적인 부분일 뿐이다. 오늘만큼은 새 왕의 등장에 마음껏 흥분하자. 자세한 사양은 아래 표를 참고.

 

 

상술된 수치들을 좀더 상세히 들여다보도록 하자. 우선 엔비디아 타이탄 X는 3584개의 쿠다코어를 탑재했으며 내부 구조가 GP104의 그것과 동일하다고 가정한다면 28개의 스트리밍 멀티프로세서(SM) 그룹으로 구성되었으리라 점쳐진다. 20개의 SM과 2560개의 쿠다코어를 가졌던 지포스 GTX 1080과 비교하면 각각 40%씩이 증가된 것이다. (※ 역자 주 : 참고로 GP100은 GP104와 다소 다른 SM 분절법을 채택, 총 3840개의 쿠다코어를 갖는 대신 SM당 쿠다코어 개수는 반감되어 있어 SM 개수는 60개에 달한다. 만약 GP102의 내부구조가 GP104가 아닌 GP100의 그것에 더욱 가깝다면 SM 개수는 28개가 아닌 56개일 수 있다.)

 

다른 모든 것을 제쳐두고 3584라는 숫자가 글쓴이의 호기심을 자극한다. 바로 지난 4월 공개되었던 테슬라 P100이 이와 정확히 같은 개수의 쿠다코어를 탑재하고 있었기 때문이다. 주지하다시피 테슬라 P100에 탑재된 GP100 GPU는 GP100의 풀 칩이 아니었으며 -풀 칩은 3840 쿠다코어를 가진다-, 비록 현재로서는 GP102에 대한 정보가 다소 부족하지만 본질적으로 GP100의 경량화된 버전(FP64 유닛 삭감, 메모리 인터페이스 HBM2 -> GDDR5X 변경 등)이라 가정해 보면 엔비디아 타이탄 X에 탑재된 GP102는 테슬라 P100에 탑재된 GP100이 그러했듯 풀 칩이 아닐 가능성이 다소 높아 보인다. 또한 지난 맥스웰 세대에 GM200과 GM204, GM206의 쿠다코어 개수 비율이 3:2:1(3072:2048:1024)이었던 것에 비춰 보더라도 GP100/GP102의 풀 칩은 3840의 쿠다코어를 갖는 편이 더 설득력 있어 보인다. 이미 2560개의 쿠다코어를 갖는 GP104가 있고, 1280개의 쿠다코어를 갖는 GP106이 나온 마당이다.

 

한편, 엔비디아 타이탄 X의 작동 속도는 베이스 클럭이 1417MHz / 평균 부스트 클럭이 1531MHz로 총 단정밀도 연산성능은 약 11 테라플롭스에 이른다. 이는 친동생뻘인 지포스 GTX 1080보다 24% 더 높은 것이며 전임자인 지포스 GTX 타이탄 X보다는 무려 60% 더 높아진 것이다. 이러한 무시무시한 연산성능에 걸맞게 GP102는 384비트 GDDR5X 메모리 인터페이스를 지원하며, 엔비디아 타이탄 X에 탑재된 메모리 모듈은 지포스 GTX 1080의 그것과 동일한 10Gbps 모듈로 총 대역폭은 지포스 GTX 1080보다 50% 높은 480GB/s에 이른다.

 

 

이제 남은 것은 TMU와 ROP 갯수가 몇 개냐는 것인데 아쉽게도 엔비디아는 여기까지는 정보를 풀지 않았다. (사실 기존의 신제품 출시에서도 TMU와 ROP 갯수까지 시시콜콜 공개하는 일은 잘 없긴 했다) 그러나 GP104와 GP106의 내부 구성비율이 GP102에도 그대로 적용된다고 가정하면 3584개의 쿠다코어와 224개의 TMU, 96개의 ROP를 갖는다고 추정하더라도 그리 터무니없게 보이지는 않을 것 같다. 앞서 짚어본 작동 속도와 이들을 조합해 보면 엔비디아 타이탄 X는 지포스 GTX 1080보다 24% 높은 연산/텍스처/쉐이더 성능과 33% 높은 렌더링 성능, 50% 높은 메모리 대역폭을 갖게 되며, 지포스 GTX 타이탄 X와 비교하면 56% 높은 연산/텍스처/쉐이더 성능, 42% 높은 렌더링 성능, 43% 높은 메모리 대역폭을 갖는다.

 

이전까지의 "지포스 타이탄"들과 마찬가지로 엔비디아 타이탄 X는 250W의 TDP를 가지며, 이는 지포스 GTX 1080보다 약 39%(70W) 더 높은 것이다. 엔비디아가 공개한 렌더링샷에 따르면 8핀+6핀 PCI-Express 보조전원 커넥터가 탑재되었고 파스칼 세대 특유의 울룩불룩 각진 NVTTM 쿨러가 그대로 적용되어 있다. 내부 구조는 공개되지 않았으나 그간의 블로워팬 + 베이퍼챔버 구조에서 크게 벗어나지 않았으리라 생각된다.

 

 

사족을 달자면, 엔비디아 타이탄 X와 지포스 GTX 1080의 TDP 차이로부터 엔비디아가 당면했을 고충을 조금은 유추해낼 수 있을지 모르겠다. 지난 맥스웰 세대에 지포스 GTX 타이탄 X는 지포스 GTX 980보다 무려 52%(85W) 더 높은 TDP를 가졌었으나 이번 세대 들어 그 폭은 39%로 크게 줄었음을 앞서 확인했다. 현재 엔비디아의 아키텍처에서 거의 유일한 성능 제약 요소가 자체 전력제한 메커니즘임을 생각할 때 엔비디아 타이탄 X와 지포스 GTX 1080의 성능 갭은 지포스 GTX 타이탄 X와 지포스 GTX 980 사이의 그것보다 다소 좁혀졌을 가능성이 있다. (클럭 곱하기 쿠다코어 개수로 산정해 본 연산성능 비율은 실제로 그러하다) 테슬라 P100은 아예 폼팩터를 달리해 TDP를 300W 이상으로 높였지만, 엔비디아가 판단하기에 PCI-Express 형상의 카드로서는 250W가 딱 적정하다는 것 같다.

 

입출력 단자를 살펴보자. 엔비디아가 열거한 바에 따르면 디스플레이포트 1.4, HDMI 2.0b, 듀얼링크 DVI를 지원하며 각각의 갯수는 불명이지만 지포스 GTX 1080의 전례에 비춰 3개의 디스플레이포트, 1개씩의 HDMI와 듀얼링크 DVI일 가능성이 높다.

 

또한 짚고 넘어가지 않을 수 없는 것이 바로 "지포스" 브랜드의 박탈인데, 이로써 엔비디아 타이탄 X는 지포스도, 쿼드로/테슬라도 아닌 제3의 무언가로 자리매김할 공산이 커졌다고 볼 수 있다. 지포스 타이탄이 처음 등장했던 2013년 이래로 해당 라인업의 정체성은 항상 게이밍용 그래픽카드와 전문가용 그래픽카드 사이에서 아슬아슬하게 줄타기를 하고 있었다. 3년의 고민 끝에 마침내 엔비디아가 내린 결론은 '타이탄은 타이탄이다' 쯤이려나.

 

지포스라는 이름을 제거함으로써 역설적으로 "타이탄" 브랜드는 더욱 견고해질 가능성이 높아졌다. 일례로 그간 지포스나 지포스 타이탄으로는 시도조차 되지 않았던 INT8 (정수 바이트) 연산성능을 엔비디아 타이탄 X 스펙의 일부로써 열거하고 있는 점을 들 수 있겠는데, 이 변수형은 신경망 네트워크에서 자주 사용되는 것이다. 전문가용과 소비자용의 교집합인 프로슈머용 카드로서의 정체성이 어느 때보다 공고해진 것이라 볼 수 있다.

 

 

가격으로 말하자면, 엔비디아의 지포스 타이탄들은 진작부터 비쌌지만 이번 엔비디아 타이탄 X는 역대 최고로 비싸다. 지포스 GTX 타이탄 X보다는 200달러, 지포스 GTX 1080 설립자 에디션보다는 500달러 더 비싼 1200달러가 이 제품의 가격표 되시겠다. 여느 지포스 타이탄이 그러했듯 엔비디아 타이탄 X 역시 독점적으로 엔비디아로부터만 생산되며 오직 단 하나의 레퍼런스 디자인만이 존재할 것이다. 판매 방식은 종전까지와 사뭇 달라져 오직 엔비디아의 공식 웹사이트 또는 완제품 PC에 탑재되는 형태로만 구할 수 있으며, 개별 디스트리뷰터를 통해서는 판매되지 않을 예정이라고.

 

종합해 보면 오늘의 주인공께서는 꽤 많은 의문을 던지는 제품이다. 당장 GP102라는 것의 정체부터가 GP100처럼 고성능 FP64 연산성능을 갖췄는지 혹은 그저 좀더 큰 GP104일 뿐인지 불분명하고, GP100에 비해 얼마나 칩 사이즈가 작아졌는지, 대체 엔비디아는 무슨 각오로 불과 두어달 새 3종의 새로운 GPU를 투입했는지 등 모든 것이 물음표 투성이이다. 그저 8월 2일이 오기만을 기다릴 밖에. 2주가 이토록 긴 시간일 줄 미처 몰랐다.

 


 

페이스북, 트위터에서 IYD를 팔로우하시면 저희가 놀아드립니다!
 
http://facebook.com/insideyourdevice
http://twitter.com/iyd_twit

댓글 3

dkdkdk

3년 전

재밌는 친구가 등장했군요 포스팅 잘보았습니다

댓글 수정 삭제

파스칼

3년 전

1080보다도 클럭이 높은 걸 보면 수율은 별로일 겁니다. 칩이 클수록 클럭 올리기가 힘들어지니까요. 따라서 1080보다 클럭 낮은 컷칩이 나올 겁니다.

댓글 수정 삭제

잼아저씨

3년 전

게이머용의 상징인 GTX 타이틀을 떼어버리고 AIB 파트너사로부터 판매를 안 한다는 건 기본적으로 일반 게이머용은 아니로군요. 요 정보는 몰랐는데 감사합니다. 딥러닝 관련 명령어 셋 추가되고 단/반정밀도 성능도 p100 버금가는 강려크함 때문인지 좀 저렴한 소규모 GPGPU용으로 굴리거나, 기존처럼 테스트, 디버깅용으로 쓰이는 목적이 주가 되려나 보네요. 과연 게이밍용 카운터파트인 지포스 라인업용 GP102 컷칩은 언제쯤 나올 것이며, 또 나온다 하더라도 가격이 $700라는 심리적 마지노선을 넘지 않을수 있을까 궁금하군요. 성능이야 뭐 1080을 위시해서 케플러 : 맥스웰 수준의 강력함을 입증했지만, 문제는 맥스웰처럼 좋은 가성비를 보여주지는 못했네요.
개인적으로는 GP102는 클럭이 어디까지 들어갈까 궁금하긴 합니다. 베이스클럭이 낮으니 2000MHz를 넘는다면 진짜 대단한 퍼포먼스를 보여줄거 같은데 말이죠. GP104, GP106은 짜고치는 고스톱이라도 하듯이 공랭에선 동작 클럭 2114MHz를 넘으면 기가막히게 CTD를 일으킵니다. 요번에 개정된 GPU Boost 3.0과 관련이 있는건지 궁금하네요. 더불어 수동 전압조절이 안된다는 점에서는 개인적으로는 아쉽습니다. AMD는 구린 UI로 까이더라도 와트맨을 넣어줘서 DIY가 가능했는데 말이죠.

댓글 수정 삭제

서버에 요청 중입니다. 잠시만 기다려 주십시오...