A Very Turing Estimation : 미리 보는 GeForce RTX 2080 Ti / 2080 성능

by Dr.Lee on 2018년 08월 18일 05시 48분 (1년 전) 조회: 6,359 추천: 6

Turing.jpg

 

NVIDIA의 차세대 게이밍 및 그래픽 워크스테이션용 GPU "Turing" 이 공식화되고, 이에 기반한 GeForce 게이밍 그래픽카드의 등장이 점쳐지며 그래픽카드 시장은 최근 2년 사이 가장 뜨겁게 달아오르고 있습니다. 아시다시피 2016년 NVIDIA가 "Pascal" GPU를 출시한 이후, 해당 성능대를 뛰어넘는 게이밍 그래픽카드의 출시는 만 2년이 되도록 없었습니다.

 

AMD는 2016년 선보인 "Polaris" Radeon 400 시리즈를 소폭 업그레이드한 500 시리즈를 2017년 중반 추가했고, 2015년 "Fiji" 이후 2년째 업데이트가 없던 최상위 라인업을 "Vega" 로 교체했으나 Pascal을 뛰어넘지 못했습니다. 또한 2017년 말에는 NVIDIA가 Pascal의 후속 GPU인 "Volta"를 발표했으나 게이밍 그래픽카드 시장에는 투입되지 않았고, 800mm2가 넘어가는 거대한 다이 / 게이밍 GPU로서는 불필요한 배정밀도 범용 연산 유닛(단정밀도의 1/2 수준)을 탑재한 등 결격사유가 많아 아예 별도의 게이밍 시장 전용 GPU를 내놓을 것이라는 루머가 함께 들려왔습니다. 결과적으로 Turing이 등장함에 따라 이 루머는 사실이 되었습니다.

 

그러나 Turing은 Volta와의 짧은 데뷔일 차이가 말해주듯, 세포 하나하나가 근본적으로 변화한 Fermi-Kepler, Kepler-Maxwell같은 관계들과는 다소 거리가 있습니다. 이에 관해서는 해외 매체들의 사설이 많으니 줄이겠습니다. Pascal-Volta/Turing은 전용 연산 유닛의 활용을 제외하면 ALU 레벨에는 큰 차이가 없고, 러프하게 '같은 수의 유닛이 같은 클럭으로 작동하면' 성능이 같습니다.

 

한편 Turing은 통상적인 범용 연산성능(쉐이더 성능)보다 그래픽 워크스테이션에 유용하게 쓰일 수 있는 레이 트레이싱 연산에 하드웨어 가속(RT코어)을 최초로 지원하면서 레이 트레이싱 연산성능이 크게 올랐는데, 이로 인해 GPU 내부의 전용 연산 유닛 비중이 크게 올랐으며, 10년 전 NVIDIA의 G80 GPU로부터 시작된 범용 연산 유닛(통합 쉐이더)으로의 통합 트렌드를 그 자신이 직접 뒤집은 셈이 되었습니다.

 

또한 소프트웨어 가속에 의존하던 주요 그래픽 기술을 하드웨어로 가속할 수 있게 된 것은 2001년 GeForce 256이 T&L 하드웨어 가속을 지원하며 스스로를 역사상 최초의 GPU라 명명한 이래 처음인 굵직한 변화입니다. NVIDIA가 Turing을 소개하며 G80 이래 GPU 역사상 가장 큰 변혁이라 일컬은 데는 이러한 사실들이 녹아 있습니다.

 

정리하면, Turing은 Volta에 RT코어를 추가하고 다른 모든 유닛 구성의 기본질서를 유지하되 규모를 절감한 마이너 파생상품입니다. 84개의 스트리밍 멀티프로세서(SM)를 탑재해 최대 5376개의 쿠다코어, 672개의 텐서코어를 갖고 있던 Volta 최상위 칩 GV100과 비교하면, Turing 최상위 칩의 규모는 4608 쿠다코어 / 576 텐서코어로 약 85% 수준으로 감축되었습니다. 메모리 및 ROP 파티션도 구조조정을 피할 수는 없었는데, GV100이 128 ROP, 4096비트의 HBM2 메모리를 지원한 것과 대조적으로 Turing 최상위 칩은 96 ROP, 384비트의 GDDR6 메모리를 지원해 약 75% 수준에 머무르고 있습니다.

 

지난주 SIGGRAPH 2018 에서 발표된 Turing 기반 그래픽카드는 워크스테이션용의 Quadro RTX 8000 / 6000 / 5000의 3종입니다. 여기에 더해 AIB 파트너로부터 Quadro RTX 8000 / 6000과 같은 칩 (이하 Turing 최상위 칩) 기반 GeForce RTX 2080 Ti, Quadro RTX 5000과 같은 칩 (이하 Turing 차상위 칩) 기반 GeForce RTX 2080의 존재가 알려지며 그래픽카드 시장은 폭풍전야의 고요함과 같은 모습이 되었습니다.

 

닥터몰라는 이 글을 준비하며, 현재까지 알려진 스펙을 바탕으로 Quadro RTX 8000 / 6000 / 5000, GeForce RTX 2080 Ti / 2080, 그리고 존재 여부는 불확실하나 TITAN 라인업 상하간의 비교가 의미있을 것으로 보고 Turing 최상위 칩으로 가정한 TITAN RTX를 VGA 계산기를 통해 시뮬레이션해 보았습니다. 그 결과를 회원 여러분과 공유합니다.

 

그래프가 너무 길어 그래프 밑에 글을 배치하면 여러분의 가독성을 해칠 것 같으니,

 

- 전체적인 '큰 그림'을 보면 Turing은 Volta의 마이너 버전이라는 점이 확연히 드러납니다.

 

- (그럼에도 불구하고) Quadro RTX 8000 / 6000은 Quadro GV100과,

 

TITAN RTX는 TITAN V와 각각 한자릿 수 % 차이까지 격차를 좁혀 거의 같은 성능입니다.

 

- GeForce RTX 2080 Ti는 메모리와 ROP가 줄었음에도 불구하고 TITAN RTX, Quadro RTX 8000 / 6000과 거의 같은 성능입니다.

 

- GeForce RTX 2080 Ti는 현존하는 어떤 게이밍 그래픽카드로도 대적할 수 없습니다.

 

- GeForce RTX 2080은 GeForce GTX 1080 Ti와 거의 같은 성능입니다.

 

- Pascal vs Turing 세대간 동일 체급 비교시 아래와 같은 성능향상이 있습니다.

  - Quadro RTX 8000 / 6000 : Quadro P6000 대비 32.5% 향상

  - Quadro RTX 5000 : Quadro P5000 대비 31.7% 향상

  - TITAN RTX : TITAN X 대비 31.8%, TITAN Xp 대비 20.6% 향상

  - GeForce RTX 2080 Ti : GeForce GTX 1080 Ti 대비 30.4% 향상

  - GeForce RTX 2080 : GeForce GTX 1080 대비 29.9% 향상

 

이상입니다. 남은 이틀 동안 즐거운 마음으로 차세대 그래픽카드를 기다려 봅시다!

 

turing_final2.jpg

 

아래는 상기 시뮬레이션에 사용된 가정 및 주요 대조군의 스펙 설명입니다.

 

1. 기출시된 제품 : 생략

 

2. TITAN V CEO Edition : NVIDIA의 CEO 젠슨 황은 지난 6월 컴퓨터 비전 및 패턴 인식 학회에서 20명의 촉망받는 스타트업 기업가 및 연구자들에게 기출시된 "TITAN V"의 특별판을 선물했습니다. TITAN V 자체는 기출시된 제품이기에 스펙과 성능이 이미 알려져 있으나, CEO Edition으로 명명된 특별판은 통상판과 구별되는 몇 가지 특징이 있습니다.

 

  - HBM2 메모리 용량이 32GB : 통상판은 12GB로 3의 배수이지만 특별판은 4의 배수가 된데다 1스택당 용량 역시 두 배로 증가한 것으로 보입니다. 이 말은 곧, 3072비트로 컷 다운 되어있던 일반판의 ROP / 메모리 파티션 역시 4096비트로 원상복구 되었음을 의미합니다.

 

  - 텐서 연산 성능이 125 TFLOPS : 통상판은 120 TFLOPS (미디어에 알려진 110 TFLOPS는 오기) 인데 연산 성능이 향상되는 데는 두 방법이 있습니다. 클럭이 높아지거나 연산 유닛 수가 늘어나거나. TITAN V는 GV100의 풀 칩이 아닌, 80 SM / 5120 쿠다코어 / 640 텐서코어의 스펙을 갖는데 마침 여기에 풀 칩의 스펙 (84 SM / 5376 쿠다코어 / 672 텐서코어) 을 대입하면 정.말.우.연.하.게.도. 125 TFLOPS가 됩니다.

 

3. Quadro RTX 8000 / 6000 : Turing 최상위 칩 풀 스펙을 탑재할 것과 단정밀도 연산 성능이 16 TFLOPS라는 사실이 NVIDIA 키노트에서 발표되었습니다. 4608 쿠다코어로 이 연산 성능을 얻으려면 약 1.73GHz가 되어야 합니다.

 

4. TITAN RTX : 3번과 동일한 것으로 가정했습니다.

 

5. GeForce RTX 2080 Ti : AIB 파트너로부터 Turing 최상위 칩을 컷다운한 4352 쿠다코어 / 352비트 11GB GDDR6 메모리 / 88 ROP의 스펙을 가질 것이라고 알려졌습니다. 한편 전세대 최상위 칩 기반 Quadro와 GeForce의 클럭을 비교하면 후자가 약 10% 더 높습니다. 3번에서 구한 1.73GHz에 이 비율을 적용하면 약 1.9GHz가 됩니다.

 

6. Quadro RTX 5000 : Turing 차상위 칩 풀 스펙을 탑재할 것이 이미 알려졌습니다. 한편 전세대 최상위 및 차상위 칩 기반 Quadro들의 클럭을 비교하면 후자가 약 10% 더 높습니다. 3번에서 구한 1.73GHz에 이 비율을 적용하면 약 1.9GHz가 됩니다.

 

7. GeForce RTX 2080 : AIB 파트너로부터 Turing 차상위 칩을 컷다운한 2944 쿠다코어의 스펙을 가질 것이라고 알려졌습니다. 메모리 및 ROP 파티션의 스펙은 풀 칩과 같다고 가정했습니다. 한편 전세대 차상위 칩 기반 Quadro와 GeForce의 클럭을 비교하면 후자가 약 10% 더 높고, 전세대 최상위 및 차상위 칩 기반 GeForce들의 클럭을 비교하더라도 이와 유사합니다. 6번에서 구한 1.9GHz에 이 비율을 적용하면 약 2GHz가 됩니다.

댓글 5

영롱한

1년 전

계산대로라면 1070에서 2080 고려하고 있는데 대략 50%의 향상을 기대할 수 있겠군요. 2일후가 기대됩니다

댓글

Profile

Nvidia

1년 전

가격이 많이 올랐더군요. 2080이 800달러에 출시되었는데 1070은 379였으니..... 1070한국시장에서 55만원을 주고 샀으니 2080은 최소 110에 사게 되겠네요 ㅠ

댓글

Profile

algalon

1년 전

새로운 그래픽 카드가 나올때면 괜시리 즐겁네요 ㅎㅎ

80ti가 동시에 발매되서 신선합니다만 과거 타이탄때 처럼 나중에 리버전이 나오진 않을까 염려도 됩니다.

재미있게 잘 봤습니다!

댓글

밀납

1년 전

황영감님이, 적절소량 고부가가치로 가는군요.

 

댓글

Ian

1년 전

경쟁이 없으니, 독점의 횡포, 갑질 가격이네요. 

댓글

A Very Turing Estimation : 미리 보는 GeForce RTX 2080 Ti / 2080 성능

NVIDIA의 차세대 게이밍 및 그래픽 워크스테이션용 GPU "Turing" 이 공식화되고, 이에 기반한 GeForce 게이밍 그래픽카드의 등장이 점쳐지며 그래픽카드 시장은 최근 2년 사이 가장 뜨겁게 달아오르고 있습니다. 아시다시피 2016년 NVIDIA가 "Pascal" GPU를 출시한 이후,...

by Dr.Lee on 1년 전
6,359 5 6

AMD 2세대 Ryzen Threadripper 프리뷰

AMD는 지난달 각국의 매체들을 대상으로 2세대 Ryzen Threadripper 테크 데이 행사를 개최, 컴퓨텍스 2018 행사에서 예고했던 자사의 차세대 HEDT 라인업을 봉인 해제하는 계기를 가졌습니다. 한국시각 기준으로 8월 6일 오후 10시를 맞고 있는 지금은 이날 공개된 정보...

by Dr.Lee on 1년 전
3,922 9

AMD의 2018년 하반기 : GTX 1060급 SoC, 2세대 Ryzen Threadripper

AMD의 역사는 이제 Zen 이전과 이후로 나뉜다. 데스크탑 CPU뿐 아니라 데이터센터, 임베디드, 그리고 콘솔에까지 가지를 뻗고 있는 AMD는 속속 전 라인업에 Zen 아키텍처를 침투시키고 있는 중이다. 콘솔 SoC는 Zen이 아직까지 뿌리내리지 못한 최후 불모지나 다름없었는...

by Dr.Lee on 1년 전
2,402 1 3

Revisiting Raven Ridge : 출시 반년, APU의 미래를 생각하다

지난 2월 출시된 AMD의 여덟번째 APU 코드네임 '레이븐 릿지'는 일년간 예리하게 검증된 Zen CPU 아키텍처에 Vega GPU 아키텍처를 가미한 첫 번째 APU였습니다. 전작인 7세대 APU '브리스톨 릿지'와 비교하면 CPU 성능이 2.5배 이상으로 -급격하다는 수식어조차 모자랄 ...

by Dr.Lee on 1년 전
4,732 2 7

가격인하로 재조명된 레이븐 릿지 : 기업용 PC, 지금은 맞고 그때는 틀리다

Zen 아키텍처가 등장한지 11개월만인 지난 2월, AMD는 드디어 APU 시장에 라이젠 브랜드를 투입하기 시작합니다. Zen과 Vega가 결합된 레이븐 릿지가 바로 그것이었습니다. 뛰어난 CPU / GPU 성능 밸런스와 가성비로 주목받으며 닥터몰라의 리뷰(링크)에서도 '드디어 AMD...

by 라디요요 on 1년 전
1,536 4 3

삼성家의 혈투 - DDR3 4GB 오버율 테스트 (2)

Author : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 며칠 전 올렸던 삼성램 수율 테스트를 기억하시나요? 1052 / 1102 / 1124 / 1126 / 1130 - 이렇게 다섯 주차의 램 열개를 가지고 수율...

by IYD on 8년 전
259 5 1

삼성家의 혈투 - DDR3 4GB 오버율 테스트 (1)

Author : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 먼젓번에 예고한 대로, 삼성 DDR3 4GB 램을 여러 개 확보해 수율 테스트를 해보게 되었습니다. 각 주차별로 표본이 많지 않아 통계적인...

by IYD on 8년 전
892 19

EK 메모리 DDR3 PC3-10600 4GB x 2EA 인디핑크 간단 리뷰

Author : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) EK메모리에서 출시한 4GB 메모리인데, 간단히 테스트해 봤습니다. 우선 사진부터...!! ▲ 참고로 핸드폰 카메라를 통해 본 색감과 달리 ...

by IYD on 8년 전
183 2

지스킬 PIS DDR3 PC3-19200 CL9 2GB x 2EA 간단 리뷰 : (2) 오버클럭

Author : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) http://iyd.kr/175 <- 이 메모리를 쥐어짠 결과입니다. ▲ 일단 전임자였던 플레어 기본스펙으로 테스트. (2000MHz / 7-9-7-24 1T / 1.6...

by IYD on 9년 전
166 1

지스킬 PIS DDR3 PC3-19200 CL9 2GB x 2EA 간단 리뷰 : (1) 외형

Author : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) (이 램의 전 주인이자, 플레어에 안주하고 있던 저를 폭풍처럼 지름의 늪으로 몰아넣으신 남대원님께 특별히 이 글을 바칩니다...) 새...

by IYD on 9년 전
109
서버에 요청 중입니다. 잠시만 기다려 주십시오...