하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] A Very Turing Estimation : 미리 보는 GeForce RTX 2080 Ti / 2080 성능

Dr.Lee | 조회 6051 | 추천 5 | 2018.08.18. 05:48 http://drmola.com/pc_column/298395

Turing.jpg

 

NVIDIA의 차세대 게이밍 및 그래픽 워크스테이션용 GPU "Turing" 이 공식화되고, 이에 기반한 GeForce 게이밍 그래픽카드의 등장이 점쳐지며 그래픽카드 시장은 최근 2년 사이 가장 뜨겁게 달아오르고 있습니다. 아시다시피 2016년 NVIDIA가 "Pascal" GPU를 출시한 이후, 해당 성능대를 뛰어넘는 게이밍 그래픽카드의 출시는 만 2년이 되도록 없었습니다.

 

AMD는 2016년 선보인 "Polaris" Radeon 400 시리즈를 소폭 업그레이드한 500 시리즈를 2017년 중반 추가했고, 2015년 "Fiji" 이후 2년째 업데이트가 없던 최상위 라인업을 "Vega" 로 교체했으나 Pascal을 뛰어넘지 못했습니다. 또한 2017년 말에는 NVIDIA가 Pascal의 후속 GPU인 "Volta"를 발표했으나 게이밍 그래픽카드 시장에는 투입되지 않았고, 800mm2가 넘어가는 거대한 다이 / 게이밍 GPU로서는 불필요한 배정밀도 범용 연산 유닛(단정밀도의 1/2 수준)을 탑재한 등 결격사유가 많아 아예 별도의 게이밍 시장 전용 GPU를 내놓을 것이라는 루머가 함께 들려왔습니다. 결과적으로 Turing이 등장함에 따라 이 루머는 사실이 되었습니다.

 

그러나 Turing은 Volta와의 짧은 데뷔일 차이가 말해주듯, 세포 하나하나가 근본적으로 변화한 Fermi-Kepler, Kepler-Maxwell같은 관계들과는 다소 거리가 있습니다. 이에 관해서는 해외 매체들의 사설이 많으니 줄이겠습니다. Pascal-Volta/Turing은 전용 연산 유닛의 활용을 제외하면 ALU 레벨에는 큰 차이가 없고, 러프하게 '같은 수의 유닛이 같은 클럭으로 작동하면' 성능이 같습니다.

 

한편 Turing은 통상적인 범용 연산성능(쉐이더 성능)보다 그래픽 워크스테이션에 유용하게 쓰일 수 있는 레이 트레이싱 연산에 하드웨어 가속(RT코어)을 최초로 지원하면서 레이 트레이싱 연산성능이 크게 올랐는데, 이로 인해 GPU 내부의 전용 연산 유닛 비중이 크게 올랐으며, 10년 전 NVIDIA의 G80 GPU로부터 시작된 범용 연산 유닛(통합 쉐이더)으로의 통합 트렌드를 그 자신이 직접 뒤집은 셈이 되었습니다.

 

또한 소프트웨어 가속에 의존하던 주요 그래픽 기술을 하드웨어로 가속할 수 있게 된 것은 2001년 GeForce 256이 T&L 하드웨어 가속을 지원하며 스스로를 역사상 최초의 GPU라 명명한 이래 처음인 굵직한 변화입니다. NVIDIA가 Turing을 소개하며 G80 이래 GPU 역사상 가장 큰 변혁이라 일컬은 데는 이러한 사실들이 녹아 있습니다.

 

정리하면, Turing은 Volta에 RT코어를 추가하고 다른 모든 유닛 구성의 기본질서를 유지하되 규모를 절감한 마이너 파생상품입니다. 84개의 스트리밍 멀티프로세서(SM)를 탑재해 최대 5376개의 쿠다코어, 672개의 텐서코어를 갖고 있던 Volta 최상위 칩 GV100과 비교하면, Turing 최상위 칩의 규모는 4608 쿠다코어 / 576 텐서코어로 약 85% 수준으로 감축되었습니다. 메모리 및 ROP 파티션도 구조조정을 피할 수는 없었는데, GV100이 128 ROP, 4096비트의 HBM2 메모리를 지원한 것과 대조적으로 Turing 최상위 칩은 96 ROP, 384비트의 GDDR6 메모리를 지원해 약 75% 수준에 머무르고 있습니다.

 

지난주 SIGGRAPH 2018 에서 발표된 Turing 기반 그래픽카드는 워크스테이션용의 Quadro RTX 8000 / 6000 / 5000의 3종입니다. 여기에 더해 AIB 파트너로부터 Quadro RTX 8000 / 6000과 같은 칩 (이하 Turing 최상위 칩) 기반 GeForce RTX 2080 Ti, Quadro RTX 5000과 같은 칩 (이하 Turing 차상위 칩) 기반 GeForce RTX 2080의 존재가 알려지며 그래픽카드 시장은 폭풍전야의 고요함과 같은 모습이 되었습니다.

 

닥터몰라는 이 글을 준비하며, 현재까지 알려진 스펙을 바탕으로 Quadro RTX 8000 / 6000 / 5000, GeForce RTX 2080 Ti / 2080, 그리고 존재 여부는 불확실하나 TITAN 라인업 상하간의 비교가 의미있을 것으로 보고 Turing 최상위 칩으로 가정한 TITAN RTX를 VGA 계산기를 통해 시뮬레이션해 보았습니다. 그 결과를 회원 여러분과 공유합니다.

 

그래프가 너무 길어 그래프 밑에 글을 배치하면 여러분의 가독성을 해칠 것 같으니,

 

- 전체적인 '큰 그림'을 보면 Turing은 Volta의 마이너 버전이라는 점이 확연히 드러납니다.

 

- (그럼에도 불구하고) Quadro RTX 8000 / 6000은 Quadro GV100과,

 

TITAN RTX는 TITAN V와 각각 한자릿 수 % 차이까지 격차를 좁혀 거의 같은 성능입니다.

 

- GeForce RTX 2080 Ti는 메모리와 ROP가 줄었음에도 불구하고 TITAN RTX, Quadro RTX 8000 / 6000과 거의 같은 성능입니다.

 

- GeForce RTX 2080 Ti는 현존하는 어떤 게이밍 그래픽카드로도 대적할 수 없습니다.

 

- GeForce RTX 2080은 GeForce GTX 1080 Ti와 거의 같은 성능입니다.

 

- Pascal vs Turing 세대간 동일 체급 비교시 아래와 같은 성능향상이 있습니다.

  - Quadro RTX 8000 / 6000 : Quadro P6000 대비 32.5% 향상

  - Quadro RTX 5000 : Quadro P5000 대비 31.7% 향상

  - TITAN RTX : TITAN X 대비 31.8%, TITAN Xp 대비 20.6% 향상

  - GeForce RTX 2080 Ti : GeForce GTX 1080 Ti 대비 30.4% 향상

  - GeForce RTX 2080 : GeForce GTX 1080 대비 29.9% 향상

 

이상입니다. 남은 이틀 동안 즐거운 마음으로 차세대 그래픽카드를 기다려 봅시다!

 

turing_final2.jpg

 

아래는 상기 시뮬레이션에 사용된 가정 및 주요 대조군의 스펙 설명입니다.

 

1. 기출시된 제품 : 생략

 

2. TITAN V CEO Edition : NVIDIA의 CEO 젠슨 황은 지난 6월 컴퓨터 비전 및 패턴 인식 학회에서 20명의 촉망받는 스타트업 기업가 및 연구자들에게 기출시된 "TITAN V"의 특별판을 선물했습니다. TITAN V 자체는 기출시된 제품이기에 스펙과 성능이 이미 알려져 있으나, CEO Edition으로 명명된 특별판은 통상판과 구별되는 몇 가지 특징이 있습니다.

 

  - HBM2 메모리 용량이 32GB : 통상판은 12GB로 3의 배수이지만 특별판은 4의 배수가 된데다 1스택당 용량 역시 두 배로 증가한 것으로 보입니다. 이 말은 곧, 3072비트로 컷 다운 되어있던 일반판의 ROP / 메모리 파티션 역시 4096비트로 원상복구 되었음을 의미합니다.

 

  - 텐서 연산 성능이 125 TFLOPS : 통상판은 120 TFLOPS (미디어에 알려진 110 TFLOPS는 오기) 인데 연산 성능이 향상되는 데는 두 방법이 있습니다. 클럭이 높아지거나 연산 유닛 수가 늘어나거나. TITAN V는 GV100의 풀 칩이 아닌, 80 SM / 5120 쿠다코어 / 640 텐서코어의 스펙을 갖는데 마침 여기에 풀 칩의 스펙 (84 SM / 5376 쿠다코어 / 672 텐서코어) 을 대입하면 정.말.우.연.하.게.도. 125 TFLOPS가 됩니다.

 

3. Quadro RTX 8000 / 6000 : Turing 최상위 칩 풀 스펙을 탑재할 것과 단정밀도 연산 성능이 16 TFLOPS라는 사실이 NVIDIA 키노트에서 발표되었습니다. 4608 쿠다코어로 이 연산 성능을 얻으려면 약 1.73GHz가 되어야 합니다.

 

4. TITAN RTX : 3번과 동일한 것으로 가정했습니다.

 

5. GeForce RTX 2080 Ti : AIB 파트너로부터 Turing 최상위 칩을 컷다운한 4352 쿠다코어 / 352비트 11GB GDDR6 메모리 / 88 ROP의 스펙을 가질 것이라고 알려졌습니다. 한편 전세대 최상위 칩 기반 Quadro와 GeForce의 클럭을 비교하면 후자가 약 10% 더 높습니다. 3번에서 구한 1.73GHz에 이 비율을 적용하면 약 1.9GHz가 됩니다.

 

6. Quadro RTX 5000 : Turing 차상위 칩 풀 스펙을 탑재할 것이 이미 알려졌습니다. 한편 전세대 최상위 및 차상위 칩 기반 Quadro들의 클럭을 비교하면 후자가 약 10% 더 높습니다. 3번에서 구한 1.73GHz에 이 비율을 적용하면 약 1.9GHz가 됩니다.

 

7. GeForce RTX 2080 : AIB 파트너로부터 Turing 차상위 칩을 컷다운한 2944 쿠다코어의 스펙을 가질 것이라고 알려졌습니다. 메모리 및 ROP 파티션의 스펙은 풀 칩과 같다고 가정했습니다. 한편 전세대 차상위 칩 기반 Quadro와 GeForce의 클럭을 비교하면 후자가 약 10% 더 높고, 전세대 최상위 및 차상위 칩 기반 GeForce들의 클럭을 비교하더라도 이와 유사합니다. 6번에서 구한 1.9GHz에 이 비율을 적용하면 약 2GHz가 됩니다.

Dr.Lee's Signature

* 적용중인 트로피 :

  1. Turing.jpg (File Size:1.90MB/Download:1)
facebook twitter google plus pinterest kakao story band
Profile image 영롱한 2018.08.18 14:46
계산대로라면 1070에서 2080 고려하고 있는데 대략 50%의 향상을 기대할 수 있겠군요. 2일후가 기대됩니다
Profile image Nvidia 2018.08.19 08:09
가격이 많이 올랐더군요. 2080이 800달러에 출시되었는데 1070은 379였으니..... 1070한국시장에서 55만원을 주고 샀으니 2080은 최소 110에 사게 되겠네요 ㅠ
Profile image algalon 2018.08.20 00:48

새로운 그래픽 카드가 나올때면 괜시리 즐겁네요 ㅎㅎ

80ti가 동시에 발매되서 신선합니다만 과거 타이탄때 처럼 나중에 리버전이 나오진 않을까 염려도 됩니다.

재미있게 잘 봤습니다!

Profile image 밀납 2018.08.28 15:19

황영감님이, 적절소량 고부가가치로 가는군요.

 

Profile image Ian 2018.08.28 19:57

경쟁이 없으니, 독점의 횡포, 갑질 가격이네요. 

  • Steve Jobs Theater에서 온 편지 : 애플 9월 스페셜 이벤트 돌아보기 Steve Jobs Theater에서 온 편지 : 애플 9월 스페셜 이벤트 돌아보기 file

    현지 시간으로 9월 12일, 애플이 스페셜 이벤트를 열렸습니다. 이번 스페셜 이벤트는 최초의 아이폰이 출시된지 10주년이 되는 해에 열린 스페셜 이벤트인데다 애플의 새 본사인 애플파크의 스티브 잡스 시어터에서 열리는 첫 번째 스페셜 이벤트라서 여느 때보다 더 특별하게 시작되었습니다. 커다란 유리 원통으로 이뤄진 ...

    • iMola |
    • 17.09.15 |
    • 조회 수 845 |
  • 아이폰에게서 (잠깐이나마) 자유로워진다. 애플 워치 시리즈 3 공개 [모바일] 아이폰에게서 (잠깐이나마) 자유로워진다. 애플 워치 시리즈 3 공개 file

    애플이 12일(현지 시각) 쿠퍼티노의 애플 파크에 위치한 스티브 잡스 시어터에서 3세대 애플 워치인 시리즈 3을 공개했습니다. 애플 워치 시리즈 3은 시리즈 2에서 또 다른 자연스러운 진화를 꾀했습니다. 바로 셀룰러를 지원하는 것입니다. 여전히 애플 워치 시리즈 3을 사용하려면 아이폰이 필요한 것은 변하지 않습니다. ...

  • X에 다 가렸지만 있을 건 다 있다. 아이폰 8 시리즈 [모바일] X에 다 가렸지만 있을 건 다 있다. 아이폰 8 시리즈 [5] file

    * (iMola) 어제 애플 파크의 스티브 잡스 시어터에서 열린 스페셜 이벤트에서 무대의 중앙에 서 있던 주인공은 당연히 아이폰 X이었습니다. 하지만 이 이벤트에서 발표된 또 다른 아이폰이 하나 있습니다. 바로 아이폰 8 시리즈입니다. 아이폰 X이 미래를 생각하며 완전히 새롭게 만들어진 아이폰이라면, 아이폰 8은 아이폰 ...

  • 아이폰 X의 심장 : A11 바이오닉 칩 살펴보기 [모바일] 아이폰 X의 심장 : A11 바이오닉 칩 살펴보기 [25] file

    아이폰 X 핸즈온(링크)에 이어 살펴볼 내용은 아이폰 X, 아이폰 8 시리즈에 들어가는 애플의 새 어플리케이션 프로세서인 A11 바이오닉 칩입니다. A4부터 A9까지는 칩 네이밍에 별 다른 단어가 붙지는 않았는데 A10 Fusion부터는 해당 칩의 특성을 나타내는 단어가 붙기 시작했습니다. A10은 방금 말한것처럼 Fusion이 붙었...

    • iMola |
    • 17.09.13 |
    • 조회 수 12995 |
  • 엑스가 아니라 텐 : 아이폰 X, 직접 써봤어요 [모바일] 엑스가 아니라 텐 : 아이폰 X, 직접 써봤어요 [14] file

    애플이 드디어 베일에 싸여있던(베일이 투명했긴 하지만) 아이폰 X을 정식으로 공개했습니다. 애플이 상용구처럼 사용하는 ‘최초의 아이폰 이래 가장 큰 진보’를 이뤄낸 아이폰이라는 수식은 이번에도 어김없이 따라붙었습니다. 하지만 이번에는 빈 말이 아닌 것 같습니다. 가장 상징적으로 아이폰 X은 최초의 아이폰 이래 ...

    • iMola |
    • 17.09.13 |
    • 조회 수 6811 |
  • 2주 앞으로 다가온 SKL-X HCC : 1900X 발표로 엿보는 AMD의 대응전략 [CPU] 2주 앞으로 다가온 SKL-X HCC : 1900X 발표로 엿보는 AMD의 대응전략 [2] file

    인텔의 HEDT 라인업 완비가 어느새 2주 앞으로 다가왔다. 지난 5월 30일 대만에서 개최된 컴퓨텍스에서 인텔은 그레고리 브라이언트 전무(SVP) 겸 클라이언트 컴퓨팅 사업부 대표(GM)가 진행한 기조연설을 통해 최대 18코어를 탑재한 차세대 코어 X-시리즈 프로세서를 정식으로 공개했으며, 그중 하위 5개 모델들인 코어 i5-...

    • Dr.Lee |
    • 17.09.11 |
    • 조회 수 2793 |
  • LG Tone Plus Free : 선 없는 추락 [음향기기] LG Tone Plus Free : 선 없는 추락 [2] file

    장비지원 : B&P 인터내셔널, 이신렬 박사님 측정수행 : STUDIO51 데이터 검증 : 이신렬 박사님 최대 출력 (0dBFS, 500Hz, sine wave) 정격 출력 (-15dBFS, 500Hz, sine wave) 비보정 주파수 응답 (20Hz-20kHz, sine sweep, -15dBFS, 1/24smoth) 기기 자체가 가지는 좌우 편차가 상당히 있는 편입니다. 이는 반복 측정시에도 ...

    • STUDIO51 |
    • 17.09.07 |
    • 조회 수 1700 |
  • 코원 PLENUE R : 무선에 대한 재고 [음향기기] 코원 PLENUE R : 무선에 대한 재고 [5] file

    "We believe in a wireless future a future where all of your devices intuitively connect." "우리는 선 없는 미래를 믿습니다. 모든 기기가 저절로 알아서 연결되는 미래를 말이죠." 애플이 아이폰7에서 이어폰 단자를 제거하고 그에 대한 대안으로 만든 에어팟 소개영상의 제일 첫 부분의 설명이다. 이어폰 단자를 최초...

    • STUDIO51 |
    • 17.08.29 |
    • 조회 수 2289 |
  • 노트북용 카비레이크 리프레시 발표 : 8세대 CPU, 인텔이 마주한 뉴 노멀 [CPU] 노트북용 카비레이크 리프레시 발표 : 8세대 CPU, 인텔이 마주한 뉴 노멀 [2] file

    지난 월요일, 인텔은 페이스북 생중계라는 형식을 빌어 8세대 코어 프로세서를 정식 공개했다. 앞서 브라이언 크르자니크 CEO는 유서깊은 인텔 개발자 포럼을 금년부터 더 이상 호스팅하지 않을 것이라고 선언했는데, 이 행사야말로 인텔이 그 해의 신제품을 전세계 미디어 앞에 첫 공개하는 가장 큰 홍보의 장이었다는 점에...

    • Dr.Lee |
    • 17.08.25 |
    • 조회 수 3093 |
  • 모바일 기기에서 성능은 이렇게 쓰는 것 : 아이패드 프로 10.5 리뷰 [모바일] 모바일 기기에서 성능은 이렇게 쓰는 것 : 아이패드 프로 10.5 리뷰 [2] file

    먼저 글을 시작하기에 앞서 아이패드 프로 10.5 리뷰는 아직 완성본이 아니며, 추가적으로 계속 수정될 것이라는 점을 알립니다. 다만 지금의 글 역시 아이패드 프로 10.5 성능 리뷰로써 한편의 완성된 글이기에 먼저 읽고 느긋하게 나머지 내용들이 추가되기를 기다려주시면 감사하겠습니다. 사진 : 백투더맥 에디터 쿠도군...

    • iMola |
    • 17.08.20 |
    • 조회 수 3973 |