엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아

by 잼아저씨 on 2018년 09월 19일 22시 56분 (1년 전) 조회: 2,419 추천: 4

페이스북 퍼가기 extends_17 

수정됨_DSC2061.jpg

 

엔비디아 RTX미디어 브리핑에 객원 에디터 자격으로 "대근님 대신" 참여하고 왔습니다. 엔비디아는 선빵필... 아니 선즉제인의 마인드로 언제나 선수를 선호해 왔기에 이들의 행보는 늘 앞서있었습니다. 종래에는 전체적인 성능을 향상시키는 범용적인 선택을 해왔지만, 왜 이번에는 갈림길에서 이 방향을 선택했는지를 납득시키기 위해 미디어 브리핑을 한 거 같았습니다. 

 

자세한 내용과 설명은 차후 언젠가는 나올 대근님의 리뷰를 참조하시고, 이번에는 간단히 이들의 길이 무엇인지를 나름대로 정리해봤습니다.

1. 타겟과 퍼포먼스

 

수정됨_DSC2262.jpg
 

수정됨_DSC2264.jpg

 

근래에는 촬영장비의 발전과 디스플레이의 보급으로 고해상도 (4K 3840*2160+)와 광색역(10bit HDR)이 영상 컨텐츠의 주요한 화두입니다. 게임업계에서도 마찬가지로 이 해상도와 색 대역을 커버하는 것이 주요한 화두중에 하나였으며, 엔비디아는 이를 RTX1080 단일 카드로 구현이 가능하다는 것을 강조했습니다. 차후에 언급하겠습니다만 튜링의 기본적인 퍼포먼스는 파스칼 대비 1.4배 정도 향상을 이루었으며 텐서 코어를 사용하는 DLSS를 쓸 경우 최대 2배 정도의 퍼포먼스 차이까지도 보일 수 있습니다.

 

2. 튜링 아키텍쳐

 

수정됨_DSC2285.jpg

 

수정됨_DSC2291.jpg

 

튜링 아키텍쳐는 엔비디아의 쿠다 도입 이래 가장 큰 변화를 겪은 아키텍쳐입니다. 크게 세가지 변화를 꼽을 수 있는데, 정수/부동소수점 연산 유닛의 분리, 캐시 구조/메모리 개선, RT코어/텐서 코어라는 ASIC의 도입입니다.

 

1) 동시 연산 수행(Concurrent Execution)

 

수정됨_DSC2298.jpg

 

수정됨_DSC2302.jpg

 

대체적으로 게임에서 부동소수점 연산을 100번 하면 36번 정도는 정수 연산을 하게 됩니다. 종래의 아키텍쳐에서는 정수 연산을 하는 경우 부동소수점 연산을 할 수가 없었으나, 튜링 아키텍쳐에서는 이 유닛을 분리해 동시에 부동소수점과 정수 연산을 할 수 있게 되었습니다. 그 덕분에 셰이딩 연산 성능은 1.5배 이상 향상되었습니다.

 

2) 캐시/메모리 개선

 

수정됨_DSC2299.jpg

 

수정됨_DSC2303.jpg

 

수정됨_DSC2307.jpg

 

L1캐시 공유 구조의 개편 히트 속도 향상, L1/L2 캐시 용량 증설로 더 효율적인 캐시 운용이 가능해졌고, 메모리 대역폭은 업계 최고 속도이며 새로운 무손실 색압축 기술로 1.5배 정도의 효율 향상을 이루었습니다.


3) 텐서코어/RT코어

 

수정됨_DSC2314.jpg

 

텐서 코어는 4x4 행렬의 곱연산과 합연산을 수행할 수 있는 유닛으로(일반적인 연산은 불가능합니다.) 연산의 유연성을 잃었지만 낮은 정밀도 연산에서 8-32배의 스루풋을 더 뽑아낼 수 있습니다. 따라서 정밀도가 중요하지 않지만, 수 많은 가능성의 가지를 탐색해야하는 딥러닝의 추론 과정에 최적화 되어 있습니다. 원래는 볼타 아키텍쳐의 테슬라에만 적용되어 있었지만, 튜링 아키텍쳐에서는 소비자용 지포스 카드에까지 넣게 되었습니다. 그 이유라면 차후에 언급하겠지만 당연히 게임에서도 딥러닝을 써먹기 위함일 것입니다.

 

수정됨_DSC2321.jpg


레이 트레이싱은 엔비디아 RTX시리즈의 핵심입니다. 근원적으로 우리가 늘 보아왔던 래스터라이제이션 방식의 렌더링은 우리의 눈이 세계를 인식하는 방식을 담지 못하고 있습니다. 그러나 레이 트레이싱은 화면에 담기는 빛의 경로를 역추적(Path Tracing)하여 광원까지 도달하게 하므로써 우리가 눈으로 보는 방식과 물리적으로 같은 결과를 낼 수 있습니다. 그러나 엄청난 연산을 필요로 하기에 영화 산업같은 실시간이 아닌 렌더에서나 주로 쓰여 왔고, 이를 실시간으로 구현하는 것은 마치 성배와도 같았습니다.

 

수정됨_DSC2338.jpg

 

엔비디아는 레이 트레이싱 안의 레이 캐스팅 과정에서 경계 계층 구조를 만들어 빛의 경로를 추적합니다. 원리는 오브젝트에 직육면체를 점점 작게 선정하여 이 중에 빛의 경로가 있는지를 탐색하는 것입니다.

 

수정됨_DSC2341.jpg

 

수정됨_DSC2345.jpg

 

파스칼에서는 이러한 레이 트레이싱을 셰이더 유닛이 담당했으나 튜링에서는 셰이더는 셰이더 대로 래스터라이제이션을 하면서 레이 트레이싱만 RT코어가 담당하여 동시에 수행하는 것입니다. 

 

수정됨_DSC2347.jpg

 

그런 고로 레이 트레이싱에 한정하면 2080Ti는 1080Ti대비 10배의 스루풋을 낼 수 있습니다.

 

3. RTX 옵스

 

수정됨_DSC2352.jpg

 

수정됨_DSC2361.jpg

 

레이 트레이싱을 사용하는 경우 동시에 기본적인 쿠다 코어, 텐서 코어, RT 코어를 "두뇌 풀가동" 시키는 것이기에 이들의 스루풋을 종합적으로 평가하기 위한 새로운 지표가 필요했습니다. 당연히 이들의 연산 비중이 얼마냐에 따라 그 결과값이 달라질 수 있기 때문에 가중치를 두어 연산능력의 최대치를 평가한 것이 RTX옵스입니다.

 

4. 셰이더 효율 증가

1) 메시 셰이더

수정됨_DSC2383.jpg

 

 

튜링 아키텍쳐에서는 레이 트레이서 뿐만 아니라 전통적인 셰이딩 자체도 변경했습니다. 메시 셰이더 모델은 지오메트리, 버텍스, 테셀레이션 셰이더로 구성되는 종래의 셰이더 구조를 개편해서 메시 셰이더로 통합한 뒤 태스크 셰이더에서 디테일 수준(LoD)을 지정하므로써 드로우콜 부담을 줄이는 것입니다. 이로써 셰이더 구조상 더 높은 유연성과 더불어 더 낮은 연산을 부담하게 되고, CPU의 부담 또한 줄일 수 있습니다. 자세한 효과는 동영상을 참조하세요.

 

2)가변 레이트 셰이딩

수정됨_DSC2391.jpg

 

수정됨_DSC2393.jpg

 

가변 레이트 셰이딩은 디테일 수준이 아니라 상황에 맞는 적응형 셰이딩으로 중요도를 지정하여 중요도가 높은 곳에는 더 많은 연산을, 낮은 곳에는 더 적은 연산을 하는 가변 셰이더 연산을 하는 것입니다. 마찬가지로 총 연산 부담을 줄일 수 있습니다.

 

5. 딥러닝

 

수정됨_DSC2425.jpg

 

수정됨_DSC2429.jpg

 

딥러닝을 그래픽 쪽에 활용하기 위해 엔비디아는 NGX, 신경망 그래픽 프레임워크를 제공합니다. 이것은 엔비디아 자사의 슈퍼컴퓨터를 활용하여 훈련(Training)한 결과를 API를 통해 게임 엔진과 상호적으로 결과를 주고 받아 낮은 비용으로 높은 그래픽적 충실도를 누리는 것입니다. 

 

수정됨_DSC2433.jpg

 

그 세부적인 적용 방식은 화질 보간입니다. 

 

 

수정됨_DSC2435.jpg

 

수정됨_DSC2450.jpg

 

DLSS(딥러닝 수퍼샘플링)는 엔비디아가 대표적으로 내세우는 NGX 기술로, 인공신경망을 활용하는 안티 에일리어싱 방식입니다. 고품질 지터 이미지를 64샘플을 수퍼 컴퓨터에 트레이닝한 후 게임 엔진에 적용한 것으로, 대략적으로 X64 수퍼샘플링(해상도를 높인 뒤 평균낸 것)과 비등한 결과를 얻으나 TAA(프레임 간 안티에일리어싱) 보다 낮은 대가를 치른다고 합니다.

 

수정됨_DSC2456.jpg

 

당연하지만 텐서 코어를 쓰기 때문에 DLSS를 쓰면 종래보다 더 높은 성능 향상치를 보입니다.

 

6. 기타

1) 스샷 놀이

수정됨_DSC2483.jpg

 

당연하지만 레이 트레이싱을 실시간으로 구현하지 않아도 되는 스크린샷에서는 더 많은 빛을 바운스시켜 더 물리적으로 정확한 빛을 구현할 수 있습니다. 지포스 익스피리언스 ANSEL SDK에 포함된 기능입니다.

 

2)오버 클럭

수정됨_DSC2510.jpg

 

수정됨_DSC2531.jpg

 

페이즈 컨트롤과 전원부 피드백 컨트롤을 향상시커 같은 전압 대비 더 높은 클럭을 뽑아낼 수 있으며, 엔비디아 스캐너를 쓰면 게임을 돌려서 안정화 하지 않더라도 데이터 기반으로 피드백을 해주어 오버클럭 최적화를 해준다고 합니다.

 

 

7. 파트너 사 시연

 

수정됨_DSC2627.jpg

 

수정됨_DSC2086.jpg

 

 

 

수정됨_DSC2630.jpg

'

수정됨_DSC2064.jpg

 

수정됨_DSC2066.jpg

 

수정됨_DSC2067.jpg

 

수정됨_DSC2072.jpg

 

수정됨_DSC2080.jpg

 

8. 제 생각

 

사실 2080Ti는 다이사이즈가 굉장히 큽니다. 775mm2라던데 웨이퍼에서 찍어내는 반도체 임계치가 850mm2 수준이라니 소비자용으로는 비정상적으로 크다는 생각도 들 정도입니다. 저 같으면 아마 거기에 셰이더 유닛과 ROP를 추가하는 간단한 성능 향상을 생각하겠지만 엔비디아는 ASIC을 택했습니다. 즉, 양적 성장보다는 질적으로 특화시켜 성장시키는 게 앞으로 나아갈 길이라고 생각하는 것이라 봅니다. 그 특화의 대상은 레이 트레이싱입니다. 더이상 게임 업계에서 참신한 그래픽적 돌파구가 없는데, 전인미답의 세계인 실시간 레이 트레이싱을 완벽하지는 않더라도 일부 도입하기 시작한 것은 놀라운 일은 분명합니다. 그것이 눈속임일지라 하더라도, 앞으로 개발자들의 참여가 미진하다 하더라도 언제든지 방향을 선회할 수 있는 엔비디아의 여유임은 분명합니다. 업계를 선도하는 기업이라면 이러한 비전은 제시할 수 있고, 또 바람직하다 생각합니다. 다만 소비자에게 업계의 포상인 당장의 가성비는 뭐... 노코멘트 하겠습니다.

 

extends_17

댓글 5

Profile

잼아저씨

1년 전

1. 타겟과 퍼포먼스에 RTX1080 -> RTX 2080입니다 ㅋㅋ

댓글

neoncat

1년 전

이번 rtx라인은 프로슈머에 초점을 맞춰 개발한 느낌이 큽니다 . 가격은 물론이고 컨셉과 성능까지 일반 사용자에게 매력적인 부분이 보이질 않는것 같아요. 저같은 서민은 그냥 gtx 중고나 구해야할것 같음돠....

댓글

로카

1년 전

다른 곳들보다 쉽게 설명해주셔서 

이해하기가 쉬웠습니다. 감사합니다

추천:1 댓글

Profile

잼아저씨

1년 전

http://itcm.co.kr/g_board/6921837 다른 동네에 좀 더 시간이 지나고 정리한 내용도 참고해주시면 감사하겠습니다.

댓글

Profile

Elrisha

1년 전

보기 좋게 정리해주셨네요!

그나저나 이상하게 그래픽카드는 새로 사기만 하면 얼마 안 되서 신제품이 나오더군요..

댓글

사진 및 파일 첨부

여기에 파일을 끌어 놓거나 왼쪽의 버튼을 클릭하세요.

파일 크기 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )
 

외신 브리핑 - 2018년 12월 18일

12월 18일. 평화로운(?) 화요일의 외신 브리핑입니다. 퓨디파이 팬들, 월 스트리트 저널 해킹 유튜버 퓨디파이(PewDiePie)의 팬들이 17일(현지 시각) 월 스트리트 저널을 해킹하는 일이 일어났습니다. 월 스트리트 저널 계열 웹사이트 중 하나가 올린 스폰서 포스트가 해...

by 쿠도군 on 11개월 전
121

외신 브리핑 - 2018년 12월 14일

12월 14일, 역시 평화로웠던 외신 브리핑입니다. 2018년 유튜브 리와인드, 역대 가장 많은 “싫어요” 받은 영상으로 등극 유튜브는 2011년부터 매해 유튜브 리와인드라 불리는, 그 해의 유튜브를 정리하는 영상을 올리고 있습니다. 매해 영상이 공개될 때마다 다양한 논란...

by 쿠도군 on 12개월 전
266

외신 브리핑 - 2018년 12월 13일

12월 13일, 뉴스가 적었던 하루의 외신 브리핑입니다. 아이폰 생산처들, 관세 25% 돌파하면 아이폰 생산을 중국 밖으로 빼낸다? 현재 도널드 트럼프 대통령이 촉발시킨 미-중 무역전쟁의 한가운데 낀 애플이 최악의 사태에 대비한 계획을 마련하고 있는 것으로 알려졌습...

by 쿠도군 on 12개월 전
306

외신 브리핑 - 2018년 12월 12일

12월 12일 쿠도군의 외신 브리핑입니다. 오늘은 양보다는 질로 승부하겠습니다. 스파이 칩 기사의 주인공 슈퍼 마이크로, 외부 감사 결과 “그런 거 없음” 지난 10월 미국 IT 업계를 발칵 뒤집은 블룸버그의 “스파이 칩” 기사를 기억하실는지 모르겠습니다. 당시 블룸버그...

by 쿠도군 on 1년 전
418

외신 브리핑 - 2018년 12월 11일

12월 11일 쿠도군의 외신 브리핑입니다. 쿠도캐스트 편집이 바빠서 10일 브리핑은 부득이하게 스킵했지만, 이번 브리핑에 모두 합쳐서 전해드립니다. 애플의 새로운 스마트 배터리 케이스 유출 애플이 아이폰 XS를 위한 새로운 스마트 배터리 케이스를 준비하고 있는 것...

by 쿠도군 on 1년 전
206
CPU

제2라운드 개막, 멀티칩 흐름 가속화하는 인텔과 AMD

다음주 개막하는 Supercomputing 2018 학회를 겨냥해 인텔은 이틀 전인 11월 5일 “Cascade Lake-AP” 차세대 서버 프로세서의 개요를 발표했다. 내용은 자못 충격적이었다. Cascade Lake-AP가 현 Skylake-SP의 두 배에 가까운 48코어를 집적한다는 사실 때문이 아니다. 20...

by Dr.Lee on 1년 전
4,241

재밌었다. 하지만 왜 재밌었을까?: 애플 2018년 10월 이벤트 결산

애플이 이번 가을에 두 개로 이벤트를 나눌 것이란 걸 알았을 때, 나는 솔직히 이번 이벤트가 더 기대가 됐었다. 까고 말하면, 아이폰이야 매년 나오는 것이 거의 확정적이고, 워낙 유출되는 일이 많다 보니 제품의 완성도 자체를 떠나 최소한 이벤트 자체의 재미는 반감...

by 쿠도군 on 1년 전
1,892 3
CPU

인텔, 9세대 Core 및 배수락 해제된 Xeon W-3175X 프로세서 출시

인텔은 한국시간 기준 지난 10월 8일 오후 11시에 주최한 9세대 Core 프로세서 공개 행사를 통해 총 3가지의 프로세서 제품군을 업데이트했다. 이날 업데이트된 제품군은 9세대 데스크탑 Core 프로세서, 9세대 하이엔드 데스크탑 (HEDT) Core X-시리즈 프로세서 및 익스...

by Dr.Lee on 1년 전
3,158 1

macOS 모하비 살펴보기: 도약을 위한 웅크림

사진 : 애플 iOS 12가 정식 공개되고 이제 macOS 모하비가 정식으로 공개되었다. iOS와 마찬가지로 macOS도 본격적으로 애플 플랫폼의 사용자가 크게 늘어나고 빠르게 신기능들을 추가하면서 품질 관리 문제가 불거졌다. 과거 PC vs Mac 광고에서 애플은 주로 윈도우즈 ...

by iMola on 1년 전
2,198

iOS 12 리뷰: OS에는 S가 필요하다.

1년 전 이맘때쯤 나온 iOS 11은 말이 많았던 iOS였다. 말이 많았다는 말로 봤을 때 좋은 얘기가 아니라는 건 예상했을 것이다. iOS 11은 매 릴리즈마다 발생하는 버그로 인해 초기에는 1주일마다 버그를 수정하는 업데이트가 나와야 했을 정도로 불안정했다. 그러다 보니...

by 쿠도군 on 1년 전
2,017
VGA

엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아

엔비디아 RTX미디어 브리핑에 객원 에디터 자격으로 "대근님 대신" 참여하고 왔습니다. 엔비디아는 선빵필... 아니 선즉제인의 마인드로 언제나 선수를 선호해 왔기에 이들의 행보는 늘 앞서있었습니다. 종래에는 전체적인 성능을 향상시키는 범용적인 선택을 해왔지만, ...

by 잼아저씨 on 1년 전
2,419 5 4
VGA

NVIDIA RTX 하드웨어와 V-Ray

아래의 내용은 아래의 블로그를 번역한 것입니다. 모든 저작권은 Chaosgroup과 Vlado에게 있습니다. https://www.chaosgroup.com/blog/what-does-the-new-nvidia-rtx-hardware-mean-for-ray-tracing-gpu-rendering-v-ray NVIDIA RTX 하드웨어가 레이 트레이싱, GPU 렌더...

by 잼아저씨 on 1년 전
1,729
VGA

[트위치 생중계] NVIDIA #BeForTheGame Event

한국시각 기준 8월 21일 오전 1시, 독일 쾰른에서는 엔비디아가 #BeForTheGame 이라는 부제 아래 CEO 젠슨 황의 키노트를 준비하고 있습니다. 모두의 관심이 집중된 차세대 게이밍 그래픽카드 GeForce RTX 시리즈가 이 자리에서 공개될 것으로 예상되는데요. 트위치 방송...

by Dr.Lee on 1년 전
1,052 3
CPU

[카드뉴스] Succeeding you, Intel : AMD Ryzen Threadripper 2990WX / 2950X +ɑ 리뷰

AMD는 지난 7월 말 이탈리아 마라넬로에서 진행된 테크 데이 행사를 통해 2세대 Ryzen Threadripper의 세부 사항을 처음으로 공개했습니다. 이어 지난 8월 6일 '성능을 제외한' 나머지 정보에 관한 엠바고가 해제되어 많은 분들이 2세대 Ryzen Threadripper의 개요 및 외...

by Dr.Lee on 1년 전
3,205 2
CPU

14nm 끝을 화려하게 장식하는 인텔 : 2018년 하반기의 뉴페이스들

인텔은 10nm 제조공정으로의 이전에 어려움을 겪고 있지만, 그런 와중에도 라인업 전개를 차질없이 해내기 위해 14nm와 10nm 사이 단계의 제품들을 쉴새없이 투입하고 있습니다. 올해 하반기에는 크게 아래 네 가지 신규 라인업에 주목해볼만 합니다. Cascade Lake-AP 인...

by Dr.Lee on 1년 전
2,666

KudoCast 048: ARM~ ARM~ 신나는 노래

쿠도군의 맥북 프로가 도착했습니다. 닥터몰라는 여전히 맥에 ARM 프로세서를 넣으라는 노래를 부르고 있으며(앞으로 1년은 더 불러야할 듯), 호로요이는 커플들에게 쏘카가 차를 대출해주려고 한다고 말합니다. 그렇습니다. 여긴 달라진 게 없네요. 가디언즈 오브 갤럭...

by 쿠도군 on 1년 전
557

금손들의 잔치, IPPAWARDS - 아이폰 사진 어워즈

작년 이맘때쯤 아이폰 10주년을 맞아 IPPAWARDS(이하 아이폰 사진 어워즈)를 소개해 드린 적이 있었습니다(링크). 아이폰 사진 어워즈는 이름에서 알 수 있듯이 아이폰으로 찍힌 사진들이 출품되는 사진 공모전입니다. 올해로 11번째 주최되는 이 공모전은 아이폰만큼이...

by iMola on 1년 전
440

KudoCast 047: ActiveX 제물

쿠도군이 짐 정리하러 세인트루이스로 돌아간 관계로 녹음방송으로만 진행된 쿠도캐스트. AT&T와 미 법무부의 2차전, 저가형 서피스 고(그리고 윈도우 얘기가 나올 때마다 나오는 ActiveX 까기), 최신 애플 루머, 그리고 새 맥북 프로 얘기까지. 그리고 닥터몰라는 이번...

by 쿠도군 on 1년 전
422
CPU

CPU 보안 취약점 중간결산, 그 두번째 : 2분기의 뉴페이스들

이 글에서는 2018년 1사분기 결산 직후 올라온 도스파라의 칼럼(링크) 이후, 지난 3개월 그러니까 2018년 2사분기 동안 새롭게 등장한 보안 취약점들을 나열하고 짚어 보도록 하겠습니다. 2018.3.27 윌리엄 앤 메리 칼리지, 카네기멜론대학, 캘리포니아주립대학 리버사이...

by 슈퍼아빠 on 1년 전
2,612 2

KudoCast 046: 둘만 좋았던 관계

지난 번엔 닥터몰라, 이번엔 호로요이가 녹음 버튼을 안 누르는 바람에 또 다시 방송분으로 나가는 쿠도캐스트. 일론 머스크는 이번엔 미니 잠수함을 만들겠다고 하고, 쿠도군은 아직도 왜 갤럭시 S9 플러스와 갤럭시 노트 9가 따로인지 이해를 못하고 있으며, 티맥스는 ...

by 쿠도군 on 1년 전
426
서버에 요청 중입니다. 잠시만 기다려 주십시오...