하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아

[게임미식가] 잼아저씨 | 조회 1326 | 추천 3 | 2018.09.19. 22:56 http://drmola.com/pc_column/302737

수정됨_DSC2061.jpg

 

엔비디아 RTX미디어 브리핑에 객원 에디터 자격으로 "대근님 대신" 참여하고 왔습니다. 엔비디아는 선빵필... 아니 선즉제인의 마인드로 언제나 선수를 선호해 왔기에 이들의 행보는 늘 앞서있었습니다. 종래에는 전체적인 성능을 향상시키는 범용적인 선택을 해왔지만, 왜 이번에는 갈림길에서 이 방향을 선택했는지를 납득시키기 위해 미디어 브리핑을 한 거 같았습니다. 

 

자세한 내용과 설명은 차후 언젠가는 나올 대근님의 리뷰를 참조하시고, 이번에는 간단히 이들의 길이 무엇인지를 나름대로 정리해봤습니다.

1. 타겟과 퍼포먼스

 

수정됨_DSC2262.jpg
 

수정됨_DSC2264.jpg

 

근래에는 촬영장비의 발전과 디스플레이의 보급으로 고해상도 (4K 3840*2160+)와 광색역(10bit HDR)이 영상 컨텐츠의 주요한 화두입니다. 게임업계에서도 마찬가지로 이 해상도와 색 대역을 커버하는 것이 주요한 화두중에 하나였으며, 엔비디아는 이를 RTX1080 단일 카드로 구현이 가능하다는 것을 강조했습니다. 차후에 언급하겠습니다만 튜링의 기본적인 퍼포먼스는 파스칼 대비 1.4배 정도 향상을 이루었으며 텐서 코어를 사용하는 DLSS를 쓸 경우 최대 2배 정도의 퍼포먼스 차이까지도 보일 수 있습니다.

 

2. 튜링 아키텍쳐

 

수정됨_DSC2285.jpg

 

수정됨_DSC2291.jpg

 

튜링 아키텍쳐는 엔비디아의 쿠다 도입 이래 가장 큰 변화를 겪은 아키텍쳐입니다. 크게 세가지 변화를 꼽을 수 있는데, 정수/부동소수점 연산 유닛의 분리, 캐시 구조/메모리 개선, RT코어/텐서 코어라는 ASIC의 도입입니다.

 

1) 동시 연산 수행(Concurrent Execution)

 

수정됨_DSC2298.jpg

 

수정됨_DSC2302.jpg

 

대체적으로 게임에서 부동소수점 연산을 100번 하면 36번 정도는 정수 연산을 하게 됩니다. 종래의 아키텍쳐에서는 정수 연산을 하는 경우 부동소수점 연산을 할 수가 없었으나, 튜링 아키텍쳐에서는 이 유닛을 분리해 동시에 부동소수점과 정수 연산을 할 수 있게 되었습니다. 그 덕분에 셰이딩 연산 성능은 1.5배 이상 향상되었습니다.

 

2) 캐시/메모리 개선

 

수정됨_DSC2299.jpg

 

수정됨_DSC2303.jpg

 

수정됨_DSC2307.jpg

 

L1캐시 공유 구조의 개편 히트 속도 향상, L1/L2 캐시 용량 증설로 더 효율적인 캐시 운용이 가능해졌고, 메모리 대역폭은 업계 최고 속도이며 새로운 무손실 색압축 기술로 1.5배 정도의 효율 향상을 이루었습니다.


3) 텐서코어/RT코어

 

수정됨_DSC2314.jpg

 

텐서 코어는 4x4 행렬의 곱연산과 합연산을 수행할 수 있는 유닛으로(일반적인 연산은 불가능합니다.) 연산의 유연성을 잃었지만 낮은 정밀도 연산에서 8-32배의 스루풋을 더 뽑아낼 수 있습니다. 따라서 정밀도가 중요하지 않지만, 수 많은 가능성의 가지를 탐색해야하는 딥러닝의 추론 과정에 최적화 되어 있습니다. 원래는 볼타 아키텍쳐의 테슬라에만 적용되어 있었지만, 튜링 아키텍쳐에서는 소비자용 지포스 카드에까지 넣게 되었습니다. 그 이유라면 차후에 언급하겠지만 당연히 게임에서도 딥러닝을 써먹기 위함일 것입니다.

 

수정됨_DSC2321.jpg


레이 트레이싱은 엔비디아 RTX시리즈의 핵심입니다. 근원적으로 우리가 늘 보아왔던 래스터라이제이션 방식의 렌더링은 우리의 눈이 세계를 인식하는 방식을 담지 못하고 있습니다. 그러나 레이 트레이싱은 화면에 담기는 빛의 경로를 역추적(Path Tracing)하여 광원까지 도달하게 하므로써 우리가 눈으로 보는 방식과 물리적으로 같은 결과를 낼 수 있습니다. 그러나 엄청난 연산을 필요로 하기에 영화 산업같은 실시간이 아닌 렌더에서나 주로 쓰여 왔고, 이를 실시간으로 구현하는 것은 마치 성배와도 같았습니다.

 

수정됨_DSC2338.jpg

 

엔비디아는 레이 트레이싱 안의 레이 캐스팅 과정에서 경계 계층 구조를 만들어 빛의 경로를 추적합니다. 원리는 오브젝트에 직육면체를 점점 작게 선정하여 이 중에 빛의 경로가 있는지를 탐색하는 것입니다.

 

수정됨_DSC2341.jpg

 

수정됨_DSC2345.jpg

 

파스칼에서는 이러한 레이 트레이싱을 셰이더 유닛이 담당했으나 튜링에서는 셰이더는 셰이더 대로 래스터라이제이션을 하면서 레이 트레이싱만 RT코어가 담당하여 동시에 수행하는 것입니다. 

 

수정됨_DSC2347.jpg

 

그런 고로 레이 트레이싱에 한정하면 2080Ti는 1080Ti대비 10배의 스루풋을 낼 수 있습니다.

 

3. RTX 옵스

 

수정됨_DSC2352.jpg

 

수정됨_DSC2361.jpg

 

레이 트레이싱을 사용하는 경우 동시에 기본적인 쿠다 코어, 텐서 코어, RT 코어를 "두뇌 풀가동" 시키는 것이기에 이들의 스루풋을 종합적으로 평가하기 위한 새로운 지표가 필요했습니다. 당연히 이들의 연산 비중이 얼마냐에 따라 그 결과값이 달라질 수 있기 때문에 가중치를 두어 연산능력의 최대치를 평가한 것이 RTX옵스입니다.

 

4. 셰이더 효율 증가

1) 메시 셰이더

수정됨_DSC2383.jpg

 

 

튜링 아키텍쳐에서는 레이 트레이서 뿐만 아니라 전통적인 셰이딩 자체도 변경했습니다. 메시 셰이더 모델은 지오메트리, 버텍스, 테셀레이션 셰이더로 구성되는 종래의 셰이더 구조를 개편해서 메시 셰이더로 통합한 뒤 태스크 셰이더에서 디테일 수준(LoD)을 지정하므로써 드로우콜 부담을 줄이는 것입니다. 이로써 셰이더 구조상 더 높은 유연성과 더불어 더 낮은 연산을 부담하게 되고, CPU의 부담 또한 줄일 수 있습니다. 자세한 효과는 동영상을 참조하세요.

 

2)가변 레이트 셰이딩

수정됨_DSC2391.jpg

 

수정됨_DSC2393.jpg

 

가변 레이트 셰이딩은 디테일 수준이 아니라 상황에 맞는 적응형 셰이딩으로 중요도를 지정하여 중요도가 높은 곳에는 더 많은 연산을, 낮은 곳에는 더 적은 연산을 하는 가변 셰이더 연산을 하는 것입니다. 마찬가지로 총 연산 부담을 줄일 수 있습니다.

 

5. 딥러닝

 

수정됨_DSC2425.jpg

 

수정됨_DSC2429.jpg

 

딥러닝을 그래픽 쪽에 활용하기 위해 엔비디아는 NGX, 신경망 그래픽 프레임워크를 제공합니다. 이것은 엔비디아 자사의 슈퍼컴퓨터를 활용하여 훈련(Training)한 결과를 API를 통해 게임 엔진과 상호적으로 결과를 주고 받아 낮은 비용으로 높은 그래픽적 충실도를 누리는 것입니다. 

 

수정됨_DSC2433.jpg

 

그 세부적인 적용 방식은 화질 보간입니다. 

 

 

수정됨_DSC2435.jpg

 

수정됨_DSC2450.jpg

 

DLSS(딥러닝 수퍼샘플링)는 엔비디아가 대표적으로 내세우는 NGX 기술로, 인공신경망을 활용하는 안티 에일리어싱 방식입니다. 고품질 지터 이미지를 64샘플을 수퍼 컴퓨터에 트레이닝한 후 게임 엔진에 적용한 것으로, 대략적으로 X64 수퍼샘플링(해상도를 높인 뒤 평균낸 것)과 비등한 결과를 얻으나 TAA(프레임 간 안티에일리어싱) 보다 낮은 대가를 치른다고 합니다.

 

수정됨_DSC2456.jpg

 

당연하지만 텐서 코어를 쓰기 때문에 DLSS를 쓰면 종래보다 더 높은 성능 향상치를 보입니다.

 

6. 기타

1) 스샷 놀이

수정됨_DSC2483.jpg

 

당연하지만 레이 트레이싱을 실시간으로 구현하지 않아도 되는 스크린샷에서는 더 많은 빛을 바운스시켜 더 물리적으로 정확한 빛을 구현할 수 있습니다. 지포스 익스피리언스 ANSEL SDK에 포함된 기능입니다.

 

2)오버 클럭

수정됨_DSC2510.jpg

 

수정됨_DSC2531.jpg

 

페이즈 컨트롤과 전원부 피드백 컨트롤을 향상시커 같은 전압 대비 더 높은 클럭을 뽑아낼 수 있으며, 엔비디아 스캐너를 쓰면 게임을 돌려서 안정화 하지 않더라도 데이터 기반으로 피드백을 해주어 오버클럭 최적화를 해준다고 합니다.

 

 

7. 파트너 사 시연

 

수정됨_DSC2627.jpg

 

수정됨_DSC2086.jpg

 

 

 

수정됨_DSC2630.jpg

'

수정됨_DSC2064.jpg

 

수정됨_DSC2066.jpg

 

수정됨_DSC2067.jpg

 

수정됨_DSC2072.jpg

 

수정됨_DSC2080.jpg

 

8. 제 생각

 

사실 2080Ti는 다이사이즈가 굉장히 큽니다. 775mm2라던데 웨이퍼에서 찍어내는 반도체 임계치가 850mm2 수준이라니 소비자용으로는 비정상적으로 크다는 생각도 들 정도입니다. 저 같으면 아마 거기에 셰이더 유닛과 ROP를 추가하는 간단한 성능 향상을 생각하겠지만 엔비디아는 ASIC을 택했습니다. 즉, 양적 성장보다는 질적으로 특화시켜 성장시키는 게 앞으로 나아갈 길이라고 생각하는 것이라 봅니다. 그 특화의 대상은 레이 트레이싱입니다. 더이상 게임 업계에서 참신한 그래픽적 돌파구가 없는데, 전인미답의 세계인 실시간 레이 트레이싱을 완벽하지는 않더라도 일부 도입하기 시작한 것은 놀라운 일은 분명합니다. 그것이 눈속임일지라 하더라도, 앞으로 개발자들의 참여가 미진하다 하더라도 언제든지 방향을 선회할 수 있는 엔비디아의 여유임은 분명합니다. 업계를 선도하는 기업이라면 이러한 비전은 제시할 수 있고, 또 바람직하다 생각합니다. 다만 소비자에게 업계의 포상인 당장의 가성비는 뭐... 노코멘트 하겠습니다.

 

잼아저씨's Signature

저는 게임의 모든 것에 관심이 있습니다.

Steam : Uncle JAM  Origin : unclejamj  Uplay : unclejamj  PSN : unclejamj

FB : 이재진

1041047.png

* 적용중인 트로피 :

  1. 수정됨_DSC2064.jpg (File Size:302.8KB/Download:0)
  2. 수정됨_DSC2066.jpg (File Size:376.6KB/Download:0)
  3. 수정됨_DSC2067.jpg (File Size:345.7KB/Download:0)
  4. 수정됨_DSC2072.jpg (File Size:282.8KB/Download:0)
  5. 수정됨_DSC2080.jpg (File Size:365.2KB/Download:0)
  6. 수정됨_DSC2086.jpg (File Size:548.8KB/Download:0)
  7. 수정됨_DSC2089.jpg (File Size:259.2KB/Download:0)
  8. 수정됨_DSC2061.jpg (File Size:335.5KB/Download:0)
  9. 수정됨_DSC2262.jpg (File Size:296.0KB/Download:0)
  10. 수정됨_DSC2264.jpg (File Size:175.9KB/Download:0)
  11. 수정됨_DSC2285.jpg (File Size:229.2KB/Download:0)
  12. 수정됨_DSC2291.jpg (File Size:188.5KB/Download:0)
  13. 수정됨_DSC2298.jpg (File Size:214.2KB/Download:0)
  14. 수정됨_DSC2299.jpg (File Size:150.3KB/Download:0)
  15. 수정됨_DSC2302.jpg (File Size:170.7KB/Download:0)
  16. 수정됨_DSC2303.jpg (File Size:227.9KB/Download:0)
  17. 수정됨_DSC2307.jpg (File Size:183.0KB/Download:0)
  18. 수정됨_DSC2314.jpg (File Size:207.5KB/Download:0)
  19. 수정됨_DSC2321.jpg (File Size:154.0KB/Download:0)
  20. 수정됨_DSC2338.jpg (File Size:147.7KB/Download:0)
  21. 수정됨_DSC2341.jpg (File Size:190.4KB/Download:0)
  22. 수정됨_DSC2345.jpg (File Size:197.3KB/Download:0)
  23. 수정됨_DSC2347.jpg (File Size:195.5KB/Download:0)
  24. 수정됨_DSC2352.jpg (File Size:208.2KB/Download:0)
  25. 수정됨_DSC2361.jpg (File Size:208.9KB/Download:0)
  26. 수정됨_DSC2372.jpg (File Size:210.0KB/Download:0)
  27. 수정됨_DSC2383.jpg (File Size:166.8KB/Download:0)
  28. 수정됨_DSC2391.jpg (File Size:224.5KB/Download:0)
  29. 수정됨_DSC2393.jpg (File Size:258.9KB/Download:0)
  30. 수정됨_DSC2410.jpg (File Size:333.3KB/Download:0)
  31. 수정됨_DSC2425.jpg (File Size:261.5KB/Download:0)
  32. 수정됨_DSC2429.jpg (File Size:115.5KB/Download:0)
  33. 수정됨_DSC2433.jpg (File Size:273.6KB/Download:0)
  34. 수정됨_DSC2435.jpg (File Size:168.4KB/Download:0)
  35. 수정됨_DSC2450.jpg (File Size:344.9KB/Download:0)
  36. 수정됨_DSC2456.jpg (File Size:146.9KB/Download:0)
  37. 수정됨_DSC2483.jpg (File Size:220.1KB/Download:0)
  38. 수정됨_DSC2510.jpg (File Size:180.5KB/Download:0)
  39. 수정됨_DSC2531.jpg (File Size:171.7KB/Download:0)
  40. 수정됨_DSC2626.jpg (File Size:242.4KB/Download:0)
  41. 수정됨_DSC2627.jpg (File Size:289.2KB/Download:0)
  42. 수정됨_DSC2630.jpg (File Size:369.5KB/Download:0)
facebook twitter google plus pinterest kakao story band
Profile image neoncat 2018.09.20 23:34

이번 rtx라인은 프로슈머에 초점을 맞춰 개발한 느낌이 큽니다 . 가격은 물론이고 컨셉과 성능까지 일반 사용자에게 매력적인 부분이 보이질 않는것 같아요. 저같은 서민은 그냥 gtx 중고나 구해야할것 같음돠....

Profile image 로카 2018.10.04 20:32

다른 곳들보다 쉽게 설명해주셔서 

이해하기가 쉬웠습니다. 감사합니다

Profile image [게임미식가] 잼아저씨 2018.10.04 21:12
http://itcm.co.kr/g_board/6921837 다른 동네에 좀 더 시간이 지나고 정리한 내용도 참고해주시면 감사하겠습니다.
Profile image Elrisha 2018.10.06 20:30

보기 좋게 정리해주셨네요!

그나저나 이상하게 그래픽카드는 새로 사기만 하면 얼마 안 되서 신제품이 나오더군요..

  • 인텔, 9세대 Core 및 배수락 해제된 Xeon W-3175X 프로세서 출시 [CPU] 인텔, 9세대 Core 및 배수락 해제된 Xeon W-3175X 프로세서 출시 file

    인텔은 한국시간 기준 지난 10월 8일 오후 11시에 주최한 9세대 Core 프로세서 공개 행사를 통해 총 3가지의 프로세서 제품군을 업데이트했다. 이날 업데이트된 제품군은 9세대 데스크탑 Core 프로세서, 9세대 하이엔드 데스크탑 (HEDT) Core X-시리즈 프로세서 및 익스트림 워크스테이션용 Xeon W-3175X 프로세서들로, 신제...

    • Dr.Lee |
    • 18.10.10 |
    • 조회 수 958 |
  • 아이폰 XS의 두뇌 A12 Bionic: 판을 엎어라 [모바일] 아이폰 XS의 두뇌 A12 Bionic: 판을 엎어라 [3] updatefile

    사진: 애플 현지시간 9월 12일, 애플은 아이폰 X의 직계 후속작인 아이폰 Xs, 아이폰 Xs Max와 아이폰 X의 방계 후속작인 아이폰 XR을 공개했다(링크). 이들 사이에는 공통점도 많고, 차이점도 많지만 이들을 한해 전 플래그십인 아이폰 X와 가장 확실히 차별화시키는 것은 A12 Bionic 칩이다. 새 아이폰과 지난 세대 아이폰...

    • iMola |
    • 18.10.09 |
    • 조회 수 622 |
  • 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아 [VGA] 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아 [5] file

    엔비디아 RTX미디어 브리핑에 객원 에디터 자격으로 "대근님 대신" 참여하고 왔습니다. 엔비디아는 선빵필... 아니 선즉제인의 마인드로 언제나 선수를 선호해 왔기에 이들의 행보는 늘 앞서있었습니다. 종래에는 전체적인 성능을 향상시키는 범용적인 선택을 해왔지만, 왜 이번에는 갈림길에서 이 방향을 선택했는지를 납득...

  • 삼형제 아이폰부터 애플워치 시리즈 4까지: 애플 9월 이벤트 결산 [모바일] 삼형제 아이폰부터 애플워치 시리즈 4까지: 애플 9월 이벤트 결산 [2] file

    애플이 매년 정기적으로 여는 이벤트가 있다. 첫 번째는 WWDC로 매해 6월 열리는 애플의 소프트웨어 중점 행사이다. 기본적으로 애플의 최신 OS들과, 개발자들을 위한 여러 API들이 공개된다. 물론 아이패드나 맥 등의 하드웨어가 깜짝 공개되는 일도 드물지 않다. 그리고 두 번째는 이름에서도 알 수 있듯 매해 9월에 열리...

    • iMola |
    • 18.09.13 |
    • 조회 수 1743 |
  • 맥북프로(2018) 자세히 알아보기: 미리 맛보기 [모바일] 맥북프로(2018) 자세히 알아보기: 미리 맛보기 file

    들어가기 전에... 햇수로 2년 전인 2016년 12월, 당시 새로이 공개되었던 터치바 맥북 프로 리뷰를 3부작으로 기획했었고 그 첫 번째 편을 게시했던 바 있습니다. 하지만 당시 개인적인 사정으로 맥북프로 리뷰 3부작 중 2부와 3부를 완성하지 못했고, 곧 찾아옵니다라는 말이 무색하게 지금까지도 2부와 3부를 완성시키지 ...

    • iMola |
    • 18.09.11 |
    • 조회 수 1133 |
  • NVIDIA RTX 하드웨어와 V-Ray [VGA] NVIDIA RTX 하드웨어와 V-Ray file

    아래의 내용은 아래의 블로그를 번역한 것입니다. 모든 저작권은 Chaosgroup과 Vlado에게 있습니다. https://www.chaosgroup.com/blog/what-does-the-new-nvidia-rtx-hardware-mean-for-ray-tracing-gpu-rendering-v-ray NVIDIA RTX 하드웨어가 레이 트레이싱, GPU 렌더링과 V-Ray에 어떤 역할을 하는가? 블라디미르 코이라...

  • [트위치 생중계] NVIDIA #BeForTheGame Event [VGA] [트위치 생중계] NVIDIA #BeForTheGame Event [3] file

    한국시각 기준 8월 21일 오전 1시, 독일 쾰른에서는 엔비디아가 #BeForTheGame 이라는 부제 아래 CEO 젠슨 황의 키노트를 준비하고 있습니다. 모두의 관심이 집중된 차세대 게이밍 그래픽카드 GeForce RTX 시리즈가 이 자리에서 공개될 것으로 예상되는데요. 트위치 방송을 지켜보며 닥터몰라에서도 라이브블로깅 세션을 열...

    • Dr.Lee |
    • 18.08.21 |
    • 조회 수 716 |
  • A Very Turing Estimation : 미리 보는 GeForce RTX 2080 Ti / 2080 성능 [VGA] A Very Turing Estimation : 미리 보는 GeForce RTX 2080 Ti / 2080 성능 [5] file

    NVIDIA의 차세대 게이밍 및 그래픽 워크스테이션용 GPU "Turing" 이 공식화되고, 이에 기반한 GeForce 게이밍 그래픽카드의 등장이 점쳐지며 그래픽카드 시장은 최근 2년 사이 가장 뜨겁게 달아오르고 있습니다. 아시다시피 2016년 NVIDIA가 "Pascal" GPU를 출시한 이후, 해당 성능대를 뛰어넘는 게이밍 그래픽카드의 출시는...

    • Dr.Lee |
    • 18.08.18 |
    • 조회 수 5621 |
  • [카드뉴스] Succeeding you, Intel : AMD Ryzen Threadripper 2990WX / 2950X +ɑ 리뷰 [CPU] [카드뉴스] Succeeding you, Intel : AMD Ryzen Threadripper 2990WX / 2950X +ɑ 리뷰 [2] file

    AMD는 지난 7월 말 이탈리아 마라넬로에서 진행된 테크 데이 행사를 통해 2세대 Ryzen Threadripper의 세부 사항을 처음으로 공개했습니다. 이어 지난 8월 6일 '성능을 제외한' 나머지 정보에 관한 엠바고가 해제되어 많은 분들이 2세대 Ryzen Threadripper의 개요 및 외관을 보셨을 줄로 압니다. 닥터몰라에서도 이때 발맞...

    • Dr.Lee |
    • 18.08.13 |
    • 조회 수 2452 |
  • 애플 홈팟 음향 리뷰: Pod을 다시 위대하게 [음향기기] 애플 홈팟 음향 리뷰: Pod을 다시 위대하게 [4] file

    - 애플 홈팟은 구글의 구글홈, 아마존에 알렉사, 네이버의 클로바에 대응하는 애플의 시리가 탑재된 AI 스피커죠. - 다른 플랫폼과는 달리 시리는 나온지 7년이 다 되기도 하였고, 이젠 아이폰과 아이패드를 넘어 맥과 애플워치에도 시리가 있기 때문에 홈팟은 시리보다는 스피커 본연의 기능에 집중한 느낌. - 블루투스를 ...

    • STUDIO51 |
    • 18.08.13 |
    • 조회 수 1447 |