하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아

[게임미식가] 잼아저씨 | 조회 1900 | 추천 3 | 2018.09.19. 22:56 http://drmola.com/pc_column/302737

수정됨_DSC2061.jpg

 

엔비디아 RTX미디어 브리핑에 객원 에디터 자격으로 "대근님 대신" 참여하고 왔습니다. 엔비디아는 선빵필... 아니 선즉제인의 마인드로 언제나 선수를 선호해 왔기에 이들의 행보는 늘 앞서있었습니다. 종래에는 전체적인 성능을 향상시키는 범용적인 선택을 해왔지만, 왜 이번에는 갈림길에서 이 방향을 선택했는지를 납득시키기 위해 미디어 브리핑을 한 거 같았습니다. 

 

자세한 내용과 설명은 차후 언젠가는 나올 대근님의 리뷰를 참조하시고, 이번에는 간단히 이들의 길이 무엇인지를 나름대로 정리해봤습니다.

1. 타겟과 퍼포먼스

 

수정됨_DSC2262.jpg
 

수정됨_DSC2264.jpg

 

근래에는 촬영장비의 발전과 디스플레이의 보급으로 고해상도 (4K 3840*2160+)와 광색역(10bit HDR)이 영상 컨텐츠의 주요한 화두입니다. 게임업계에서도 마찬가지로 이 해상도와 색 대역을 커버하는 것이 주요한 화두중에 하나였으며, 엔비디아는 이를 RTX1080 단일 카드로 구현이 가능하다는 것을 강조했습니다. 차후에 언급하겠습니다만 튜링의 기본적인 퍼포먼스는 파스칼 대비 1.4배 정도 향상을 이루었으며 텐서 코어를 사용하는 DLSS를 쓸 경우 최대 2배 정도의 퍼포먼스 차이까지도 보일 수 있습니다.

 

2. 튜링 아키텍쳐

 

수정됨_DSC2285.jpg

 

수정됨_DSC2291.jpg

 

튜링 아키텍쳐는 엔비디아의 쿠다 도입 이래 가장 큰 변화를 겪은 아키텍쳐입니다. 크게 세가지 변화를 꼽을 수 있는데, 정수/부동소수점 연산 유닛의 분리, 캐시 구조/메모리 개선, RT코어/텐서 코어라는 ASIC의 도입입니다.

 

1) 동시 연산 수행(Concurrent Execution)

 

수정됨_DSC2298.jpg

 

수정됨_DSC2302.jpg

 

대체적으로 게임에서 부동소수점 연산을 100번 하면 36번 정도는 정수 연산을 하게 됩니다. 종래의 아키텍쳐에서는 정수 연산을 하는 경우 부동소수점 연산을 할 수가 없었으나, 튜링 아키텍쳐에서는 이 유닛을 분리해 동시에 부동소수점과 정수 연산을 할 수 있게 되었습니다. 그 덕분에 셰이딩 연산 성능은 1.5배 이상 향상되었습니다.

 

2) 캐시/메모리 개선

 

수정됨_DSC2299.jpg

 

수정됨_DSC2303.jpg

 

수정됨_DSC2307.jpg

 

L1캐시 공유 구조의 개편 히트 속도 향상, L1/L2 캐시 용량 증설로 더 효율적인 캐시 운용이 가능해졌고, 메모리 대역폭은 업계 최고 속도이며 새로운 무손실 색압축 기술로 1.5배 정도의 효율 향상을 이루었습니다.


3) 텐서코어/RT코어

 

수정됨_DSC2314.jpg

 

텐서 코어는 4x4 행렬의 곱연산과 합연산을 수행할 수 있는 유닛으로(일반적인 연산은 불가능합니다.) 연산의 유연성을 잃었지만 낮은 정밀도 연산에서 8-32배의 스루풋을 더 뽑아낼 수 있습니다. 따라서 정밀도가 중요하지 않지만, 수 많은 가능성의 가지를 탐색해야하는 딥러닝의 추론 과정에 최적화 되어 있습니다. 원래는 볼타 아키텍쳐의 테슬라에만 적용되어 있었지만, 튜링 아키텍쳐에서는 소비자용 지포스 카드에까지 넣게 되었습니다. 그 이유라면 차후에 언급하겠지만 당연히 게임에서도 딥러닝을 써먹기 위함일 것입니다.

 

수정됨_DSC2321.jpg


레이 트레이싱은 엔비디아 RTX시리즈의 핵심입니다. 근원적으로 우리가 늘 보아왔던 래스터라이제이션 방식의 렌더링은 우리의 눈이 세계를 인식하는 방식을 담지 못하고 있습니다. 그러나 레이 트레이싱은 화면에 담기는 빛의 경로를 역추적(Path Tracing)하여 광원까지 도달하게 하므로써 우리가 눈으로 보는 방식과 물리적으로 같은 결과를 낼 수 있습니다. 그러나 엄청난 연산을 필요로 하기에 영화 산업같은 실시간이 아닌 렌더에서나 주로 쓰여 왔고, 이를 실시간으로 구현하는 것은 마치 성배와도 같았습니다.

 

수정됨_DSC2338.jpg

 

엔비디아는 레이 트레이싱 안의 레이 캐스팅 과정에서 경계 계층 구조를 만들어 빛의 경로를 추적합니다. 원리는 오브젝트에 직육면체를 점점 작게 선정하여 이 중에 빛의 경로가 있는지를 탐색하는 것입니다.

 

수정됨_DSC2341.jpg

 

수정됨_DSC2345.jpg

 

파스칼에서는 이러한 레이 트레이싱을 셰이더 유닛이 담당했으나 튜링에서는 셰이더는 셰이더 대로 래스터라이제이션을 하면서 레이 트레이싱만 RT코어가 담당하여 동시에 수행하는 것입니다. 

 

수정됨_DSC2347.jpg

 

그런 고로 레이 트레이싱에 한정하면 2080Ti는 1080Ti대비 10배의 스루풋을 낼 수 있습니다.

 

3. RTX 옵스

 

수정됨_DSC2352.jpg

 

수정됨_DSC2361.jpg

 

레이 트레이싱을 사용하는 경우 동시에 기본적인 쿠다 코어, 텐서 코어, RT 코어를 "두뇌 풀가동" 시키는 것이기에 이들의 스루풋을 종합적으로 평가하기 위한 새로운 지표가 필요했습니다. 당연히 이들의 연산 비중이 얼마냐에 따라 그 결과값이 달라질 수 있기 때문에 가중치를 두어 연산능력의 최대치를 평가한 것이 RTX옵스입니다.

 

4. 셰이더 효율 증가

1) 메시 셰이더

수정됨_DSC2383.jpg

 

 

튜링 아키텍쳐에서는 레이 트레이서 뿐만 아니라 전통적인 셰이딩 자체도 변경했습니다. 메시 셰이더 모델은 지오메트리, 버텍스, 테셀레이션 셰이더로 구성되는 종래의 셰이더 구조를 개편해서 메시 셰이더로 통합한 뒤 태스크 셰이더에서 디테일 수준(LoD)을 지정하므로써 드로우콜 부담을 줄이는 것입니다. 이로써 셰이더 구조상 더 높은 유연성과 더불어 더 낮은 연산을 부담하게 되고, CPU의 부담 또한 줄일 수 있습니다. 자세한 효과는 동영상을 참조하세요.

 

2)가변 레이트 셰이딩

수정됨_DSC2391.jpg

 

수정됨_DSC2393.jpg

 

가변 레이트 셰이딩은 디테일 수준이 아니라 상황에 맞는 적응형 셰이딩으로 중요도를 지정하여 중요도가 높은 곳에는 더 많은 연산을, 낮은 곳에는 더 적은 연산을 하는 가변 셰이더 연산을 하는 것입니다. 마찬가지로 총 연산 부담을 줄일 수 있습니다.

 

5. 딥러닝

 

수정됨_DSC2425.jpg

 

수정됨_DSC2429.jpg

 

딥러닝을 그래픽 쪽에 활용하기 위해 엔비디아는 NGX, 신경망 그래픽 프레임워크를 제공합니다. 이것은 엔비디아 자사의 슈퍼컴퓨터를 활용하여 훈련(Training)한 결과를 API를 통해 게임 엔진과 상호적으로 결과를 주고 받아 낮은 비용으로 높은 그래픽적 충실도를 누리는 것입니다. 

 

수정됨_DSC2433.jpg

 

그 세부적인 적용 방식은 화질 보간입니다. 

 

 

수정됨_DSC2435.jpg

 

수정됨_DSC2450.jpg

 

DLSS(딥러닝 수퍼샘플링)는 엔비디아가 대표적으로 내세우는 NGX 기술로, 인공신경망을 활용하는 안티 에일리어싱 방식입니다. 고품질 지터 이미지를 64샘플을 수퍼 컴퓨터에 트레이닝한 후 게임 엔진에 적용한 것으로, 대략적으로 X64 수퍼샘플링(해상도를 높인 뒤 평균낸 것)과 비등한 결과를 얻으나 TAA(프레임 간 안티에일리어싱) 보다 낮은 대가를 치른다고 합니다.

 

수정됨_DSC2456.jpg

 

당연하지만 텐서 코어를 쓰기 때문에 DLSS를 쓰면 종래보다 더 높은 성능 향상치를 보입니다.

 

6. 기타

1) 스샷 놀이

수정됨_DSC2483.jpg

 

당연하지만 레이 트레이싱을 실시간으로 구현하지 않아도 되는 스크린샷에서는 더 많은 빛을 바운스시켜 더 물리적으로 정확한 빛을 구현할 수 있습니다. 지포스 익스피리언스 ANSEL SDK에 포함된 기능입니다.

 

2)오버 클럭

수정됨_DSC2510.jpg

 

수정됨_DSC2531.jpg

 

페이즈 컨트롤과 전원부 피드백 컨트롤을 향상시커 같은 전압 대비 더 높은 클럭을 뽑아낼 수 있으며, 엔비디아 스캐너를 쓰면 게임을 돌려서 안정화 하지 않더라도 데이터 기반으로 피드백을 해주어 오버클럭 최적화를 해준다고 합니다.

 

 

7. 파트너 사 시연

 

수정됨_DSC2627.jpg

 

수정됨_DSC2086.jpg

 

 

 

수정됨_DSC2630.jpg

'

수정됨_DSC2064.jpg

 

수정됨_DSC2066.jpg

 

수정됨_DSC2067.jpg

 

수정됨_DSC2072.jpg

 

수정됨_DSC2080.jpg

 

8. 제 생각

 

사실 2080Ti는 다이사이즈가 굉장히 큽니다. 775mm2라던데 웨이퍼에서 찍어내는 반도체 임계치가 850mm2 수준이라니 소비자용으로는 비정상적으로 크다는 생각도 들 정도입니다. 저 같으면 아마 거기에 셰이더 유닛과 ROP를 추가하는 간단한 성능 향상을 생각하겠지만 엔비디아는 ASIC을 택했습니다. 즉, 양적 성장보다는 질적으로 특화시켜 성장시키는 게 앞으로 나아갈 길이라고 생각하는 것이라 봅니다. 그 특화의 대상은 레이 트레이싱입니다. 더이상 게임 업계에서 참신한 그래픽적 돌파구가 없는데, 전인미답의 세계인 실시간 레이 트레이싱을 완벽하지는 않더라도 일부 도입하기 시작한 것은 놀라운 일은 분명합니다. 그것이 눈속임일지라 하더라도, 앞으로 개발자들의 참여가 미진하다 하더라도 언제든지 방향을 선회할 수 있는 엔비디아의 여유임은 분명합니다. 업계를 선도하는 기업이라면 이러한 비전은 제시할 수 있고, 또 바람직하다 생각합니다. 다만 소비자에게 업계의 포상인 당장의 가성비는 뭐... 노코멘트 하겠습니다.

 

잼아저씨's Signature

저는 게임의 모든 것에 관심이 있습니다.

Steam : Uncle JAM  Origin : unclejamj  Uplay : unclejamj  PSN : unclejamj

FB : 이재진

1041047.png

* 적용중인 트로피 :

  1. 수정됨_DSC2064.jpg (File Size:302.8KB/Download:0)
  2. 수정됨_DSC2066.jpg (File Size:376.6KB/Download:0)
  3. 수정됨_DSC2067.jpg (File Size:345.7KB/Download:0)
  4. 수정됨_DSC2072.jpg (File Size:282.8KB/Download:0)
  5. 수정됨_DSC2080.jpg (File Size:365.2KB/Download:0)
  6. 수정됨_DSC2086.jpg (File Size:548.8KB/Download:0)
  7. 수정됨_DSC2089.jpg (File Size:259.2KB/Download:0)
  8. 수정됨_DSC2061.jpg (File Size:335.5KB/Download:0)
  9. 수정됨_DSC2262.jpg (File Size:296.0KB/Download:0)
  10. 수정됨_DSC2264.jpg (File Size:175.9KB/Download:0)
  11. 수정됨_DSC2285.jpg (File Size:229.2KB/Download:0)
  12. 수정됨_DSC2291.jpg (File Size:188.5KB/Download:0)
  13. 수정됨_DSC2298.jpg (File Size:214.2KB/Download:0)
  14. 수정됨_DSC2299.jpg (File Size:150.3KB/Download:0)
  15. 수정됨_DSC2302.jpg (File Size:170.7KB/Download:0)
  16. 수정됨_DSC2303.jpg (File Size:227.9KB/Download:0)
  17. 수정됨_DSC2307.jpg (File Size:183.0KB/Download:0)
  18. 수정됨_DSC2314.jpg (File Size:207.5KB/Download:0)
  19. 수정됨_DSC2321.jpg (File Size:154.0KB/Download:0)
  20. 수정됨_DSC2338.jpg (File Size:147.7KB/Download:0)
  21. 수정됨_DSC2341.jpg (File Size:190.4KB/Download:0)
  22. 수정됨_DSC2345.jpg (File Size:197.3KB/Download:0)
  23. 수정됨_DSC2347.jpg (File Size:195.5KB/Download:0)
  24. 수정됨_DSC2352.jpg (File Size:208.2KB/Download:0)
  25. 수정됨_DSC2361.jpg (File Size:208.9KB/Download:0)
  26. 수정됨_DSC2372.jpg (File Size:210.0KB/Download:0)
  27. 수정됨_DSC2383.jpg (File Size:166.8KB/Download:0)
  28. 수정됨_DSC2391.jpg (File Size:224.5KB/Download:0)
  29. 수정됨_DSC2393.jpg (File Size:258.9KB/Download:0)
  30. 수정됨_DSC2410.jpg (File Size:333.3KB/Download:0)
  31. 수정됨_DSC2425.jpg (File Size:261.5KB/Download:0)
  32. 수정됨_DSC2429.jpg (File Size:115.5KB/Download:0)
  33. 수정됨_DSC2433.jpg (File Size:273.6KB/Download:0)
  34. 수정됨_DSC2435.jpg (File Size:168.4KB/Download:0)
  35. 수정됨_DSC2450.jpg (File Size:344.9KB/Download:0)
  36. 수정됨_DSC2456.jpg (File Size:146.9KB/Download:0)
  37. 수정됨_DSC2483.jpg (File Size:220.1KB/Download:0)
  38. 수정됨_DSC2510.jpg (File Size:180.5KB/Download:0)
  39. 수정됨_DSC2531.jpg (File Size:171.7KB/Download:0)
  40. 수정됨_DSC2626.jpg (File Size:242.4KB/Download:0)
  41. 수정됨_DSC2627.jpg (File Size:289.2KB/Download:0)
  42. 수정됨_DSC2630.jpg (File Size:369.5KB/Download:0)
facebook twitter google plus pinterest kakao story band
Profile image neoncat 2018.09.20 23:34

이번 rtx라인은 프로슈머에 초점을 맞춰 개발한 느낌이 큽니다 . 가격은 물론이고 컨셉과 성능까지 일반 사용자에게 매력적인 부분이 보이질 않는것 같아요. 저같은 서민은 그냥 gtx 중고나 구해야할것 같음돠....

Profile image 로카 2018.10.04 20:32

다른 곳들보다 쉽게 설명해주셔서 

이해하기가 쉬웠습니다. 감사합니다

Profile image [게임미식가] 잼아저씨 2018.10.04 21:12
http://itcm.co.kr/g_board/6921837 다른 동네에 좀 더 시간이 지나고 정리한 내용도 참고해주시면 감사하겠습니다.
Profile image Elrisha 2018.10.06 20:30

보기 좋게 정리해주셨네요!

그나저나 이상하게 그래픽카드는 새로 사기만 하면 얼마 안 되서 신제품이 나오더군요..

  • LG V40 씽큐 음향리뷰: 독고다이 [음향기기] LG V40 씽큐 음향리뷰: 독고다이 file

    측정 개요 1. 모든 데이터 표기 방법, 측정 파형, 측정 환경은 AES-17 국제 표준을 기반으로 하였으며, 이해를 돕기 위해 필요한 몇몇 측정 항목에 한해서 이신렬 박사님의 자문 하에추가, 수정하였습니다. 2. 측정 장비는 국제 표준 측정 장비인 Audio Precision사의 APx 555와 APx1701을 사용하였습니다. APx555와 APx 170...

    • STUDIO51 |
    • 18.12.03 |
    • 조회 수 203 |
  • 애플 아이폰 XS & XS 맥스 음향 리뷰: 일취월장 [음향기기] 애플 아이폰 XS & XS 맥스 음향 리뷰: 일취월장 [2] file

    측정 개요 1. 측정 장비는 국제 표준 측정 장비인 Audio Precision사의 APx 555와 APx 1701을 사용하였습니다. APx555는 Audio Precision 한국 지사인 B&P 인터내셔널사와 이신렬 박사님의 지원이 있었습니다. 2. 측정은 APx Waveform Generator Utility 4.6의 24Bit 192kHz 음원을 사용하였습니다. 모든 측정은 기본 음악 ...

    • STUDIO51 |
    • 18.11.07 |
    • 조회 수 798 |
  • 제2라운드 개막, 멀티칩 흐름 가속화하는 인텔과 AMD [CPU] 제2라운드 개막, 멀티칩 흐름 가속화하는 인텔과 AMD file

    다음주 개막하는 Supercomputing 2018 학회를 겨냥해 인텔은 이틀 전인 11월 5일 “Cascade Lake-AP” 차세대 서버 프로세서의 개요를 발표했다. 내용은 자못 충격적이었다. Cascade Lake-AP가 현 Skylake-SP의 두 배에 가까운 48코어를 집적한다는 사실 때문이 아니다. 2006년의 Yorkfield를 마지막으로 한동안 인텔 로드맵에...

    • Dr.Lee |
    • 18.11.07 |
    • 조회 수 2491 |
  • 아이폰 XR 리뷰: iPhone X Refined [모바일] 아이폰 XR 리뷰: iPhone X Refined [13] file

    애플은 지난해 아이폰 8, 아이폰 8 플러스, 아이폰 X을 각각 출시하며 세 종류의 최신 아이폰을 소비자들에게 선보였다. 아이폰 X이라는 상대적으로 큰 변화를 가져온 폰과 함께 전통적이고 상대적으로 저렴한 아이폰 8, 아이폰 8 플러스를 함께 제공하여 급격한 변화와 가격 상승에 거부감을 가진 소비자를 위한 대안을 제...

    • iMola |
    • 18.11.02 |
    • 조회 수 2162 |
  • 재밌었다. 하지만 왜 재밌었을까?: 애플 2018년 10월 이벤트 결산 [etc] 재밌었다. 하지만 왜 재밌었을까?: 애플 2018년 10월 이벤트 결산 [3] file

    애플이 이번 가을에 두 개로 이벤트를 나눌 것이란 걸 알았을 때, 나는 솔직히 이번 이벤트가 더 기대가 됐었다. 까고 말하면, 아이폰이야 매년 나오는 것이 거의 확정적이고, 워낙 유출되는 일이 많다 보니 제품의 완성도 자체를 떠나 최소한 이벤트 자체의 재미는 반감되는 게 없지 않아 있었다. 특히 올해의 아이폰 XS와 ...

  • 인텔, 9세대 Core 및 배수락 해제된 Xeon W-3175X 프로세서 출시 [CPU] 인텔, 9세대 Core 및 배수락 해제된 Xeon W-3175X 프로세서 출시 [1] file

    인텔은 한국시간 기준 지난 10월 8일 오후 11시에 주최한 9세대 Core 프로세서 공개 행사를 통해 총 3가지의 프로세서 제품군을 업데이트했다. 이날 업데이트된 제품군은 9세대 데스크탑 Core 프로세서, 9세대 하이엔드 데스크탑 (HEDT) Core X-시리즈 프로세서 및 익스트림 워크스테이션용 Xeon W-3175X 프로세서들로, 신제...

    • Dr.Lee |
    • 18.10.10 |
    • 조회 수 2100 |
  • 아이폰 XS의 두뇌 A12 Bionic: 판을 엎어라 [모바일] 아이폰 XS의 두뇌 A12 Bionic: 판을 엎어라 [4] file

    사진: 애플 현지시간 9월 12일, 애플은 아이폰 X의 직계 후속작인 아이폰 Xs, 아이폰 Xs Max와 아이폰 X의 방계 후속작인 아이폰 XR을 공개했다(링크). 이들 사이에는 공통점도 많고, 차이점도 많지만 이들을 한해 전 플래그십인 아이폰 X와 가장 확실히 차별화시키는 것은 A12 Bionic 칩이다. 새 아이폰과 지난 세대 아이폰...

    • iMola |
    • 18.10.09 |
    • 조회 수 3205 |
  • 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아 [VGA] 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아 [5] file

    엔비디아 RTX미디어 브리핑에 객원 에디터 자격으로 "대근님 대신" 참여하고 왔습니다. 엔비디아는 선빵필... 아니 선즉제인의 마인드로 언제나 선수를 선호해 왔기에 이들의 행보는 늘 앞서있었습니다. 종래에는 전체적인 성능을 향상시키는 범용적인 선택을 해왔지만, 왜 이번에는 갈림길에서 이 방향을 선택했는지를 납득...

  • 삼형제 아이폰부터 애플워치 시리즈 4까지: 애플 9월 이벤트 결산 [모바일] 삼형제 아이폰부터 애플워치 시리즈 4까지: 애플 9월 이벤트 결산 [2] file

    애플이 매년 정기적으로 여는 이벤트가 있다. 첫 번째는 WWDC로 매해 6월 열리는 애플의 소프트웨어 중점 행사이다. 기본적으로 애플의 최신 OS들과, 개발자들을 위한 여러 API들이 공개된다. 물론 아이패드나 맥 등의 하드웨어가 깜짝 공개되는 일도 드물지 않다. 그리고 두 번째는 이름에서도 알 수 있듯 매해 9월에 열리...

    • iMola |
    • 18.09.13 |
    • 조회 수 2272 |
  • 맥북프로(2018) 자세히 알아보기: 미리 맛보기 [모바일] 맥북프로(2018) 자세히 알아보기: 미리 맛보기 file

    들어가기 전에... 햇수로 2년 전인 2016년 12월, 당시 새로이 공개되었던 터치바 맥북 프로 리뷰를 3부작으로 기획했었고 그 첫 번째 편을 게시했던 바 있습니다. 하지만 당시 개인적인 사정으로 맥북프로 리뷰 3부작 중 2부와 3부를 완성하지 못했고, 곧 찾아옵니다라는 말이 무색하게 지금까지도 2부와 3부를 완성시키지 ...

    • iMola |
    • 18.09.11 |
    • 조회 수 1831 |