[VGA] 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아
엔비디아 RTX미디어 브리핑에 객원 에디터 자격으로 "대근님 대신" 참여하고 왔습니다. 엔비디아는 선빵필... 아니 선즉제인의 마인드로 언제나 선수를 선호해 왔기에 이들의 행보는 늘 앞서있었습니다. 종래에는 전체적인 성능을 향상시키는 범용적인 선택을 해왔지만, 왜 이번에는 갈림길에서 이 방향을 선택했는지를 납득시키기 위해 미디어 브리핑을 한 거 같았습니다.
자세한 내용과 설명은 차후 언젠가는 나올 대근님의 리뷰를 참조하시고, 이번에는 간단히 이들의 길이 무엇인지를 나름대로 정리해봤습니다.
1. 타겟과 퍼포먼스
근래에는 촬영장비의 발전과 디스플레이의 보급으로 고해상도 (4K 3840*2160+)와 광색역(10bit HDR)이 영상 컨텐츠의 주요한 화두입니다. 게임업계에서도 마찬가지로 이 해상도와 색 대역을 커버하는 것이 주요한 화두중에 하나였으며, 엔비디아는 이를 RTX1080 단일 카드로 구현이 가능하다는 것을 강조했습니다. 차후에 언급하겠습니다만 튜링의 기본적인 퍼포먼스는 파스칼 대비 1.4배 정도 향상을 이루었으며 텐서 코어를 사용하는 DLSS를 쓸 경우 최대 2배 정도의 퍼포먼스 차이까지도 보일 수 있습니다.
2. 튜링 아키텍쳐
튜링 아키텍쳐는 엔비디아의 쿠다 도입 이래 가장 큰 변화를 겪은 아키텍쳐입니다. 크게 세가지 변화를 꼽을 수 있는데, 정수/부동소수점 연산 유닛의 분리, 캐시 구조/메모리 개선, RT코어/텐서 코어라는 ASIC의 도입입니다.
1) 동시 연산 수행(Concurrent Execution)
대체적으로 게임에서 부동소수점 연산을 100번 하면 36번 정도는 정수 연산을 하게 됩니다. 종래의 아키텍쳐에서는 정수 연산을 하는 경우 부동소수점 연산을 할 수가 없었으나, 튜링 아키텍쳐에서는 이 유닛을 분리해 동시에 부동소수점과 정수 연산을 할 수 있게 되었습니다. 그 덕분에 셰이딩 연산 성능은 1.5배 이상 향상되었습니다.
2) 캐시/메모리 개선
L1캐시 공유 구조의 개편 히트 속도 향상, L1/L2 캐시 용량 증설로 더 효율적인 캐시 운용이 가능해졌고, 메모리 대역폭은 업계 최고 속도이며 새로운 무손실 색압축 기술로 1.5배 정도의 효율 향상을 이루었습니다.
3) 텐서코어/RT코어
텐서 코어는 4x4 행렬의 곱연산과 합연산을 수행할 수 있는 유닛으로(일반적인 연산은 불가능합니다.) 연산의 유연성을 잃었지만 낮은 정밀도 연산에서 8-32배의 스루풋을 더 뽑아낼 수 있습니다. 따라서 정밀도가 중요하지 않지만, 수 많은 가능성의 가지를 탐색해야하는 딥러닝의 추론 과정에 최적화 되어 있습니다. 원래는 볼타 아키텍쳐의 테슬라에만 적용되어 있었지만, 튜링 아키텍쳐에서는 소비자용 지포스 카드에까지 넣게 되었습니다. 그 이유라면 차후에 언급하겠지만 당연히 게임에서도 딥러닝을 써먹기 위함일 것입니다.
레이 트레이싱은 엔비디아 RTX시리즈의 핵심입니다. 근원적으로 우리가 늘 보아왔던 래스터라이제이션 방식의 렌더링은 우리의 눈이 세계를 인식하는 방식을 담지 못하고 있습니다. 그러나 레이 트레이싱은 화면에 담기는 빛의 경로를 역추적(Path Tracing)하여 광원까지 도달하게 하므로써 우리가 눈으로 보는 방식과 물리적으로 같은 결과를 낼 수 있습니다. 그러나 엄청난 연산을 필요로 하기에 영화 산업같은 실시간이 아닌 렌더에서나 주로 쓰여 왔고, 이를 실시간으로 구현하는 것은 마치 성배와도 같았습니다.
엔비디아는 레이 트레이싱 안의 레이 캐스팅 과정에서 경계 계층 구조를 만들어 빛의 경로를 추적합니다. 원리는 오브젝트에 직육면체를 점점 작게 선정하여 이 중에 빛의 경로가 있는지를 탐색하는 것입니다.
파스칼에서는 이러한 레이 트레이싱을 셰이더 유닛이 담당했으나 튜링에서는 셰이더는 셰이더 대로 래스터라이제이션을 하면서 레이 트레이싱만 RT코어가 담당하여 동시에 수행하는 것입니다.
그런 고로 레이 트레이싱에 한정하면 2080Ti는 1080Ti대비 10배의 스루풋을 낼 수 있습니다.
3. RTX 옵스
레이 트레이싱을 사용하는 경우 동시에 기본적인 쿠다 코어, 텐서 코어, RT 코어를 "두뇌 풀가동" 시키는 것이기에 이들의 스루풋을 종합적으로 평가하기 위한 새로운 지표가 필요했습니다. 당연히 이들의 연산 비중이 얼마냐에 따라 그 결과값이 달라질 수 있기 때문에 가중치를 두어 연산능력의 최대치를 평가한 것이 RTX옵스입니다.
4. 셰이더 효율 증가
1) 메시 셰이더
튜링 아키텍쳐에서는 레이 트레이서 뿐만 아니라 전통적인 셰이딩 자체도 변경했습니다. 메시 셰이더 모델은 지오메트리, 버텍스, 테셀레이션 셰이더로 구성되는 종래의 셰이더 구조를 개편해서 메시 셰이더로 통합한 뒤 태스크 셰이더에서 디테일 수준(LoD)을 지정하므로써 드로우콜 부담을 줄이는 것입니다. 이로써 셰이더 구조상 더 높은 유연성과 더불어 더 낮은 연산을 부담하게 되고, CPU의 부담 또한 줄일 수 있습니다. 자세한 효과는 동영상을 참조하세요.
2)가변 레이트 셰이딩
가변 레이트 셰이딩은 디테일 수준이 아니라 상황에 맞는 적응형 셰이딩으로 중요도를 지정하여 중요도가 높은 곳에는 더 많은 연산을, 낮은 곳에는 더 적은 연산을 하는 가변 셰이더 연산을 하는 것입니다. 마찬가지로 총 연산 부담을 줄일 수 있습니다.
5. 딥러닝
딥러닝을 그래픽 쪽에 활용하기 위해 엔비디아는 NGX, 신경망 그래픽 프레임워크를 제공합니다. 이것은 엔비디아 자사의 슈퍼컴퓨터를 활용하여 훈련(Training)한 결과를 API를 통해 게임 엔진과 상호적으로 결과를 주고 받아 낮은 비용으로 높은 그래픽적 충실도를 누리는 것입니다.
그 세부적인 적용 방식은 화질 보간입니다.
DLSS(딥러닝 수퍼샘플링)는 엔비디아가 대표적으로 내세우는 NGX 기술로, 인공신경망을 활용하는 안티 에일리어싱 방식입니다. 고품질 지터 이미지를 64샘플을 수퍼 컴퓨터에 트레이닝한 후 게임 엔진에 적용한 것으로, 대략적으로 X64 수퍼샘플링(해상도를 높인 뒤 평균낸 것)과 비등한 결과를 얻으나 TAA(프레임 간 안티에일리어싱) 보다 낮은 대가를 치른다고 합니다.
당연하지만 텐서 코어를 쓰기 때문에 DLSS를 쓰면 종래보다 더 높은 성능 향상치를 보입니다.
6. 기타
1) 스샷 놀이
당연하지만 레이 트레이싱을 실시간으로 구현하지 않아도 되는 스크린샷에서는 더 많은 빛을 바운스시켜 더 물리적으로 정확한 빛을 구현할 수 있습니다. 지포스 익스피리언스 ANSEL SDK에 포함된 기능입니다.
2)오버 클럭
페이즈 컨트롤과 전원부 피드백 컨트롤을 향상시커 같은 전압 대비 더 높은 클럭을 뽑아낼 수 있으며, 엔비디아 스캐너를 쓰면 게임을 돌려서 안정화 하지 않더라도 데이터 기반으로 피드백을 해주어 오버클럭 최적화를 해준다고 합니다.
7. 파트너 사 시연
'
8. 제 생각
사실 2080Ti는 다이사이즈가 굉장히 큽니다. 775mm2라던데 웨이퍼에서 찍어내는 반도체 임계치가 850mm2 수준이라니 소비자용으로는 비정상적으로 크다는 생각도 들 정도입니다. 저 같으면 아마 거기에 셰이더 유닛과 ROP를 추가하는 간단한 성능 향상을 생각하겠지만 엔비디아는 ASIC을 택했습니다. 즉, 양적 성장보다는 질적으로 특화시켜 성장시키는 게 앞으로 나아갈 길이라고 생각하는 것이라 봅니다. 그 특화의 대상은 레이 트레이싱입니다. 더이상 게임 업계에서 참신한 그래픽적 돌파구가 없는데, 전인미답의 세계인 실시간 레이 트레이싱을 완벽하지는 않더라도 일부 도입하기 시작한 것은 놀라운 일은 분명합니다. 그것이 눈속임일지라 하더라도, 앞으로 개발자들의 참여가 미진하다 하더라도 언제든지 방향을 선회할 수 있는 엔비디아의 여유임은 분명합니다. 업계를 선도하는 기업이라면 이러한 비전은 제시할 수 있고, 또 바람직하다 생각합니다. 다만 소비자에게 업계의 포상인 당장의 가성비는 뭐... 노코멘트 하겠습니다.
잼아저씨's Signature
DR.MOLA
레벨 | Lv. 15 (88%) |
---|---|
포인트 | 22,709 p |
출석 | 560 일 (개근 5 일) |
STEAM
닉네임 | Uncle JAM ( 친구추가) |
---|---|
레벨 | Lv. 28 (98%) |
보유게임 | 620 개 |
플레이 | 0 시간 (0 분) |
잼아저씨'님의
- 연관 글
- 게임 정보
- [VGA] NVIDIA RTX 하드웨어와 V-Ray {today_a_date(strtotime($item->regdate), 'y.m.d')}
- [피씨] NVIDIA, GeForce RTX 2080 Ti / 2080 / 2070 발표 {today_a_date(strtotime($item->regdate), 'y.m.d')}
- [VGA] [트위치 생중계] NVIDIA #BeForTheGame Event {today_a_date(strtotime($item->regdate), 'y.m.d')}
- [VGA] A Very Turing Estimation : 미리 보는 GeForce RTX 2080 Ti / 2080 성능 {today_a_date(strtotime($item->regdate), 'y.m.d')}
- [소개] (만시지탄인) 지포스 11 시리즈 성능 예측 by VGA 계산기 {today_a_date(strtotime($item->regdate), 'y.m.d')}
- [VGA] 암호화폐 대 PC방 : 지포스 GTX 1060 5GB 모델 투입의 의미 {today_a_date(strtotime($item->regdate), 'y.m.d')}
- [피씨] 15년만의 부활, 지포스 MX : MX130 / MX110으로 재등장한 맥스웰 {today_a_date(strtotime($item->regdate), 'y.m.d')}
- Genre:
- nvidia
- Publisher:
- nvidia
- 수정됨_DSC2064.jpg (File Size:302.8KB/Download:0)
- 수정됨_DSC2066.jpg (File Size:376.6KB/Download:0)
- 수정됨_DSC2067.jpg (File Size:345.7KB/Download:0)
- 수정됨_DSC2072.jpg (File Size:282.8KB/Download:0)
- 수정됨_DSC2080.jpg (File Size:365.2KB/Download:0)
- 수정됨_DSC2086.jpg (File Size:548.8KB/Download:0)
- 수정됨_DSC2089.jpg (File Size:259.2KB/Download:0)
- 수정됨_DSC2061.jpg (File Size:335.5KB/Download:0)
- 수정됨_DSC2262.jpg (File Size:296.0KB/Download:0)
- 수정됨_DSC2264.jpg (File Size:175.9KB/Download:0)
- 수정됨_DSC2285.jpg (File Size:229.2KB/Download:0)
- 수정됨_DSC2291.jpg (File Size:188.5KB/Download:0)
- 수정됨_DSC2298.jpg (File Size:214.2KB/Download:0)
- 수정됨_DSC2299.jpg (File Size:150.3KB/Download:0)
- 수정됨_DSC2302.jpg (File Size:170.7KB/Download:0)
- 수정됨_DSC2303.jpg (File Size:227.9KB/Download:0)
- 수정됨_DSC2307.jpg (File Size:183.0KB/Download:0)
- 수정됨_DSC2314.jpg (File Size:207.5KB/Download:0)
- 수정됨_DSC2321.jpg (File Size:154.0KB/Download:0)
- 수정됨_DSC2338.jpg (File Size:147.7KB/Download:0)
- 수정됨_DSC2341.jpg (File Size:190.4KB/Download:0)
- 수정됨_DSC2345.jpg (File Size:197.3KB/Download:0)
- 수정됨_DSC2347.jpg (File Size:195.5KB/Download:0)
- 수정됨_DSC2352.jpg (File Size:208.2KB/Download:0)
- 수정됨_DSC2361.jpg (File Size:208.9KB/Download:0)
- 수정됨_DSC2372.jpg (File Size:210.0KB/Download:0)
- 수정됨_DSC2383.jpg (File Size:166.8KB/Download:0)
- 수정됨_DSC2391.jpg (File Size:224.5KB/Download:0)
- 수정됨_DSC2393.jpg (File Size:258.9KB/Download:0)
- 수정됨_DSC2410.jpg (File Size:333.3KB/Download:0)
- 수정됨_DSC2425.jpg (File Size:261.5KB/Download:0)
- 수정됨_DSC2429.jpg (File Size:115.5KB/Download:0)
- 수정됨_DSC2433.jpg (File Size:273.6KB/Download:0)
- 수정됨_DSC2435.jpg (File Size:168.4KB/Download:0)
- 수정됨_DSC2450.jpg (File Size:344.9KB/Download:0)
- 수정됨_DSC2456.jpg (File Size:146.9KB/Download:0)
- 수정됨_DSC2483.jpg (File Size:220.1KB/Download:0)
- 수정됨_DSC2510.jpg (File Size:180.5KB/Download:0)
- 수정됨_DSC2531.jpg (File Size:171.7KB/Download:0)
- 수정됨_DSC2626.jpg (File Size:242.4KB/Download:0)
- 수정됨_DSC2627.jpg (File Size:289.2KB/Download:0)
- 수정됨_DSC2630.jpg (File Size:369.5KB/Download:0)
1. 타겟과 퍼포먼스에 RTX1080 -> RTX 2080입니다 ㅋㅋ
이번 rtx라인은 프로슈머에 초점을 맞춰 개발한 느낌이 큽니다 . 가격은 물론이고 컨셉과 성능까지 일반 사용자에게 매력적인 부분이 보이질 않는것 같아요. 저같은 서민은 그냥 gtx 중고나 구해야할것 같음돠....
다른 곳들보다 쉽게 설명해주셔서
이해하기가 쉬웠습니다. 감사합니다