하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] NVIDIA RTX 하드웨어와 V-Ray

[게임미식가] 잼아저씨 | 조회 621 | 추천 0 | 2018.09.06. 13:47 http://drmola.com/pc_column/300877

아래의 내용은 아래의 블로그를 번역한 것입니다. 모든 저작권은 Chaosgroup과 Vlado에게 있습니다.

https://www.chaosgroup.com/blog/what-does-the-new-nvidia-rtx-hardware-mean-for-ray-tracing-gpu-rendering-v-ray


 

NVIDIA RTX 하드웨어가 레이 트레이싱, GPU 렌더링과 V-Ray에 어떤 역할을 하는가?

 

speakers-vlado.jpg

 

블라디미르 코이라조프 (Vlado, 카오스 그룹 CTO)

 

새로운 GPU 레이 트레이싱 하드웨어의 발표와 함께 미래의 렌더링을 위한 이 돌파구에 대해 Vlado가 설명합니다.

 

지난 20년간 저희는 렌더러 V-Ray를 통해 극사실적 렌더링을 연구하고 도입해왔습니다. 레이 트레이싱은 빛의 물리적 특성에 기반했기에 극사실적 렌더링을 구현하는 가장 자연스러운 방법입니다. 아카데미 오브 모션 픽쳐 앤 사이언스 (*오스카상의 그 ‘아카데미’)에서도 레이 트레이스 렌더링에 대한 저희의 공헌을 인정하여 시각 효과를 널리 쓰이게 한 데 대해 과학 기술 상을 주었습니다. 그러나 레이 트레이싱의 과제는 진정한 극사실적 렌더링을 위해서는 엄청난 양의 연산 성능이 필요하다는 것입니다. 저희는 언제나 더 빠른 레이 트레이싱을 갈구해 왔고, 지난 10년간 GPU의 성능을 V-Ray에 끌어오기 시작했습니다. 이제 저희는 새로이 레이 트레이싱에 특화하여 디자인된 GPU 하드웨어의 도입을 눈앞에 두고 있습니다. 이것은 저희가 레이 트레이스 렌더링을 실시간으로 할 수 있는 능력을 가지게 되었단 것을 의미합니다.

 

엔비디아의 차세대 튜링 GPU와 RTX 제품군은 컴퓨터 그래픽 역사상 중요한 성과이며 레이 트레이싱에 있어서는 더욱 그러합니다. 전문용 쿼드로 RTX 시리즈는 시그래프 2018에서 발표되었으며, 소비자용 지포스 RTX 시리즈는 게임스컴 2018에서 발표되었습니다. 이 새 GPU들은 새로운 전용 하드웨어(RT 코어라고 불립니다.)를 포함하고 있어 저희의 레이 트레이싱 솔루션을 가속할 뿐만 아니라 성능과 가성비를 NV링크를 통해 메모리를 2배로 늘리므로써 크게 확장할 수 있습니다. 전체 라인업 공개와 더불어 RTX가 무슨 특징을 가졌는지 미래의 렌더링을 위해 알아볼 가치가 있습니다.

 

RT코어를 가진 RTX 카드

 

RT코어가 무슨 능력을 가졌는지 알아보기 전에, 간단하게 레이 트레이싱에 있어서 중요한 사실을 몇가지 설명하겠습니다. 어떤 장면에서 광선 경로 추적 과정은 대개 특징적인 두 부분으로 나뉘어져 있습니다. 레이 캐스팅과 셰이딩입니다.

 

레이 캐스팅

레이 캐스팅은 장면의 모든 오브젝트와 광선이 만나는 과정입니다. 오브젝트는 각자 다른 기하적 기초 구성 요소로 되어 있습니다. 삼각형, 곡선 요소(머리카락 등), 입자 기타 등등입니다. 오브젝트는 또한 장면 전체에 걸쳐 인스턴스로 존재할 수 있으며, 이 경우 수천개의 오브젝트 인스턴스는 수백만개의 각자 다른 기하적 기초 구성 요소로 존재할 수 있습니다. 이러한 모든 구성 요소들과 광선이 만나게 되면 대단히 복잡한 동작을 필요로 하며 데이터 구조를 경계 계층 구조(BVH)로 형성하여 연산을 단순화 합니다.

 

셰이딩

셰이딩은 오브젝트의 텍스쳐 맵핑과 매테리얼 특성 연산등을 포함한 겉모습을 결정하는 과정으로, 오브젝트과 빛에 대응하는 방식도 결정합니다. 셰이딩은 또한 특정한 빛을 지정해 추적하여 오브젝트의 겉모습을 연산하는 역할도 합니다. 이 빛은 그림자, 광원, 반사, 전역 조명 등등으로 부터 나온 광선일 수 있습니다. 장면을 구성할 때 세이딩 네트워크는 매우 복잡할 수 있고, 절차적 텍스쳐, 비트맵 검색 등을 포함해 다양한 방식으로 합하여 표면의 매테리얼 특성을 결정하는 데 필요한 연산을 요구할 수 있습니다. 이러한 특성에는 확산된 빛의 색, 반사의 강도와 거칠기, 법선(범프 매핑을 통하여) 등등이 있습니다. 빛의 연산 또한 여기에 포함됩니다.

 

장면마다 기하 요소의 양과 셰이더의 복잡도, 레이 캐스팅과 셰이딩 사이의 균형은 큰 차이를 보일 수 있습니다. 단순한 장면에서 레이 캐스팅이 80% 정도 비중이라면 복잡한 장면에서는 20%일 수 있습니다. RTX그래픽 카드는 특화된 RT코어를 포함하여 레이 캐스팅 과정을 가속합니다. 레이 캐스팅이 상대적으로 복잡한 알고리즘이기 때문에 하드웨어에서 이를 직접 수행하는 경우 상당한 시간 단축 효과를 누릴 수 있습니다. 그러나 특기할만한 점은 레이 캐스팅이 무한정 빠르고 0의 시간이 걸린다 하더라도 레이 트레이싱의 셰이딩 요소가 남아 있습니다. 그러므로 RT코어 사용은 레이 캐스팅에 얼마나 시간이 걸리느냐에 따라 좌우됩니다. 일반적으로 단순한 셰이더와 많은 기하 요소를 갖고 있다면 레이 캐스팅에 시간이 많이 걸리고 셰이딩에 시간이 적게 걸려 RT코어가 최상의 효율을 낼 수 있습니다. 이에 비해 셰이딩 네트워크가 복잡하고 절차적 텍스쳐 등이 많은데 비해 기하 요소가 적다면 가속 효과는 적을 것입니다.

 

위에서 지적한 점을 직접 보여드리기 위해 저희는 V-Ray GPU와 NVIDIA RTX가 지원되는 시험버전으로 동일한 장면을 렌더해 보았습니다. 저희는 같은 장면을 그레이 매테리얼 오버라이드를 통해 한 번 렌더해 보았고 다시 한 번 원본 매테리얼로 렌더해 보았습니다. 이 장면에는 총  95,668,638,333개의 삼각형이 존재하며, 고정 샘플링 레이트로 픽셀당 512 샘플을 사용했습니다.

 

lavina-pic1.jpg

 

그레이 매테리얼 오버라이드를 사용한 장면. 이 경우 레이 캐스팅에 쓰이는 대략 76%의 시간이 RT코어의 혜택을 봅니다.

 

lavina-pic2.jpg

 

온전한 매테리얼을 쓰는 경우 레이 캐스팅에 쓰이는 대략 59%의 시간이 RT코어의 혜택을 봅니다.

 

저희는 발매되지 않은 엔비디아 하드웨어에 대해 성능을 게시하긴 이르다 생각하지만, RT코어의 성능 이득에 대한 방향성은 제시할 수 있습니다. 위의 장면들은 발매 전 버전 튜링 하드웨어로 발매 전 드라이버와 실험 버전 V-Ray GPU를 사용하여 레이 캐스팅 장면을 계측하였습니다. 셰이딩이 단순하면 렌더 시간 중 더 높은 비중으로 레이 캐스팅 연산에 쓰이고, 그에 따라 RT코어 사용에 따른 성능 향상 혜택을 더 많이 누렸습니다. 저희 또한 V-Ray GPU 동작 방식을 개량하여 새 하드웨어에 대해 최대 성능을 뽑을 방법을 찾고 있습니다. 또한 조치 없이도 V-Ray GPU를 구동하면 튜링 하드웨어 그 자체만으로도 이전의 파스칼에 비해 더 나은 결과를 얻을 수 있습니다.

 

또한 말씀드려야 할 중요한 점은 RT코어의 성능 증대 효과를 누리기 위해서는 그에 맞게 전용 프로그래밍이 필요하다는 점입니다. 그러므로 이미 존재하는 레이 트레이싱 어플리케이션들은 자동적으로 그 혜택을 누리지 못합니다. RT코어는 공개적으로 쓰이는 세 가지 API들 (엔비디아 OptiX, 마이크로소프트 다이렉트X(DXR 확장 프로그램을 통하여 가능), 그리고 벌칸)을 활용하여 프로그래밍이 가능합니다. 다이렉트 X와 벌칸은 게임의 리얼 타임 렌더 엔진에 쓰이는 것을 전제로 하며, OptiX는 오프라인 렌더러에 자주 쓰입니다.

 

카오스 그룹은 엔비디아와 저희 제품에서의 RT코어 활용을 위해 거의 1년간 함께 연구하고 있어 왔습니다. V-Ray GPU는 이 기술을 활용할 수 있으며, 시험 빌드를 통해 사용할 수 있습니다. 다만 코드 최적화와 완전한 지원을 위해서는 시간이 조금 걸릴 것입니다. 그 동안 V-Ray GPU의 최신 릴리즈 빌드들은 RTX GPU 사용에 문제가 없을것이지만, RT코어의 혜택은 아직 누릴 수 없습니다. RT코어 지원을 추가한다 하더라도 이전 그래픽 카드에 대한 지원은 늘 그래왔듯 계속할 것입니다.

 

아래의 비디오에서 RT코어 사용을 위해 개조된 버전의 V-Ray GPU에서 RT코어가 어떻게 쓰이는지, 매테리얼과 기하 요소들을 정상적으로 활용이 가능한지 시험해 보았습니다. 이 비디오는 성능을 보여드리기 위함이 아닙니다. 공식적으로 하드웨어가 발매되면 성능 벤치마크를 새로운 게시물로 알려드리겠습니다.

 

 

하드웨어 성능을 확인하기 위해 저희의 프로젝트 라비나를 RT코어를 활용하여 리얼 타임 레이 트레이싱을 하는 것을 시연했습니다. 저희는 또한 래스터라이제이션을 완전히 레이 트레이싱으로 대체할 수 있는지에 대해서도 관심이 있습니다. DXR은 최초로 RT코어를 지원하는 실시간 API였으므로, 그 때에 프로젝트 라비나는 그것을 사용했습니다. 저희는 또한 리눅스 운영체제 등을 위해 추후에 벌칸 API를 지원할 것을 고려하고 있습니다. 초기 결과는 분명 희망적이며, 저희는 이 기술을 지속적으로 개발하고 발전시킬 계획입니다. 분명 지금은 아주 초기의 단계입니다. 현재 연구에 아주 많은 투자가 되고 있으며, 앞으로 몇 달간 실시간 경로 추적 결과는 분명 빠르게 발전할 것입니다. 이를 통해서 실시간 엔진을 위해 변환하는 답답한 과정을 거치지 않고 유저들 께서는 실시간 환경을 조성할 수 있을 것입니다.

 

 

주로 래스터라이제이션에 의존하는 게임 엔진과 DXR 예제와는 달리 언제나 그래왔듯 저희의 솔루션을 레이 트레이싱만을 사용합니다.

 

RT코어는 이 이야기의 전부가 아닙니다. RTX 그래픽 카드는 또한 NV링크라는, 성능에 작은 영향만을 주면서 V-Ray GPU 렌더링에서 메모리 용량을 두 배로 쓸 수 있는 것을 지원합니다.

 

NV링크

 

NV링크는 두 개 혹은 그 이상의 GPU를 브릿지로 연결하여 데이터를 극단적으로 빠르게 공유하는 기술입니다. 이것은 각각의 GPU가 다른 메모리에 접근할 수 있다는 뜻이며, V-Ray GPU는 단일 카드에 올려놓기 힘든 장면을 렌더할 수 있는 장점을 누릴 수 있다는 뜻입니다. 전통적으로 다중 그래픽 카드를 이용해 렌더링을 하는 경우 V-Ray GPU는 같은 데이터를 각각의 GPU에 복제했었습니다. 그러나 NV링크의 V램은 풀이 가능합니다.예를 들어 11GB의 메모리가 달린 두 개의 GPU가 서로 연결되어 있으면, V-Ray GPU는 장면을 렌더하는 데 최대 22GB까지 쓸 수 있다는 뜻입니다. 이것은 완전히 유저가 자유롭게 쓸 수 있으며, V-Ray GPU에서 NV링크가 된 경우 자동적으로 감지하여 사용 가능합니다. 그러므로, 과거에는 듀얼 카드를 쓴 다면 속도만 2배가 되었지만, 지금은 NV링크를 사용하여 V램도 2배로 쓸 수 있습니다.

 

NV링크는 2016년 도입되었으며, V-Ray GPU가 최초로 이를 공식적으로 지원하는 렌더러입니다. V-Ray GPU 3.6 버전 이상의 경우 렌더를 지원합니다. 지금까지 이 기술은 전문가용 쿼드로나 테슬라 카드에서만 가능했지만 RTX 시리즈를 발매한 이후에는 NV링크는 게이밍 GPU에서 또한 활용할 수 있게 되었습니다. 다만 RTX 2080과 2080Ti에서만 가능합니다. NV링크를 사용해 두 장의 카드를 연결하기 위해서는 특별한 NV 링크 브릿지가 필요하며, 별매입니다.

 

 

결론

 

레이 캐스팅에 특화된 하드웨어를 만들어 내는 것은 이전에서도 시도되었으나, 큰 실패를 겪었습니다. 부분적으로는, 셰이딩과 레이 캐스팅 연산은 서로 밀접한 관련이 있어 이종 하드웨어간에서 하기에는 효율적이지 않기 때문입니다. 두 과정을 같은 GPU 하나에서 한다는것이 RTX 아키텍쳐를 흥미롭게 합니다. 저희는 앞으로 RTX GPU 시리즈가 렌더링에 큰 영향을 주고, 오프 라인이든, 리얼 타임이든 GPU 레이 트레이싱에 든든한 기반을 만드는 기술이 될 것이라 생각합니다. 저희 카오스 그룹은 유저를 위해 이 하드웨어를 활용하는 데 최선의 노력을 다 할 것입니다.

잼아저씨's Signature

저는 게임의 모든 것에 관심이 있습니다.

Steam : Uncle JAM  Origin : unclejamj  Uplay : unclejamj  PSN : unclejamj

FB : 이재진

1041047.png

* 적용중인 트로피 :

  1. speakers-vlado.jpg (File Size:3.5KB/Download:0)
  2. lavina-pic1.jpg (File Size:26.9KB/Download:0)
  3. lavina-pic2.jpg (File Size:33.6KB/Download:0)
facebook twitter google plus pinterest kakao story band
  • 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아 [VGA] 엔비디아 RTX 미디어 브리핑 : 갈림길의 엔비디아 [2] file

    엔비디아 RTX미디어 브리핑에 객원 에디터 자격으로 "대근님 대신" 참여하고 왔습니다. 엔비디아는 선빵필... 아니 선즉제인의 마인드로 언제나 선수를 선호해 왔기에 이들의 행보는 늘 앞서있었습니다. 종래에는 전체적인 성능을 향상시키는 범용적인 선택을 해왔지만, 왜 이번에는 갈림길에서 이 방향을 선택했는지를 납득...

  • 삼형제 아이폰부터 애플워치 시리즈 4까지: 애플 9월 이벤트 결산 [모바일] 삼형제 아이폰부터 애플워치 시리즈 4까지: 애플 9월 이벤트 결산 [2] file

    애플이 매년 정기적으로 여는 이벤트가 있다. 첫 번째는 WWDC로 매해 6월 열리는 애플의 소프트웨어 중점 행사이다. 기본적으로 애플의 최신 OS들과, 개발자들을 위한 여러 API들이 공개된다. 물론 아이패드나 맥 등의 하드웨어가 깜짝 공개되는 일도 드물지 않다. 그리고 두 번째는 이름에서도 알 수 있듯 매해 9월에 열리...

    • iMola |
    • 18.09.13 |
    • 조회 수 1377 |
  • 맥북프로(2018) 자세히 알아보기: 미리 맛보기 [모바일] 맥북프로(2018) 자세히 알아보기: 미리 맛보기 file

    들어가기 전에... 햇수로 2년 전인 2016년 12월, 당시 새로이 공개되었던 터치바 맥북 프로 리뷰를 3부작으로 기획했었고 그 첫 번째 편을 게시했던 바 있습니다. 하지만 당시 개인적인 사정으로 맥북프로 리뷰 3부작 중 2부와 3부를 완성하지 못했고, 곧 찾아옵니다라는 말이 무색하게 지금까지도 2부와 3부를 완성시키지 ...

    • iMola |
    • 18.09.11 |
    • 조회 수 805 |
  • NVIDIA RTX 하드웨어와 V-Ray [VGA] NVIDIA RTX 하드웨어와 V-Ray file

    아래의 내용은 아래의 블로그를 번역한 것입니다. 모든 저작권은 Chaosgroup과 Vlado에게 있습니다. https://www.chaosgroup.com/blog/what-does-the-new-nvidia-rtx-hardware-mean-for-ray-tracing-gpu-rendering-v-ray NVIDIA RTX 하드웨어가 레이 트레이싱, GPU 렌더링과 V-Ray에 어떤 역할을 하는가? 블라디미르 코이라...

  • [트위치 생중계] NVIDIA #BeForTheGame Event [VGA] [트위치 생중계] NVIDIA #BeForTheGame Event [3] file

    한국시각 기준 8월 21일 오전 1시, 독일 쾰른에서는 엔비디아가 #BeForTheGame 이라는 부제 아래 CEO 젠슨 황의 키노트를 준비하고 있습니다. 모두의 관심이 집중된 차세대 게이밍 그래픽카드 GeForce RTX 시리즈가 이 자리에서 공개될 것으로 예상되는데요. 트위치 방송을 지켜보며 닥터몰라에서도 라이브블로깅 세션을 열...

    • Dr.Lee |
    • 18.08.21 |
    • 조회 수 682 |
  • A Very Turing Estimation : 미리 보는 GeForce RTX 2080 Ti / 2080 성능 [VGA] A Very Turing Estimation : 미리 보는 GeForce RTX 2080 Ti / 2080 성능 [5] file

    NVIDIA의 차세대 게이밍 및 그래픽 워크스테이션용 GPU "Turing" 이 공식화되고, 이에 기반한 GeForce 게이밍 그래픽카드의 등장이 점쳐지며 그래픽카드 시장은 최근 2년 사이 가장 뜨겁게 달아오르고 있습니다. 아시다시피 2016년 NVIDIA가 "Pascal" GPU를 출시한 이후, 해당 성능대를 뛰어넘는 게이밍 그래픽카드의 출시는...

    • Dr.Lee |
    • 18.08.18 |
    • 조회 수 5458 |
  • [카드뉴스] Succeeding you, Intel : AMD Ryzen Threadripper 2990WX / 2950X +ɑ 리뷰 [CPU] [카드뉴스] Succeeding you, Intel : AMD Ryzen Threadripper 2990WX / 2950X +ɑ 리뷰 [2] file

    AMD는 지난 7월 말 이탈리아 마라넬로에서 진행된 테크 데이 행사를 통해 2세대 Ryzen Threadripper의 세부 사항을 처음으로 공개했습니다. 이어 지난 8월 6일 '성능을 제외한' 나머지 정보에 관한 엠바고가 해제되어 많은 분들이 2세대 Ryzen Threadripper의 개요 및 외관을 보셨을 줄로 압니다. 닥터몰라에서도 이때 발맞...

    • Dr.Lee |
    • 18.08.13 |
    • 조회 수 2283 |
  • 애플 홈팟 음향 리뷰: Pod을 다시 위대하게 [음향기기] 애플 홈팟 음향 리뷰: Pod을 다시 위대하게 [4] file

    - 애플 홈팟은 구글의 구글홈, 아마존에 알렉사, 네이버의 클로바에 대응하는 애플의 시리가 탑재된 AI 스피커죠. - 다른 플랫폼과는 달리 시리는 나온지 7년이 다 되기도 하였고, 이젠 아이폰과 아이패드를 넘어 맥과 애플워치에도 시리가 있기 때문에 홈팟은 시리보다는 스피커 본연의 기능에 집중한 느낌. - 블루투스를 ...

    • STUDIO51 |
    • 18.08.13 |
    • 조회 수 1245 |
  • AMD 2세대 Ryzen Threadripper 프리뷰 [CPU] AMD 2세대 Ryzen Threadripper 프리뷰 file

    AMD는 지난달 각국의 매체들을 대상으로 2세대 Ryzen Threadripper 테크 데이 행사를 개최, 컴퓨텍스 2018 행사에서 예고했던 자사의 차세대 HEDT 라인업을 봉인 해제하는 계기를 가졌습니다. 한국시각 기준으로 8월 6일 오후 10시를 맞고 있는 지금은 이날 공개된 정보들 중 제품 리뷰 (구체적인 성능 수치) 그 자체를 제외...

    • Dr.Lee |
    • 18.08.06 |
    • 조회 수 3103 |
  • AMD의 2018년 하반기 : GTX 1060급 SoC, 2세대 Ryzen Threadripper [CPU] AMD의 2018년 하반기 : GTX 1060급 SoC, 2세대 Ryzen Threadripper [1] file

    AMD의 역사는 이제 Zen 이전과 이후로 나뉜다. 데스크탑 CPU뿐 아니라 데이터센터, 임베디드, 그리고 콘솔에까지 가지를 뻗고 있는 AMD는 속속 전 라인업에 Zen 아키텍처를 침투시키고 있는 중이다. 콘솔 SoC는 Zen이 아직까지 뿌리내리지 못한 최후 불모지나 다름없었는데, 이는 콘솔 제조업체 자체적인 제품 갱신주기 도래...

    • Dr.Lee |
    • 18.08.06 |
    • 조회 수 1842 |