AMD FAD2017 키노트 해설 : (5) RTG 대표 라자 쿠드리

by Dr.Lee on 2017년 05월 18일 00시 12분 (2년 전) 조회: 938 추천: 4

AMDFAD2017 - Raja Koduri-01.jpg

 

한국 기준 5월 17일 새벽 5시 AMD는 연례행사인 파이낸셜 애널리스트 데이를 개최했습니다. 작년에 이어 행사는 전세계에 인터넷으로 생중계되어 원하는 이들 모두 실시간으로 지켜볼 수 있었는데요. 특히 회사의 C레벨급 탑5 고위 임원이 총출동해 한 세션씩을 맡은고로 AMD가 사업을 수행하고 있는 각 분야의 현황과 다가올 제품에 대해서도 알짜배기 정보를 들을 수 있다는 기대가 걸려 있었습니다. 참고로 제작년의 같은 행사에서 AMD는 최초로 Zen 아키텍처의 윤곽을 밝힌 바 있기도 합니다.
 
이 글은 동 행사에서 발표된 키노트 자료를 통째로 소개하며 해설해 드릴 (다이제스트) 목적으로 작성됩니다. 첫번째 연사로 대표이사(CEO) 사장인 리사 수 박사, 두번째 연사로 CTO를 맡고 있는 마크 페이퍼마스터 전무(SVP), 세번째 연사로 CG사업부 대표(GM) 짐 앤더슨 전무, 네번째 연사로 EESC사업부 대표 포레스트 노로드 전무가 등장한 데 이어 마지막 연사로 라데온 테크놀러지 그룹의 대표(Chief Architect) 라자 쿠드리 전무가 무대에 올랐습니다.

 

<AMD 파이낸셜 애널리스트 데이 2017 키노트 목록>

 

1. CEO 리사 수

2. CTO 마크 페이퍼마스터

3. 컴퓨팅 및 그래픽 사업부 대표 짐 앤더슨

4. 엔터프라이즈, 임베디드 및 세미커스텀 사업부 대표 포레스트 노로드

5. 라데온 테크놀러지 그룹 대표 라자 쿠드리

 

AMDFAD2017 - Raja Koduri-03.jpg

 

시작부터 앞의 세션들과 달리, AMD에 대해 다소간 독립적 위상을 갖는 라데온 테크놀러지 그룹답게 다른 색채가 묻어나는 오프닝을 보여줍니다. 라자 쿠드리 대표의 강좌 "라데온 라이징", 그 첫번째 챕터는 "더 나은 기본".

 

AMDFAD2017 - Raja Koduri-04.jpgAMDFAD2017 - Raja Koduri-05.jpg

 

라데온 테크놀러지 그룹은 작년 초 창설되어 구 ATI 인력 대부분을 승계하고 있습니다. 그간 분산되어 있었던 3000여 명 GPU 전문가들의 역량이 한 곳으로 집결되었고, 회사 차원에서도 더욱 투자를 늘린 덕분에 작년 이맘때 폴라리스 GPU를 발표할 수 있었습니다.

 

폴라리스 기반 그래픽카드는 현재 해당 체급에서 성능 우위를 지키고 있으며 (주 : 라데온 RX 480/580 기준으로, 엔비디아 지포스 GTX 1060급을 대적하는 것을 의미합니다) 전세대 대비 2.8배의 전성비를 달성했습니다. (주2 : 라데온 RX 480은 하와이보다 성능이 좋습니다.) 무엇보다 출시 당시를 기준으로 200달러 이하의 VR-레디 그래픽카드였다는 점에 이들은 큰 자부심을 갖고 있습니다.

 

AMDFAD2017 - Raja Koduri-06.jpgAMDFAD2017 - Raja Koduri-07.jpg

 

나아진 것은 하드웨어 개발 환경뿐만이 아닙니다. 악명높던 카탈리스트의 버그와 늦은 사후관리를 보강하기 위해 관련 인력을 크게 늘렸고, 이에 따라 30여 종의 메이저 게임 타이틀은 출시 당일 즉시 제공된 드라이버 패치를 통해 제대로 된 성능을 누릴 수 있었습니다. 컨슈머 제품뿐만이 아닙니다. 전문가용인 라데온 프로와 라데온 인스팅트 역시 더 강화된 안정성과 ROCm 등의 생태계 지원을 통해 시장에 안착할 수 있었다고 하네요.

 

그리하여 기존에는 컨슈머 그래픽카드만을 상징하는 브랜드이던 라데온은 AMD의 모든 그래픽카드의 상위 개념쯤으로 격상되었습니다. 종전 라데온의 영역을 계승한 라데온 RX, 파이어프로를 계승한 라데온 프로와 라데온 인스팅트. 이들은 각각 게이밍, 컨텐츠 생산, 기계지능(기계학습)이라는 3가지 시장을 겨냥하고 있습니다.

 

AMDFAD2017 - Raja Koduri-08.jpg

 

여기서 잠깐. 지금까지의 발표를 들으며 너무 현실과 동떨어진 자화자찬 일색 아니냐는 의문이 드셨다면 반쯤은 맞았습니다. 절반이 틀린 이유는 라데온 테크놀러지 그룹의 최우선순위 자체가 "최상급 성능의 GPU를 개발하는 것"에서 살짝 비켜났기 때문입니다. 정확히 말해 이들은 "가장 폭넓은 소비자층을 공략할 수 있는" '스윗 스팟'을 겨냥하고 있습니다. 그리고 AMD에 따르면 그 시장은 구체적으로 300달러 이하의 그래픽카드로 정의되는듯 합니다.

 

300달러 이하의 그래픽카드가 시장에서 점유하는 비율은 제작년말 21%에서 작년말 31%로 10%p나 올랐습니다. 여기까지만 보면 전체 그래픽카드 시장이 쪼그라들었나 싶지만 실상은 반대입니다. 전체 데스크탑 컴퓨터로 시장을 확대해 볼 때 내장그래픽이 아닌 컴퓨터의 비중이 오히려 7.3%p 올랐거든요. 즉 '스윗 스팟' 그래픽카드의 판매가 확대되는 것이 전체 그래픽카드 시장의 파이를 키우는 효과를 낳은 것입니다.

 

AMDFAD2017 - Raja Koduri-09.jpg

 

그러나 여기에도 아쉬운 점은 있습니다. 구체적으로 '폴라리스 이하'급 중저가 그래픽카드가 시장에서 벌어들인 마진은 전체의 33%에 불과합니다. 반면 개당 200-500달러에 달하는 열성 게이머용 그래픽카드나 심지어 1000달러를 호가하는 컴퓨팅용 그래픽카드를 통해 벌어들인 수익은 시장의 66%를 차지하고 있죠. 이 부분에서 완전히 손을 뗐다는 항간의 의심과 달리 라자 쿠드리 대표는 바로 이곳이 향후 그들이 개척할 "기회"의 땅임을 명확히 선언했습니다.

 

AMDFAD2017 - Raja Koduri-10.jpg

 

이어지는 챕터 투. "기본을 넘어서".

 

AMDFAD2017 - Raja Koduri-12.jpg

 

오늘날 프로페셔널 용도의 그래픽카드가 현업에서 사용하는 데이터의 크기는 기하급수적으로 커지고 있습니다.

 

AMDFAD2017 - Raja Koduri-13.jpgAMDFAD2017 - Raja Koduri-14.jpg

 

이는 나날이 사용자가 요구하는 기술의 수준이 높아지기 때문입니다. 가령 모든 개발자들은 그들이 구현할 가상현실이 더욱 디테일해지기를 원하며 게임 개발자들은 실시간에 가깝게 디테일한 그래픽이 구현되기를 원하고 있습니다.

 

AMDFAD2017 - Raja Koduri-15.jpg

 

영상 제작으로 눈길을 돌려 볼까요. 십여년 전 "반지의 제왕 : 반지 원정대"가 만들어지던 때와 비교해 영화 하나가 요구하는 데이터셋의 크기는 시간의 흐름에 따라 거의 기하급수적으로 증가하는 모습을 보이고 있습니다. 반지의 제왕에서 호빗 3부작에 이르기까지는 10년 가량이 소요되었지만, 그 정확히 두 배쯤인 "마이 리틀 자이언트" (The BFG; Big Friendly Giant) 가 되기까지는 단 2-3년이 걸렸을 뿐입니다.

 

AMDFAD2017 - Raja Koduri-16.jpgAMDFAD2017 - Raja Koduri-17.jpg

 

심지어 요구되는 연산량은 그보다도 가파르게 올라가고 있습니다. 그에 비해 현실의 GPU가 발전해 온 속도는 거기에 훨씬 못 미치는 수준이죠. 더욱 심각한 것은, 그래픽 메모리의 용량 증가율은 GPU의 연산성능이 오르는 속도조차도 따라잡지 못하고 있다는 겁니다.

 

AMDFAD2017 - Raja Koduri-18.jpg

 

바로 여기에 해답을 제시하기 위해 베가 아키텍처가 개발되었습니다. 앞서 이 글에서 베가 아키텍처를 상세하게 짚어본 바 있죠. HBCC의 도입으로 달라진 메모리 계층 구조, 지오메트리 엔진과 래스터라이저 (=픽셀 엔진) 의 개선, 그리고 2배속 FP16 연산의 도입까지. 이를 통해 게이밍과 기계학습 등 HPC 분야라는 이질적인 영역을 하나의 GPU로 대응하려는 것입니다.

 

AMDFAD2017 - Raja Koduri-19.jpgAMDFAD2017 - Raja Koduri-21.jpgAMDFAD2017 - Raja Koduri-23.jpg

 

(지금까지 유출되었던 루머를 종합, 베가 GPU를 탑재한 그래픽카드의 추정 성능을 이 글에서 다룬 바 있으니 혹시 궁금하시다면 보고 오셔도 좋겠습니다.)

 

AMDFAD2017 - Raja Koduri-22.jpg

 

이러한 고용량 그래픽 메모리의 니즈에 부응하기 위해 AMD는 작년 7월 폴라리스 10 GPU를 탑재한 라데온 프로 SSG를 발표했었죠. 이제 와서 돌이켜보니 그 모든 움직임이 베가의 HBCC 메모리 계층 구조를 활용하기 위한 밑밥이었다는 생각이 듭니다. 바로 라데온 프로 "베가" SSG를 새로 발표한 것입니다.

 

NVMe SSD가 온보드되어 있다는 점은 종전의 라데온 프로 SSG와 같으나 차이점이 하나 있습니다. 그 상위계층 메모리로 16GB HBM2를 탑재한 것이죠. 직전세대의 피지 GPU에서는 전통적인 VRAM으로 쓰였던 HBM을 상위계층 메모리인 '캐시' 처럼 활용, 그 아래 계층의 시스템 메모리 등을 그래픽메모리의 일부로써 활용할 수 있게 한 베가 GPU의 장점을 극대화한 예시입니다.

 

AMDFAD2017 - Raja Koduri-24.jpgAMDFAD2017 - Raja Koduri-25.jpg

 

한편 베가가 겨냥한 또 다른 용도는 바로 기계지능(기계학습). 오늘날 딥러닝 등을 제대로 구현하기 위해서는 CPU 단독으로는 불가능하고 CPU와 GPU가 협업하는 헤테로지니어스 컴퓨팅, 또는 GPGPU 연산이 필수적입니다. 이를 위해 라데온 테크놀러지 그룹이 주도하여 "라데온을 사용한, HSA 지원" HPC 개발 오픈소스 플랫폼인 ROCm의 저변을 넓히고 있습니다.

 

AMDFAD2017 - Raja Koduri-27.jpgAMDFAD2017 - Raja Koduri-28.jpg

 

기계학습 / 딥러닝 성능의 척도로 평가받는 딥벤치 구동 결과입니다. 인텔의 HPC 솔루션인 제온 파이 7250 (나이츠 랜딩, 68코어) 조차 엔비디아의 한세대 전 테슬라 M40 (GM200, 3072SP) 의 절반 수준에 그치는 성능을 보이고 있으며 현세대 테슬라 P100 (GP100, 3584SP) 는 재차 그보다 2배 이상 좋은 성능을 보였습니다.

 

이번에는 베가의 성능을 알아볼까요. 놀랍게도 딥러닝 성능이 테슬라 P100보다도 1.5배쯤 좋게 측정되었습니다. 테슬라 P100의 연산성능이 FP16 기준 약 21 테라플롭스로 알려졌고 베가의 경우 라데온 인스팅트 MI25가 25 테라플롭스로 알려졌기에, 단순 연산성능 차이보다도 더 큰 격차로 벌어진 것입니다. 물론 단 하나의 측정값만을 보신 것이니 다소 걸러 생각하셔야겠죠.

 

AMDFAD2017 - Raja Koduri-31.jpg

 

오늘 행사의 가장 큰 미스테리라고 해도 과언이 아닐, 라데온 베가 프론티어 에디션이 갑자기 공개되었습니다. 컨슈머용 라인업의 라데온 RX도, 프로페셔널 라인업의 라데온 프로도 아니고 심지어 라데온 인스팅트도 MI도 아닌 그냥 라데온 베가. 엔비디아가 지포스 GTX 타이탄을 마침내 "엔비디아 타이탄" 으로 독립시켰듯 "베가" 라는 독자 브랜드를 창설하려는 것일까요.

 

AMDFAD2017 - Raja Koduri-32.jpg

 

다만 AMD는 라데온 베가의 타겟층을 연구자/엔지니어 및 디자이너로 상정함으로써, 이 제품이 컨슈머 지향이 아니라는 것만큼은 명확히 했습니다.

 

AMDFAD2017 - Raja Koduri-33.jpg

 

라데온 베가는 제작년의 라데온 R9 Fury X보다 1.5배 높은 FP32 연산성능과 3배 높은 FP16 연산성능, 그리고 4배 더 많은 HBM(2) 메모리 용량을 가졌습니다. 물론 이것은 진작부터 예상되어 온 정보를 다시 한번 재확인하는 것에 그쳤을 뿐이고, 실제 성능은 여전히 베일에 가려 있는 상태입니다. 오는 6월 말경 출시된다고.

 

AMDFAD2017 - Raja Koduri-34.jpg

 

드디어 기계학습을 정복하기 위한 지도가 그려졌습니다. (바로 앞 세션에서 정식으로 "에픽" 발표된) 네이플스, 베가, 그리고 ROCm 플랫폼. 그러니까 64코어 / 128스레드 에픽 2소켓 플랫폼에 라데온 베가 여러 장을 인피니티 패브릭으로 연결하고 ROCm으로 소프트웨어 라이브러리를 제공하면 AMD가 상정하는 최고의 기계학습 / 딥러닝 머신이 된다는 이야기겠죠. 어쩐지 엔비디아의 DevBox와도 일맥상통하는 것 같지만 여전히 베일에 가려진 성능 탓에 의구심을 완전히 제거할 순 없겠습니다.

 

AMDFAD2017 - Raja Koduri-35.jpg

 

자세한 건 다음에 말씀드리겠습니다(...), 라며 라자 쿠드리 대표의 발표가 막을 내렸습니다.

 

AMDFAD2017 - Raja Koduri-36.jpg

 

이것으로 AMD 파이낸셜 애널리스트 데이 2017 키노트 해설이 모두 끝났습니다. 긴 글 읽어주신 여러분, 수고 많으셨습니다.

 


 

<AMD 파이낸셜 애널리스트 데이 2017 키노트 목록>

 

1. CEO 리사 수

2. CTO 마크 페이퍼마스터

3. 컴퓨팅 및 그래픽 사업부 대표 짐 앤더슨

4. 엔터프라이즈, 임베디드 및 세미커스텀 사업부 대표 포레스트 노로드

5. 라데온 테크놀러지 그룹 대표 라자 쿠드리

댓글 3

Profile

잼아저씨

2년 전

폴라리스의 발매는 분명 경쟁사 메인스트림급보다 한달. 두달 정도씩 일러서 시기 적절하면서도 나름 성공적인 전략이었다고 생각합니다. 다만 하이엔드 및 기업용 고성능 GPU는 경쟁사보다 1년 넘게 뒤쳐졌으면서 그 절대성능 또한 경쟁사를 넘어서지 못할 것이라는 게 거의 확실하다는 점이 슬픕니다.

댓글

SayAkhan

2년 전

기계학습을 신경쓸꺼면 텐서플로우도 지원좀 해줬으면 하네요 cuda만 지원해서 맨날 cpu로 연산하는데 답답해 죽겠어요 ㅠㅠ

댓글

Profile

위네

2년 전

텐서플로는 구글이 쿠다로 개발해버려서 암드가 어찌할 수 있는 부분이 아니에요
구글이 의지를 가지고 OpenCL로 포팅해줘야해요

댓글

컴퓨텍스 2017 : 대만 출장 4일차

컴퓨텍스 개막 이틀째이자 닥몰 원정대의 출장 4일차인 오늘은 오전 10시에 웨스틴 타이페이 호텔에서 AMD의 프레스 이벤트가 예정되어 있습니다. 이외에도 오후 1시에 엔비디아 본사 직원과 라운드테이블 형식의 인터뷰가 있고, 어제 들르지 못한 난강전람관의 컴퓨텍스...

by Dr.Lee on 2년 전
1,302 8 5

컴퓨텍스 2017 : 대만 출장 3일차 (개막일)

오늘은 대망의 컴퓨텍스 개막일. 어제의 강행군으로 지친 몸을 이끌고 저희는 컴퓨텍스 D-DAY 첫 일정, TWTC 전시장 근처의 그랜드 하얏트 타이페이 호텔에서 열리는 엔비디아 AI 포럼에 참석하기 위해 전철에 올랐습니다. (이 글은 전철에서 핸드폰과 맥북으로 쓰여지고...

by Dr.Lee on 2년 전
1,362 18 11

컴퓨텍스 2017 : 대만 출장 2일차 (개막 D-1)

대만 여행 2일차를 맞아 저희는 지금 (아침 일찍!) 예류 지질공원에 갑니다. 오늘은 컴퓨텍스 개막 D-1으로 여전히 본 행사와 관련해서는 보여드릴 게 없지만, 프레스 센터가 운영되어 사전 등록자들은 배지(출입증)를 발급받을 수 있습니다. 또한 오후 한시에는 ASUS 프...

by Dr.Lee on 2년 전
926 15 6

컴퓨텍스 2017 : 대만 출장 1일차 (개막 D-2)

2017년 컴퓨텍스를 맞아 닥터몰라 운영진 중 Archost님, 콜드오브젝트님, 그리고 저는 대만행 비행기에 오르고 있습니다. 오늘은 개막 D-2로 행사와 관련된 무언가를 보여 드릴 가능성은 낮겠지만, 어쩄든 닥터몰라 팀의 여행 1일차로써 대만에서 놀고 먹는 모습을 최대...

by Dr.Lee on 2년 전
976 22 4

AMD FAD2017 키노트 해설 : (5) RTG 대표 라자 쿠드리

한국 기준 5월 17일 새벽 5시 AMD는 연례행사인 파이낸셜 애널리스트 데이를 개최했습니다. 작년에 이어 행사는 전세계에 인터넷으로 생중계되어 원하는 이들 모두 실시간으로 지켜볼 수 있었는데요. 특히 회사의 C레벨급 탑5 고위 임원이 총출동해 한 세션씩을 맡은고로...

by Dr.Lee on 2년 전
938 3 4

AMD FAD2017 키노트 해설 : (4) EESC사업부 대표 포레스트 노로드

한국 기준 5월 17일 새벽 5시 AMD는 연례행사인 파이낸셜 애널리스트 데이를 개최했습니다. 작년에 이어 행사는 전세계에 인터넷으로 생중계되어 원하는 이들 모두 실시간으로 지켜볼 수 있었는데요. 특히 회사의 C레벨급 탑5 고위 임원이 총출동해 한 세션씩을 맡은고로...

by Dr.Lee on 2년 전
569 3

AMD FAD2017 키노트 해설 : (3) CG사업부 대표 짐 앤더슨

한국 기준 5월 17일 새벽 5시 AMD는 연례행사인 파이낸셜 애널리스트 데이를 개최했습니다. 작년에 이어 행사는 전세계에 인터넷으로 생중계되어 원하는 이들 모두 실시간으로 지켜볼 수 있었는데요. 특히 회사의 C레벨급 탑5 고위 임원이 총출동해 한 세션씩을 맡은고로...

by Dr.Lee on 2년 전
610 2

AMD FAD2017 키노트 해설 : (2) CTO 마크 페이퍼마스터

한국 기준 5월 17일 새벽 5시 AMD는 연례행사인 파이낸셜 애널리스트 데이를 개최했습니다. 작년에 이어 행사는 전세계에 인터넷으로 생중계되어 원하는 이들 모두 실시간으로 지켜볼 수 있었는데요. 특히 회사의 C레벨급 탑5 고위 임원이 총출동해 한 세션씩을 맡은고로...

by Dr.Lee on 2년 전
592 2

AMD FAD2017 키노트 해설 : (1) CEO 리사 수

한국 기준 5월 17일 새벽 5시 AMD는 연례행사인 파이낸셜 애널리스트 데이를 개최했습니다. 작년에 이어 행사는 전세계에 인터넷으로 생중계되어 원하는 이들 모두 실시간으로 지켜볼 수 있었는데요. 특히 회사의 C레벨급 탑5 고위 임원이 총출동해 한 세션씩을 맡은고로...

by Dr.Lee on 2년 전
1,503 6 7

삼성 갤럭시 S8 음향 리뷰: G6에 완패?!

안녕하세요 STUDIO51 입니다. 이미 영상으로 찾아 뵈었지만 시간 제약 때문에 못 다 전해드린 내용이 있어서 글로 마저 전해드립니다. 이 글은 영상으로 전해드리기엔 복잡해서 영상에 넣지 않았던 측정 환경과 측정 조건에 대해서 명시합니다 1. 모든 데이터 표기 방법,...

by STUDIO51 on 2년 전
2,768 4 4
서버에 요청 중입니다. 잠시만 기다려 주십시오...