엔비디아, 머신러닝 겨냥한 새 테슬라 출시

by IYD on 2015년 11월 11일 12시 38분 (4년 전) 조회: 148 추천: 1

Translator : Daeguen Lee

(※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.)

 

 

 

엔비디아, 머신러닝 겨냥한 새 테슬라 출시

 

 

맥스웰은 천천히, 하지만 꾸준히 서버 시장에 진출하기 위해 시도하고 있다. 비록 맥스웰 아키텍처의 선천적인 한계인 배정밀도 연산기능의 결여 등으로 인해 본래 테슬라 브랜드가 겨냥한 목표 시장인 고성능 HPC에는 적합하지 않다는 지적이 있어 왔으나, 엔비디아는 최근 생각을 바꾼 듯 하다. 맥스웰이 제공하는 수준의 연산성능만으로도 통상적인 서버 용도에는 아무 문제가 없다는 것이다. 그리고 그 결과, 맥스웰에 기반한 일련의 테슬라들을 최근 몇달 사이 출시하기에 이르렀다.

 

지난 8월에 출시되었던 테슬라 M60/M6은 그리드 환경과 VDI에 초점을 맞추고 있었는데, 오늘 출시된 테슬라 M40/M4는 또다시 초점을 바꿔 머신러닝 시장을 겨냥하고 있다. 엔비디아는 이들을 "하이퍼스케일 액셀러레이터"라 명명했다.

 

 

 

오늘의 주인공을 살펴보자. 우선 테슬라 M40은 GM200 GPU가 테슬라 라인업에 이식된 첫 제품이다. 이 제품을 통해 엔비디아가 의도하는 것은 명백히 "최고의 단정밀도 연산성능"을 구현하는 것이리라. GM200 풀칩을 탑재해 총 TDP는 250W에 달하며 6GHz로 작동하는 GDDR5 VRAM을 12GB나 탑재하고 있다. 비록 맥스웰 아키텍처 자체의 한계로 온칩 ECC 기능 등이 배제되어 있기는 한데 이를 소프트-ECC로 구현하고 있는지는 확실치 않다. 이상의 점들을 제외하면 이 제품은 본질적으로 껍데기가 바뀐 지포스 GTX 타이탄 X와 같다.

 

 

한편 테슬라 M40과 함께 출시된 M4로 말하자면, 한자릿수 모델넘버가 암시하듯 보다 작고 저성능의 제품이다. 로우 프로파일 (LP) 규격으로 일반적인 PCI-E 브라켓보다 절반 가량의 높이를 가지고 있으며 고밀도 클러스터 (dense cluster) 에 사용될 것을 목적으로 엔비디아가 이 제품을 만들었다고 한다. 테슬라 M4는 GM206 GPU를 탑재하고 있으며 -이것 역시 테슬라 라인업에 이식되기로는 처음이다- 5GHz로 작동하는 4GB GDDR5 VRAM을 탑재하고 있다. 엔비디아는 개별 고객의 요구에 맞춰 이 제품의 소비전력과 작동 속도를 커스텀해 주는 옵션을 제공하며, TDP는 50W~75W의 범위 내에서, 연산 성능은 최대 2.2 TFLOPS의 범위 내에서 커스텀이 가능하다.

 

 

이번에 출시된 테슬라 M40과 M4는 모두 '머신러닝'이라는 시장을 겨냥하고 있다. 엔비디아는 지난 수년간 이 분야에 공을 들여왔으며, 머신러닝이야말로 앞으로 GPU들이 맞이하게 될 거대한 전선이라고 보고 있는 상황이다. 엔비디아가 인공신경망 (neural network) 연구에 거액을 투자한 결과, 신경망을 학습시키는 것 / 실행시키는 것에 있어 모두 GPU가 가장 좋은 솔루션이라는 사실이 점차 드러나고 있다. 또한 기업들이 방대한 양의 오디오 / 비디오 데이터를 처리하는 데 (예 : 페이스북) 있어서도 인공신경망이 더욱 효율적이라는 인식이 점차 확산되어가는 추세에 있다.

 

이러한 기조의 연장선에서, 엔비디아는 그간 꾸준히 머신러닝 부문을 겨냥한 제품을 선보여 왔으며 그 중에는 무인자동차 시스템에 탑재되는 Drive PX 등이 있었다. 또한 금년도의 GTC (GPU Tech Conference) 2015에서 그들의 이러한 장기적인 비전을 구체화한 바 있다. 이번의 테슬라 M40/M4는 어찌 보면 (머신러닝에 더욱 특화될 미래의 아키텍처가 아닌) 현행 아키텍처에서 머신러닝 시장을 공략할 수 있는 엔비디아의 '임시 담당자' 역할을 수행하게 될 것이다.

 

 

테슬라 M40과 M4의 매우 상이한 스펙 및 소비전력을 놓고 볼 때, 이들은 (한 시장 내에서 경쟁하는 것이 아니라) 각기 다른 시장을 공략해 들어갈 가능성이 높으며 그것은 바로 (신경망) '학습'과 '실행' 부문이다. 구체적으로, 막강한 연산 성능으로 무장한 M40은 (머신러닝 시스템의 프론트엔드에 해당하는) '학습' 부문을 맡게 될 것이며 M4는 고밀도 서버에 집적되어 실제 서비스의 실행을 담당하는 (백엔드) 부문을 맡을 것이다.

 

재미있는 것은 사실 M40보다 더 연산성능이 높은 M60이 있음에도 엔비디아가 M60에는 굳이 다른 분야를 맡기고 M40으로 하여금 머신러닝 프론트엔드 부문을 맡겼다는 점이다. 이는 엔비디아가 GTC 2015에서 밝힌 내용으로 유추해볼 수 있는데, 현 아키텍처와 머신러닝 알고리즘 하에서 멀티 GPU의 효율은 그리 높지 않다고 하며 공교롭게도 테슬라 M60은 GM204 GPU 두개를 탑재하고 있다. 그렇기 때문에 단일 GPU로서 더 고성능 칩을 탑재한 테슬라 M40에 이런 임무가 맡겨진 것이다.

 

 

한편 엔비디아는 새로운 하드웨어를 발표하는 것과 함께 이를 뒷받침할 새로운 소프트웨어도 발표했는데, "엔비디아 하이퍼스케일 스위트" 가 그것이다. 그 핵심은 엔비디아가 개발한 "GPU REST 엔진"으로 각종 웹서비스가 GPU에 보다 쉽게 액세스할 수 있도록 도와주는 것이다. 엔비디아는 이 엔진이 검색 가속(search acceleration), 이미지 판별(image classification)등 모든 분야에 응용되리라 기대하고 있으며 그 한가지 예시로 "엔비디아 이미지 컴퓨트 엔진"을 선보이고 있다. 또한 이 패키지의 구성품으로 cuDNN 신경망 소프트웨어, GPU 인코드/디코드를 지원하는 FFmpeg 등도 포함되어 있다.

 

 

종합적으로, 그간 여느 테슬라 출시가 그러했듯 이번의 발표는 제품 자체가 출시되는 것보다는 다소 앞서 이뤄졌으며 엔비디아는 이들 제품들이 (소프트웨어 포함) 금년 연말 출시될 것이라고 알렸다. 단 테슬라 M4는 2016년 1분기에 출시될 것이라고 한다. 이들의 가격은 아직 정해지지 않았다.

 

(주 : 아래는 보도자료)

 

 

 

 

 

 

 

 

 

댓글 0

SC15 스케치 : 美 기상청, 엔비디아에 차기 슈퍼컴퓨터 발주

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) SC15 스케치 : 美 기상청, 엔비디아에 차기 슈퍼컴퓨터 발주 앞의 두 현장 스케치에 이어 세번째 주인공은 바로 엔비디아이다. 이 회사는 지난주에 테슬라 M40/M4를 출시하며 우리의 ...

by IYD on 4년 전
100 1

SC15 스케치 : AMD GPU를 위한 C++/CUDA 컴파일러

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) SC15 스케치 : AMD GPU를 위한 C++/CUDA 컴파일러 SC15의 두번째 굵직한 소식은 AMD로부터 전해졌다. 이 회사 역시 FirePro S 시리즈 제품군으로 HPC 시장을 공략하고 있는 중이며, ...

by IYD on 4년 전
749 2

SC15 스케치 : IBM & Xilinx 편

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) SC15 스케치 : IBM & Xilinx 편 오늘 개막한 국제 고성능 컴퓨팅, 네트워크, 스토리지학회 (International Conference for High Performance Computing, Networking, Storage, and An...

by IYD on 4년 전
91

사상 첫 10코어 인텔 데스크탑 프로세서 출시 임박

Translator : Daeguen Lee (※ 이 글은 WCCFTech의 원문 (링크) 을 번역한 것입니다.) 사상 첫 10코어 인텔 데스크탑 프로세서 출시 임박 최근 브로드웰-E CPU의 잠정적인 사양이 공개되었다. 이에 따르자면 인텔은 다시 한번 그들의 하이엔드 데스크탑 (High-end Desktop...

by IYD on 4년 전
148 11

차세대 콘솔을 대하는 AMD의 키워드 : 전성비, VR

Translator : Daeguen Lee (※ 이 글은 WCCFTech의 원문 (링크) 을 번역한 것입니다.) 차세대 콘솔을 대하는 AMD의 키워드 : 전성비, VR 최근 우리는 AMD의 관계자로부터 이 회사의 미래 계획에 관한 이야기를 들을 수 있었다. 그 계획 가운데는 차세대 콘솔이 자연스레 ...

by IYD on 4년 전
94 1

Helio X30 : 미디어텍의 기상천외한 10코어 AP

Translator : Daeguen Lee (※ 이 글은 WCCFTech의 원문 (링크) 을 번역한 것입니다.) Helio X30 : 기상천외한 4클러스터 10코어 AP 얼마 전까지만 하더라도 우리는 Helio X20의 후속작에 대해 'A72 코어를 좀 더 늘릴 수도 있겠지' 정도 이상을 예상하지 못했다. 오늘 미...

by IYD on 4년 전
170

막강한 GPU 내장한 엑시노스 8890 깜짝 발표

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) 삼성, 엑시노스 8890 깜짝 발표 삼성은 어제 기습적으로 그들의 새로운 플래그십 SoC인 엑시노스 8 시리즈를 발표했다. 정확히는 엑시노스 8890 하나를 발표한 것인데, 이 제품은 올 ...

by IYD on 4년 전
326 1

ARM의 야심작, 초 저전력 Cortex-A35 코어 공개

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) 웨어러블용 초 저전력 Cortex-A35 코어 공개 TechCon 행사의 일환으로 오늘 ARM은 자사의 새로운 저전력 CPU 아키텍처 Cortex-A35를 공개했다. 알다시피 ARM은 자신들이 라이선싱하는...

by IYD on 4년 전
947

이례적인 2+2코어 구조의 스냅드래곤 820

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) 이례적인 2+2코어 구조의 스냅드래곤 820 스냅드래곤 820을 둘러싼 루머가 다방면에서 불거지는 가운데, 그중 몇가지가 며칠 전의 행사에서 해결되었다. 퀄컴은 이날 스냅드래곤 820...

by IYD on 4년 전
169 3

엔비디아, 머신러닝 겨냥한 새 테슬라 출시

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) 엔비디아, 머신러닝 겨냥한 새 테슬라 출시 맥스웰은 천천히, 하지만 꾸준히 서버 시장에 진출하기 위해 시도하고 있다. 비록 맥스웰 아키텍처의 선천적인 한계인 배정밀도 연산기능...

by IYD on 4년 전
148 1
서버에 요청 중입니다. 잠시만 기다려 주십시오...