인텔, AMD, 엔비디아의 시행착오 : HPC와 AI라는 두 마리 토끼

by Dr.Lee on 2017년 06월 26일 01시 54분 (2년 전) 조회: 3,690 추천: 9

페이스북 퍼가기 extends_15 

인텔이 제온 파이 제품군의 가격을 대폭 인하했습니다. 최상위 모델인 제온 파이 프로세서 및 코프로세서 7290의 가격이 6500달러에서 3200달러로, 옴니패스 패브릭을 제공하는 파생 모델 7290F은 6700달러에서 3300달러로 떨어지는 등 각각 반값으로 내려진 것이 특징입니다. 이외에도 3800달러이던 7230이 1900달러로, 2500달러이던 7210이 1800달러로 인하되는 등 상후하박의 인하폭은 전형적인 '신제품을 맞이하기 직전의' 징후입니다.

 

xeonphi_11.png

(사진 : 제온 파이 프로세서)

 

현세대 제온 파이 코/프로세서는 "나이츠 랜딩" 아키텍처 기반으로, PCIe 인터페이스를 사용하는 쪽이 제온 파이 코프로세서 / SVLC-LGA3647이라는 소켓 규격을 사용하는 쪽이 제온 파이 프로세서라는 이름이 붙습니다. 코프로세서는 별도의 CPU가 있는 시스템에 확장 카드로 사용 가능하지만 프로세서는 직접 부팅가능한 것이 특징이죠. SVLC-LGA3647이라는 소켓 규격은 다소 생소할 수 있지만 스카이레이크-SP 기반 제온 스케일러블 프로세서 제품군이 사용하게 될 LGA3647과 같은 것입니다. 한결 친숙하죠?

 

xeonphi_10.pngxeonphi_12.jpg

(사진 : 나이츠 랜딩의 메쉬 구조(좌), 다이 이미지(우))

 

잠시 나이츠 랜딩의 구조를 복습해 봅시다. 지난주 스카이레이크-X/SP의 구조를 설명하며 익숙해진 메쉬 구조는 사실 제온 파이의 원형인 인텔 MIC (Many Integrated Core) 아키텍처에서 최초로 도입된 것입니다. 나이츠 랜딩은 512비트 벡터연산이 가능하도록 개조된 실버몬트 아키텍처를 기반으로 삼고 있습니다. 2개의 변형-실버몬트 코어를 하나로 묶어 (과거 코어 2 듀오와 유사하게) 이를 "타일" 이라는 단위로 취급하며, 36개의 타일과 2개의 메모리컨트롤러를 배치해 총 72코어를 제공하는 방식입니다.

 

xeonphi_14.jpg

 

인텔이 아무 이유 없이 팔리고 있는 제품의 가격을 내리지는 않습니다. 그렇다면 나이츠 랜딩의 가격이 내려진 까닭은 무엇일까요? 연내 출시가 공식화된 인텔의 차세대 제온 파이 "나이츠 밀"이 그 원인일 가능성이 높습니다. 나이츠 밀은 나이츠 랜딩과 호환되는 규격을 갖지만 AI 시장을 겨냥해 반정밀도(FP16), INT8 등을 강화한 버전입니다. 반면 현존하는 나이츠 랜딩은 전통적인 HPC 시장용으로 배정밀도(FP64) 연산성능이 좋죠. 이들은 서로 다른 시장을 지향하며 당분간 공존할 예정입니다. '당분간'이 언제까지냐고요?

 

xeonphi_13.jpg

 

앞서 인텔은 지난 2015년 나이츠 랜딩을 출시하며, 진정한 다음 세대 아키텍처인 "나이츠 힐"을 예고한 바 있으나 이후 한동안 로드맵에서 사라져 있었습니다. 주된 이유는 역시 10nm 공정으로의 이전이 순탄치 않았기 때문이겠죠. 발음도 비슷하게 오늘 갑툭튀한 나이츠 밀이 그 자리를 대체하는 것이라 오인하기 쉽지만 나이츠 힐은 10nm 제조공정으로 생산되는, HPC와 AI 시장을 동시에 공략할 전혀 다른 제품입니다. 반면 나이츠 밀은 HPC 시장을 겨냥하지 않고, 나이츠 랜딩과 같은 14nm 제조공정을 사용하는 차이점이 있습니다.

 

요약하자면 인텔은 나이츠 랜딩을 소폭 개량한 나이츠 밀을 투입함으로써 뜨고 있는 AI 시장의 수요에 대응하려는 것입니다. 제조공정을 진화시키지 않으면서 반정밀도 / INT8 등 '더 낮은 정밀도'의 연산성능을 발전시키는 방향은 두 세대 전 엔비디아가 추구했던 것과 일치합니다. 당시 엔비디아는 TSMC의 28nm 판형 공정에 발목을 잡힌 채 케플러-맥스웰의 2세대를 끌었고, 배정밀도 성능을 중시한 GK110의 후속으로 이를 제거한 GM100을 투입한 한편 모바일 시장에서 반정밀도 가속 기능을 시범 도입한 적이 있습니다.

 

vega01.png

 

한편, 조만간 등장이 예정된 AMD의 새 GPU "베가" 역시 나이츠 밀과 비슷한 의의를 갖는 것으로 보입니다. 지난 1월 공개한 베가 아키텍처 개요에 따르면 베가는 반정밀도 및 INT8 연산 가속에 최적화되어 있음을 강조했으나 전통적으로 AMD GPU의 강점이던 배정밀도 연산에 대해서는 언급이 없었습니다. 당시 그러한 이유로 '전통적 의미에서의 슈퍼컴퓨팅에는 적합하다고 보기 어렵(이상 위의 링크 중에서 발췌)' 다는 소결론을 지은 바 있었고, 얼마 전 이를 뒷받침할 만한 단서가 누출되었지요.

 

 

 

 

요약하자면 베가는 좋은 성능을 가질 것이지만 HPC 시장을 위해서는 다음 세대 GPU인 나비가 나와야 한다는 것인데 전후의 맥락을 종합할 때 '베가가 HPC 시장에 적합하지 않은' 단 하나의 이유가 배정밀도 연산성능의 부재로 좁혀지지 않을 수 없습니다.

 

국내 매체로 옮겨지며 다소간 오역이 붙어 베가의 (비-엔터프라이즈 영역에서의, 즉 일반 소비자=게이머용의) 성능 자체를 부정적으로 묘사한 것처럼 알려지기도 했으나 일단 저 트윗들이 언급하는 내용은 매우 명확합니다. 베가는 HPC 시장에 적합하지 않다는 것. 그리고 그 후속작이 될 "나비" 는 HPC와 AI 시장을 모두 만족시킬 수 있으리라는 것. 이로부터 나비는 배정밀도와 낮은 정밀도를 모두 지원할 것임을 엿볼 수도 있습니다. 정확히 나이츠 밀-나이츠 힐로 이어지는 인텔의 행보와 닮은꼴을 그리고 있습니다.

 

vega02.jpg

 

이렇듯 인텔과 AMD는 AI에 특화된 (=낮은 정밀도의 연산성능에 특화된) 칩을 먼저 내놓고, HPC와 AI 시장에 대응하는 연산성능을 집대성한 칩을 후속으로 내놓는 '단계별 접근'을 취하는 점에서 닮아 있습니다. 제조공정이 두 세대 지연된 끝에 차차기 아키텍처 (나이츠 힐, 나비) 가 도래할 시기에나 신공정을 도입하는 것도 우연의 일치이겠지만 같은 부분입니다.

 

한편, 엔비디아는 이들과 대조적인 접근법을 취하고 있습니다. 이미 지난달 공개된 "볼타"는 반정밀도 / INT8 연산 가속을 지원할 뿐만 아니라 칩 내부에 (일종의 행렬연산용 고정기능 ASIC인) '텐서 코어'를 내장해 행렬연산을 더욱 빨리 수행할 수 있게 되었습니다. AI 시장을 공략하기 위해 아키텍처를 아낌없이 개조한 것이죠. 그러면서도 뛰어난 배정밀도 연산성능을 유지해 현존하는 GPU 중 AI 용도로도, HPC 용도로도 최고의 성능을 보이게 되었습니다.

 

volta01.png

(사진 : GV100 칩셋 블록 다이어그램)

 

이는 앞서 케플러-맥스웰 과도기에 배정밀도 연산성능을 들어내버린 것과는 전혀 다른 움직임입니다. 맥스웰-파스칼로 오며 최상위 GP100 칩셋의 배정밀도 성능은 회복되었지만, 이 시기 엔비디아는 아예 설계노선이 전혀 다른 두 칩을 투 톱으로 내세우며 GP100은 배정밀도와 반정밀도 연산에 특화시키고, GP102는 INT8 연산에 특화시키는 대신 반정밀도 성능을 의도적으로 제한하는 쌍봉형 라인업을 구축합니다. 그러나 볼타에서는, 적어도 최상위 칩셋인 GV100만큼은 어떤 정밀도에서도 연산성능을 희생시키지 않은 것입니다.

 

다만 이러한 접근법의 차이를 단순히 '반대' 로만은 볼 수 없는 것 같기도 합니다. 앞서 언급했듯 엔비디아 역시 두 세대 전에는 이들과 같은 시행착오(?)를 겪은 바 있고 그로부터 도출된 것이 지금의 행보일 테니까요. '지금 당장'의 단면으로 보아 대척점에 선듯한 인텔-AMD vs 엔비디아의 접근법 차이는 시간차를 두고 반복되는 역사의 흐름이었을 뿐인지도 모릅니다.

extends_15

댓글 5

Profile

ihatesniper

2년 전

오 고찰과 통찰에 감탄하고 갑니다. 결국 시행착오가 공평하게 돌아가는걸까요.

댓글

Profile

위네

2년 전

인텔의 10nm가 언제 제품으로 나올지 불분명하고, 암드는 베가를 쭉쭉 뒤로 미룬 전력이 있으니 내년까지도 볼타 혼자서 승승장구하겠네요
엔디비아는 물건은 정말 잘 만드는데 이름가지고 장난을 치니까 잘 알아보고 골라도 뒤가 구린 느낌이에요

댓글

신림동

2년 전

정보 수집력과 글 솜씨에 또 한번 놀라고 갑니다.

댓글

RuBisCO

2년 전

엔비디아쪽이 앞서가고 있다는 쪽이 좀 더 맞겠지요. 그나저나 구글이 과연 TPU를 시장에 풀지 아니면 사내에서만 독점할지 궁금해집니다. 단순히 AI 용도의 효율만으로는 가장 앞서고 있는데 과연...

댓글

아하하

2년 전

경쟁은 좋은것!!

댓글

사진 및 파일 첨부

여기에 파일을 끌어 놓거나 왼쪽의 버튼을 클릭하세요.

파일 크기 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )
 
VGA

캡사이신 이벤트 : SIGGRAPH 2017 [LIVE]

안녕하세요 독자 여러분. 저는 지금 로스앤젤레스에서 개최되는 SIGGRAPH 2017 학회와 이에 연접하여 개최된 AMD의 라데온 베가 및 라이젠 스레드리퍼 테크 데이 행사에 참석하고 있습니다. 이벤트의 존재 자체가 이 글이 등록될 CAPSAICIN : SIGGRAPH 2017 행사 개막 전...

by Dr.Lee on 2년 전
1,341 1
CPU

라이젠 3 미니 리뷰 : AMD 남하 대작전 (7.29 내용추가)

안녕하세요 독자 여러분. 이 글이 공개된 현 시간부로 (한국시간 기준 7월 27일 오후 10시) 엠바고가 해제된 라이젠 3을 소개해드리기 위해 오랜만에 카드뉴스를 만들었습니다. 아니, 정확히는 만들다 말았습니다. 모종의 사정으로 인해 엠바고 해제 시간까지 제가 이 글...

by iMola on 2년 전
4,890 6

열심히 일한 당신 떠나라 : 휴가를 위한 앱 3종 세트

긴 장마도 끝을 보이고, 본격적으로 태양빛이 내리쬐는 여름이 시작되었다. 그리고 뜨거운 날씨와 함께 본격적인 피서 휴가 역시 떠날 때가 되었다. 휴가 때 집에서 만사를 제쳐두고 쉬고 싶은 사람도 있을 것이고, 휴양지에서 여유를 즐기는 사람, 배낭 하나 둘러매고 ...

by iMola on 2년 전
601

세계 이모지의 날 맞아 새로운 이모지를 선보인 애플

안녕하세요, 백투더맥의 에디터를 맡고 있는 쿠도군이라고 합니다. 첫 인사글을 겸해서 백투더맥에 쓴 글을 여기로 옮겨오게 됐습니다. 잘 부탁드립니다! 지난 7월 17일은 ‘세계 이모지의 날(World Emojis Day)’였습니다. 애플은 이 날을 기념해 올해 말 iOS와 macOS, 그...

by 쿠도군 on 2년 전
535

'맥은 비싸다'는 편견을 깨다 : iMac(Retina 5K, 2017) 리뷰

애플 로고가 그려진 컴퓨터는 특유의 날렵한 디자인과 함께 비싸다라는 이미지로 많은 사람들에게 각인되어 있다. 그리고 실제로도 애플이 판매하는 컴퓨터의 가격은 결코 저렴하지 않다. 현재 애플이 판매하고 있는 컴퓨터 중 가장 저렴한 모델은 62만원부터 시작하는 ...

by iMola on 2년 전
9,035 20
CPU

스카이레이크-SP 제온 VS EPYC 벤치마크 (아난드텍 기사 번역)

오늘 아침은 서버 시장에 매우 흥미로운 전환점이 되었다. 스카이레이크-SP 아키텍처 기반의 새로운 제온 스케일러블 프로세서 (제온 SP) 제품군이 정식으로 발표된 것이다. 이들은 새로운 플랫폼과 옴니패스 인터커넥트 패브릭 등 풍성한 신기술로 무장하고 있다. 코어 ...

by Dr.Lee on 2년 전
6,079 6

아이맥 프로 옵션별 가격 예상 : 저평가된 맥의 가치

WWDC17에서 맛보기로 깜짝 공개된 아이맥 프로. 27인치 아이맥의 형상에 단지 스페이스 그레이를 입혔을 뿐인 이 녀석이 보일듯말듯한 실루엣으로 키노트에 등장하는 순간 가슴은 왜 그리 두근거리던지. 저 혼자만의 경험은 아니었을 거라 믿습니다. 아이맥 프로를 설명...

by Dr.Lee on 2년 전
3,904 5
CPU

인텔, AMD, 엔비디아의 시행착오 : HPC와 AI라는 두 마리 토끼

인텔이 제온 파이 제품군의 가격을 대폭 인하했습니다. 최상위 모델인 제온 파이 프로세서 및 코프로세서 7290의 가격이 6500달러에서 3200달러로, 옴니패스 패브릭을 제공하는 파생 모델 7290F은 6700달러에서 3300달러로 떨어지는 등 각각 반값으로 내려진 것이 특징입...

by Dr.Lee on 2년 전
3,690 5 9
CPU

링 구조를 탈피한 스카이레이크-X/SP의 설계방식

인텔은 2011년 출시한 샌디브릿지부터 (정확히는 웨스트미어-EX부터) 링 구조를 도입해 코어 수 증가에 따른 복잡도를 완화해온 바 있습니다. 이전까지의 크로스바 구조에서 최대 8코어에 그쳤던 것과 대조적으로 링 구조를 채택한 최초의 CPU 웨스트미어-EX는 10코어로 ...

by Dr.Lee on 2년 전
4,023 11
VGA

PCI-Express 대역폭과 그래픽카드

개요 “내가 사용하는 메인보드는 PCI-Express 3.0을 지원하지 않는데 성능의 하락이 있는것이 아닐까?, 나는 멀티 그래픽카드 구성을 사용하는데 HEDT플랫폼을 사용하지 않으면 성능을 100%사용할 수 없는것이 아닐까?” 라는 의문을 가지고 계신분들이 계실겁니다. 결론...

by Archost on 2년 전
8,724 9

WWDC17, 애플이 풀어놓은 선물 보따리 - 하드웨어 편

원래, WWDC는 개발자를 위한 행사이다. 그리고 이번 WWDC에는 충분히 만족스러운 소프트웨어들이 그 내용을 장식했다. 하지만 애플은 이번 WWDC를 그냥 흘려 보낼 생각이 없었나보다. 오늘 애플의 기조연설은 시작부터 급했다. 팀 쿡은 무대에서 오늘 여섯가지 중요한 이...

by iMola on 2년 전
2,317 5

WWDC17, 애플이 풀어놓은 선물 보따리 - 소프트웨어편

산호세에서 애플의 연례 개발자 컨퍼런스인 WWDC17이 그 막을 올렸다. 행사의 시작을 알리며, 가장 이목이 집중되는 기조연설에서 애플은 두시간 삼십여분가량을 가득채운 선물 보따리를 풀어놓았다. 새로운 하드웨어를 기대하는 많은 사람들에게 기대 이하였던 적이 많...

by iMola on 2년 전
2,036 5
CPU

인텔의 14-18코어 HEDT CPU는 현존하지 않는다?

유명한 하드웨어 리뷰 유튜브 채널 Linus Tech Tips / LTT에서 평소와 사뭇 다른 어조의 동영상 칼럼을 하나 게시했습니다. 제목은 "I have something to say - Core i9 & X299". 뭔가 간절히 하고 싶은 말이 있는 것 같죠. 여느 LTT의 리뷰가 그렇듯 영상 초반부터 3분 ...

by Dr.Lee on 2년 전
8,680 12
CPU

인텔, 최대 18코어 스카이레이크-X 전격 발표

인텔은 오늘, 자사의 컨슈머 사업부이자 가장 큰 사업부인 클라이언트 컴퓨팅 그룹의 대표(GM) 그레고리 브라이언트 부사장의 입을 빌어 새로운 코어 X 시리즈 HEDT CPU를 발표했다. 알다시피 스카이레이크 아키텍처에 기반한 이 제품이 공개된 오늘은 5월 30일, 2017년 ...

by Dr.Lee on 2년 전
4,485 4

사랑과 전쟁 : 도시바, 샌디스크, 그리고 웨스턴디지털

도시바의 메모리사업부 매각이 한창 추진되는 가운데, 그간 침묵을 지키던 도시바-샌디스크 연합의 한 축 샌디스크가 어깃장을 놓을 조짐을 보이기 시작했다. 이들은 지난 2005년 낸드 플래시메모리 생산을 위한 공동자회사를 조인트 벤처로 설립, 각자의 브랜드를 붙이...

by Dr.Lee on 2년 전
1,244 1
CPU

반도체 수율에 관한 짧은 칼럼 : 에픽, 라이젠, 스윗 스팟

글로벌파운드리의 14LPP 제조공정이 매우 안정화되어, Zen 8코어가 모두 살아 있는 라이젠과 라이젠 스레드리퍼, 에픽 모두의 원형인 제플린 다이의 수율이 80%에 이른다는 이 글을 보고 문득 궁금해져 계산해 보았다. 머피의 수율모델에 따르면 반도체의 수율은 아래의 ...

by Dr.Lee on 2년 전
4,810 7

아이패드, 이렇게 사용합니다 : 일상편

이번 시리즈부터는 카드뉴스를 나레이션이 포함된 영상 형태로도 제공합니다. 영상 형태의 콘텐츠가 보고싶으신 분들은 영상을, 기존과 같은 웹 형식의 콘텐츠가 좋으신 분들은 스크롤을 내리시면서 읽으시면 되겠습니다. 얼마 전 올린 아이패드(2017) 자세히 알아보기는...

by iMola on 2년 전
3,031 2

애플과 접근성 : 세계 접근성 인식의 날을 맞아서

사진 : GAAD 5월 18일인 오늘은 우리에게 특별한 의미가 있습니다. 우리나라의 민주주의를 얻어내기 위해 일어난 5.18 민주화 운동이 있었던 날이기 때문입니다. 하지만 바로 오늘 5월 18일 목요일은 또 다른 의미를 가지고 있는 날이기도 합니다. 오늘은 Global Accessi...

by iMola on 2년 전
702 1
CPU

권불십년 : 9년 집권이 끝나다

근래 보기드문 숨가쁜 한 주였다. 지난주 오늘 들어선 새 정부는 한숨 돌릴 새도 없이 곧바로 임기를 개시했으며 지난 4년, 나아가 지난 9년간 차츰 굽어가며 지나온 궤도를 그 반대 방향으로 돌려놓기 위해 고군분투할 것이다. 9년. 아홉수. 금방이라도 끓어오를 것 같...

by Dr.Lee on 2년 전
4,851 7
VGA

지포스 GTX 1070, 1060의 ROP에 관한 비밀

지난 세대 지포스 GTX 970의 메모리 / ROP 스캔들을 기억하는 분께는 묘한 기분을 불러일으킬 수도 있을텐데, 이 글에서는 지포스 GTX 1070, 1060의 ROP에 관한 잘 알려지지 않은 사실을 다뤄 보려 합니다. 대외적으로 VGA 계산기가 공개되지 않은지는 벌써 몇달이 되어...

by Dr.Lee on 2년 전
3,349 3
서버에 요청 중입니다. 잠시만 기다려 주십시오...