하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[CPU] 인텔, AMD, 엔비디아의 시행착오 : HPC와 AI라는 두 마리 토끼

Dr.Lee | 조회 2769 | 추천 8 | 2017.06.26. 01:54 http://drmola.com/pc_column/204281

인텔이 제온 파이 제품군의 가격을 대폭 인하했습니다. 최상위 모델인 제온 파이 프로세서 및 코프로세서 7290의 가격이 6500달러에서 3200달러로, 옴니패스 패브릭을 제공하는 파생 모델 7290F은 6700달러에서 3300달러로 떨어지는 등 각각 반값으로 내려진 것이 특징입니다. 이외에도 3800달러이던 7230이 1900달러로, 2500달러이던 7210이 1800달러로 인하되는 등 상후하박의 인하폭은 전형적인 '신제품을 맞이하기 직전의' 징후입니다.

 

xeonphi_11.png

(사진 : 제온 파이 프로세서)

 

현세대 제온 파이 코/프로세서는 "나이츠 랜딩" 아키텍처 기반으로, PCIe 인터페이스를 사용하는 쪽이 제온 파이 코프로세서 / SVLC-LGA3647이라는 소켓 규격을 사용하는 쪽이 제온 파이 프로세서라는 이름이 붙습니다. 코프로세서는 별도의 CPU가 있는 시스템에 확장 카드로 사용 가능하지만 프로세서는 직접 부팅가능한 것이 특징이죠. SVLC-LGA3647이라는 소켓 규격은 다소 생소할 수 있지만 스카이레이크-SP 기반 제온 스케일러블 프로세서 제품군이 사용하게 될 LGA3647과 같은 것입니다. 한결 친숙하죠?

 

xeonphi_10.pngxeonphi_12.jpg

(사진 : 나이츠 랜딩의 메쉬 구조(좌), 다이 이미지(우))

 

잠시 나이츠 랜딩의 구조를 복습해 봅시다. 지난주 스카이레이크-X/SP의 구조를 설명하며 익숙해진 메쉬 구조는 사실 제온 파이의 원형인 인텔 MIC (Many Integrated Core) 아키텍처에서 최초로 도입된 것입니다. 나이츠 랜딩은 512비트 벡터연산이 가능하도록 개조된 실버몬트 아키텍처를 기반으로 삼고 있습니다. 2개의 변형-실버몬트 코어를 하나로 묶어 (과거 코어 2 듀오와 유사하게) 이를 "타일" 이라는 단위로 취급하며, 36개의 타일과 2개의 메모리컨트롤러를 배치해 총 72코어를 제공하는 방식입니다.

 

xeonphi_14.jpg

 

인텔이 아무 이유 없이 팔리고 있는 제품의 가격을 내리지는 않습니다. 그렇다면 나이츠 랜딩의 가격이 내려진 까닭은 무엇일까요? 연내 출시가 공식화된 인텔의 차세대 제온 파이 "나이츠 밀"이 그 원인일 가능성이 높습니다. 나이츠 밀은 나이츠 랜딩과 호환되는 규격을 갖지만 AI 시장을 겨냥해 반정밀도(FP16), INT8 등을 강화한 버전입니다. 반면 현존하는 나이츠 랜딩은 전통적인 HPC 시장용으로 배정밀도(FP64) 연산성능이 좋죠. 이들은 서로 다른 시장을 지향하며 당분간 공존할 예정입니다. '당분간'이 언제까지냐고요?

 

xeonphi_13.jpg

 

앞서 인텔은 지난 2015년 나이츠 랜딩을 출시하며, 진정한 다음 세대 아키텍처인 "나이츠 힐"을 예고한 바 있으나 이후 한동안 로드맵에서 사라져 있었습니다. 주된 이유는 역시 10nm 공정으로의 이전이 순탄치 않았기 때문이겠죠. 발음도 비슷하게 오늘 갑툭튀한 나이츠 밀이 그 자리를 대체하는 것이라 오인하기 쉽지만 나이츠 힐은 10nm 제조공정으로 생산되는, HPC와 AI 시장을 동시에 공략할 전혀 다른 제품입니다. 반면 나이츠 밀은 HPC 시장을 겨냥하지 않고, 나이츠 랜딩과 같은 14nm 제조공정을 사용하는 차이점이 있습니다.

 

요약하자면 인텔은 나이츠 랜딩을 소폭 개량한 나이츠 밀을 투입함으로써 뜨고 있는 AI 시장의 수요에 대응하려는 것입니다. 제조공정을 진화시키지 않으면서 반정밀도 / INT8 등 '더 낮은 정밀도'의 연산성능을 발전시키는 방향은 두 세대 전 엔비디아가 추구했던 것과 일치합니다. 당시 엔비디아는 TSMC의 28nm 판형 공정에 발목을 잡힌 채 케플러-맥스웰의 2세대를 끌었고, 배정밀도 성능을 중시한 GK110의 후속으로 이를 제거한 GM100을 투입한 한편 모바일 시장에서 반정밀도 가속 기능을 시범 도입한 적이 있습니다.

 

vega01.png

 

한편, 조만간 등장이 예정된 AMD의 새 GPU "베가" 역시 나이츠 밀과 비슷한 의의를 갖는 것으로 보입니다. 지난 1월 공개한 베가 아키텍처 개요에 따르면 베가는 반정밀도 및 INT8 연산 가속에 최적화되어 있음을 강조했으나 전통적으로 AMD GPU의 강점이던 배정밀도 연산에 대해서는 언급이 없었습니다. 당시 그러한 이유로 '전통적 의미에서의 슈퍼컴퓨팅에는 적합하다고 보기 어렵(이상 위의 링크 중에서 발췌)' 다는 소결론을 지은 바 있었고, 얼마 전 이를 뒷받침할 만한 단서가 누출되었지요.

 

 

 

 

요약하자면 베가는 좋은 성능을 가질 것이지만 HPC 시장을 위해서는 다음 세대 GPU인 나비가 나와야 한다는 것인데 전후의 맥락을 종합할 때 '베가가 HPC 시장에 적합하지 않은' 단 하나의 이유가 배정밀도 연산성능의 부재로 좁혀지지 않을 수 없습니다.

 

국내 매체로 옮겨지며 다소간 오역이 붙어 베가의 (비-엔터프라이즈 영역에서의, 즉 일반 소비자=게이머용의) 성능 자체를 부정적으로 묘사한 것처럼 알려지기도 했으나 일단 저 트윗들이 언급하는 내용은 매우 명확합니다. 베가는 HPC 시장에 적합하지 않다는 것. 그리고 그 후속작이 될 "나비" 는 HPC와 AI 시장을 모두 만족시킬 수 있으리라는 것. 이로부터 나비는 배정밀도와 낮은 정밀도를 모두 지원할 것임을 엿볼 수도 있습니다. 정확히 나이츠 밀-나이츠 힐로 이어지는 인텔의 행보와 닮은꼴을 그리고 있습니다.

 

vega02.jpg

 

이렇듯 인텔과 AMD는 AI에 특화된 (=낮은 정밀도의 연산성능에 특화된) 칩을 먼저 내놓고, HPC와 AI 시장에 대응하는 연산성능을 집대성한 칩을 후속으로 내놓는 '단계별 접근'을 취하는 점에서 닮아 있습니다. 제조공정이 두 세대 지연된 끝에 차차기 아키텍처 (나이츠 힐, 나비) 가 도래할 시기에나 신공정을 도입하는 것도 우연의 일치이겠지만 같은 부분입니다.

 

한편, 엔비디아는 이들과 대조적인 접근법을 취하고 있습니다. 이미 지난달 공개된 "볼타"는 반정밀도 / INT8 연산 가속을 지원할 뿐만 아니라 칩 내부에 (일종의 행렬연산용 고정기능 ASIC인) '텐서 코어'를 내장해 행렬연산을 더욱 빨리 수행할 수 있게 되었습니다. AI 시장을 공략하기 위해 아키텍처를 아낌없이 개조한 것이죠. 그러면서도 뛰어난 배정밀도 연산성능을 유지해 현존하는 GPU 중 AI 용도로도, HPC 용도로도 최고의 성능을 보이게 되었습니다.

 

volta01.png

(사진 : GV100 칩셋 블록 다이어그램)

 

이는 앞서 케플러-맥스웰 과도기에 배정밀도 연산성능을 들어내버린 것과는 전혀 다른 움직임입니다. 맥스웰-파스칼로 오며 최상위 GP100 칩셋의 배정밀도 성능은 회복되었지만, 이 시기 엔비디아는 아예 설계노선이 전혀 다른 두 칩을 투 톱으로 내세우며 GP100은 배정밀도와 반정밀도 연산에 특화시키고, GP102는 INT8 연산에 특화시키는 대신 반정밀도 성능을 의도적으로 제한하는 쌍봉형 라인업을 구축합니다. 그러나 볼타에서는, 적어도 최상위 칩셋인 GV100만큼은 어떤 정밀도에서도 연산성능을 희생시키지 않은 것입니다.

 

다만 이러한 접근법의 차이를 단순히 '반대' 로만은 볼 수 없는 것 같기도 합니다. 앞서 언급했듯 엔비디아 역시 두 세대 전에는 이들과 같은 시행착오(?)를 겪은 바 있고 그로부터 도출된 것이 지금의 행보일 테니까요. '지금 당장'의 단면으로 보아 대척점에 선듯한 인텔-AMD vs 엔비디아의 접근법 차이는 시간차를 두고 반복되는 역사의 흐름이었을 뿐인지도 모릅니다.

  • |
  • |
  1. xeonphi_12.jpg (File Size:457.7KB/Download:0)
facebook twitter google plus pinterest kakao story band

서명

Profile image

Dr.Lee

(level 30)

* 적용중인 트로피 :

Profile image ihatesniper 2017.06.26 09:33
오 고찰과 통찰에 감탄하고 갑니다. 결국 시행착오가 공평하게 돌아가는걸까요.
Profile image 위네 2017.06.26 19:10
인텔의 10nm가 언제 제품으로 나올지 불분명하고, 암드는 베가를 쭉쭉 뒤로 미룬 전력이 있으니 내년까지도 볼타 혼자서 승승장구하겠네요
엔디비아는 물건은 정말 잘 만드는데 이름가지고 장난을 치니까 잘 알아보고 골라도 뒤가 구린 느낌이에요
Profile image 신림동 2017.06.26 22:01
정보 수집력과 글 솜씨에 또 한번 놀라고 갑니다.
Profile image RuBisCO 2017.06.27 22:57
엔비디아쪽이 앞서가고 있다는 쪽이 좀 더 맞겠지요. 그나저나 구글이 과연 TPU를 시장에 풀지 아니면 사내에서만 독점할지 궁금해집니다. 단순히 AI 용도의 효율만으로는 가장 앞서고 있는데 과연...
Profile image 아하하 2017.07.05 05:12
경쟁은 좋은것!!
  • 특별할 것 없어요 : 갤럭시 노트 FE 성능리뷰 [모바일] 특별할 것 없어요 : 갤럭시 노트 FE 성능리뷰 [6] updatefile

    작년, 삼성의 플래그십 스마트폰인 갤럭시 노트 7이 처음 공개될 때만 해도 갤럭시 노트 7이 이런 최후를 맞을 것이라 예상하는 사람은 많지 않았습니다. 갤럭시 노트 7은 화려하게 출시되었지만 화려하게 폭발했고, 결국 모든 제품이 리콜되기에 이르렀습니다. 하지만 갤럭시 노트 7의 이런 운명에도 불구하고, 갤럭시 노트...

    • iMola |
    • 17.07.20 |
    • 조회 825 |
  • '맥은 비싸다'는 편견을 깨다 : iMac(Retina 5K, 2017) 리뷰 '맥은 비싸다'는 편견을 깨다 : iMac(Retina 5K, 2017) 리뷰 [16] file

    애플 로고가 그려진 컴퓨터는 특유의 날렵한 디자인과 함께 비싸다라는 이미지로 많은 사람들에게 각인되어 있다. 그리고 실제로도 애플이 판매하는 컴퓨터의 가격은 결코 저렴하지 않다. 현재 애플이 판매하고 있는 컴퓨터 중 가장 저렴한 모델은 62만원부터 시작하는 맥 미니 모델이다. 하지만 이 맥 미니는 모니터가 포함...

    • iMola |
    • 17.07.17 |
    • 조회 2472 |
  • 스카이레이크-SP 제온 VS EPYC 벤치마크 (아난드텍 기사 번역) [CPU] 스카이레이크-SP 제온 VS EPYC 벤치마크 (아난드텍 기사 번역) [6] file

    오늘 아침은 서버 시장에 매우 흥미로운 전환점이 되었다. 스카이레이크-SP 아키텍처 기반의 새로운 제온 스케일러블 프로세서 (제온 SP) 제품군이 정식으로 발표된 것이다. 이들은 새로운 플랫폼과 옴니패스 인터커넥트 패브릭 등 풍성한 신기술로 무장하고 있다. 코어 수가 더욱 늘어난 것은 물론이다. 한편 지난 달에는 A...

    • Dr.Lee |
    • 17.07.12 |
    • 조회 2302 |
  • 아이맥 프로 옵션별 가격 예상 : 저평가된 맥의 가치 [etc] 아이맥 프로 옵션별 가격 예상 : 저평가된 맥의 가치 [5] file

    WWDC17에서 맛보기로 깜짝 공개된 아이맥 프로. 27인치 아이맥의 형상에 단지 스페이스 그레이를 입혔을 뿐인 이 녀석이 보일듯말듯한 실루엣으로 키노트에 등장하는 순간 가슴은 왜 그리 두근거리던지. 저 혼자만의 경험은 아니었을 거라 믿습니다. 아이맥 프로를 설명하는 많은 요소 중 제 가슴을 뛰게 한 건 무엇이었을까...

    • Dr.Lee |
    • 17.07.05 |
    • 조회 1887 |
  • 인텔, AMD, 엔비디아의 시행착오 : HPC와 AI라는 두 마리 토끼 [CPU] 인텔, AMD, 엔비디아의 시행착오 : HPC와 AI라는 두 마리 토끼 [5] file

    인텔이 제온 파이 제품군의 가격을 대폭 인하했습니다. 최상위 모델인 제온 파이 프로세서 및 코프로세서 7290의 가격이 6500달러에서 3200달러로, 옴니패스 패브릭을 제공하는 파생 모델 7290F은 6700달러에서 3300달러로 떨어지는 등 각각 반값으로 내려진 것이 특징입니다. 이외에도 3800달러이던 7230이 1900달러로, 250...

    • Dr.Lee |
    • 17.06.26 |
    • 조회 2769 |
  • 링 구조를 탈피한 스카이레이크-X/SP의 설계방식 [CPU] 링 구조를 탈피한 스카이레이크-X/SP의 설계방식 [11] file

    인텔은 2011년 출시한 샌디브릿지부터 (정확히는 웨스트미어-EX부터) 링 구조를 도입해 코어 수 증가에 따른 복잡도를 완화해온 바 있습니다. 이전까지의 크로스바 구조에서 최대 8코어에 그쳤던 것과 대조적으로 링 구조를 채택한 최초의 CPU 웨스트미어-EX는 10코어로 신고식을 치르기도 했죠. 그러나 링 구조에도 문제가 ...

    • Dr.Lee |
    • 17.06.16 |
    • 조회 3001 |
  • PCI-Express 대역폭과 그래픽카드 [VGA] PCI-Express 대역폭과 그래픽카드 [7] file

    개요 “내가 사용하는 메인보드는 PCI-Express 3.0을 지원하지 않는데 성능의 하락이 있는것이 아닐까?, 나는 멀티 그래픽카드 구성을 사용하는데 HEDT플랫폼을 사용하지 않으면 성능을 100%사용할 수 없는것이 아닐까?” 라는 의문을 가지고 계신분들이 계실겁니다. 결론부터 말하자면 “일정 속도 이상부터 차이가 없으며, 차...

    • Archost |
    • 17.06.16 |
    • 조회 2411 |
  • 인텔의 14-18코어 HEDT CPU는 현존하지 않는다? [CPU] 인텔의 14-18코어 HEDT CPU는 현존하지 않는다? [12] file

    유명한 하드웨어 리뷰 유튜브 채널 Linus Tech Tips / LTT에서 평소와 사뭇 다른 어조의 동영상 칼럼을 하나 게시했습니다. 제목은 "I have something to say - Core i9 & X299". 뭔가 간절히 하고 싶은 말이 있는 것 같죠. 여느 LTT의 리뷰가 그렇듯 영상 초반부터 3분 35초까지는 주인공 라이너스가 이번 컴퓨텍스 기간 중...

    • Dr.Lee |
    • 17.06.05 |
    • 조회 7070 |
  • 인텔, 최대 18코어 스카이레이크-X 전격 발표 [CPU] 인텔, 최대 18코어 스카이레이크-X 전격 발표 [4] file

    인텔은 오늘, 자사의 컨슈머 사업부이자 가장 큰 사업부인 클라이언트 컴퓨팅 그룹의 대표(GM) 그레고리 브라이언트 부사장의 입을 빌어 새로운 코어 X 시리즈 HEDT CPU를 발표했다. 알다시피 스카이레이크 아키텍처에 기반한 이 제품이 공개된 오늘은 5월 30일, 2017년 2분기이다. 2015년 3분기 스카이레이크가 출시된 이후...

    • Dr.Lee |
    • 17.05.31 |
    • 조회 3122 |
  • 반도체 수율에 관한 짧은 칼럼 : 에픽, 라이젠, 스윗 스팟 [CPU] 반도체 수율에 관한 짧은 칼럼 : 에픽, 라이젠, 스윗 스팟 [7] file

    글로벌파운드리의 14LPP 제조공정이 매우 안정화되어, Zen 8코어가 모두 살아 있는 라이젠과 라이젠 스레드리퍼, 에픽 모두의 원형인 제플린 다이의 수율이 80%에 이른다는 이 글을 보고 문득 궁금해져 계산해 보았다. 머피의 수율모델에 따르면 반도체의 수율은 아래의 2변수함수로 근사할 수 있다. 수율(yield rate)의 머...

    • Dr.Lee |
    • 17.05.26 |
    • 조회 2417 |