하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[CPU] 링 구조를 탈피한 스카이레이크-X/SP의 설계방식

Dr.Lee | 조회 3336 | 추천 14 | 2017.06.16. 13:43 http://drmola.com/pc_column/198827

인텔은 2011년 출시한 샌디브릿지부터 (정확히는 웨스트미어-EX부터) 링 구조를 도입해 코어 수 증가에 따른 복잡도를 완화해온 바 있습니다. 이전까지의 크로스바 구조에서 최대 8코어에 그쳤던 것과 대조적으로 링 구조를 채택한 최초의 CPU 웨스트미어-EX는 10코어로 신고식을 치르기도 했죠. 그러나 링 구조에도 문제가 없는 건 아니었으니 가장 큰 제약은 모든 코어와 메모리컨트롤러 / 노스브릿지 등이 한붓그리기로 폐곡선을 그려야 한다는 점이었습니다.

 

xeon_01.jpgxeon_02.jpg(출처 : CPU WARS : EPISODE VI - RETURN OF THE HAIFA)

 

이 제약은 초기에는 노출되지 않았으나 코어 수가 15개까지 증가한 아이비브릿지-EP/EX에 들어서며 문제가 되기 시작합니다. 통상적인 설계방식을 따르자면 최대 8행까지 코어가 2열 종대로 배치되어야 하는데, 길이가 길어지는 건 둘째치고 한 코어가 가장 먼 코어를 액세스하는 데 소요되는 레이턴시와 가장 가까운 코어를 액세스하는 데 소요되는 레이턴시가 큰 편차를 보이게 된 것이죠. 즉, 링 구조의 약점은 코어의 위치에 따른 레이턴시 편차에 있었습니다. 이를 줄이기 위해 아이비브릿지-EP/EX부터 인텔은 링 도메인을 분리하기 시작했고, 최초로 "완전히 분리된" 두 링 도메인 구조는 하스웰-EP/EX에서 선보였습니다.

 

xeon_03.png

 

특히 링 도메인이 분리되며, 일반적으로 쿼드채널 메모리컨트롤러를 탑재한 제온 CPU가 내부적으로는 링 도메인마다 듀얼채널 컨트롤러 하나씩을 따로 배치하는 식으로 '내부적인 2 CPU화'를 꾀하게 되었습니다. 어떻게 보면 AMD가 라이젠을 출시하며 CCX라는 구조를 도입하여 'CPU 내에서의 멀티 CPU화'를 꾀한 것과 닮은 전략이죠. 당시엔 이 사실이 잘 알려지지 않았는데 일부 벤치마크 등을 통해서만 간혹 오작동 (anomaly) 이 검출되는 정도였습니다.

 

anand_xeon.png

 

"Interestingly, the previous generation Xeons and the Xeon E5-2667 v3 need to use one thread per logical thread to use the full potential of the memory controller. The reason that the Xeon E5-2667 v3 shows similar behavior as the previous Xeons is that it is also a die with one dual ring and one memory controller. Also, 16 threads (one per physical core) is probably not enough to get the full potential of a quad channel DDR4-2133 memory subsystem. The new High Core Count (HCC, 14-18 core) Xeon E5 chips perform better with one thread per physical processor."

 

(출처 : AnandTech)

 

그렇지만 대외적으로 잘 알려지지 않았다고 하여 인텔 내부에서도 이 사실을 몰랐던 건 아닙니다. 오히려 매우 정확히 인지하고 있었고, 따라서 이로 인한 성능저하를 해결하기 위해 여러 노력을 기울였죠. 그 중 대표적인 것이 COD (Cluster on Die) 모드의 도입. 아주 러프하게 말해, 두 링 도메인을 넘나들며 데이터 트랜스퍼가 일어날 때 성능 저하가 발생하므로 링 도메인을 완전히 별개의 NUMA 도메인으로 인식하게 한 것입니다. 한 CPU 안에 두 도메인이 있어 문제가 되니 아예 CPU를 해체해 2개의 논리 CPU(소켓)로 만든 것이죠.

 

xeon_04.jpgxeon_05.jpg(출처 : CPU WARS : EPISODE VII - THE FOURTH AWAKENS)

 

하지만 브로드웰-EP/EX가 재차 24코어로 코어 수를 증가시키며 다시 하나의 링 도메인에 할당되는 코어 수가 임계점 근처에 도달하게 됩니다. 여태까지 인텔이 출시한 어떤 CPU도 하나의 링 도메인이 10개를 넘는 코어를 관할한 적이 없지만 브로드웰-EP/EX는 처음으로 12개를 찍었습니다. 그나마 실제 제온 E5로 출시된 모델은 코어 2개를 비활성화해 최대 22코어로 출시되었기에 링 도메인당 코어 수는 11개가 됩니다.

 

xeon_06.jpgxeon_07.jpgxeon_08.jpg

 

그래서인지는 모르겠지만, 아이비브릿지-E/EP/EX부터 하스웰-E/EP/EX에 이르기까지 상위 다이(HCC)로부터 하위 다이(LCC)를 파생하는 데 소요되는 재설계량을 최소화하는 경향이 있던 인텔이 브로드웰-E/EP/EX의 파생에는 이례적으로 다소 복잡한 재설계를 거쳤습니다. 그 결과 하위 다이의 링 도메인당 코어 수가 10개로 돌아온 것이 단순한 우연은 아니겠지요.

 

그 뒤를 이은 스카이레이크-X/SP. 최대 28코어를 탑재한다는 소식이 전해졌을 때 어떤 다이 구조를 갖게 될지는 대단한 관심사였습니다. 링 도메인당 14코어씩 2개의 링을 갖게 될까요? 일단 지난 3월의 Technology and Manufacturing Day 2017 행사에서 공개된 다이 이미지는 오히려 3개의 링에 도메인당 10코어를 붙인 모양에 가까워 보였습니다. 아니, 사실 30코어인지조차 불분명했습니다. 다른 코어들과 사뭇 다르게 표시된 2개의 유사-코어가 정말로 코어인지 확신이 없었기 때문이죠.

 

xeon_09.jpgxeon_10.png

 

한편 인텔은 지난 5월 30일 컴퓨텍스 개막에 발맞춰 최대 18코어를 갖는 코어 X 시리즈를 공개하며 그 다이 이미지를 함께 공개한 바 있습니다. 앞의 이미지와 비교해 볼 때 코어 X 시리즈(중에서도 18코어급)의 스카이레이크-X 다이는 스카이레이크-SP 최상위 다이(XCC)로부터 2열을 삭제한 중간급 다이(HCC)로 여겨집니다.

 

xeon_11.jpg

 

이제 남은 것은 단 하나, 코어 X 시리즈의 하위 모델에 적용될 것으로 예상되는 하위 다이(LCC)의 구성이죠. 여기에 우리가 참고할 수 있는 좋은 정보가 있습니다. 바로 10코어 코어 i9-7900X의 히트스프레더를 제거해 다이의 가로세로 크기를 측정한 사진이 공개되었기 때문이죠. 이에 따르면 스카이레이크-X/SP LCC 다이의 긴 변은 약 24.5mm, 짧은 변은 14.5mm 가량입니다. 종횡비는 약 1.6:1, 면적은 대략 355mm2. 이 숫자들을 유념하시기 바랍니다.

 

+ 2017.06.18 정정 : 최초 작성시 눈금 기록에 착오가 있었고 퇴고 과정에서 발견하지 못해 그대로 발행된 까닭에, 부득이하게 상기 수치를 정정합니다. 스카이레이크-X/SP LCC 다이의 긴 변은 24.5 -> 22.5mm, 짧은 변은 14.5 -> 14mm, 면적은 355 -> 315mm2.

 

xeon_12-1.jpgxeon_12-2.jpg

(출처 : GamersNexus)

 

다시 스카이레이크-X/SP XCC 및 HCC로 돌아옵시다. 이미 공개된 스카이레이크(=카비레이크)의 다이 사진과 비교해 혹시라도 인텔에 의해 편집되었을 수 있는 이미지를 최대한 원본에 가깝게 복원시키는 것이 목적입니다. 데스크탑용 스카이레이크는 코어당 256KB의 L2 캐시와 2MB의 L3캐시를 갖는데, 스카이레이크-X/SP에서 인텔은 그 비율을 변경해 코어당 1MB의 L2 캐시와 1.375MB의 L3 캐시로 조정한 바 있습니다. 우선 아래의 사진으로 두 다이에서 '코어' 부분의 유사성을 보겠습니다.
sky-die.001.png

스카이레이크는 코어의 위아래를 둘러싸는 구조로 L3 캐시가 배열되어 있는 반면 스카이레이크-X/SP는 코어의 한 면에 일렬로 배열되었다는 차이가 있습니다. 또한 L2 캐시 역시 크게 늘어난 만큼 배열이 다소 바뀌었지만 전체 면적비율은 용량과 거의 정비례하는 것으로 보입니다. 무엇보다 중요한 점은 캐시를 제외한 나머지 부분의 배열에서 유사성이 관찰되어, 이들 나머지 부분의 가로세로 비율에 맞춰 전체 다이 이미지를 재조정해 보는 것이 의미있겠단 점이죠. 다행히 슬라이드에 수록된 이미지 원본 속 스카이레이크-X/SP는 종횡비가 조작되지 않은 것 같습니다.

 

잠시 숲을 보겠습니다. 그렇다면 스카이레이크-SP XCC는 3개의 링 도메인으로 구성되는 것일까요? 결론부터 말하자면 "아니다" 입니다. Tom's Hardware에 따르면 스카이레이크-X/SP는 인텔이 제온 파이를 설계하며 사용했던 메쉬 구조를 적용했다고 합니다. 모든 코어와 L3 캐시, 메모리컨트롤러를 비롯한 각종 언코어 컴포넌트는 격자형으로 연결되어, 더 이상 링 구조 하에서의 배열 안배에 신경쓸 필요가 없습니다. 제온 파이는 이미 72코어까지 확장된 전력이 있으니 마찬가지로 앞으로의 제온 역시 그 정도에 이르기까지는 설계 걱정을 한시름 놓은 것으로 보입니다.

 

xeon_20.jpg

(출처 : Tom's Hardware)

 

여기서 재미있는 사실이 드러나는데 앞서 "유사-코어"라 명명했던 사뭇 다르게 생긴 부분이 실은 메모리컨트롤러였다는 것. 이로부터 자연히 스카이레이크-SP XCC 다이가 내추럴 본 28코어라는 사실이 입증됩니다. 동시에 스카이레이크-X/SP HCC 다이는 내추럴 본 18코어가 되죠. 그렇다면 LCC는? 이제부터가 재미있는 부분입니다.

 

지금까지 인텔이 공식적으로 스카이레이크-X/SP의 LCC 버전 다이를 가타부타 언급한 적이 없는 가운데 여러 매체에서는 최대 10코어 혹은 12코어로 의견이 갈려 있던 상황. 이달 중 10코어 모델까지만 선 출시한다는 점은 LCC 10코어 다이설의 정황증거가 되어 주기도 했고, 반대로 HCC 다이를 바탕으로 공개된 사진상의 종횡비에 맞게 잘라 내면 12코어가 된다는 설 역시 존재했습니다.

 

sky_sp.001.png

그러나 유사-코어가 메모리컨트롤러로 밝혀진 이상, 스카이레이크-X/SP LCC 다이는 후자의 파생 방식을 취하는 동시에 네이티브 10코어가 유력시됩니다. 즉 이달 중 선출시될 6-10코어 스카이레이크-X는 사실 LCC 다이를 모두 활용한 것일 가능성이 높습니다.

 

이제 이들의 면적을 유추해 보죠. 스카이레이크-X/SP LCC 다이는 앞서 355mm2 가량으로 실측된 기록이 있습니다. 이를 바탕으로 공개된 다이 이미지의 가로세로 픽셀 수를 찍어 추정해 보면 네이티브 18코어 HCC 다이의 경우 약 540-550mm2, 가장 큰 네이티브 28코어 XCC 다이는 약 780-790mm2로 계산됩니다. 이것이 맞다면 스카이레이크-SP XCC는 x86 역사상 최대 크기입니다. 하스웰-EP/EX의 662mm2는 물론 네할렘-EX의 684mm2마저 뛰어넘는 것이죠.

 

+ 2017.06.18 정정 : 최초 작성시 스카이레이크-X/SP LCC 다이의 면적 계산에 착오가 있었고 따라서 이에 기초해 계산된 HCC 및 XCC 다이의 면적 역시 비례하는 오차가 발생했으나 퇴고 과정에서 발견하지 못해 그대로 발행된 까닭에, 부득이하게 상기 수치를 정정합니다. LCC 다이의 면적은 355 -> 315mm2, HCC 다이는 540-550 -> 480-490mm2, XCC 다이는 780-790 -> 690-700mm2.

 

 

여러 가지 측면에서 스카이레이크-X/SP는 기념비적인 작품입니다. 인텔과 삼성/글로벌파운드리의 14nm 핀펫 공정엔 상당한 차이가 있겠지만, 이 글을 참조해 아주 러프하게 둘의 불량률을 비슷하게 잡고 수율을 비교하면 28코어 스카이레이크-SP XCC는 (4개의 8코어 제플린 다이로 구성되는) 32코어 EPYC보다 80% 더 비싼 생산단가를 가질 것으로 추정됩니다. 또한 18코어 스카이레이크-X/SP HCC는 (2개의 8코어 제플린 다이로 구성되는) 16코어 라이젠 스레드리퍼보다 정확히 2배 비싼 생산단가를 가질 것으로 추정됩니다. 인텔과 AMD의 근본적인 전략 차이를 엿볼 수 있는 대목입니다.

  • |
  • |
  1. xeon_10.png (File Size:620.3KB/Download:0)
facebook twitter google plus pinterest kakao story band

서명

Profile image

Dr.Lee

(level 30)

* 적용중인 트로피 :

Profile image Please& 2017.06.16 14:08
중간에 뭔가 이상한 짤이 하나 숨어있는거 같은데 말이지요. ㅋㅋ
Profile image Dr.Lee 2017.06.16 15:51
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
Profile image passmeby30 2017.06.17 02:18
ㅋㅋㅋㅋ 고심 끝에.. 댓글을 못 봤으면 몰랐을뻔 했네요
Profile image 떼삼사 2017.06.17 11:57
도대체 뭐가 숨어있는 겁니까? 저만 모르는 건가요..
Profile image 따미 2017.06.17 16:33
얼핏보면 모를것을.... 대단하십니다~
Profile image 무한창공 2017.06.17 19:51
댓글보고 짤 열심히 찾아봤네요. 고심했습니다. ㅋㅋㅋ
Profile image RuBisCO 2017.06.18 06:18
무어의 법칙이 무너진 끝에 다시 칩들 덩치가 무지막지하게 커지는군요 ㄷㄷㄷ
Profile image Dr.Lee 2017.06.26 21:28
(엠바고가 풀린 뒤 드러난) 스카이-X XCC 칩의 경우 해외 사이트마다 최소 677-최대 698mm2로 예상치에 다소 편차가 있는데, 어쨌든 네할렘-EX와 1, 2위를 다툴 정도의 거대한 칩인 것은 확실해 보입니다. 설마 다음번 '톡' 주기에 이것보다 더 커지지는 않겠죠...;;;;;;
Profile image 마라톤 2017.06.19 16:28
좋은 정보 감사합니다. ^_^
Profile image Dr.Lee 2017.06.26 21:28
읽어 주셔서 감사합니다!! ^-^
  • 라이젠 3 미니 리뷰 : AMD 남하 대작전 (7.29 내용추가) [CPU] 라이젠 3 미니 리뷰 : AMD 남하 대작전 (7.29 내용추가) [6] file

    안녕하세요 독자 여러분. 이 글이 공개된 현 시간부로 (한국시간 기준 7월 27일 오후 10시) 엠바고가 해제된 라이젠 3을 소개해드리기 위해 오랜만에 카드뉴스를 만들었습니다. 아니, 정확히는 만들다 말았습니다. 모종의 사정으로 인해 엠바고 해제 시간까지 제가 이 글을 붙들고 있을 수 없게 되었거든요. 따라서 이번 리...

    • iMola |
    • 17.07.27 |
    • 조회 2876 |
  • 다시 찾은 균형 : 원플러스 5 성능 리뷰 [모바일] 다시 찾은 균형 : 원플러스 5 성능 리뷰 [3] file

    Oneplus가 벌써 원플러스 5를 출시했습니다. 원플러스 5는 적당한 가격에 좋은 성능을 제공하는, 가격대 성능비에 초점을 맞추고 있는 스마트폰입니다. 원플러스 5는 퀄컴의 스냅드래곤 835를 탑재하고 있는데, 이 어플리케이션 프로세서는 엑시노스 8895와 함께 삼성의 플래그십 스마트폰인 갤럭시 S8 시리즈에도 들어가 있...

    • iMola |
    • 17.07.27 |
    • 조회 1435 |
  • 특별할 것 없어요 : 갤럭시 노트 FE 성능리뷰 [모바일] 특별할 것 없어요 : 갤럭시 노트 FE 성능리뷰 [8] file

    작년, 삼성의 플래그십 스마트폰인 갤럭시 노트 7이 처음 공개될 때만 해도 갤럭시 노트 7이 이런 최후를 맞을 것이라 예상하는 사람은 많지 않았습니다. 갤럭시 노트 7은 화려하게 출시되었지만 화려하게 폭발했고, 결국 모든 제품이 리콜되기에 이르렀습니다. 하지만 갤럭시 노트 7의 이런 운명에도 불구하고, 갤럭시 노트...

    • iMola |
    • 17.07.20 |
    • 조회 1609 |
  • '맥은 비싸다'는 편견을 깨다 : iMac(Retina 5K, 2017) 리뷰 '맥은 비싸다'는 편견을 깨다 : iMac(Retina 5K, 2017) 리뷰 [17] file

    애플 로고가 그려진 컴퓨터는 특유의 날렵한 디자인과 함께 비싸다라는 이미지로 많은 사람들에게 각인되어 있다. 그리고 실제로도 애플이 판매하는 컴퓨터의 가격은 결코 저렴하지 않다. 현재 애플이 판매하고 있는 컴퓨터 중 가장 저렴한 모델은 62만원부터 시작하는 맥 미니 모델이다. 하지만 이 맥 미니는 모니터가 포함...

    • iMola |
    • 17.07.17 |
    • 조회 3657 |
  • 스카이레이크-SP 제온 VS EPYC 벤치마크 (아난드텍 기사 번역) [CPU] 스카이레이크-SP 제온 VS EPYC 벤치마크 (아난드텍 기사 번역) [6] file

    오늘 아침은 서버 시장에 매우 흥미로운 전환점이 되었다. 스카이레이크-SP 아키텍처 기반의 새로운 제온 스케일러블 프로세서 (제온 SP) 제품군이 정식으로 발표된 것이다. 이들은 새로운 플랫폼과 옴니패스 인터커넥트 패브릭 등 풍성한 신기술로 무장하고 있다. 코어 수가 더욱 늘어난 것은 물론이다. 한편 지난 달에는 A...

    • Dr.Lee |
    • 17.07.12 |
    • 조회 3215 |
  • 아이맥 프로 옵션별 가격 예상 : 저평가된 맥의 가치 [etc] 아이맥 프로 옵션별 가격 예상 : 저평가된 맥의 가치 [5] file

    WWDC17에서 맛보기로 깜짝 공개된 아이맥 프로. 27인치 아이맥의 형상에 단지 스페이스 그레이를 입혔을 뿐인 이 녀석이 보일듯말듯한 실루엣으로 키노트에 등장하는 순간 가슴은 왜 그리 두근거리던지. 저 혼자만의 경험은 아니었을 거라 믿습니다. 아이맥 프로를 설명하는 많은 요소 중 제 가슴을 뛰게 한 건 무엇이었을까...

    • Dr.Lee |
    • 17.07.05 |
    • 조회 2470 |
  • 인텔, AMD, 엔비디아의 시행착오 : HPC와 AI라는 두 마리 토끼 [CPU] 인텔, AMD, 엔비디아의 시행착오 : HPC와 AI라는 두 마리 토끼 [5] file

    인텔이 제온 파이 제품군의 가격을 대폭 인하했습니다. 최상위 모델인 제온 파이 프로세서 및 코프로세서 7290의 가격이 6500달러에서 3200달러로, 옴니패스 패브릭을 제공하는 파생 모델 7290F은 6700달러에서 3300달러로 떨어지는 등 각각 반값으로 내려진 것이 특징입니다. 이외에도 3800달러이던 7230이 1900달러로, 250...

    • Dr.Lee |
    • 17.06.26 |
    • 조회 3135 |
  • 링 구조를 탈피한 스카이레이크-X/SP의 설계방식 [CPU] 링 구조를 탈피한 스카이레이크-X/SP의 설계방식 [11] file

    인텔은 2011년 출시한 샌디브릿지부터 (정확히는 웨스트미어-EX부터) 링 구조를 도입해 코어 수 증가에 따른 복잡도를 완화해온 바 있습니다. 이전까지의 크로스바 구조에서 최대 8코어에 그쳤던 것과 대조적으로 링 구조를 채택한 최초의 CPU 웨스트미어-EX는 10코어로 신고식을 치르기도 했죠. 그러나 링 구조에도 문제가 ...

    • Dr.Lee |
    • 17.06.16 |
    • 조회 3336 |
  • PCI-Express 대역폭과 그래픽카드 [VGA] PCI-Express 대역폭과 그래픽카드 [9] file

    개요 “내가 사용하는 메인보드는 PCI-Express 3.0을 지원하지 않는데 성능의 하락이 있는것이 아닐까?, 나는 멀티 그래픽카드 구성을 사용하는데 HEDT플랫폼을 사용하지 않으면 성능을 100%사용할 수 없는것이 아닐까?” 라는 의문을 가지고 계신분들이 계실겁니다. 결론부터 말하자면 “일정 속도 이상부터 차이가 없으며, 차...

    • Archost |
    • 17.06.16 |
    • 조회 2850 |
  • 인텔의 14-18코어 HEDT CPU는 현존하지 않는다? [CPU] 인텔의 14-18코어 HEDT CPU는 현존하지 않는다? [12] file

    유명한 하드웨어 리뷰 유튜브 채널 Linus Tech Tips / LTT에서 평소와 사뭇 다른 어조의 동영상 칼럼을 하나 게시했습니다. 제목은 "I have something to say - Core i9 & X299". 뭔가 간절히 하고 싶은 말이 있는 것 같죠. 여느 LTT의 리뷰가 그렇듯 영상 초반부터 3분 35초까지는 주인공 라이너스가 이번 컴퓨텍스 기간 중...

    • Dr.Lee |
    • 17.06.05 |
    • 조회 7438 |