하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[CPU] CCX에 관한 해외의 분석 : 720p / 1080p 게임을 중심으로

Dr.Lee | 조회 2678 | 추천 3 | 2017.03.29. 07:42 http://drmola.com/pc_column/152059

AMD가 Zen 기반 CPU를 설계하며 코어 컴플렉스(CCX)라는 독특한 최소단위를 도입한 것은 이미 잘 알려진 사실입니다. 하나의 CCX는 4개의 Zen 코어와 그에 딸린 96KB L1 / 512KB L2 캐시(이상은 inclusive), 그리고 4개의 코어 전체에 걸쳐 공유되는 8MB L3 캐시(L1/L2와 exclusive)로 구성되는데요. 오늘날 시판되고 있는 유일한 Zen 기반 상용 CPU 라이젠은 이러한 CCX 두 개를 하나의 다이에 탑재한 구조입니다. 총 8코어, 8 x 512KB L2 캐시, 16MB L3 캐시 구성.


라이젠의 CCX는 내부적으로도, 각 CCX 사이에서도 모두 인피니티 패브릭이라는 동일한 인터커넥트를 사용하지만 CCX 사이를 넘나드는 경우 더 많은 레이턴시가 소요되리라고 짐작됩니다. 이미 경쟁사에서도 하스웰-EP/EX 서버용 칩이 소개될 당시 분리된 두 개의 링 도메인 사이에서 유사한 현상이 관찰된 바 있으며(아래 우측 그래프. 둘 중 하나의 링 도메인이 적절히 스케줄링되지 않으면 메모리 대역폭이 반토막남) 실제 이를 위한 해결책으로 레이턴시 자체를 줄이기보다 '논리적 멀티소켓화'에 가깝게 두 링 도메인을 더욱 분절하는 방향으로 문제를 비껴간 적이 있습니다.

 

haswell_ep.jpg

(우측 이미지 출처 : AnandTech)

 

서버의 경우 워크로드 자체가 멀티스레드/멀티소켓에 최적화된 경우가 많아 이런 해법이 큰 논란으로 이어지지 않았는데, 라이젠은 어디까지나 (하이엔드 데스크탑이라고는 해도) '데스크탑' 시장향 CPU라는 점에서 처한 상황이 다소 다르다고 볼 수 있습니다. 일반적으로 데스크탑의 워크로드는 서버보다 멀티스레드 최적화 수준이 낮고, 예측 불가능한 작업을 다수 수행하여 스케줄링의 난이도가 더 높은 편입니다. 만약 OS의 스케줄링 알고리즘이 각 CCX 사이를 자주 넘나들게끔 되어 있다면 라이젠에 관해 우려하는 부분들이 현실화될 수 있습니다.

 

특히 라이젠 5의 출시가 다가오며 이러한 우려가 증폭되고 있는데, 이는 4코어 모델이 예고된 것과 무관하지 않습니다. 이론적으로 8코어 라이젠 다이에서 4코어를 파생하는 방법은 크게 두 가지로 구분됩니다 : (1) CCX 하나를 통째로 비활성화해 하나의 4코어 CCX로 구성하는 것, 또는 (2) 어떤 비율로든 양 CCX에 걸쳐 4코어를 비활성화하는 것. AMD에 의해 '두 가지 구성 설'은 즉각 반박되었지만(이에 따르면 양 CCX에서 각 2개씩을 비활성화해 2+2구성을 취한다고 합니다) 두 구성의 성능 차이가 분명 존재하리라는 믿음은 오히려 더욱 커져 가고 있습니다.

 

crosshair.jpg

 

이에 독일의 PC잡지 PC Games Hardware와 호주의 하드웨어 전문 유튜브 채널 Hardware Unboxed에서는 각기 CCX 구성에 따른 성능차 검증을 진행했는데, 이 글에서는 둘의 결과를 한데 모아 소개해 보도록 하겠습니다.

 

우선 PC Games Hardware의 벤치마크 결과입니다. 여기서는 총 6종의 게임으로 테스트를 진행했으며 CPU 이외의 컴포넌트에 의한 성능 간섭을 최소화하고자 해상도를 720p로 제한, GPU가 주도적으로 처리하는 이등방성 필터링과 후처리 효과들도 모두 비활성화했고 다만 이들을 제외한 나머지 옵션은 CPU의 연산부담을 늘리는 효과가 있어 모두 설정 가능한 최상으로 설정했다고 전했습니다.

 

ghostrecon_1280.png

gta5_1280.png

watchdogs_1280.png

 

우선 위 3개의 타이틀 - 고스트 리콘, GTA5, 와치 독스 - 은 CCX 구성에 따른 성능 차이가 거의  없습니다. 그러나,

 

bf1_1280.png

forhonor_1280.png

tr_1280.png

 

위 3개의 타이틀은 모두 단일 CCX(4+0) 구성일 때 2 CCX(2+2) 구성보다 성능이 좋았는데, 포 아너에서는 3.9%, 라이즈 오브 더 툼 레이더에서는 8.1%의 성능 차가 관찰되었고 배틀필드1은 가장 극단적으로 성능 차가 나타난 예입니다(약 10%). 6개 타이틀 전체로 평균을 내면 약 3-4% 가량 평균적인 성능 차가 있는 셈. 한편 지금까지 살펴본 모든 게임에서 코어 개수에 따른 성능 차는 고루 스케일링되는 것으로 나타나 멀티스레드 최적화 문제가 아니라는 점은 명확히 알 수 있습니다.

 

이번에는 Hardware Unboxed의 벤치마크 결과를 살펴봅시다. 여기서는 보편적으로 사용되는 1080p (FHD) 해상도에서 벤치마크를 진행했는데, 따라서 앞서 살펴본 결과보다는 CCX 구성에 따른 성능차가 적을 수 있단 점을 염두해야겠습니다.

 

 

1920_battlefield1.jpg

1920_battlefield1_2.jpg

 

앞서 720p에서는 CCX 구성별 성능차가 10%에 달했던 배틀필드1이지만 1080p에서는 그 차가 3.2%로 크게 줄었습니다. 720p의 픽셀 수는 약 92만개, 1080p는 207만개로 2.25배의 격차가 있고 그만큼 VGA 의존도가 높아진 결과로 해석됩니다. 중요한 것은 위 두 장의 그래프 중 아래의 것인데, 평균프레임은 3.2% 차이가 났지만 실질적으로 시스템 부하가 피크를 찍을 때라고 볼 수 있을 1% / 0.1% 최저프레임은 양쪽 모두 동일하게 나타나, CCX 구성이 CPU의 '본질적인 연산 성능'에 영향을 주는 것은 아니라는 추측도 가능합니다. 이에 관해서는 아래에서 다시 다룹니다.

 

1920_f12016.jpg

1920_farcry.jpg

1920_forhonor.jpg

1920_ghostrecon.jpg

1920_mafia3.jpg

 

지금까지의 결과를 종합해 볼까요. 배틀필드1에서 3.2%의 격차를 보였던 CCX 구성별 성능차는 이후 5개의 테스트를 거치는 동안 F1 2016, 고스트 리콘에서 1-2%의 미세한 차이를 보였을 뿐 나머지 3개의 게임에서는 아예 차이가 없는 것으로 나타났습니다. 그나마 고스트 리콘은 720p에서도 이미 성능 차가 없는 유형에 속했으니, 720p에서 8.1%의 격차를 보이다 1080p에서는 격차가 없어져 버린 포 아너의 결과 등만이 주목할만한 것으로 남습니다.

 

1920_z1.jpg

1920_z2.jpg

 

앞서 최소프레임 차이가 없는 것을 근거로 CCX 구조가 본질적인 연산성능 자체를 침해하지는 않는다는 소결론을 내렸는데 위의 두 테스트 결과가 이를 뒷받침합니다. AIDA64로 측정한 결과 두 CCX 구성별 캐시 레이턴시 및 대역폭이 상당히 상이하게 나타났는데, 짐작하시듯 단일 CCX 구성일 때 L3 캐시 레이턴시가 약 11% 절감되었으며 읽기/쓰기/복사 대역폭에서 큰 차이를 보였습니다.

 

메모리 계층구조는 CPU 연산성능의 본질과는 관계가 없으나, CPU가 연산을 수행하기에 필요한 코드/데이터 스트림을 끊김없이 공급하는 데 불가결한 요소이기도 해 최종적으로는 영향을 미치게 됩니다. 지금까지 살펴보았던 게임 성능 편차는 바로 여기 기인하는 것이며, 항목의 특성상('메모리 계층구조'가 큰 영향을 주므로) 그간 여러 포럼에서 제보된 '메모리를 오버클럭하니 성능이 크게 올랐다'는 증언과도 일치하는 것으로 보입니다.

 

공교롭게도 제온 역시 링 도메인이 분리되며, 임의의 코어가 자신이 속하지 않은 다른 링 도메인 관할의 메모리컨트롤러를 액세스할 때 대역폭이 반토막나는 것이 문제가 되었던 것이니 결국은 두 경우 모두 메모리 계층구조가 발목을 잡는 근본 원인이었던 셈입니다. 다만 종합적으로 보아 라이젠급의 고성능 CPU를 구매하는 계층에서 굳이 저해상도(720p) 게이밍을 즐길 케이스가 과연 얼마나 될 것인지(그나마 여기서도 평균 성능차는 3-4% 수준에 그침), 1080p부터는 그나마 있던 격차조차 거의 사라진다는 점 등을 생각해 봐야겠고 최종평은 언제나 그렇듯 여러분의 몫. 긴 글 읽어주셔서 감사합니다.

 


 

※ 이 글은 PC Games Hardware, Hardware Unboxed의 글/영상을 바탕으로, 자유형식으로 재구성한 것입니다.

Dr.Lee's Signature

* 적용중인 트로피 :

DR.MOLA

레벨 Lv. 30 (-18%)
포인트 95,205 p
출석 11 일 (개근 0 일)

Dr.Lee'님의

  1. crosshair.jpg (File Size:551.8KB/Download:0)
facebook twitter google plus pinterest kakao story band
Profile image 퍼렁곰 2017.03.29 08:07
이로써 ccx에관한 논란은 많이 수그러들겠군요...!
Profile image 허쉬쵸콜렛 2017.03.29 10:20
포아너는 씨퓨보단 그레픽에 대한 부담이 많이 큰가봐요
인텔 라인업별 차이도 없고 그렇다고 라이젠과 다른것도 아니고
라이젠도 코어수 마다 프레임이 마치 짠것마냥 똑같이 나오네요 ㄷㄷ
Profile image Dr.Lee 2017.03.29 10:42
포 아너마저도 씨피유에 의한 영향이 '크다'고는 할 수 없는게... 720p라는 엄청난 저해상도의 결과임을 감안하셔야 합니다. 사실상 실제 게임할 때는 알 수 없을 차이...
Profile image 허쉬쵸콜렛 2017.03.29 11:24
그 720p 말고 1080p에서 인텔과 라이젠 코어별 비교 보면 너무 획일적으로 평균과 최대프레임이 나와서요...
720정도는 씨퓨의 차이가 보이는데 1080에서는 씨퓨 차이가 아예 없는것 처럼 나오니
벤치의 의미로 쓰이기엔 포아너는 좀 문제가 있어보이네요
Profile image [게임미식가] 잼아저씨 2017.03.29 10:34

개인적으로 테스트 했을 때도 2% 차이 안쪽으로 유의미한 차이라기엔 약한 편이었습니다. 라이젠은 CCX 자체보다는 코드 별 부동소수점 성능 차이가 인텔에 비해 게이밍 성능이 잘 나오지 않는 이유같습니다.

Profile image 여우비 2017.03.29 10:56
대근님 이 글 퍼가도 괜찮을까요?
1차 저작물에 대한 링크도 명시하겠습니다.
Profile image Dr.Lee 2017.03.29 11:39
넵. 애초에 제 글이라고 할 부분은 주석밖에 없으니^^;; 원 출처 두 곳들(PC Games Hardware / Hardware Unboxed)을 명시해 주시면 감사하겠습니다.
Profile image 가비의_리 2017.03.29 16:55
잘 봤습니다.
음... 되게 쓸데없는 궁금증이 생겼는데, 2+2 / 4+0 의미있는(?) 소비전력차이가 있을까요? ^^;;
Profile image ARMCC 2017.03.30 00:47
AIDA64의 레이턴시 결과는 오류인 것으로 보입니다. 라이젠 패치 적용된 결과는 L3레이턴시가 10초반으로 좋아집니다.
Profile image 루인 2017.03.30 00:57
2CCX자체는 문제가 없다는 쪽으로 결론이 내려지네요. 다음세대는 FPU와 인피니티 패브릭 개선에 신경써야 겠네요.
클럭과 IPC향상은 당연하고요.
  • 팩트체크 : 인텔, AMD와 정말 손잡나? [CPU] 팩트체크 : 인텔, AMD와 정말 손잡나? [5] file

    만우절이 끝나기 무섭게 해외의 저명한 하드웨어 포럼/매체들은 우후죽순으로 기사를 쏟아내고 있습니다. 무슨 소식을 전해도 곧이곧대로 들리지 않을 만우절을 피한 수요가 분출된 것이겠지만 개중엔 만우절 끝물을 켜는 것도 섞여 있기 마련인데요. 이 중 저의 흥미를 잡아끈 건 바로 이것. 인텔이 케이비레이크-G 라는 새...

    • Dr.Lee |
    • 17.04.05 |
    • 조회 2450 |
  • CCX에 관한 해외의 분석 : 720p / 1080p 게임을 중심으로 [CPU] CCX에 관한 해외의 분석 : 720p / 1080p 게임을 중심으로 [10] file

    AMD가 Zen 기반 CPU를 설계하며 코어 컴플렉스(CCX)라는 독특한 최소단위를 도입한 것은 이미 잘 알려진 사실입니다. 하나의 CCX는 4개의 Zen 코어와 그에 딸린 96KB L1 / 512KB L2 캐시(이상은 inclusive), 그리고 4개의 코어 전체에 걸쳐 공유되는 8MB L3 캐시(L1/L2와 exclusive)로 구성되는데요. 오늘날 시판되고 있는 ...

    • Dr.Lee |
    • 17.03.29 |
    • 조회 2678 |
  • 비츠 솔로3 (beats Solo3) 측정 리뷰 [음향기기] 비츠 솔로3 (beats Solo3) 측정 리뷰 [1] file

    beats Solo3 측정 리뷰 안녕하세요 STUDIO51 입니다. IT 전문 리뷰어 그룹인 Dr. MOLA와의 합동 리뷰로 비츠(beats)사의 솔로3 (Solo3)을 진행하게 되었습니다. 저 STUDIO51은 이어폰을 듣고 리뷰하는 기존의 일반적인 리뷰 방식에서 벗어나, 측정을 통해 가능한 객관적으로 그 성능을 분석, 평가하고자 합니다. *비츠 솔로3...

  • 하청과 원청 사이, 스프레드트럼의 인텔 아키텍처 기반 SoC [모바일] 하청과 원청 사이, 스프레드트럼의 인텔 아키텍처 기반 SoC [7] file

    지난해 인텔은 모뎀을 제외한 스마트폰용 SoC 개발을 전면적으로 중단한 바 있다. 따라서 이 분야에 x86 SoC가 다시 등장했다는 것은 사뭇 놀라운 소식이다. 사실상 사문화된 것으로 여겨졌던 인텔과 서드파티 SoC 제조사간의 라이선스 계약이 부활하며 스프레드트럼이 인텔 에어몬트 기반 8코어 SoC를 내놓은 것이다. 당연...

    • Dr.Lee |
    • 17.03.23 |
    • 조회 1280 |
  • 한층 저렴해진 Zen을 만나다 - AMD, 라이젠 5 공개 [CPU] 한층 저렴해진 Zen을 만나다 - AMD, 라이젠 5 공개 [35] file

    AMD는 한국시각 기준 지난 15일 오전 11시, 웹 브리핑을 통해 자사의 퍼포먼스 CPU 라인업인 라이젠 5를 페이퍼 런치했습니다. 앞서 지난 2일 정식 출시된 하이엔드 라인업 라이젠 7은 자사 직전세대 제품 대비 경악할만한 성능향상을 이뤘음은 물론, 지난 11년간 경쟁상대가 없다시피 한 경쟁사의 하이엔드 CPU와 처음으로 ...

    • Dr.Lee |
    • 17.03.16 |
    • 조회 7189 |
  • [카드뉴스] 지포스 GTX 1080 Ti 리뷰 : 타이탄 X의 헌신 [VGA] [카드뉴스] 지포스 GTX 1080 Ti 리뷰 : 타이탄 X의 헌신 [27] file

    안녕하세요 독자 여러분. 엔비디아는 GDC 2017 기간 중인 지난 2월 28일 샌프란시스코에 세계의 테크 미디어를 초청, Editor's Day 행사를 개최해 이 자리에서 차세대 지포스 플래그십인 GTX 1080 Ti를 공개한 바 있습니다. 이후 3월 6일 오후 11시(한국시각 기준) 동영상 리뷰어 한정 언박싱 엠바고가 해제된 데 이어, 금일...

    • Dr.Lee |
    • 17.03.09 |
    • 조회 3564 |
  • Zen 기반 서버용 CPU, Naples가 예고되다 [CPU] Zen 기반 서버용 CPU, Naples가 예고되다 [15] file

    2주 전, AMD는 전 세계의 테크 미디어를 대상으로 출시를 한 주 앞두고 있던 "Zen"의 사전 설명회 격인 Tech Day 행사를 샌프란시스코에서 개최했습니다. 이 자리에서는 이미 지난 3월 3일 엠바고가 풀린 Zen 기반 HEDT CPU 라이젠 7뿐만 아니라 바로 지금 엠바고가 풀린 서버용 CPU "Naples" 에 대한 정보 또한 간단히 소개...

    • Dr.Lee |
    • 17.03.07 |
    • 조회 2665 |
  • [카드뉴스] CPU WARS : EPISODE VIII - THE LAST REBEL [CPU] [카드뉴스] CPU WARS : EPISODE VIII - THE LAST REBEL [68] file

    안녕하세요 독자 여러분. 이 글이 공개되는 2017년 3월 2일 한국시간 기준 오후 11시 -> 3월 3일 자정, <현대 CPU의 구조>를 7년만에 리부트해 이 카드뉴스로 연재되게끔 한 장본인, 바로 AMD의 '라이젠'이 정식으로 출시되며 마지막까지 걸려 있던 엠바고가 해제되었습니다. 그리하여 이번 편은, 오래 전부터 이 날 발행을 ...

    • Dr.Lee |
    • 17.03.02 |
    • 조회 17175 |
  • GTX 1080 Ti 공개 : 누가 엔비디아를 떠밀었나 [VGA] GTX 1080 Ti 공개 : 누가 엔비디아를 떠밀었나 [10] file

    사진 : 엔비디아 엔비디아가 GDC 이벤트에서 자사의 새로운 플래그십 그래픽카드를 발표했다. 이번에 발표한 GTX 1080 Ti는 기존에 개인용 비디오 카드의 플래그십 자리를 차지하고 있던 GTX 1080을 대체하게 된다. 기존의 예상과 같이 GTX 1080 Ti는 타이탄 X와 같은 GP102 칩을 사용했다. 하지만 기존의 예상과는 다르게 ...

    • iMola |
    • 17.03.01 |
    • 조회 4480 |
  • [카드뉴스] LOW-V ONE : A CPU WARS STORY [CPU] [카드뉴스] LOW-V ONE : A CPU WARS STORY [22] file

    안녕하세요 독자 여러분. 가장 중요한 에피소드 8을 코앞에 둔 지금, 잠시 쉬어가는 편으로 외전을 들고 찾아뵙게 되었습니다. 이름하야 LOW-V ONE : A CPU WARS STORY. 이번 편에서는 인텔과 AMD 양사의 저전력 CPU 아키텍처를 죽 훑어보며, 주류 아키텍처와는 또 다른 궤적을 남긴 이들의 흥망성쇠를 살펴보도록 할 텐데요...

    • Dr.Lee |
    • 17.02.27 |
    • 조회 2196 |