하드웨어 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] GCN 5.0 아닌 베가 1.0 : 최초 공개, 베가 아키텍처 개요

Dr.Lee | 조회 5109 | 추천 18 | 2017.01.06. 12:53 http://drmola.com/pc_column/118547

vega_01.png

 

베가는 AMD가 FinFET 제조공정으로 생산하는 첫 '빅 뷰티' 칩셋이다. 글로벌파운드리의 14nm FinFET 공정이 적용된 폴라리스가 반년 전 출시되었지만 하이엔드 라인업이 공석으로 남아 있었기 때문이다. 베가의 등장은 2015년 피지에 이어 21개월만의 하이엔드 세대교체이자, 2011년 12월 타히티 칩셋으로 GCN 아키텍처가 첫 도입된 이래 무려 61개월만의 메이저 아키텍처 전환을 의미한다.

 

그렇다. 베가는 GCN의 연장선이 아닌 것이다. 그것도 연산 유닛 구성뿐 아니라 래스터라이저, 캐시/메모리 계층 구조에 이르기까지 GPU 칩셋으로서 손댈 수 있는 거의 전 분야를 뜯어고친 아키텍처다.

 

vega_35.png

 

아래에 분야별로 자세히 살펴볼 것이지만 우선 머신러닝 시대에 돌입해 이에 적합한 정밀도의 연산을 지원하게 된 것을 언급하지 않을 수 없다. 전통적으로 라데온이 잘 해 오던, 그러나 한물간 고정밀도(FP32/64) 위주의 설계에서 탈피해 반정밀도(FP16) 부동소수점 및 8비트 정수(INT8)연산에 적합하도록 아키텍처를 뜯어 고친 베가는 FP16 / INT8 명령을 기존의 FP32 SIMD 레지스터에 각각 2개 / 4개씩 "Packed"(묶음)로 입력해 동시에 처리할 수 있다.

 

따라서 베가의 FP16 연산성능은 FP32 연산성능의 최대 두 배, INT8 연산성능은 무려 네 배에 달한다. 아키텍처가 지원하는 정밀도를 변경하는 큰 패러다임 변화를 위해 AMD는 앞서 플레이스테이션4 프로에 공급하는 자체 커스텀 SoC에 이를 선 적용해 테스트베드로 삼은 바 있다. 엔비디아 역시 파스칼에 전면적으로 적용하기 전 맥스웰 기반의 테그라 X1에 이를 선 적용한 바 있어 이러한 단계별 신기술 적용은 거의 모범 공식처럼 되어가는 것 같다. (링크)

 

이 글에서는 베가 아키텍처의 주요한 개선점들을 GPU 칩셋 내 기능별로 크게 묶어 살펴볼 것이다.

 


 

1. 컴퓨트 엔진

 

vega_25.png

 

인간이 처리할 수 없는 고도로 정확한 연산을 수행케 하는 것이 과거의 HPC 패러다임이었다면 머신러닝은 마치 인간의 뇌처럼, 개별 연산의 정확도는 떨어지더라도 이를 무수히 많이 중첩해 패턴을 도출하는 것이 목표라 할 수 있다. 머신러닝은 다시 최초로 패턴을 도출하는 ‘학습’training과 이미 학습된 경로를 수행하는 ‘추론’inference으로 나뉘며 전자가 요구하는 연산의 정확도 / 연산량 모두 후자보다 높은 편이다. 앞서 AMD의 경쟁사는 신경망 학습에 대응하는 솔루션으로 연산가속기 테슬라 P100을, 신경망 추론용으로는 테슬라 P40 / P4 및 그래픽 출력 겸용의 타이탄 X를 내놓은 바 있다. (링크)

 

스크린샷 2017-01-06 오전 11.51.44.png

 

칩셋 기준으로 분류하자면 테슬라 P100에 사용된 GP100은 파스칼 세대의 최상위 칩셋으로 FP32와 2배속 Packed FP16을 지원하는 것이 특징이다. 그 아래의 GP102 / GP104는 2배속 Packed FP16을 생략한 대신 4배속 Packed INT8을 지원하도록 해 결과적으로 각각의 역할 분담을 명확히 했다. GP102는 테슬라 P40과 타이탄 X에 사용되며 GP104는 테슬라 P4에 적용된 칩셋이다. (맥락상 해당 칩셋들이 사용된 컨슈머 그래픽카드는 나열하지 않음.)

 

반면 베가는 FP32와 2배속 Packed FP16 / 4배속 Packed INT8을 모두 지원하여, 적어도 아키텍처 레벨에서 역할이 나뉘지는 않은 것 같다. 추후 상용화되는 모델에 따라 특정 정밀도의 연산 가속을 비활성화하는 등으로 대응할 수 있을 것이다. 예컨대 지난달 선공개되었던 라데온 인스팅트 MI25는 신경망 학습을 겨냥하여 25 테라플롭스의 Packed FP16 연산성능을 갖도록 기획된 모델이었다. (링크)

 

vega_26.png

 

위 슬라이드로부터 역산하건대, 하나의 연산유닛이 사이클당 2개의 FP32 연산을 수행하므로 베가의 NCU는 총 64개의 연산유닛으로 구성된다. 이는 GCN의 CU 구성과 동일한 것이다. Packed 연산에 대해 부연하자면 이것은 네이티브 FP16 / INT8과 완전히 같지는 않다. 네이티브 수행에서 각 명령의 분기는 자유로운 반면 "묶음" 처리된 명령은 제각기 분기할 수 없는 까닭에, 예측가능성이 떨어지는 경우 연산 효율이 급격히 하락하기 때문이다.

 

vega_27.png

 

최악의 경우 사이클당 4개x2로 "묶음"된 INT8 명령의 처리량이 사이클당 FP32의 그것(=사이클당 두 개)과 동일할 수도 있다. 다만 분기가 많지 않은 경우는 거의 이론과 비슷하게 스케일링되는 편이고 머신러닝은 전형적인 그런 예에 속한다.

 

따라서 베가는 전통적 의미에서의 FP16 / INT8 슈퍼컴퓨팅에는 적합하다고 보기 어렵고, 오로지 이들을 활용하는 신경망 학습 / 추론에 최적화되었다고 볼 수 있다. 또한 PC게임 타이틀만큼 컬러/텍스처 포맷이 정밀하지 않은 모바일/콘솔 게임의 경우 FP16의 활용도가 높기에 여기서도 전세대보다 좋은 성능을 보일 것이다.

 

vega_28.png

 

파이프라인 스테이지를 세분화해 고클럭화를 추구한 것도 베가의 특징이다. 앞선 FinFET 칩셋이었던 폴라리스에서도 이러한 방향의 접근이 시도되었고 실제 폴라리스의 작동속도는 GCN 1.2까지의 여타 칩셋보다 현저히 높아진 바 있다. 이를 더욱 개량한 것이 베가의 NCU. 결국 폴라리스와 베가의 관계는 7년 전 40nm 공정으로의 전환기에 보여졌던 라데온 HD 4770과 HD 5000 시리즈의 그것에 비유할 수 있겠다. 폴라리스는 베가를 위한 테스트베드였던 셈.

 


 

2. 지오메트리 엔진

 

vega_21.png

 

GCN 아키텍처가 4세대의 발전을 거치면서도 거의 개선되지 않은 부분이 있으니 다름아닌 지오메트리 엔진. 타히티로 대표되는 1세대 GCN에서 2개의 지오메트리 엔진 구성을 채택하던 것이 2세대(GCN 1.1) 하와이에서는 4개로 증설되었으나, 이후 3세대(GCN 1.2) 피지에 이르기까지 그대로 4개로 묶여 있던 것이다. 타히티의 지오메트리 엔진은 각각 16개의 CU를 관장했고 하와이는 11개를 관장했지만 피지는 도로 16개로 늘어 병렬성 역시 떨어지게 되었다.

 

러프하게 말하자면 엔진 내 지오메트리 프로세서(파이프라인)가 사이클당 하나의 폴리곤(다각형)을 생성하는데 여기에 각각 11-16개씩의 CU가 달라붙어 연산을 하는 것이다. 그만한 연산량을 필요로 하는 폴리곤이면 문제가 없지만 그보다 적은 연산량으로도 충분하다면 병목현상의 원인이 된다. 즉, 요지는 로드 밸런싱을 능동적으로 해야 한다는 것. 2816SP인 하와이나 4096SP인 피지나 똑같이 사이클당 4개의 폴리곤에 매달렸다는 사실이 놀랍지 않은가.

 

vega_24.png

 

AMD는 베가의 각 지오메트리 엔진이 어떤 구성인지 밝히지 않았다. 지오메트리 프로세서가 몇 개고 테셀레이터가 몇 개인지 현재로서는 오리무중일 따름. 다만 주석에 따르면 4개의 지오메트리 엔진이 사이클당 최대 11개의 폴리곤을 생성할 수 있다고 밝혀 지오메트리 엔진 자체의 효율이 평균 2.75배 가량 증가된 것으로 여겨진다. 4개의 지오메트리 엔진이 각각 사이클당 3 / 3 / 3 / 2개의 폴리곤을 생성한다고 가정하면 가장 느린 쪽을 기준삼아도 스루풋이 기존 대비 2배로 향상된 것이다.

 

vega_22.png

 

여기서 한가지 엿볼 수 있는 사실은 베가의 연산유닛 수의 상한. 지오메트리 엔진의 병목현상을 해소하는 것이 명분이었던 만큼, 지오메트리 엔진의 성능향상폭만큼 CU 수가 증가했다면 아무 의미가 없을 것이다. 다시 말해 베가 아키텍처 하에서 하나의 지오메트리 엔진이 가질 수 있는 CU 수의 상한은 과거 GCN에서 달성한 최소값인 11개의 두 배, 즉 22개(=5632SP)를 넘지 않을 것이라 봐도 될 것이다.

 

vega_23.png

 

또한 기존의 버텍스 쉐이더 / 지오메트리 쉐이더 2단계 스테이지를 대체하는 단일 스테이지 프리미티브 쉐이더를 도입했다. 이것의 작동원리가 자세히 설명되지 않아 ‘자동으로’ 기존의 2단계 스테이지를 대체하게 되는지 혹은 개발자 레벨에서 별도의 컴파일이 필요한지 여부는 현재로서는 불명. 다만 쉐이더 연산단계를 1단계 줄일 수 있다는 점과, 화면 구성상 가려진(불필요한) 요소들을 이 단계에서 생략할 수 있어 전체적인 연산량을 절감하는 데 도움이 된다.

 

종합적으로 베가는 지오메트리 엔진이 연산을 빠르게 수행하면서 + 더 적은 연산을 수행해도 되도록 계획한 아키텍처라 할 수 있다.

 


 

3. 래스터라이저

 

vega_30.png

 

전통적으로 데스크탑용 GPU는 매 드로우콜마다 프레임버퍼를 갱신한다. 모바일 시장이 성장하며 이 방식에 의문이 제기되었으니 대체로 모바일 기기의 대역폭은 데스크탑의 그것보다 훨씬 제한적이었기 때문. 이러한 의문에 기초해, 고해상도의 프레임버퍼 전체를 갱신하는 대신 프레임버퍼를 가상의 하위단위인 ‘타일’로 분할하고, 실제 도형이 그려지는 타일만 갱신해 렌더링하는 기법이 타일 기반 렌더링tile based rendering이다.

 

타일 기반 렌더링은 전통적인 렌더링 방식과 비교해 요구하는 대역폭과 연산량이 줄기 때문에, 메모리 유효 대역폭을 늘리는 효과와 소비전력 절감을 동시에 달성할 수 있다. 엔비디아의 맥스웰이 이러한 기법을 사용해 동일한 제조공정을 사용한 케플러보다 전력 효율을 크게 높인 적이 있다. 베가는 이와 유사한 기법인 드로우 스트림 비닝 래스터라이저를 탑재했다.

 

vega_31.png

 

현 단계에서는 이외의 정보들, 가령 ROP 개수가 몇 개인지, 이 알려지지 않아 성능을 예상하는 데 한계가 있을 수밖에 없지만 적어도 이전 세대들보다 전력 효율이 비약적으로 향상되었을 것이라 기대할 수 있다. 아주 러프하게 보자면 엔비디아가 케플러에서 맥스웰로 이행하며 달성한 전력 효율 향상을 폴라리스에서 베가로의 이행에 기대할 수도 있을 것이다. 두 경우 모두 전후 아키텍처의 제조공정은 같았고, 아키텍처 전환만이 효율 향상의 동력이었다는 점을 기억하자.

 

vega_32.png

 

비단 래스터라이저의 효율성만 개선된 것은 아니다. 기존 아키텍처와 비교해 캐시 구조 역시 크게 변경되었는데 우선 위 슬라이드를 통해 레거시 캐시구조를 숙지하자. GPU 칩셋 내부에 L1 / L2 캐시가 내장되었지만 L2 캐시는 컴퓨트 엔진과 지오메트리 엔진만이 공유하고, 래스터라이저(픽셀 엔진)는 여기서 제외되어 있고 메모리컨트롤러에 직결된 것이 특징이다. (엔비디아의 경우 역시 ROP와 메모리컨트롤러, L2 캐시가 하나로 묶여 있음)

 

아마도 래스터라이저가 직접 프레임버퍼(그래픽 메모리)에 접근할 일이 많아서겠지만, 결과적으로 래스터라이저는 L1 캐시 미스만 발생하더라도 큰 규모의 파이프라인 버블을 피할 수 없게 된다.

 

vega_33_merged.jpg

 

베가는 이 부분을 개선, 컴퓨트 엔진과 지오메트리 엔진, 래스터라이저가 모두 L2 캐시를 공유하도록 했다. 최근 사용빈도가 증대되고 있는 지연 쉐이딩deferred shading 기법은 렌더 투 텍스처RTT가 빈번하게 쓰이는 예인데 레거시 구조 하에서 래스터라이저가 반드시 메모리컨트롤러를 거쳐 텍스처 유닛에 접근할 수 있던 것과 달리 베가는 공유 L2 캐시를 통해 훨씬 빠른 접근이 가능하다.

 

또한, 비단 이런 기능의 직접적인 수혜를 보는 경우가 아니라도 사실상 래스터라이저에 있어서는 없던 L2 캐시가 생긴 것과 마찬가지이므로 큰 성능향상이 있을 것이다. 게다가, 후술하겠지만 베가는 HBM 기반의 고대역 캐시high bandwidth cache를 도입해 GPU로서는 최초로 L3 캐시를 탑재한 셈이 되었다. 다만 개념적으로 그렇다는 것이고 베가의 고대역 캐시는 피지의 HBM 그래픽 메모리와 구조적으로 동일한 것이다.

 


 

4. 메모리 계층 구조

 

vega_11.png

vega_12.png

 

오래전부터 알려졌듯 베가는 HBM2를 탑재하고 있다. 상술했듯 고대역 캐시의 정체는 HBM2 메모리 스택의 또다른 이름이다. 스택당 대역폭이 HBM1의 2배에 달하는 것으로 알려져 당초 베가가 피지 대비 2배의 대역폭을 가질 것으로 점쳐지기도 했으나, 공개된 다이 이미지에 의하면 스택이 피지의 절반인 2개로 줄어 최종 대역폭은 비슷한 수준에 그칠 것으로 전망된다.

 

vega_gpu_image.jpg

vega_13_merged.jpg

 

그러나 스택당 용량이 최대 8배 향상되어 베가 시제품은 16GB의 그래픽 메모리를 탑재할 것으로 관측되고 있다. 참고로 위의 슬라이드는 하와이와 피지를 비교한 것인데 이처럼 전체 기판 면적을 최소화할 수 있게 되어 100 테라플롭스의 FP16 연산성능을 집적한 ‘베가 큐브’와 같은 컨셉을 시연하기도 했다.

 

vega_cube.jpg

 

한편 베가는 GPU 칩셋과 한 패키지에 스택된 HBM2 고대역캐시와 별도로, 오프 패키지 / 온보드 메모리 역시 상정하고 있는 것이 특징이다. 하나의 그래픽카드 안에서 메모리 계층을 나눈 첫 사례일 것이다. 베가가 HBM2와 GDDR5/X를 모두 지원한다는 루머가 여기서 기인한 것으로 추측되는데, 이렇게 중층적 구조를 채택한 데에는 이유가 있다. 프로페셔널 부문에서 그래픽 메모리의 사용량이 꾸준히, 급속히 증가했기 때문.

 

vega_08.png

vega_10.png

 

2001년 영화 '반지의 제왕'이 제작될 당시 총 작업량은 당시로서는 거대한 수준이었지만 오늘날의 기준에서는 극히 미미한 수준에 불과하다. 아바타에 이어 호빗 3부작 중 첫번째까지는 그럭저럭 선형 스케일로 추세선을 그릴 수 있었지만 2, 3편으로 갈수록 기하급수적으로 작업량은 늘어 갔으며, 이렇듯 엑사스케일로 증가해 가는 그래픽 워크로드를 지탱하기 위해 메모리를 고도로 집적하는 것은 선택이 아닌 필수가 되어가고 있다.

 

심지어 과거 HBM1을 도입했던 피지의 경우, 메모리 용량 구성이 4GB로 매우 경직되어 미래는커녕 당대의 워크로드에도 다소 부족한 감이 있었을 정도. 이러한 진화는 라데온 프로 SSG의 등장과도 일맥상통하는 부분이 있다. (링크)

 

vega_15.png

 

GPU 패키지에 탑재한 HBM2 스택의 이름을 메모리가 아닌 고대역 캐시로 바꿨으니 메모리컨트롤러의 이름도 고대역 캐시 컨트롤러로 바뀌었다. 설명의 편의상 이 글 다른 곳에서는 그대로 메모리컨트롤러라 지칭할 것이다.

 

베가의 메모리컨트롤러의 관할 범위는 그래픽카드 내의 메모리에 한정되는 것이 아니라 온보드 비휘발성 메모리(낸드플래시), 네트워크 스토리지, 심지어 시스템 메모리의 일부까지 포함하게 된다. 이렇게 베가의 메모리컨트롤러가 제어할 수 있는 총 주소공간은 512TB에 달해 HBM 시리즈의 경직적 구성과 증대되는 그래픽 메모리 요구량 사이의 타협점을 모색한 것.

 

vega_16_merged.jpg

 


 

정리해 보자. 베가는 연산 유닛, 래스터라이저, 메모리 계층 구조라는 GPU의 주요 기능요소를 일거에 혁신한, AMD로서는 실로 오랜만의 새 아키텍처이다.

 

vega_36.png

 

연산 유닛 중 컴퓨트 엔진은 점증하는 머신 러닝 수요에 피벗팅해 2배속 Packed FP16 및 4배속 Packed INT8 연산을 지원하도록 했으며, 파이프라인 세분화로 고클럭화를 꾀했고, 지오메트리 엔진은 그동안 컴퓨트 엔진과의 불균형으로 야기되던 병목현상을 해결하기 위해 최대 2배 이상 스루풋을 늘리도록 개량해냈다. 또한 프리미티브 쉐이더라는 개념을 도입, 연산 유닛의 요구 연산량을 낮춰 종합적으로 더 높은 게임성능을 발휘할 수 있도록 했다.

 

또한 경쟁사가 맥스웰 아키텍처에서 도입했고 그 외 유수의 모바일 칩셋 제조사들이 진작 도입하고 있던, 타일 기반 렌더링(의 유사 기술)을 래스터라이저에 적용해 전력 효율 향상을 꾀했으며, 래스터라이저가 L2 캐시를 공유하지 못하던 기존의 캐시 구조를 개편해 래스터라이저도 다른 두 엔진(컴퓨트, 지오메트리)과 함께 L2 캐시에 직접 액세스할 수 있게 되었다. 이로써 지연 쉐이딩, RTT 등 직접적인 혜택을 보게 된 분야 외에도, 래스터라이저 입장에서는 없던 것이나 마찬가지이던 L2 캐시가 신설된 셈인 만큼 전반적으로 큰 성능향상을 기대할 수 있게 되었다.

 

마지막으로 메모리 계층 구조에서, 베가는 직전의 하이엔드 칩셋이었던 피지가 HBM 스택을 ‘그래픽 메모리’라 부르던 것을 ‘고대역 캐시’로 바꿔 부르게 했는데 이는 그래픽 메모리의 총량을 엄청나게 늘리기 위해 계층 차등화가 필수적이었기 때문이다. 이에 따라 GPU 칩셋과 함께 패키징되는 HBM2 캐시와 별개로, 그래픽카드상에 온보드되는 메모리가 별도로 등장할 가능성이 높아졌으며, 베가의 메모리컨트롤러는 한발 더 나아가 온보드 비휘발성 메모리(낸드플래시), 네트워크 스토리지까지 제어할 수 있도록 준비를 갖추었다.

 

흥미로운 것은 이 모든 것들이 한번쯤 서로 다른 형태로 '떡밥'이 던져진 기술들이라는 것. Packed FP16이 플레이스테이션 4 프로에서, 온보드 낸드플래시가 라데온 프로 SSG에서 미리 다뤄졌듯이 말이다. 자칭타칭 '준비된 새 아키텍처' 베가가 과연 어떤 데뷔 무대를 가질지 기대와 우려가 교차하는 지금이다. 나는 일단, 21개월간의 복무를 마치고 만기 전역하는 피지를 박수로 배웅하려 한다.

  • |
  1. vega_01.png (File Size:760.7KB/Download:5)
facebook twitter google plus pinterest kakao story band

서명

Profile image

Dr.Lee

(level 30)
-30%

* 적용중인 트로피 :

Profile image 게임미식가
잼아저씨
2017.01.06 13:22

INSTINCT MI 시리즈는 결국 머신러닝을 위해 단일 기종으로 커버가 되는군요. 다이 크기가 공정 미세화를 했음에도 상당히 큰데(~530mm2?)는 이런 이유 때문이기도 할까요? 결론적으로 빨리 성능을 보여줬으면 합니다. ㅎㅎ.

근데 퓨리X 런치가 15년 6월 말이었으면 베가는 3월에 나오나 보네요.

Profile image 감자사랑 2017.01.06 17:08
포스팅 하신데로 Mobile GPU는 Tile based Rendering과 더불어서
연산유닛이 Unified shader로 구성해서 Geometry/compute/pixel을 통합해서 효율을 높였는데,
Vega는 다 나누어 두었는데 유리한 점이 있을까요??
nVidia의 Pascal도 통합쉐이더였던걸로 기억합니다..
Profile image RuBisCO 2017.01.06 23:58
와. Fury 계열 보다도 아담하군요. 레이븐 릿지에서도 볼 수 있었으면 좋겠는데 비용상 힘들겠죠...?
그동안 병목을 일으키던 래스터라이저 쪽이 개선된다니 기대가 큽니다. 다만 파이프라인이 더 깊어진다니 걱정되는군요. 엔비디아 쪽에선 페르미-케플러-맥스웰의 단계를 밟는동안 지속적으로 파이프라인을 얕게 만들어가며 효율을 키웠는데 그 반대로 간다니 우려됩니다.
  • iPhone 7 자세히 알아보기 : 카메라 [모바일] iPhone 7 자세히 알아보기 : 카메라 [12] file

    정말 오랫만에 아이폰 7 자세히 알아보기 시리즈로 여러분들을 찾아올 수 있게 되어 기쁘다. 오늘 살펴볼 것은 카메라편으로, 아이폰 7과 7플러스에서 향상된 ‘광각’ iSight 카메라는 물론이고 아이폰 7 플러스에만 들어가는 ‘망원’ 카메라의 성능과 두 개의 카메라가 어떻게 동작하는지에 대해 집중적으로 살펴볼 것이다. ...

    • iMola |
    • 17.02.12 |
    • 조회 수 3149 |
  • [카드뉴스] CPU WARS : EPISODE I - THE PHANTOM MENACE [CPU] [카드뉴스] CPU WARS : EPISODE I - THE PHANTOM MENACE [19] file

    ※ 닥터몰라 페이스북 페이지에 게시된 원본은 여기서 보실 수 있습니다! 안녕하세요 독자 여러분. 이번 주엔 유독 자주 찾아뵙는 것 같지만 기분 탓이겠죠. 에헴. 전편으로부터 10년을 거슬러 올라간 이번 편의 제목은 "보이지 않는 위협". 인텔의 탕아, <넷버스트> 아키텍처의 특징을 조목조목 짚어 보는 시간을 갖도록 하...

    • Dr.Lee |
    • 17.02.11 |
    • 조회 수 3483 |
  • [카드뉴스] CPU WARS : EPISODE VI - RETURN OF THE HAIFA [CPU] [카드뉴스] CPU WARS : EPISODE VI - RETURN OF THE HAIFA [24] file

    ※ 닥터몰라 페이스북 페이지에 게시된 원본은 여기서 보실 수 있습니다! 안녕하세요 독자 여러분. 오늘은 CPU WARS 그 세번째 편, 에피소드 6 "하이파의 귀환" 을 들고 찾아왔습니다. 이스라엘의 하이파 연구소. 아시다시피 P6을 개량한 코어 아키텍처를 개발하며, 넷버스트의 수렁에 빠졌던 인텔을 기사회생시킨 구원투수인...

    • Dr.Lee |
    • 17.02.08 |
    • 조회 수 3295 |
  • [카드뉴스] CPU WARS : EPISODE V "THE EMPIRE STRIKES BACK" [CPU] [카드뉴스] CPU WARS : EPISODE V "THE EMPIRE STRIKES BACK" [30] file

    ※ 닥터몰라 페이스북 페이지에 게시된 원본은 여기서 보실 수 있습니다! 안녕하세요 독자 여러분. 어느새 두번째 편으로 찾아뵙게 되었습니다. 이번 편에서는 제국의 필살기, 데스스타... 아니 코어 아키텍처가 어떻게 태동하였는지를 간단히 짚어보고, 코어 아키텍처 및 그 전신인 P6 아키텍처, 그리고 코어의 후신인 네할...

    • Dr.Lee |
    • 17.02.05 |
    • 조회 수 5019 |
  • [카드뉴스] CPU WARS : EPISODE IV "A NEW HOPE" [CPU] [카드뉴스] CPU WARS : EPISODE IV "A NEW HOPE" [27] file

    ※ 닥터몰라 페이스북 페이지에 게시된 원본은 여기서 보실 수 있습니다! 안녕하세요. 닥터몰라가 준비한 카드뉴스 그 네번째. <CPU WARS : 에피소드 4 '새로운 희망'> 편입니다. 금주부터 한달여간 연재될 <CPU WARS> 는 라이젠의 출시를 맞아, 카드뉴스라는 새로운 포맷으로 리부트된 <현대 CPU의 구조> 입니다. 지금까지 ...

    • Dr.Lee |
    • 17.01.30 |
    • 조회 수 11966 |
  • 다시 만난 세계 : 새로운 HEDT, 인텔의 출구전략 [CPU] 다시 만난 세계 : 새로운 HEDT, 인텔의 출구전략 [6] file

    (이미지 출처 : Benchlife) 오는 8월 개막할 Gamescom 행사에 맞춰 인텔이 라이젠의 라이벌을 준비하고 있다는 소식이다. 외신의 기사(링크)에 따르면 각각 스카이레이크와 케이비레이크의 HEDT판 실리콘들인 스카이레이크-X, 케이비레이크-X가 동시에 한 라인업으로 출시될 예정이며 이들은 모두 코어 i7-7800/7900 시리즈...

    • Dr.Lee |
    • 17.01.25 |
    • 조회 수 2686 |
  • [카드뉴스] 아이폰 발표 10주년. 아이폰이 바꾼 것 10가지. [etc] [카드뉴스] 아이폰 발표 10주년. 아이폰이 바꾼 것 10가지. [3] file

    스티브 잡스는 10년 전 오늘, 맥월드 행사에서 세 가지 ‘혁명적인’ 제품을 발표했습니다. 터치로 컨트롤하는 와이드 스크린을 탑재한 아이팟, 혁명적인 휴대폰, 획기적인 인터넷 커뮤니케이션 기기를 발표했죠. 아시겠지만 이 세 기기는 별도의 기기가 아니라 iPhone이라는 단일 기기입니다. 아이폰은 애플 뿐만 아니라 IT ...

    • iMola |
    • 17.01.10 |
    • 조회 수 901 |
  • 끊을 수 없는 고리 : 퀄컴의 야심과 TSMC, 삼성, 그리고 모두에게 얽힌 굴레 [모바일] 끊을 수 없는 고리 : 퀄컴의 야심과 TSMC, 삼성, 그리고 모두에게 얽힌 굴레 file

    2년하고도 1개월이 지난 끝에 퀄컴Qualcomm의 집념이 그 결실을 맺기 시작했다. 지난달 ARM 기반 48코어 SoC를 시연하며 스케일아웃scale-out 서버 시장에 진출하겠다는 목표에 성큼 다가선 것이다. 시연을 성공적으로 마치며 퀄컴은 자사의 서버용 SoC가 현 단계에 이미 완전히 작동 가능하고, 이른 시일 내에 상용화될 수 ...

    • Dr.Lee |
    • 17.01.10 |
    • 조회 수 1867 |
  • GCN 5.0 아닌 베가 1.0 : 최초 공개, 베가 아키텍처 개요 [VGA] GCN 5.0 아닌 베가 1.0 : 최초 공개, 베가 아키텍처 개요 [3] file

    베가는 AMD가 FinFET 제조공정으로 생산하는 첫 '빅 뷰티' 칩셋이다. 글로벌파운드리의 14nm FinFET 공정이 적용된 폴라리스가 반년 전 출시되었지만 하이엔드 라인업이 공석으로 남아 있었기 때문이다. 베가의 등장은 2015년 피지에 이어 21개월만의 하이엔드 세대교체이자, 2011년 12월 타히티 칩셋으로 GCN 아키텍처가 첫...

    • Dr.Lee |
    • 17.01.06 |
    • 조회 수 5109 |
  • 노트북 GPU 전 체급에 뻗어나가는 파스칼 : 지포스 GTX 1050 / 1050 Ti 가세 [VGA] 노트북 GPU 전 체급에 뻗어나가는 파스칼 : 지포스 GTX 1050 / 1050 Ti 가세 [3] file

    세계 최대의 소비자가전 전시회 CES가 이틀 전 개막했다. 엔비디아는 이날 자사의 노트북 GPU 라인업에 산뜻한 터치를 더했으니, 바로 메인스트림급 지포스 GTX 1050 / 1050 Ti를 모바일에도 이식한 것이다. 근래 지포스 10 시리즈에서 데스크탑과 모바일 GPU 사이의 차이가 극히 미미했던 것에서 짐작 가능하듯 1050 시리즈...

    • Dr.Lee |
    • 17.01.05 |
    • 조회 수 2077 |