ARM의 야심작, 초 저전력 Cortex-A35 코어 공개

by IYD on 2015년 11월 12일 22시 09분 (5년 전) 조회: 1,083

Translator : Daeguen Lee

(※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.)

 

 

 

웨어러블용 초 저전력 Cortex-A35 코어 공개

 

 

TechCon 행사의 일환으로 오늘 ARM은 자사의 새로운 저전력 CPU 아키텍처 Cortex-A35를 공개했다. 알다시피 ARM은 자신들이 라이선싱하는 CPU 설계 (IP, 지적재산권) 를 몇 가지 세그먼트로 나눠 여러 시장에 공략하고 있는데 각 시장이 요구하는 성능과 소비전력의 레벨에 따라 이러한 세그먼트가 나눠진다. Cortex-A 라인업만 하더라도 세 가지의 계층이 있으니 '고성능', '저전력', '초 저전력' 이 이러한 계층 구분에 해당한다. 첫번째 그룹은 Cortex-A57 / A72 등 주로 big.LITTLE 아키텍처 하에서 '빅' 클러스터에 탑재되는 코어들에 해당하고 Cortex-A53 등 '리틀' 클러스터에 탑재되는 것들이 두번째 그룹에 해당한다.

 

 

이름에서 풍기는 뉘앙스와는 달리 Cortex-A35은 A53과 어떤 직접적인 관계가 있지는 않다. 오히려 기존의 Cortex-A7이나 A5를 대체하는 것에 가깝다. 예전 엑시노스 5433 리뷰에서 우리가 Cortex-A53에 대해 깊이 파헤친 적이 있는데, (Cortex-A53이 A7의 후계자라는 세간의 통념과 달리) 우리는 Cortex-A53의 성능-전력 곡선이 Cortex-A7의 그것과는 사뭇 다르다는 점을 지적했었다. 오늘 A35가 출시됨으로써 ARM이 직접 이러한 사실을 재확인해 준 것이라고 볼 수 있겠다.

 

따라서, A35는 기존 A7/A5와 비슷한 125mW 이하의 소비전력대를 타겟으로 설계된다. 실제 양산될 경우의 스펙을 미리 상정해 보자면 ARM은 이것을 28nm 공정 하에서 / 90mW의 소비전력으로 / 1GHz로 구동시키는 경우를 상정하고 있는 것 같다. 물론 제조공정을 최신의 14/16nm 노드로 한다든지 작동 속도를 예컨대 2GHz 정도로까지 더 높인다든지 등 광범위한 응용이 가능하다. 오늘날 A53이 적용되고 있는 것과 비슷하리만치 폭넓게 응용될 수 있을 것이다.

 

중요한 것은 ARM이 Cortex-A35를 발표함으로써 그들의 ARMv8 프로세서 포트폴리오를 (고성능에서부터 초 저전력까지) 완성하게 되었다는 점이다. 또한 A72/A57/A53과 big.LITTLE 형태로의 조합 역시 가능하기에, 제조사들이 마음먹기에 따라 진정 이색적인 조합도 가능해지게 되었다. (예컨대 "진정한" 트리플 클러스터 CPU라든지)

 

 

내부 구조를 볼 때, A35는 A7이나 A53과 유사한 순차 수행 방식 (in-order) 제한적 듀얼 이슈 (limited dual-issue) 구조를 채택하고 있다. 파이프라인 스테이지가 8단계라는 점 역시 동일하다. 따라서 기본적인 구조 자체가 크게 바뀐 것은 아니다. ARM이 개혁을 가한 부분은 개별 요소들을 최적화해 효율성을 높인 것이다.

 

굳이 따지자면 프론트엔드 부분의 효율을 개선하는 데 초점을 맞췄다고 한다. 예컨대 명령어 페치 유닛이라든지 분기 예측 장치 (branch predictor) 의 성능이 개선되었다고 한다. 소비전력과 성능의 균형을 위해 명령어 페치 대역폭을 조절했으며 명령어 큐의 크기 역시 효율성을 위해 축소하는 방향으로의 개편이 행해졌다고 한다.

 

 

또한 A7과 비교했을 때 A35의 메모리 대역폭 역시 눈여겨볼 만한 부분이다. A35는 A53의 메모리 아키텍처를 상당 부분 차용했다. L1 캐시는 명령어/데이터 각각 8~64KB로 다양한 구성이 가능하며 '멀티스트림 오토매틱 데이터 프리페치' 등 신기술이 적용되었다. L2 캐시는 128KB~1MB로 역시 다양화된 구성이 가능하며 '일관성 최적화 (coherency optimization)' 등 신기술이 적용되었다.

 

백엔드의 (부동소수점 및 벡터 파이프라인인) NEON/FP 파이프라인 역시 큰 변화가 있었다. '스토어' 유닛이 보다 강화되었고, 배정밀도 곱셈이 완벽히 파이프라인화되어 구현되었다. 또한 전체 파이프라인 설계 자체가 면적을 더 줄일 수 있도록 개량되어 A35는 A53보다 훨씬 적은 면적만을 차지하도록 되었다.

 

전력관리의 측면에서 살펴보면 A35는 A53이 도입했던 전력관리 기술을 거의 그대로 차용하고 있다. 흥미롭게도 CPU 내부에 별도의 통제장치(hardware governor)가 있는 것처럼 CPU 코어 클러스터의 활성/비활성을 제어하는 것처럼 보인다. 현재로서는 각 제조사들이 이러한 부분에 관해 상세히 정보를 제공하지 않고 있으나 얼마 전 스냅드래곤 810이 소프트웨어 업데이트를 통해 이런 기능을 '비활성화'하도록 (처참한 성능저하를 막기 위해) 하는 와중에 (그러한 메커니즘의 존재가) 간접적으로 드러난 바 있다.

 

 

같은 제조공정과 작동 속도를 갖는 경우 A35는 A7보다 약 10% 가량 낮아진 소비전력을 보일 것이라고 한다. 반면 성능은 6~40% 정도 향상될 것이라고 한다. 구체적으로 정수연산 성능은 6%, 부동소수점 연산 성능은 36% 정도까지 향상되었다고 한다.

 

아마도 여러분이 가장 궁금해할 부분은 A35와 A53을 일대일로 비교한 결과일 것이다. 놀랍게도 다른 모든 조건이 동일할 때 A35는 A53 성능의 80~100% 정도를 달성할 수 있다고 한다. 구체적으로 웹브라우징 벤치마크에서는 A53의 80% 정도 성능을 보이고, 정수연산 성능은 A53의 84~85%, 메모리 성능이 중시되는 어플리케이션에서는 거의 같은 성능을 보일 것이라고 한다.

 

 

그러면서도 A35의 코어 사이즈는 A53의 75%, 소비전력은 68% 수준에 불과하다. ARM은 A35와 A53이 공존할 것이며 심지어 A53과 A35로 big.LITTLE을 구성할 수도 있을 것이라고 덧붙였지만, 개인적인 생각으로는 A53이 더 이상 존속할 이유가 없어졌다는 생각마저 든다. 심지어 고성는 A72와의 big.LITTLE 러닝메이트로도 A53보다 (차라리 클럭을 더 높인) A35를 더 매력적으로 느낄 제조사들이 많을 것이다. 설령 클럭을 높여 A35의 소비전력이 A53과 동등한 수준까지 상향되더라도 면적을 줄일 수 있다는 큰 장점이 여전히 남아 있기 때문이다.

 

 

ARM은 새로운 A35를 어떤 형태로든 융합하기 좋은 (most configurable) 코어 아키텍처로 홍보하고 있다. 설계자들은 그들이 원하는 바에 따라 NEON, 암호화, ACP 유닛 등을 탈착하거나 L2 캐시 구성을 마음대로 변경해 볼 수 있다. ARM은 장차 이 프로세서가 수십억 대의 스마트폰에 이식될 것으로 전망하고 있으며 나아가 IoT, 웨어러블 등에까지 사용될 것으로 내다보고 있다.

 

ARM은 Cortex-A35를 사용한 첫번째 양산품이 내년 연말께 나올 것으로 전망하고 있다. 높은 활용성과 기대 판매수량 등으로 미뤄 볼 때, A35는 의심의 여지 없이 앞으로 한동안 ARM의 가장 중요한 CPU 포트폴리오 중 하나가 될 것이다.

 

 

댓글 0

SC15 스케치 : IBM & Xilinx 편

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) SC15 스케치 : IBM & Xilinx 편 오늘 개막한 국제 고성능 컴퓨팅, 네트워크, 스토리지학회 (International Conference for High Performance Computing, Networking, Storage, and An...

by IYD on 5년 전
91

사상 첫 10코어 인텔 데스크탑 프로세서 출시 임박

Translator : Daeguen Lee (※ 이 글은 WCCFTech의 원문 (링크) 을 번역한 것입니다.) 사상 첫 10코어 인텔 데스크탑 프로세서 출시 임박 최근 브로드웰-E CPU의 잠정적인 사양이 공개되었다. 이에 따르자면 인텔은 다시 한번 그들의 하이엔드 데스크탑 (High-end Desktop...

by IYD on 5년 전
149 11

차세대 콘솔을 대하는 AMD의 키워드 : 전성비, VR

Translator : Daeguen Lee (※ 이 글은 WCCFTech의 원문 (링크) 을 번역한 것입니다.) 차세대 콘솔을 대하는 AMD의 키워드 : 전성비, VR 최근 우리는 AMD의 관계자로부터 이 회사의 미래 계획에 관한 이야기를 들을 수 있었다. 그 계획 가운데는 차세대 콘솔이 자연스레 ...

by IYD on 5년 전
94 1

Helio X30 : 미디어텍의 기상천외한 10코어 AP

Translator : Daeguen Lee (※ 이 글은 WCCFTech의 원문 (링크) 을 번역한 것입니다.) Helio X30 : 기상천외한 4클러스터 10코어 AP 얼마 전까지만 하더라도 우리는 Helio X20의 후속작에 대해 'A72 코어를 좀 더 늘릴 수도 있겠지' 정도 이상을 예상하지 못했다. 오늘 미...

by IYD on 5년 전
173

막강한 GPU 내장한 엑시노스 8890 깜짝 발표

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) 삼성, 엑시노스 8890 깜짝 발표 삼성은 어제 기습적으로 그들의 새로운 플래그십 SoC인 엑시노스 8 시리즈를 발표했다. 정확히는 엑시노스 8890 하나를 발표한 것인데, 이 제품은 올 ...

by IYD on 5년 전
352 1

ARM의 야심작, 초 저전력 Cortex-A35 코어 공개

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) 웨어러블용 초 저전력 Cortex-A35 코어 공개 TechCon 행사의 일환으로 오늘 ARM은 자사의 새로운 저전력 CPU 아키텍처 Cortex-A35를 공개했다. 알다시피 ARM은 자신들이 라이선싱하는...

by IYD on 5년 전
1,083

이례적인 2+2코어 구조의 스냅드래곤 820

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) 이례적인 2+2코어 구조의 스냅드래곤 820 스냅드래곤 820을 둘러싼 루머가 다방면에서 불거지는 가운데, 그중 몇가지가 며칠 전의 행사에서 해결되었다. 퀄컴은 이날 스냅드래곤 820...

by IYD on 5년 전
180 3

엔비디아, 머신러닝 겨냥한 새 테슬라 출시

Translator : Daeguen Lee (※ 이 글은 AnandTech의 원문 (링크) 을 번역한 것입니다.) 엔비디아, 머신러닝 겨냥한 새 테슬라 출시 맥스웰은 천천히, 하지만 꾸준히 서버 시장에 진출하기 위해 시도하고 있다. 비록 맥스웰 아키텍처의 선천적인 한계인 배정밀도 연산기능...

by IYD on 5년 전
152

화웨이, 엑시노스 7420 / 스냅드래곤 810보다 강력한 AP 출시

Translator : Daeguen Lee (※ 이 글은 WCCFTech의 원문 (링크) 을 번역한 것입니다.) 화웨이, 엑시노스 7420 / 스냅드래곤 810보다 강력한 AP 출시 그간 심심찮게 우리는 화웨이의 새 플래그십 AP "Kirin 950"의 유출된 성능에 관해 보도해 왔는데, 오늘 마침내 화웨이의...

by IYD on 5년 전
159

엔비디아, 4K 디스플레이 8개까지 출력 가능한 새 그래픽카드 발표

Translator : Daeguen Lee (※ 이 글은 WCCFTech의 원문 (링크) 을 번역한 것입니다.) 엔비디아, 4K 디스플레이 8개까지 출력 가능한 새 그래픽카드 발표 일반적인 그래픽카드의 사용영역과 달리, 대량의 디스플레이를 구동하면서도 그래픽 성능 자체는 그리 요구되지 않...

by IYD on 5년 전
269
서버에 요청 중입니다. 잠시만 기다려 주십시오...