A short essay on "Kaveri"

by IYD on 2013년 11월 27일 01시 23분 (5년 전) 조회: 87

페이스북 퍼가기  

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)




사실 "Future is fusion" 이라는 AMD의 슬로건에서부터 예견되었던 것이기도 하지만 CPU+GPU 이종교배의 진정한 힘은 다이사이즈 축소를 통한 원가절감 따위를 훨씬 상회하는 것이리라. Massive parallelism이 요구되는 영역에서 CPU의 역할을 전통적으로 프론트엔드가 해오던 작업으로 한정하고 GPU의 강력한 연산성능을 백엔드로 활용해 지금까지의 "CPU 성능" 척도를 무력한 수준으로 격하시키는 것이 처음부터 AMD의 의도이자 그들이 나아갈 방향일 것이니.그런 의미에서 (단지 CPU와 GPU의 물리적인 '동거' 수준에 머물렀던 경쟁사의 CPU들이나 AMD의 이전까지의 APU들과 달리) HSA, hUMA 등을 내세워 진정한 '헤테로지니어스 컴퓨팅'을 표방한 카베리의 등장은 그 자체로 특별한 의의를 갖는다.



카베리에서 CPU와 GPU의 총 연산성능이 856GFLOPS에 달한다는 그들의 레토릭은 그 구체적인 숫자 이전에 CPU와 GPU의 연산성능의 산술합을 성능의 척도로 제시하는 해괴한 계산법이 핵심으로, 아주 간단히 축약하자면 (sooner or later) 하다못해 SuperPI를 돌리더라도 CPU의 미약한 부동소수점 유닛이 아닌 거대한 GPU의 컴퓨팅 파워를 끌어다 쓸 수 있게 된다는 것. 이는 곧 AMD가 (카베리의 CPU 파트에 적용된 새 아키텍처인) 스팀롤러 기반의 -iGPU 없는- '단독' CPU를 예고하지 않은 점이나, (그간 APU-based 옵테론이 없었던 것을 생각하면) 이례적으로 카베리를 서버용으로도 투입할 것을 공언한 계량적 근거가 된다.


뭐 어쨌든 카베리는 완성체라기보단 이제 시작이니. 첫 술에 배부르겠냐는 느낌으로 느긋하게 지켜보려는 중. 그래도 생각보다 좋게 나와줬으면 하는 기대는 늘 하고 있다. 뭔가 당장 혁신적인 모습을 보일 수 없더라도 전통적인 의미에서의 CPU 성능이라도 의미 있는 향상을 이루면 좋을텐데.

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)

 

 

댓글 13

하하

5년 전

불도저 비쉐라 꼴만 안났으면 좋겠습니다 ㅋ

댓글 수정 삭제

IYD

5년 전

그러게요 ㅠㅠㅋ

댓글

민천우

5년 전

제가 했던 생각이랑 똑같네요 부동소수점 연산을 cpu가 아닌 gpu가 대신하게 되었고 거기다 gpu의 부동소수점 연산을 제한하지 않았고 벤치볼때 정수부분에서 많은 향상이 있었는데 기대가 되네요

댓글 수정 삭제

민천우

5년 전

홈페이지에 제가 쓴글 링크걸어놨는데 저랑 같은 생각을 하시는 분을 만나서 기쁘네요 ㅋㅋ 근데 카베리늕멏코어로 나올까요?4코어? 8코어?

댓글 수정 삭제

IYD

5년 전

일단 불도저부터 도입된 "모듈" 구조를 그대로 가져가는것 같은데, 카베리는 2개의 스팀롤러 모듈을 탑재한다고 합니다. 즉 현재의 트리니티/리치랜드와 마찬가지로 2모듈/4코어(스레드)를 갖게 됩니다.

댓글

민천우

5년 전

그럼 코어수가 4/8이라고 써있는데 4cpu코어 8cu 인가요??

댓글 수정 삭제

IYD

5년 전

GPU 파트를 보통 CPU랑 그렇게 병렬적으로 취급하는 건 본 적이 없어서... 4코어 또는 8코어라는 뜻일 것 같습니다.

댓글

RuBisCO

5년 전

그런데 왠지 그게 달성 되어도 CELL브로드밴드병진의 선례처럼 비대칭인 코어들을 유기적으로 활용하지 못하는 건 아닐까 우려되긴 합니다.

댓글 수정 삭제

IYD

5년 전

일단은 달성부터 하고 봐야... ^^;;;

댓글

RuBisCO

5년 전

아 망했어요... 2년전 물건들한테 털리고 있어요...

댓글 수정 삭제

IYD

5년 전

괜찮은것 같은데요...^^

댓글

하드웨어에 당이 어디있냐

5년 전

K10.5의 정수 파이프라인 코어 당 3개, 모듈의 정수 파이프라인 코어 당 2개(합쳐서 4개) 어디 출처인지 기억은 안 나지만 모듈 구조의 장점은 다이 사이즈에 있다고 들었습니다. 다만, FX시리즈는 대용량 L3캐시와 설계 검수를 제대로 하지않아서 다이 사이즈가 폭등했고 코어 당 파이프라인 갯수가 줄어들면서 성능을 일정부분 유지하기 위해서 고클럭으로 가게되었고 결론은 낮은 성능과 높은 소비전력으로 망했습니다

AMD는 K10.5때 자사 공장을 팔아먹었고 외부 팹에서 칩을 생산하니 개발과 생산 연계가 쉽지 않을것이고 비용적인 부담이 인텔보다 훨씬 높을거라고 생각합니다 필연적으로 그래서 생산 원가에 사활을 걸고 모듈을 유지시키는 것이 아닐지ㅎㅎ 정확한 출처는 기억이 안나지만 K10.5를 32nm로 이행했어도 모듈 사이즈보다는 한참 컸을거라는 분석을 본 적이 있네요

카베리의 스팀롤러도 근본적으로 불도저의 모듈 구조에서 약간의 변화를 준 것으로 알고있습니다. 간혹가다 데네브에 털린다든지 이런 글 보긴하는데 어차피 코어 당 정수 파이프라인이나 기타 자원을 줄였기때문에 데네브 IPC에 털리는건 당연하지 않을까요? APU는 말 그대로 CPU와 GPU파트를 하나의 칩에 집적한것인데 앞서 말했듯 사이즈의 이점과(인텔에 비하면.. 공정이 딸리는터라 어쩔수없죠..) 상당한 크기를 차지하는 FX의 대용량 L3캐시가 APU라인에서는 제거되어 있기때문에 설사 동일 구조를 사용한 FX에 비해서 IPC가 떨어지더라도 더 많은 그래픽 프로세서를 집적할수있고 ㄷㄱ님이 글 초반부에 말씀드렸듯 AMD의 목적은 내장한 GPU의 프로세싱 파워를 극대화해서 CPU파트의 성능을 한정된 자원에서 끌어내려는게 AMD가 할수있는 최선의 방책이 아니지 싶네요

제 의견에 어떻게 생각하시는지요? 댓글이다보니 제가 말씀드리려는 내용의 한 30퍼센트는 부득이하게 상기 본문에 적혀있질 않으시지만 ㄷㄱ님은 제가 무슨 소리를 하려는것인지 대충 아실거라고 생각합니다ㅎ 평소 ㄷㄱ님 포스팅 잘 읽고있고 매번 수고에 감사합니다

댓글 수정 삭제

IYD

5년 전

한 문장으로 요약해 "AMD를 위한 변명" 쯤 되려나요.ㅎㅎ 물론 이 말은 저 스스로도 AMD 팬인 입장에서 내뱉은 것이니 비꼬는 것이란 오해는 안 하실거라 믿습니다^^;

사실 변명이라기보다도 그들의 전략이 그러함을 받아들이고 나면 일련의 행보가 지극히 이성적인 판단에 의한 것임을 알 수 있을텐데 그렇지 않은 사람들이 있어 가끔 답답함을 느끼곤 합니다. 뭐 비단 팬덤간에만 있는 현상도, 하드웨어란 분야에만 있는 현상은 더더욱 아니니깐 그러려니 합니다. 뭔가 얘기가 점점 더 큰 담론으로 흘러가는것 같으니 이쯤에서 ^^;;

암튼. 제 글을 평소에도 읽어 주셨다니 정말 감사합니다. 페북 하시면 친추해 주셔도 좋고, 활동하시는 커뮤니티가 있다면 살짝 귀띔해 주셔도 좋을 것 같네요. 물론 연결고리가 전혀 없더라도 제 블로그에 와서 제 글을 읽어 주신 것만으로 감사하구요.^^

좋은 하루 되시고, 향후 며칠간 리뷰가 심심찮게 올려질 예정이니 종종 들러 확인해 주시길 바랍니다. 댓글도 남겨 주시면 제가 더 반갑겠죠? ^^

댓글

사진 및 파일 첨부

여기에 파일을 끌어 놓거나 왼쪽의 버튼을 클릭하세요.

파일 크기 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )
 
서버에 요청 중입니다. 잠시만 기다려 주십시오...