기타 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] VGA 계산기 : 실전 응용편

IYD | 조회 55 | 추천 0 | 2011.01.14. 01:52 http://drmola.com/etc_column/29385

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)




오늘날 우리가 사용하는 그래픽카드의 성능을 알기 위해 여러 테스트 툴을 동원하고 있는데
이러한 툴로 직접 테스트한 결과가 공개되기 전까지는 신제품의 성능을 짐작할 수 없어 답답했습니다.
그래서... 공개된 '스펙'만으로 성능을 어떻게 예측해볼까 고민하다 방정식을 만들어보게 되었습니다ㅋ

그럼 편하게 읽어 주세요~ ^^


GPU의 연산은 내부적으로 매우 복잡한 단계를 거치지만

간략화시키면 아래의 세 단계가 됩니다.

1. 쉐이더 작업 (오브젝트의 모양을 만듦)
2. 텍스처 작업 (오브젝트의 모양 위에 질감을 씌움)
3. 렌더링 작업 (모양 & 질감이 형성된 오브젝트를 '그려 냄')

각 작업에 영향을 주는 요소는 쉐이더(SP) / 텍스처 유닛(TMU) / 렌더링 아웃풋 파이프라인(ROP) 이고
각 요소의 갯수 x 클럭에 비례해서 연산속도가 늘어나게 됩니다.
간단히 말해 SP 갯수가 두개 많거나 쉐이더 클럭이 두배 높으면
쉐이더 작업에 걸리는 시간이 1/2로 단축된다는 것이죠.


이렇게 각각의 작업에 할당되는 시간을 계산해서 더하고
GPU 내부에서 각 단계 사이사이에서 낭비되는 시간 (=레이턴시) 을 계산하기 위해서
레이턴시는 단순히 GPU 클럭에 반비례한다고 가정했습니다.
(∴ 클럭이 높을수록 지연시간이 낮아질 테니까요)

그리고 마지막으로, 데이터가 GPU ↔ 메모리 사이를 오가는 레이턴시를 계산하기 위해
이때의 레이턴시는 메모리 대역폭에 반비례한다고 보았습니다.
대역폭은 메모리클럭 x 메모리 비트수로 구해지는 값입니다.


즉 방정식의 최종 모습은 아래와 같게 됩니다.

VGA 연산 시간 = S/(SP 속도) + T/(TMU 속도) + R/(ROP 속도) + I/(GPU 클럭) + O/(메모리 대역폭)

위의 식에서 S / T / R은 각각 쉐이더, 텍스처, 렌더링 연산량을 의미하는 상수입니다.
SP 속도 / TMU 속도 / ROP 속도는 위에서 설명했듯 각 유닛의 갯수 x 클럭으로 정해집니다.
한편 I-항과 O-항은 각각 GPU 내부 / GPU ↔ 메모리 사이의 레이턴시를 의미하는데
I / O 각 문자는 I-항 / O-항의 비례상수가 됩니다.
(더 자세한 설명은 이 글 참조 -> http://udteam.tistory.com/59)


아무튼. 이렇게 해서 만든 방정식을 엑셀 파일로 저장해두고 필요할 때마다 꺼내서 두드려보곤 하는데요
이 방정식을 GTX 200 시절에 만들었음에도 불구하고 최신 그래픽카드까지의 서열도 잘 반영되는 편입니다.
(물론 정확히 몇% 성능이 나온다- 까지 맞지는 않지만, 대충 그래픽카드간의 서열 비교는 되는 편이죠)


백문이 불여일견...
네이밍이 거지같은 -_-;;;; 465, 460 1GB, 460 768MB 사이의 성능 관계를 한번 계산해 봅시다.
우선 465의 스펙을 입력해 보겠습니다.


GTX 465
(352SP / 44TMU / 32ROP / GPU 607MHz / Shader 1215MHz / RAM 3206MHz / 256bit)


▲ 성능표 기준으로 280보다는 좋고 285보다는 약간 안 좋은 전형적인 465의 성능이 나왔습니다.
실제로 벤치를 돌려 보면 모델명으론 아래인 460이 465와 비슷하거나 (768MB 버전) 더 뛰어난 (1GB 버전) 성능을 보여주는데, 과연 이 방정식으로 계산해 본 결과는 어떨까요?


GTX 460 768MB
(336SP / 56TMU / 24ROP / GPU 675MHz / Shader 1350MHz / RAM 3600MHz / 192bit)


▲ 실제와 거의 비슷한 결과입니다. 460 768MB 버전과 465가 성능이 거의 비슷하게 나왔죠?
특히 게임성능이 비슷한 데 비해서 (Model 2의 결과) 3DMark 처럼 쉐이더를 떡칠한 테스트에선
460보다 465가 더 유리하단 것까지 비교적 정확히 반영하고 있습니다. (Model 1의 결과)

그렇다면 과연, 460 1GB 버전이 465를 앞서는 것도 방정식으로 예측할 수 있을까요?


GTX 460 1GB
(336SP / 56TMU / 32ROP / GPU 675MHz / Shader 1350MHz / RAM 3600MHz / 256bit)


▲ 방정식에 넣어 본 결과 실제로 460 1GB버전이 465를 누르는 것으로 나오고 있습니다.
특히 460 1GB의 게임성능은 275~280과 동급이고, 285보다는 떨어지지만 3DMark 점수는 더 잘 나오는 편인데
이것마저도 정확히 반영하고 있습니다. (285의 결과를 100%로 잡았으니 쉽게 비교가 가능하실 겁니다)


그리고 마지막으로...
460 1GB 버전을 800MHz 정도로 오버클럭하면 3DMark Vantage 성능이 470이랑 비슷해지는데
이것도 방정식으로 예측이 가능할지 한번 살펴보도록 하죠.

우선 470의 스펙을 입력해 보겠습니다.


GTX 470
(448SP / 56TMU / 40ROP / GPU 607MHz / Shader 1215MHz / RAM 3348MHz / 320bit)


▲ 470의 성능이 이렇게 나오는군요. 460 1GB를 800MHz로 오버한 스펙도 입력해 보겠습니다.


GTX 460 1GB @ 800/4000


▲ 어떤가요?
오버된 460의 성능이 좀 높게 나온 것 같긴 하지만 그래도 우리가 알고 있는 것과 가까운 결과값이 나왔습니다.
특히 Shader-heavy 모델의 적중률이 높은 편인데 이것은 특별한 비결이 있다기보단 제가 실제 게이밍 환경의 텍스처 / 렌더링 연산량 비율을 정확히 모르기 때문입니다. (-_-;;)


한편, 같은 방법으로 AMD 그래픽카드들의 성능도 비교해 볼 수 있는데
비교적 최근에 출시되어 성능이 공개된 6800 시리즈의 스펙을 한번 입력해 봅시다.


HD 6870
(1120SP / 56TMU / 32ROP / GPU 900MHz / RAM 4200MHz / 256bit)


▲ 보시다시피 6870의 쉐이더(SP) 갯수가 5850보다 많이 적은데도 불구하고
Shader-heavy 모델인 3DMark 모델에서도 5850 < 6870 < 5870의 관계를 성립시키고 있습니다.
그만큼 이 방정식이 코어클럭, 메모리 대역폭 등 다른 요소들로 인한 영향을 무시하지 않는다는 뜻도 되죠.
특히 3DMark 에서 그나마 성능이 안 나오는 편인 6800번대의 특성을 잘 반영해
실 게임성능 모델 (Model 2) 에서는 5850을 더 큰 격차로 따돌리며 5870과 5850 사이의 성능을 내고 있습니다.


그렇다면 6850은 어떨까요?


HD 6850
(960SP / 48TMU / 32ROP / GPU 775MHz / RAM 4000MHz / 256bit)


▲ 6850은 SP 갯수가 적어 3DMark 성능에선 5830보다 떨어지는 편이지만 실 게임성능은 5830보다 뛰어납니다.
...보시다시피, 방정식으로 계산한 결과에서도 이를 정확히 반영하고 있습니다.
(Model 1 / Model 2에서의 결과값을 5830 항목과 비교해 보세요)


아무튼...ㅋㅋ 그래픽카드 성능 계산식이란 개념에 좀 더 친숙해지셨으면 하는 바램에 끄적여 봤습니다. :-P

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)

 

  • |
  • |
  1. 6870.jpg (File Size:93.8KB/Download:0)
  2. gtx465.jpg (File Size:81.7KB/Download:0)
  3. gtx460_OC.jpg (File Size:81.4KB/Download:1)
  4. gtx460_1g.jpg (File Size:81.3KB/Download:0)
  5. gtx460_768.jpg (File Size:81.2KB/Download:0)
  6. 6850.jpg (File Size:93.8KB/Download:0)
  7. gtx470.jpg (File Size:81.6KB/Download:1)
facebook twitter google plus pinterest kakao story band

서명

no image

IYD

(level 1)

적용중인 트로피가 없습니다.

Profile image 독학맨 2010.12.28 11:49
아수스 메인보드 성능표에 있던데
멀티VGA 상세 지원 : CF X + Hybrid CF X
이제품에 -1만원 메인보드가 그냥 Hybrid CF X 이던데 CF X라는게 뭔가요?
수정 삭제
Profile image IYD 2010.12.28 18:44
하이브리드 크파는 내장그래픽이 있는 경우에, 내장그래픽이랑 저가형 외장그래픽을 묶어 쓸 수 있는 기능입니다. 사실상 유명무실한 기능이라고 보셔도 돼요ㅋ
Profile image 독학맨 2010.12.28 19:39
아하..CF 가 크로스파이어였군요 ㅎ;.
수정 삭제
Profile image DGLee 2011.01.12 17:41
오 들러주셔서 감사합니다^^
수정 삭제
Profile image 왕달구 2011.01.30 22:06
최근에 파워가 폭발(?)해 버려 근 3년만에 컴을 사려 하다가,
VGA 관련하여 좋은 글이 있길래 보고 갑니다.
여전히 ATI를 살지 nVIDIA를 살지 고민입니다만 ^^
(샌디브릿지를 살지 린필드를 살지, AMD로 가버릴지도 고민 -_-a
컴퓨터 부품은 선택의 폭이 너무 넓어요 ㅠ.ㅠ)
수정 삭제
Profile image K.S.J 2011.02.11 21:16
안녕하세요~ 이번에도 역시 질문이 있어서 댓글을 올려봅니다ㅎ
간단한 질문인데요... 쉐이더를 하는게 SP라고 하셨는데 여기서 SP가
Stream Processor의 줄임말이 맞나요?
수정 삭제
Profile image K.S.J 2011.02.11 21:23
그럼 엔비디아의 SP는 CUDA프로세서인가요?
수정 삭제
Profile image ㄷㄱ ver.2 2011.02.11 22:25
네. SP는 Shader Processor / Streaming Processor의 약자입니다.
엔비디아의 SP는 CUDA 코어인 것도 맞고요..ㅋ
수정 삭제
Profile image K.S.J 2011.02.13 14:56
감사합니다~ㅎㅎ
수정 삭제
Profile image 대단해!! 2011.04.16 13:02
이런방정식툴이나작성자께서 사용하신 툴은 어디서 구할수있나요?
수정 삭제
Profile image ㄷㄱ ver.2 2011.04.17 20:58
엑셀로 만들었습니다^^;
본문에 첨부된 성능표도 엑셀로 꾸민 거에요...^^
수정 삭제
Profile image 노형덕 2011.04.24 13:16
그렇긴 하지만.. 5870의 가격과 소비전력이..ㅋ

오 25만원정도 하는 게 하나 있네요 5870ㅋㅋ
수정 삭제
Profile image 초보열공 2012.03.24 01:22
안녕하세요
그래픽카드의 TMU와 ROP를 쉽게 확인할수있는 방법은 무엇이 있을까요?
위키에서 찾아봐도 다른 정보의 글만뜨고 해서요~~
수정 삭제
  • 맥 프로의 가치 [ICT] 맥 프로의 가치 [7] file

    Author : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)0. 내색한 적은 한번도 없지만 (그리고 아무도 안 믿을테지만) 내겐 완제품 PC에 대한 로망이 있다. 특히 맥... 새로 나온 맥 프로가 그간 이미지로만 보던것과 달리 매우 아담하단 사실에 ...

    • IYD |
    • 13.12.26 |
    • 조회 30 |
  • A short essay on "Kaveri" [CPU] A short essay on "Kaveri" [13] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 사실 "Future is fusion" 이라는 AMD의 슬로건에서부터 예견되었던 것이기도 하지만 CPU+GPU 이종교배의 진정한 힘은 다이사이즈 축소를 통한 원가절감 따위를 훨씬 상회하는 것이리라. Ma...

    • IYD |
    • 13.11.27 |
    • 조회 6 |
  • [VGA] 라데온 R9 290 -> R9 290X 변신?! [14] secret

    비밀글입니다.

    • IYD |
    • 13.11.15 |
    • 조회 2 |
  • [VGA] GeForce GTX 780 GHz에 관한 썰 [4] secret

    비밀글입니다.

    • IYD |
    • 13.10.31 |
    • 조회 0 |
  • NVIDIA GeForce GTX 780 Ti 성능 예측 [VGA] NVIDIA GeForce GTX 780 Ti 성능 예측 [6] file

    글쓴이 : 이대근연락처 : leedaeguen [at] kaist.ac.kr(이 블로그의 CCL정책에 위배되는 무단전재 및 재배포를 금지합니다)두시간 전 해외 포럼인 ChipHell을 통해 GTX 780 Ti의 사양으로 추정되는 스크린샷이 유출되었습니다.▲ GTX 780 Ti의 사양으로 2496SP설, 2688SP설, 2880SP설 등이 분분했는데, 위의 정보가 정확한 것...

    • IYD |
    • 13.10.22 |
    • 조회 46 |
  • An essay on NVIDIA GeForce GTX 780 Ti [VGA] An essay on NVIDIA GeForce GTX 780 Ti [5] file

    글쓴이 : 이대근 (이 블로그의 CCL 정책에 위배되는 무단전재 및 재배포를 금지합니다) 엔비디아에서 방금 지포스 GTX 780 Ti라는 새 제품의 출시를 예고했습니다. 그간의 네이밍 정책에 비춰 볼 때 해당 제품은 GTX 780의 상위 모델일 것은 확실하나 모델 넘버가 없는 GTX TITAN과의 우열관계는 확실치 않은데, 일단 단선적...

    • IYD |
    • 13.10.19 |
    • 조회 5 |
  • FCAT : 프랩스에 종언을 고함 [VGA] FCAT : 프랩스에 종언을 고함 [2] file

    글쓴이 : 이대근 (이 블로그의 CCL정책에 위배되는 무단전재/재배포를 금지합니다) 재미있는 글을 읽었습니다. 일단 글을 소개하자면 원문은 아래 링크와 같습니다. (see this : http://techreport.com/review/24553) 간단히 요약하자면 "Fraps로 측정하는 프레임레이트는 정확하지 않다. 나아가 현존하는 모든 방식의 프레...

    • IYD |
    • 13.09.30 |
    • 조회 16 |
  • GK110, 하와이 가상 대결 : by VGA 계산기 [VGA] GK110, 하와이 가상 대결 : by VGA 계산기 [7] file

    글쓴이: 이대근 (이 블로그의 CCL 정책에 위배되는 무단전재/재배포를 금지합니다) 그동안 '그래픽카드 성능 방정식'을 사용해 몇번의 포스팅을 올리곤 했는데, 혹시 이 방정식의 배경이 궁금하셨던 분은 안 계셨는지요. 오늘은 아직 출시되지 않은 '가까운 미래의' 그래픽카드의 성능을 예측함과 함께 그간 한번도 직접적으...

    • IYD |
    • 13.09.12 |
    • 조회 23 |
  • [VGA] A short essay on GK110 [4]

    글쓴이: 이대근 (이 블로그의 CCL 정책에 위배되는 무단전재/재배포를 금지합니다) 지금으로부터 약 19개월 전, AMD는 코드명 Southern Islands로 명명된 새 GPU를 발표했고 이들 제품군은 전세대 자사/경쟁사 플래그십 제품군 대비 2배~2.5배에 가까운 압도적인 성능 향상을 가져온 반면 소비전력은 전세대와 별 차이가 없...

    • IYD |
    • 13.09.05 |
    • 조회 7 |
  • [ICT] 주파수경매 총평

    글쓴이: 이대근 연락처: leedaeguen [at] kaist.ac.kr (이 블로그의 CCL 정책에 위배되는 무단전재/재배포를 금지합니다) 주파수경매 총평 (매우 주관적임) : 1. KT는 (이미 보유하고 있던) 1.8GHz대역 20MHz폭(업로드 10/다운로드 10)의 바로 옆에 추가로 15MHz폭(업 5/다운 10)을 보유하게 됨으로써 별도의 기술적 변경 없...

    • IYD |
    • 13.08.31 |
    • 조회 18 |
  • [VGA] 지포스 GTX TITAN 성능 예상 : by VGA 계산기 [3]

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) ▶ 참고글1: http://iyd.kr/488 (그래픽카드 성능 방정식을 이용한 7970/680 성능 예측) ▶ 참고글2: http://iyd.kr/200 (그래픽카드 성능 방정식을 이용한 페르미 라인업의 성능 예측) ▶ 참...

    • IYD |
    • 13.02.19 |
    • 조회 32 |
  • It still works! : VGA 계산기로 돌려 본 7970, 680 예상 성능 [VGA] It still works! : VGA 계산기로 돌려 본 7970, 680 예상 성능 [8] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 안녕하세요. 한동안 올릴 글이 없었는데 지인의 요청을 받고 간단히 해 본 실험입니다.ㅎㅎ 다름이 아니라...... 오래 전 만든 'VGA 성능 방정식' 이 최신 VGA에까지 적용이 가능한지 여부...

    • IYD |
    • 12.04.11 |
    • 조회 40 |
  • [CPU] 잊혀진 아키텍처들 (예고편) [22] secret

    비밀글입니다.

    • IYD |
    • 11.10.17 |
    • 조회 4 |
  • [VGA] Hybrid PhysX 구성 팁 [12] secret

    비밀글입니다.

    • IYD |
    • 11.08.06 |
    • 조회 1 |
  • Hybrid PhysX : 6990 + GTX260 [VGA] Hybrid PhysX : 6990 + GTX260 [5] file

    글쓴이: 이대근 (ㄷㄱ)※ 무단전재 및 재배포를 금지합니다. 퍼가실 때에는 원제, 작성자, 출처를 반드시 병기해 주시기 바랍니다 ※ 안녕하세요. 오랜만에 벤치를 작성하게 되었습니다ㅋㅋ 이 블로그 개설 초기에 라데온 4870 + 9800GT를 사용한 하이브리드 피직스 구성 팁을 올렸었는데요,드라이버 버전들이 많이 올라가고 (...

    • IYD |
    • 11.08.05 |
    • 조회 6 |
  • AFR의 비밀 : 크로스파이어 미지원 게임 수동 설정법 [VGA] AFR의 비밀 : 크로스파이어 미지원 게임 수동 설정법 [14] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 크파 유저분들은 가끔 이 문제로 속을 썩으셨을 텐데요...비싼 돈 들여 크파를 구성해 놨더니 정작 갖고 있는 게임이 크파를 지원하지 않는다면?!눈물을 머금고 GPU 하나만 갈구며 게임을 ...

    • IYD |
    • 11.07.10 |
    • 조회 86 |
  • [VGA] Some articles on multi-GPU scaling [6] secret

    비밀글입니다.

    • IYD |
    • 11.06.30 |
    • 조회 0 |
  • 파이프라이닝의 이해 [CPU] 파이프라이닝의 이해 [22] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) (그림 출처: 위키피디아)명령어가 수행되는 과정을 아래와 같다고 칩시다.인출 - 디코드 - 실행 - 쓰기(완료)이 네가지 과정은 각각 해당 과정의 기능에 맞는 하드웨어에 의해 수행되고이...

    • IYD |
    • 11.03.02 |
    • 조회 73 |
  • 멀티스레딩 기술의 이해 [CPU] 멀티스레딩 기술의 이해 [53] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 오늘은 현대 CPU의 성능향상 기법 중 하나인 SMT에 대해 간단히 알아 보겠습니다.SMT는 Simutaneous Multi-threading의 약자로, 동시에 여러 스레드를 처리하는 기법을 통칭합니다.CPU의 ...

    • IYD |
    • 11.02.05 |
    • 조회 97 |
  • 현대 CPU의 구조 : 프론트엔드 편 [CPU] 현대 CPU의 구조 : 프론트엔드 편 [36] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) Tweet 얼마 전 백엔드 구조를 중심으로 현대의 CPU에 대해 알아 보았습니다.(현대 CPU의 구조 강좌 <백엔드 편> ☞ 여기)이번 강좌에서는 그때 설명하지 않고 남겨둔 프론트엔드에 대해 간...

    • IYD |
    • 11.01.22 |
    • 조회 180 |