기타 칼럼

리뷰(게임, 하드웨어, 칼럼, 영상리뷰) 게시판은
닥터몰라 운영진이 작성한 게시글을 보는 게시판으로 회원들의 작성은 금지되어 있습니다.
(단, 좋은 글이 있으면 글 작성자의 허락과 운영자의 회의를 통하여 리뷰게시판으로 이동 됩니다.)

[VGA] VGA 계산기 : 실전 응용편

IYD | 조회 116 | 추천 0 | 2011.01.14. 01:52 http://drmola.com/etc_column/29385

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)




오늘날 우리가 사용하는 그래픽카드의 성능을 알기 위해 여러 테스트 툴을 동원하고 있는데
이러한 툴로 직접 테스트한 결과가 공개되기 전까지는 신제품의 성능을 짐작할 수 없어 답답했습니다.
그래서... 공개된 '스펙'만으로 성능을 어떻게 예측해볼까 고민하다 방정식을 만들어보게 되었습니다ㅋ

그럼 편하게 읽어 주세요~ ^^


GPU의 연산은 내부적으로 매우 복잡한 단계를 거치지만

간략화시키면 아래의 세 단계가 됩니다.

1. 쉐이더 작업 (오브젝트의 모양을 만듦)
2. 텍스처 작업 (오브젝트의 모양 위에 질감을 씌움)
3. 렌더링 작업 (모양 & 질감이 형성된 오브젝트를 '그려 냄')

각 작업에 영향을 주는 요소는 쉐이더(SP) / 텍스처 유닛(TMU) / 렌더링 아웃풋 파이프라인(ROP) 이고
각 요소의 갯수 x 클럭에 비례해서 연산속도가 늘어나게 됩니다.
간단히 말해 SP 갯수가 두개 많거나 쉐이더 클럭이 두배 높으면
쉐이더 작업에 걸리는 시간이 1/2로 단축된다는 것이죠.


이렇게 각각의 작업에 할당되는 시간을 계산해서 더하고
GPU 내부에서 각 단계 사이사이에서 낭비되는 시간 (=레이턴시) 을 계산하기 위해서
레이턴시는 단순히 GPU 클럭에 반비례한다고 가정했습니다.
(∴ 클럭이 높을수록 지연시간이 낮아질 테니까요)

그리고 마지막으로, 데이터가 GPU ↔ 메모리 사이를 오가는 레이턴시를 계산하기 위해
이때의 레이턴시는 메모리 대역폭에 반비례한다고 보았습니다.
대역폭은 메모리클럭 x 메모리 비트수로 구해지는 값입니다.


즉 방정식의 최종 모습은 아래와 같게 됩니다.

VGA 연산 시간 = S/(SP 속도) + T/(TMU 속도) + R/(ROP 속도) + I/(GPU 클럭) + O/(메모리 대역폭)

위의 식에서 S / T / R은 각각 쉐이더, 텍스처, 렌더링 연산량을 의미하는 상수입니다.
SP 속도 / TMU 속도 / ROP 속도는 위에서 설명했듯 각 유닛의 갯수 x 클럭으로 정해집니다.
한편 I-항과 O-항은 각각 GPU 내부 / GPU ↔ 메모리 사이의 레이턴시를 의미하는데
I / O 각 문자는 I-항 / O-항의 비례상수가 됩니다.
(더 자세한 설명은 이 글 참조 -> http://udteam.tistory.com/59)


아무튼. 이렇게 해서 만든 방정식을 엑셀 파일로 저장해두고 필요할 때마다 꺼내서 두드려보곤 하는데요
이 방정식을 GTX 200 시절에 만들었음에도 불구하고 최신 그래픽카드까지의 서열도 잘 반영되는 편입니다.
(물론 정확히 몇% 성능이 나온다- 까지 맞지는 않지만, 대충 그래픽카드간의 서열 비교는 되는 편이죠)


백문이 불여일견...
네이밍이 거지같은 -_-;;;; 465, 460 1GB, 460 768MB 사이의 성능 관계를 한번 계산해 봅시다.
우선 465의 스펙을 입력해 보겠습니다.


GTX 465
(352SP / 44TMU / 32ROP / GPU 607MHz / Shader 1215MHz / RAM 3206MHz / 256bit)


▲ 성능표 기준으로 280보다는 좋고 285보다는 약간 안 좋은 전형적인 465의 성능이 나왔습니다.
실제로 벤치를 돌려 보면 모델명으론 아래인 460이 465와 비슷하거나 (768MB 버전) 더 뛰어난 (1GB 버전) 성능을 보여주는데, 과연 이 방정식으로 계산해 본 결과는 어떨까요?


GTX 460 768MB
(336SP / 56TMU / 24ROP / GPU 675MHz / Shader 1350MHz / RAM 3600MHz / 192bit)


▲ 실제와 거의 비슷한 결과입니다. 460 768MB 버전과 465가 성능이 거의 비슷하게 나왔죠?
특히 게임성능이 비슷한 데 비해서 (Model 2의 결과) 3DMark 처럼 쉐이더를 떡칠한 테스트에선
460보다 465가 더 유리하단 것까지 비교적 정확히 반영하고 있습니다. (Model 1의 결과)

그렇다면 과연, 460 1GB 버전이 465를 앞서는 것도 방정식으로 예측할 수 있을까요?


GTX 460 1GB
(336SP / 56TMU / 32ROP / GPU 675MHz / Shader 1350MHz / RAM 3600MHz / 256bit)


▲ 방정식에 넣어 본 결과 실제로 460 1GB버전이 465를 누르는 것으로 나오고 있습니다.
특히 460 1GB의 게임성능은 275~280과 동급이고, 285보다는 떨어지지만 3DMark 점수는 더 잘 나오는 편인데
이것마저도 정확히 반영하고 있습니다. (285의 결과를 100%로 잡았으니 쉽게 비교가 가능하실 겁니다)


그리고 마지막으로...
460 1GB 버전을 800MHz 정도로 오버클럭하면 3DMark Vantage 성능이 470이랑 비슷해지는데
이것도 방정식으로 예측이 가능할지 한번 살펴보도록 하죠.

우선 470의 스펙을 입력해 보겠습니다.


GTX 470
(448SP / 56TMU / 40ROP / GPU 607MHz / Shader 1215MHz / RAM 3348MHz / 320bit)


▲ 470의 성능이 이렇게 나오는군요. 460 1GB를 800MHz로 오버한 스펙도 입력해 보겠습니다.


GTX 460 1GB @ 800/4000


▲ 어떤가요?
오버된 460의 성능이 좀 높게 나온 것 같긴 하지만 그래도 우리가 알고 있는 것과 가까운 결과값이 나왔습니다.
특히 Shader-heavy 모델의 적중률이 높은 편인데 이것은 특별한 비결이 있다기보단 제가 실제 게이밍 환경의 텍스처 / 렌더링 연산량 비율을 정확히 모르기 때문입니다. (-_-;;)


한편, 같은 방법으로 AMD 그래픽카드들의 성능도 비교해 볼 수 있는데
비교적 최근에 출시되어 성능이 공개된 6800 시리즈의 스펙을 한번 입력해 봅시다.


HD 6870
(1120SP / 56TMU / 32ROP / GPU 900MHz / RAM 4200MHz / 256bit)


▲ 보시다시피 6870의 쉐이더(SP) 갯수가 5850보다 많이 적은데도 불구하고
Shader-heavy 모델인 3DMark 모델에서도 5850 < 6870 < 5870의 관계를 성립시키고 있습니다.
그만큼 이 방정식이 코어클럭, 메모리 대역폭 등 다른 요소들로 인한 영향을 무시하지 않는다는 뜻도 되죠.
특히 3DMark 에서 그나마 성능이 안 나오는 편인 6800번대의 특성을 잘 반영해
실 게임성능 모델 (Model 2) 에서는 5850을 더 큰 격차로 따돌리며 5870과 5850 사이의 성능을 내고 있습니다.


그렇다면 6850은 어떨까요?


HD 6850
(960SP / 48TMU / 32ROP / GPU 775MHz / RAM 4000MHz / 256bit)


▲ 6850은 SP 갯수가 적어 3DMark 성능에선 5830보다 떨어지는 편이지만 실 게임성능은 5830보다 뛰어납니다.
...보시다시피, 방정식으로 계산한 결과에서도 이를 정확히 반영하고 있습니다.
(Model 1 / Model 2에서의 결과값을 5830 항목과 비교해 보세요)


아무튼...ㅋㅋ 그래픽카드 성능 계산식이란 개념에 좀 더 친숙해지셨으면 하는 바램에 끄적여 봤습니다. :-P

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)

 

IYD's Signature

적용중인 트로피가 없습니다.

DR.MOLA

레벨 Lv. 2 (30%)
포인트 496 p
출석 11 일 (개근 0 일)

IYD'님의

  1. 6870.jpg (File Size:93.8KB/Download:0)
  2. gtx465.jpg (File Size:81.7KB/Download:1)
  3. gtx460_OC.jpg (File Size:81.4KB/Download:1)
  4. gtx460_1g.jpg (File Size:81.3KB/Download:0)
  5. gtx460_768.jpg (File Size:81.2KB/Download:0)
  6. 6850.jpg (File Size:93.8KB/Download:0)
  7. gtx470.jpg (File Size:81.6KB/Download:1)
facebook twitter google plus pinterest kakao story band
Profile image 독학맨 2010.12.28 11:49
아수스 메인보드 성능표에 있던데
멀티VGA 상세 지원 : CF X + Hybrid CF X
이제품에 -1만원 메인보드가 그냥 Hybrid CF X 이던데 CF X라는게 뭔가요?
수정 삭제
Profile image IYD 2010.12.28 18:44
하이브리드 크파는 내장그래픽이 있는 경우에, 내장그래픽이랑 저가형 외장그래픽을 묶어 쓸 수 있는 기능입니다. 사실상 유명무실한 기능이라고 보셔도 돼요ㅋ
Profile image 독학맨 2010.12.28 19:39
아하..CF 가 크로스파이어였군요 ㅎ;.
수정 삭제
Profile image DGLee 2011.01.12 17:41
오 들러주셔서 감사합니다^^
수정 삭제
Profile image 왕달구 2011.01.30 22:06
최근에 파워가 폭발(?)해 버려 근 3년만에 컴을 사려 하다가,
VGA 관련하여 좋은 글이 있길래 보고 갑니다.
여전히 ATI를 살지 nVIDIA를 살지 고민입니다만 ^^
(샌디브릿지를 살지 린필드를 살지, AMD로 가버릴지도 고민 -_-a
컴퓨터 부품은 선택의 폭이 너무 넓어요 ㅠ.ㅠ)
수정 삭제
Profile image K.S.J 2011.02.11 21:16
안녕하세요~ 이번에도 역시 질문이 있어서 댓글을 올려봅니다ㅎ
간단한 질문인데요... 쉐이더를 하는게 SP라고 하셨는데 여기서 SP가
Stream Processor의 줄임말이 맞나요?
수정 삭제
Profile image K.S.J 2011.02.11 21:23
그럼 엔비디아의 SP는 CUDA프로세서인가요?
수정 삭제
Profile image ㄷㄱ ver.2 2011.02.11 22:25
네. SP는 Shader Processor / Streaming Processor의 약자입니다.
엔비디아의 SP는 CUDA 코어인 것도 맞고요..ㅋ
수정 삭제
Profile image K.S.J 2011.02.13 14:56
감사합니다~ㅎㅎ
수정 삭제
Profile image 대단해!! 2011.04.16 13:02
이런방정식툴이나작성자께서 사용하신 툴은 어디서 구할수있나요?
수정 삭제
Profile image ㄷㄱ ver.2 2011.04.17 20:58
엑셀로 만들었습니다^^;
본문에 첨부된 성능표도 엑셀로 꾸민 거에요...^^
수정 삭제
Profile image 노형덕 2011.04.24 13:16
그렇긴 하지만.. 5870의 가격과 소비전력이..ㅋ

오 25만원정도 하는 게 하나 있네요 5870ㅋㅋ
수정 삭제
Profile image 초보열공 2012.03.24 01:22
안녕하세요
그래픽카드의 TMU와 ROP를 쉽게 확인할수있는 방법은 무엇이 있을까요?
위키에서 찾아봐도 다른 정보의 글만뜨고 해서요~~
수정 삭제
  • 지포스 GTX 960 성능 예상 : 2세대 맥스웰 예측을 바탕으로 [VGA] 지포스 GTX 960 성능 예상 : 2세대 맥스웰 예측을 바탕으로 [6] file

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 지난달 중순, 아래 글을 통해 엔비디아가 맥스웰 아키텍처를 도입하며 이뤄 낸 성과를 계량화하려는 시도를 한 바 있는데, 마침 엔비디아의 공식 발표자료를 통해 예측이 거의 정확했음이 증명된 바 있습니다. (이...

    • IYD |
    • 14.09.19 |
    • 조회 수 83 |
  • [CPU] 마침내 게이머가 이겼다 : 하스웰-E를 생각하며

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 오늘 새벽 공식 출시된 하스웰-E의 각 라인업을 전세대 카운터파트인 아이비브릿지-E와 SKU 대 SKU로 비교했을 때, 인텔 코어 i7 (이하 모델넘버 앞 "인텔 코어 i7" 부분 통째로 생략. 이 ...

    • IYD |
    • 14.08.30 |
    • 조회 수 65 |
  • 2세대 맥스웰 (GM204 : GTX 870/880) 성능 예측 [VGA] 2세대 맥스웰 (GM204 : GTX 870/880) 성능 예측 [3] file

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 어제의 Tonga 예측에 이어 이틀 연속 예측 2연타를 날리게 됐습니다. 오늘은 아마 모든 분들이 궁금해하실 2세대 맥스웰, 바로 지포스 GTX 880 / 870의 성능을 예측해 보고자 합니다. 우선 이 글의 영감이 된 WCCF...

    • IYD |
    • 14.08.12 |
    • 조회 수 66 |
  • 갤럭시노트2 킷캣 업데이트 [ICT] 갤럭시노트2 킷캣 업데이트 [6] file

    노트2 유저로써 오매불망 기다려왔던 킷캣 업데이트가, 오늘 새벽을 기해 풀렸습니다. 아직 OTA (Over the air; 무선) 로 배포되지는 않았고, 따라서 KIES를 통해 펌웨어 업데이트를 진행해야 합니다. 업데이트를 시작하기 전, 젤리빈일 때의 화면을 대강 남겨 보겠습니다. 별로 새로울것도 없는 젤리빈. 그럼 이제 업데이트...

    • IYD |
    • 14.06.03 |
    • 조회 수 71 |
  • GTX TITAN Z 가격의 숨겨진 진실 [VGA] GTX TITAN Z 가격의 숨겨진 진실 [13] file

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 약 일주일쯤 전, 엔비디아의 CEO가 한 매체와의 인터뷰에서 TITAN Z의 비싼 가격을 옹호하며 대충 이런 요지의 논리를 폈다. "TITAN Z가 겨냥한 해상도는 지원하는 모니터부터가 수천만원을 호가한다. 이런 모니터...

    • IYD |
    • 14.05.28 |
    • 조회 수 135 |
  • 모니터 크기, 해상도별 조합 가이드 [ICT] 모니터 크기, 해상도별 조합 가이드 [6] file

    며칠 전 엄청난 분량의 글을 올린 뒤로, 다음 글까지는 또 적잖은 시간이 걸릴 것 같아 조금이라도 (저의, 그리고 들르시는 분의) 적적함을 달래기 위해 캐주얼한 강좌를 하나 써 봐야지 생각했습니다. 마침 제가 요새 꽂혀있는 분야가 디스플레이인 이유로 오늘 소개할 글은 저로썬 처음인 "디스플레이 가이드" 되겠습니다....

    • IYD |
    • 14.05.23 |
    • 조회 수 1497 |
  • 라데온 Rx 300 시리즈 성능 예측 [VGA] 라데온 Rx 300 시리즈 성능 예측 [11] file

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 파키스탄의 하드웨어 전문 사이트 WCCFTech에서 4일 전 라데온 300 시리즈의 스펙을 공개했습니다. (원문 : http://bit.ly/1eyXKdC) 자료의 진위 여부는 확인되지 않았으나, 최초로 AMD의 차세대 GPU인 Pirate Isl...

    • IYD |
    • 14.04.14 |
    • 조회 수 49 |
  • [VGA] TITAN-Z는 엔비디아의 마지막 패가 아니다 [17]

    Author : Daeguen Lee (Any action violating either CCL policy or copyright laws is strictly prohibited) 지난 3월 26일, 엔비디아는 GTC 2014 행사에서 전격적으로 지포스 GTX TITAN-Z를 발표했다. 한편, 많은 이들은 엔비디아가 그 자리에서 그들의 차세대 아키텍처인 20nm 기반 맥스웰에 관해 언급할 것이라 예상했지...

    • IYD |
    • 14.04.03 |
    • 조회 수 100 |
  • [VGA] VGA calculator : 2014 updates [9] secret

    비밀글입니다.

    • IYD |
    • 14.01.16 |
    • 조회 수 2 |
  • AMD 본사 직원 인터뷰 : 스팀롤러와 HSA의 의의 [ICT] AMD 본사 직원 인터뷰 : 스팀롤러와 HSA의 의의 [4] file

    Interviewer & Author : Daeguen Lee Interviewee : Adam Kozak, Terry Makedon (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 지난 12일엔 서울 모처에서 AMD의 APU Tech Day 행사가 열렸습니다. 이 글에서 간단히 행사장 전경을 전달해드렸었죠. 당시 AMD ...

    • IYD |
    • 14.01.15 |
    • 조회 수 69 |
  • [VGA] A speculation on GTX 790 [2] secret

    비밀글입니다.

    • IYD |
    • 14.01.05 |
    • 조회 수 1 |
  • 맥 프로의 가치 [ICT] 맥 프로의 가치 [7] file

    Author : Daeguen Lee(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)0. 내색한 적은 한번도 없지만 (그리고 아무도 안 믿을테지만) 내겐 완제품 PC에 대한 로망이 있다. 특히 맥... 새로 나온 맥 프로가 그간 이미지로만 보던것과 달리 매우 아담하단 사실에 ...

    • IYD |
    • 13.12.26 |
    • 조회 수 133 |
  • A short essay on "Kaveri" [CPU] A short essay on "Kaveri" [13] file

    Author : Daeguen Lee (Any action violating either copyright laws or CCL policy of the original source is strictly prohibited) 사실 "Future is fusion" 이라는 AMD의 슬로건에서부터 예견되었던 것이기도 하지만 CPU+GPU 이종교배의 진정한 힘은 다이사이즈 축소를 통한 원가절감 따위를 훨씬 상회하는 것이리라. Ma...

    • IYD |
    • 13.11.27 |
    • 조회 수 46 |
  • [VGA] 라데온 R9 290 -> R9 290X 변신?! [14] secret

    비밀글입니다.

    • IYD |
    • 13.11.15 |
    • 조회 수 3 |
  • [VGA] GeForce GTX 780 GHz에 관한 썰 [4] secret

    비밀글입니다.

    • IYD |
    • 13.10.31 |
    • 조회 수 1 |
  • NVIDIA GeForce GTX 780 Ti 성능 예측 [VGA] NVIDIA GeForce GTX 780 Ti 성능 예측 [6] file

    글쓴이 : 이대근연락처 : leedaeguen [at] kaist.ac.kr(이 블로그의 CCL정책에 위배되는 무단전재 및 재배포를 금지합니다)두시간 전 해외 포럼인 ChipHell을 통해 GTX 780 Ti의 사양으로 추정되는 스크린샷이 유출되었습니다.▲ GTX 780 Ti의 사양으로 2496SP설, 2688SP설, 2880SP설 등이 분분했는데, 위의 정보가 정확한 것...

    • IYD |
    • 13.10.22 |
    • 조회 수 88 |
  • An essay on NVIDIA GeForce GTX 780 Ti [VGA] An essay on NVIDIA GeForce GTX 780 Ti [5] file

    글쓴이 : 이대근 (이 블로그의 CCL 정책에 위배되는 무단전재 및 재배포를 금지합니다) 엔비디아에서 방금 지포스 GTX 780 Ti라는 새 제품의 출시를 예고했습니다. 그간의 네이밍 정책에 비춰 볼 때 해당 제품은 GTX 780의 상위 모델일 것은 확실하나 모델 넘버가 없는 GTX TITAN과의 우열관계는 확실치 않은데, 일단 단선적...

    • IYD |
    • 13.10.19 |
    • 조회 수 30 |
  • FCAT : 프랩스에 종언을 고함 [VGA] FCAT : 프랩스에 종언을 고함 [2] file

    글쓴이 : 이대근 (이 블로그의 CCL정책에 위배되는 무단전재/재배포를 금지합니다) 재미있는 글을 읽었습니다. 일단 글을 소개하자면 원문은 아래 링크와 같습니다. (see this : http://techreport.com/review/24553) 간단히 요약하자면 "Fraps로 측정하는 프레임레이트는 정확하지 않다. 나아가 현존하는 모든 방식의 프레...

    • IYD |
    • 13.09.30 |
    • 조회 수 49 |
  • GK110, 하와이 가상 대결 : by VGA 계산기 [VGA] GK110, 하와이 가상 대결 : by VGA 계산기 [7] file

    글쓴이: 이대근 (이 블로그의 CCL 정책에 위배되는 무단전재/재배포를 금지합니다) 그동안 '그래픽카드 성능 방정식'을 사용해 몇번의 포스팅을 올리곤 했는데, 혹시 이 방정식의 배경이 궁금하셨던 분은 안 계셨는지요. 오늘은 아직 출시되지 않은 '가까운 미래의' 그래픽카드의 성능을 예측함과 함께 그간 한번도 직접적으...

    • IYD |
    • 13.09.12 |
    • 조회 수 52 |
  • [VGA] A short essay on GK110 [4]

    글쓴이: 이대근 (이 블로그의 CCL 정책에 위배되는 무단전재/재배포를 금지합니다) 지금으로부터 약 19개월 전, AMD는 코드명 Southern Islands로 명명된 새 GPU를 발표했고 이들 제품군은 전세대 자사/경쟁사 플래그십 제품군 대비 2배~2.5배에 가까운 압도적인 성능 향상을 가져온 반면 소비전력은 전세대와 별 차이가 없...

    • IYD |
    • 13.09.05 |
    • 조회 수 32 |