뉴스탭
기획
오색 매력 카베리 '이래서 끌린다'HSA와 맨틀, 트루오디오까지 '최초'의 기능 대거 탑재된 AMD 카베리
홍진욱 기자  |  honga@newstap.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2014.02.17  14:02:03
트위터 페이스북 미투데이 요즘 네이버 구글 msn

'APU, 과연 믿을만 한가요?'

불과 3년여 전 AMD 라노(Llano) 프로세서가 처음 나왔을 때까지만 하더라도 상당수의 유저들이 GPU가 내장된 프로세서의 활용성에 대해 의구심을 제기했다. 그도 그럴 것이 APU가 기존에 출시된 프로세서에 비해 획기적인 개선을 이룬 제품이라는 점은 누구나 인정하면서도 기대했던 성능에는 미치지 못했기에 실망스러움이 컸던 것이다. GPU의 활용이 적은 보급형 시스템에서는 별 문제없이 돌아갔지만, 3D 성능이 요구되던 게임에서는 큰 힘을 발휘하지 못했다.

하지만 이러한 인식은 2세대 APU 트리니티(Trinity)와 3세대 리치랜드(Richland)를 거치면서 조금씩 변하게 된다. CPU 성능도 그렇지만 무엇보다 GPU 성능이 크게 높아지면서 기존 내장 그래픽 프로세서로 할 수 없던 일들을 척척 해내기 시작했기 때문이다. 물론 아직까지 그래픽카드의 뛰어난 3D 연산 능력을 완벽히 구현하기에는 무리가 있지만, 보급형 그래픽카드 만큼의 성능을 뽑아내면서 가벼운 온라인 게임 정도는 쉽게 돌리는 모습으로 조립PC 시장의 새로운 트렌드를 구축했다는 평을 받고 있다.

   
 
이 뿐만이 아니다. 일부 외장형 그래픽카드와 결합했을 때 3D 그래픽 성능을 더욱 높여주는 하이브리드 크로스파이어와 GPU를 사용해 일부 프로그램의 연산 속도를 빠르게 만들어주는 GPGPU (General Purpose computing on Graphics Processing Unit) 기술 등을 한층 발전시켜 시스템의 활용도를 높여줬다.

특히 출시된 지 꽤 오랜 시간이 지난 2세대 APU 트리니티는 현재 CPU 시장에서 큰 인기를 끌고 있는 인텔 4세대 코어 프로세서 보다 높은 내장 그래픽 성능과 저렴한 가격으로 보급형PC를 꾸미기 위한 최상의 제품으로 평가받는다. 비록 전체 판매량에 있어서는 기대에 못 미쳤다고 하지만, 오래 전부터 AMD가 꿈꿔왔던 퓨전(FUSION) 플랫폼을 위한 도약이라는 점에서 높은 점수를 줄 수 있을 것이다.

   
 
그리고 2014년 1월. AMD는 지금까지의 APU와 확연히 다른 아키텍처로 만들어진 차세대 APU 코드명 카베리(Kaveri)를 내놓음으로써 CPU와 GPU의 진정한 융합에 한층 더 가까이 다가서고 있다. 카베리의 출시로 APU는 단순히 컴퓨팅 연산을 하는 도구에만 그치는 것이 아니라 그 이상의 역할로 PC의 영역을 더욱 넓혀줄 것이라는 평가를 받고 있다.

'최초'라는 타이틀을 거머 쥔 카베리의 5가지 특징

카베리 APU가 기존 제품들에 비해 돋보이는 가장 큰 이유로 '최초'라 불리는 다양한 기술들이 적용됐다는 점을 들 수 있다. 프로세서로는 최초로 HSA(Heterogeneous System Architecture) 기능이 적용됐고, 최초로 맨틀(MANTLE)과 트루오디오를 APU에 내장했다. 또한 최초로 스팀롤러(Steamroller) 아키텍처를 넣었고, 마찬가지로 GCN 아키텍처를 GPU에 도입한 최초의 APU가 바로 카베리인 것이다.

   
 
특히 3세대 제품인 리치랜드가 이전 세대인 트리니티와 비교해 기능 및 성능의 향상을 기대만큼 이끌어내지 못했기에 카베리의 이러한 점들은 더욱 돋보일 수밖에 없다. 카베리에 적용된 기능을 통해 궁극적으로 CPU와 GPU의 속도가 빨라졌고, 게임이나 프로그램 개발 등 다양한 분야에서 활용도가 더욱 높아졌기 때문에 카베리를 통한 AMD의 시도는 일단 성공적이라고 평가할 수 있는 것이다. 그럼 성능에 들어가기에 앞서 카베리에 적용된 '최초의 기능'들은 어떤 것이 있는지 알기 쉽게 풀어봤다.

무궁무진한 가능성을 지닌 HSA, iGPU의 수준을 끌어올리다.

APU가 처음 출시됐을 때 세간의 화제로 떠오른 이유는 작은 프로세서 안에 CPU와 GPU를 내장해 진정한 의미의 내장 그래픽을 구현할 수 있게 되었기 때문이다. 물론 이전에도 그래픽카드 없이 메인보드에 GPU를 탑재해 영상을 출력하는 방식으로 내장 그래픽을 사용하기는 했으나 인터페이스의 제약으로 제 속도를 내기 어려워 한계에 부딪혔다. APU의 출시로 한층 원활한 GPU 구동이 가능해졌고, 결과적으로 성능 향상과 단가 절감이라는 긍정적인 효과를 얻게 됐다.

   
 
하지만 이런 APU에도 분명 한계가 존재했다. 라노에 이어 트리니티와 리치랜드까지 세대를 거듭하면서 GPU의 속도가 많이 빨라졌지만, 성능 향상의 폭이 소비자들의 기대에 미치지는 못했다. 여기에 CPU 성능이 보급형의 수준을 벗어나지 못했고, GPGPU를 통한 효과도 미약해 아쉬움도 컸다. 물론 트리니티 같은 경우 보급형 프로세서 중 최고의 가격대비 성능을 갖췄다는 평가를 받고 있으나 성능 개선에 대한 소비자들의 바람도 적지 않았다.

   
 
AMD 카베리는 이런 문제점을 HSA를 통해 해결했다. 카베리에 대해 이야기할 때 첫 손가락으로 꼽을 수 있는 무기는 HSA(Heterogeneous System Architecture)라 불리는 이기종 시스템 아키텍처다. 이는 하나의 프로세서에 내장된 CPU와 GPU가 서로 조화롭게 작동할 수 있게 도와줌으로써 AMD가 GPGPU를 통해 이루고자 했던 퓨전(FUSION)에 한걸음 가깝게 다가설 수 있게 됐다.

HSA의 핵심 기술은 새롭게 변경된 hUMA와 hQ다. hUMA(Heterogeneous Unified Memory Architecture)는 CPU와 GPU가 함께 메모리 공간을 말한다. 지금까지의 APU는 프로세서에 CPU와 GPU가 있었지만, 서로 다른 공간에 위치한 메모리를 사용했기 때문에 이를 활용해야 하는 프로그램에 있어서는 분명 제약이 따를 수밖에 없었다.

하지만 hUMA를 통해 하나로 합쳐진 가상의 메모리 공간을 CPU와 GPU가 함께 사용해 데이터 전송의 효율이 높아졌고, 진정한 이기종 시스템 구현에 더 가까이 갈 수 있게 됐다. 물론 전문적으로 프로그램을 개발하는 프로그래머의 입장에서도 더욱 편리해진 것은 두말할 나위가 없다.

   
 
hUMA와 함께 HSA를 완성시키는 기술이 바로 hQ다. hUMA를 공간 할당을 위한 물리적인 변화로 본다면 hQ는 CPU를 통해 제어받던 GPU를 독립적으로 움직임으로써 hUMA를 통해 공유된 데이터를 더욱 효율적으로 사용할 수 있게 해주는 논리적인 기술로 볼 수 있다.

   
 
기존의 APU는 CPU의 결정에 따라 GPU가 움직이는 방식으로 작동했다. GPU의 연산이 요구되는 작업에서도 CPU의 명령을 통해 움직이는 복잡한 명령어 체계를 갖고 있었기에 데이터 처리에 걸리는 시간이 늦어질 수밖에 없다. 하지만 hQ가 적용된 카베리 APU에서는 각각의 코어가 독립적으로 명령을 수행할 수 있어 지연 시간을 그만큼 줄일 수 있게 된 것이다. 결과적으로 GPU 기반의 데이터 출력 속도가 그만큼 빨라지게 된 것이다.

맨틀(MANTLE) '아직은 약한 바람, 하지만 언젠가는 폭풍이 될 것'

AMD가 지난 2013년 하반기에 출시한 그래픽카드 라데온 R7/R9 시리즈가 시장에 큰 파장을 일으키고 있다. 성능이 뛰어난데다 가격까지 만족스러운 수준이다 보니, 하이엔드부터 중급형에 이르기까지 시장을 휩쓸다시피 하며 과거의 영광을 재현하고 있다. 여기에 최근 이슈가 되고 있는 비트코인에 R9 시리즈가 적합하다는 소식이 알려지면서 채굴용으로도 상당한 인기를 얻고 있어 연일 품절을 기록하는 중이다.

R 시리즈 그래픽카드가 성능 못지 않게 주목을 받았던 기술이 있다. 바로 맨틀(MANTLE) API다. 맨틀은 처음 출시됐을 때까지만 하더라도 단순히 게임 개발자들이 콘솔용 게임을 PC 게임으로 변환하기 쉽게 해주는 언어 정도로만 생각됐다. 물론 이를 통해 게임 속도가 빨라지는 것은 알려지긴 했으나 맨틀을 공식적으로 지원하는 게임이 없다보니 시장에 큰 변화를 가져오기 힘들고, 성능 향상도 그다지 크지 않을 것이라는 의견이 적지 않았다.

   
 
하지만 뚜껑을 열어보니 달랐다. 맨틀은 AMD가 얼마 전 발표한 카탈리스트 14.1 베타 버전을 통해 구현할 수 있는데, 맨틀을 지원하는 게임에서 다이렉트X와 비교해 약 10% 이상의 성능 차이가 날 정도로 높은 성능을 보여줬다. 단순하게 드라이버 하나 바꿨을 뿐인데, 10% 이상 빨라지는 효과를 볼 수 있게 된 셈이다. 사용자 입장에서는 말 그대로 '돈 안들이고, 성능을 높일 수 있는 방법'이다.

맨틀은 CPU의 오버헤드를 줄여 드로우 콜(Draw call)을 기존에 비해 9배 이상 늘림으로써 게임이나 그래픽 작업시 복잡한 오브젝트에 대한 처리 속도를 빠르게 만들어주는 것이다. 배틀필드4가 대표적인 예다. 맨틀을 이용해 배틀필드4를 돌릴 경우 파편이 튀는 전투 상황이나, 탈 것으로 이동하는 상황에서 다이렉트X에 비해 한층 빠른 프레임으로 부드러운 움직임을 확인할 수 있는 것으로 알려졌다.

   
 
AMD가 처음 맨틀을 발표했을 때 엄청난 화제작이었던 배틀필드4가 이를 지원한다는 사실을 무척 강조했다. EA와 같은 굵직한 게임 개발사가 맨틀 기반의 게임을 만든다는 것은 AMD로써는 엄청난 우군이 생긴 것이나 다름 없었기 때문이다. 정작 맨틀 드라이버가 늦게 발표되면서 기대했던 배틀필드4로 인한 효과가 크지는 않았지만, 이후 많은 개발사들이 맨틀 지원을 약속했기에 전망은 무척 밝다고 볼 수 있다.

맨틀의 성공 여부를 섣불리 장담하기는 어렵다. 현재 다이렉트X의 영향력이 워낙 뛰어나다 보니 GPU 개발사가 독자적으로 만든 API가 성과를 거두기란 결코 쉽지 않다. 하지만 게임 개발사나 마니아 층의 긍정적인 반응으로 미루어 봤을 때, 고객의 불편함을 해결하며 한 걸음씩 나아간다면 충분히 승산은 있을 것으로 보인다.

부족한 감성을 채워주는 2% '트루오디오 (TureAudio)'

세 번째로 눈 여겨 볼 것이 바로 '트루오디오 (TureAudio)'라 불리는 기술이다. 트루오디오는 GPU의 오디오 파이프라인을 프로그래밍 할 수 있는 기술로 게임 구동시 별도의 오디오 장치 없이 현실감있는 사운드를 제공한다. 트루오디오는 궁극적으로 CPU의 멀티 프로세싱 능력과 다양한 명령어를 활용함으로써 선명한 사운드를 구현하는데 도움을 주는 기술로 볼 수 있다.

   
 
트루오디오 역시 지난 2013년 10월 AMD 라데온 R 시리즈 그래픽카드 발표시 맨틀과 함께 소개됐던 기술로 적잖은 주목을 받았다. 하지만 이를 지원하는 드라이버가 없어 아직까지 사용하지 못하다, 최근 선보인 카탈리스트 14.1 베타 버전을 트루오디오를 쓸 수 있는 것으로 알려지면서 다시금 화제로 떠오르고 있다.

사실 트루오디오 기술이 게임 유저들에게 어느만큼 사랑받을 수 있을지는 미지수다. 다만 지금까지의 APU가 신경쓰지 못했던(?) 사운드 부분까지 고려했다는 점에서 좋은 평가를 받을 수 있을 것으로 보인다.

파일드라이버(Piledriver)는 잊어라. 이제는 '스팀롤러(Steamroller)'의 시대

APU가 CPU와 GPU의 역할을 하나로 합친 것이라고 하지만 굳이 비중을 두자면 아직까지는 CPU로써의 역할이 더 크다고 볼 수 있다. GPU가 완전한 게임용으로는 아직 부족한 상황이다 보니, CPU의 역할이 상대적으로 중요할 수밖에 없는 것이다.

   
 
AMD는 라노와 트리니티, 리치랜드 등을 거치면서 불도저와 파일드라이버 등의 아키텍처를 입혀왔다. 이 중 파일드라이버는 주목을 받지 못했지만, 불도저는 커다란 구조 변화를 통해 많은 주목을 받았었다. 결과적으로 APU로써는 아쉬움이 많이 남긴 했지만, 변화의 틀을 마련했다는 점에서 높은 점수를 받을 수 있다.

카베리 APU의 또 다른 특징으로 CPU 성능의 향상을 위해 오랜 시간 사용해 온 파일드라이버(Piledriver) 아키텍처 대신 IPC의 효율이 개선된 스팀롤러(Steamroller) 아키텍처를 사용했다는 것을 꼽을 수 있다.

카베리는 28nm의 제조 공정으로 만들어졌고, 24억 개의 트랜지스터를 내장해 파일드라이버 아키텍처 기반의 기존 APU와 비교해 물리적으로 더 좋아진 사양을 갖췄다. CPU에는 최대 4개의 코어를 내장해 멀티코어의 성능을 요하는 각종 프로그램에서 강한 면모를 보여준다.

스팀롤러는 성능 향상이 비교적 크지 않았던 것으로 알려진 파일드라이버의 단점을 극복하고자 하드웨어적인 변화를 꾀했다. 명령어를 변환하는 디코드(Decode)의 수를 2개로 늘려 캐시 실패율을 30% 이상 낮췄고, 스케줄링의 효율은 10% 가량 증가시켰다. 이를 통해 분기 예측의 성공률을 기존에 비해 20% 가량 끌어올렸다. 아울러 명령어 캐시의 용량을 더욱 높여 성능 향상에 기여코저 했다. 결과적으로 CPU를 통한 연산 속도는 약 10~15% 가량 빨라졌으니, 목적은 달성한 셈이다.

GCN 아키텍처, 내장 그래픽의 새로운 장을 열다

AMD가 작년에 출시한 라데온 HD7000 시리즈와 올초 선보인 R 시리즈 그래픽카드는 GCN(Graphics Core Next) 아키텍처를 탑재해 뛰어난 가격대비 성능을 보여주며 큰 인기를 끌고 있다. 카베리는 기존 APU에서 사용했던 VLIW4 아키텍처를 버리고 GCN 아키텍처를 채택해 GPU의 성능을 크게 높였다.

   
 
어찌보면 지금까지 언급한 여러 가지 기능들보다 이 부분이 소비자들에게 가장 실질적인 혜택을 줄 수 있는 특징일 것이다. 물론 트리니티와 리치랜드의 GPU 성능도 다른 프로세서와 비교해 상당히 높은 것은 사실이지만, HSA와 맨틀을 효율적으로 지원하기에는 한계가 있었다. GCN 아키텍처는 성능 향상에만 중점을 둔 것이 아니라 CPU와 유기적으로 작동해 GPGPU를 효과적으로 구현할 수 있고, 트루오디오와 아이피니티 기술을 실현해주는 최적의 아키텍처로 꼽힌다.

우선 하드웨어 사양이 크게 높아졌다. GPU 코어의 수를 8개로 배치했고, 스트림 프로세서의 개수를 512개로 늘렸다. 또한 GPU 클럭은 720MHz로 작동하고, DDR3 2400MHz를 지원해 고성능 메모리와 함께 사용했을 때 그래픽 성능을 더 높일 수 있다. 이에 65W APU를 기준으로 리치랜드와 비교해 약 20%, 45W APU에서는 약 60~70% 가량 성능 향상이 있는 것으로 알려졌다. A10 7850K의 경우 리치랜 6800K보다 IPC 당 효율이 평균 10% 가량 높아진 셈이다. 물론 고사양을 요하는 게임에서는 다소 부족할 수 있지만, 현재 인기있는 온라인 게임의 대부분은 카베리의 내장 그래픽을 이용해 무난하게 돌릴 수 있다.

API의 활용폭도 넓어졌다. 앞서 소개한 맨틀을 지원하는 것은 물론 다이렉트X 11.2를 구현할 수 있어 최신 게임을 돌리기에 부족함 없는 모습을 보여준다. 이 뿐만이 아니다. 하이엔드 게이머나 전문가를 위한 AMD의 다중 모니터 구성 시스템인 아이피니티 기술을 내장 그래픽을 통해 실현할 수 있게 됐고, 최근 이슈가 되고 있는 4K 울트라 HD도 지원해 게임은 물론 멀티미디어용 PC도 구성할 수 있다. 또한 외장 그래픽카드를 위한 PCI-Express 3.0 인터페이스를 공식적으로 지원하고, 디스플레이 포트 1.2도 사용 가능하다.

   
 
그래픽카드와 결합해 부가적인 성능 향상을 기대할 수 있는 듀얼 그래픽스 기술도 빠짐없이 지원한다. 아직까지 R9 등의 고성능 그래픽카드와 결합은 어렵지만 보급형 제품인 R7 시리즈를 연결했을 때 단일 그래픽카드를 쓰는 것보다 약 2배 가량의 성능 향상을 누릴 수 있는 것으로 알려졌다. 아울러 프레임 페이싱 기술로 프레임을 안정적으로 유지시킬 수 있도록 한 점도 눈에 띈다.

 없어서 못 파는 카베리 APU, 시작은 이제부터

카베리 APU에 대한 시장 반응이 상당히 뜨겁다. 최근 쇼핑몰을 통해 진행한 특가 판매에서 예상보다 뜨거운 구매 열기에 행사가 조기 종료되는 진풍경을 연출하기도 했고, 가격비교 사이트에서는 출시된 지 한 달이 채 되지 않은 제품이 인기 순위 상위권에 오를 만큼 많은 관심을 얻고 있다.

   
 
물론 아직까지 라인업에 완전히 갖춰지지 않았고, 가격도 불안정해 소비자들이 원하는 바를 100% 채웠다고 보기는 어렵다. 하지만 역대 APU 중 가장 뛰어난 성능과 기능으로 무장한 제품인 만큼 올 상반기 뜨거운 감자로 시장을 선도할 가능성은 충분하다고 판단

된다. HSA와 맨틀 등 AMD가 자랑하는 기술이 완성되기 위해서는 업계의 지원이 필수이긴 하지만 글로벌 개발사들이 이 프로젝트에 속속 참여 의사를 밝히고 있어 카베리의 활용도는 시간이 갈수록 더욱 높아질 것으로 보인다. 이어지는 기사를 통해 카베리 APU의 벤치마크 성능과 실제 인기 온라인 게임을 돌렸을 때 어느 정도의 성능 향상이 있는지 알아보겠다.

[관련기사]

홍진욱 기자의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
가장 많이 본 기사
1
슬기로운 학교 생활을 위한 특급 도우미 '외장SSD'
2
지포스 RTX3060에 어울리는 합리적인 구성의 PC 조합은?
3
와이덱스 모멘트 보청기, CES 2021 혁신상 2관왕 수상
4
프레스티지바이오로직스, 공모가 상단 12,400원 확정
5
퀀텀, 2021 데이터 관리 방안 발표
6
식탁이 있는 삶, 한농대에 발전기금 100만원 및 400만원 상당 밀키트 기탁
7
엔투셀, ‘브레스 타이니탄 마스크’ 400억 원 규모 일본 공급 계약 체결
8
RTX 30 시리즈의 합리적 선택 ‘GIGABYTE G7 KC’ 게이밍 노트북
9
와이제이엠게임즈, 모바일 MMORPG ‘소울워커 아카데미아’ 첫 대규모 업데이트 실시
10
애드피아몰, ‘2022학년도 수능특강 스티커’ 출시
신문사소개기사제보광고문의불편신고개인정보취급방침청소년보호정책이메일무단수집거부
서울특별시 영등포구 영신로34길 10 영남빌딩 5층 504호  |  대표전화 : 070-7527-0410
등록번호 : 서울특별시 자00408  |  등록년월일 : 2013년 4월 15일
발행인 : (주)이노엠앤엠 이준문  |  편집인 : 이준문  |  청소년보호책임자 : 이준문
Copyright © 2013 뉴스탭. All rights reserved. mail to news@newstap.co.kr