IntelAtom과는 크게 다른 Bobcat아키텍처


AMD는 저소비 전력&저비용 CPU Bobcat에 대해서도 개요를 분명히 했다. Bobcat은 종래의AMDK8 코어나 Hound(K10) 코어와도 다른 아키텍처로 Bulldozer와도 다르다고 한다. 1W 이하를 타겟으로 개발된 완전하게 새로운 코어로 IntelAtom에 상당한다.


그러나 아키텍처는 Atom과는 꽤 다르다. 최대 2명령 발행인 점은 Atom과 같지만 명령 스케줄링에 차이가 있다. Atom이 복잡성을 없애기 위해서 명령을 차례로 실행하는 In-Order실행을 채용한 것에 비하여 Bobcat은 명령의 순서를 바꿔 넣는 Out-of-Order 실행을 채용하고 있다. Out-of-Order 실행이 In-Order 실행보다 명령의 병렬 실행 확률이 높아지기 때문에 IPC(Instruction-per-Clock)가 높아진다. 그 반면 CPU의 스케줄러가 복잡하게 된다.


Bobcat2 명령 발행 2 명령 리타이어/사이클의 Out-of-Order 실행 코어로 퍼포먼스는 상대적으로 같은 클락의 Atom보다 높다고 추정된다. AMD는 지금의 메인 스트림 퍼포먼스로 비교해서 90%를 달성할 수 있다고 설명하고 있다. CPU의 실리콘 에리어는 반으로 끝난다고 한다. 50% die size(면적)으로 90%의 퍼포먼스를 실현할 수 있게 된다.


이러한 배경으로부터 BobcatAtom보다 약간 높은 퍼포먼스 레인지의 아키텍처라고 추정된다. 명령 세트에서는 지금의 메인 스트림 CPUfeature를 커버한다고 한다.  x86명령 셋의 확장에서는 SSE1~3과 가상화가 지원된다.


Bobcat
Bulldozer와 같이 2011년에 등장할 예정이다. 최초의 제품은 Ontario로 노트북 PC를 타겟으로 한다. Bobcat은 커스텀 회로를 사용하지 않고 재이용하기 쉽게 고 레벨 언어로 쓰여져 있다. 그 때문에 바리에이션이 다수 등장하는 것이 예상된다.

Bobcat의 아키텍처


 APU의 최초의 칩 Llano가 드디어 베일을 벗는다


AMD
CPUGPU코어를 통합한 APU(Accelerated Processing Unit)의 최초의 제품 Llano에 대해서도 개요를 분명히 했다. Llano는 노트북 PC와 데스크탑 PC 전용으로 2011년 초에 등장한다. 제조 프로세스는 32nm SOI로 된다.

Llano
1개의 다이에 4개의 CPU코어와 DirectX 11 GPU코어를 통합한다. 설계 플로우로서 디스크리트의 CPUGPU 각각으로서 성숙한 기술을 APU에서 융합시킨다고 한다. 그 때문에 LlanoCPU코어도 GPU코어도 2011년 시점의 최첨단의 것은 아니다. CPU 코어는 현재의 Hound(K10) 코어를 32nm로 해서 확장한 것으로 GPU코어도 DirectX 11베이스가 된다.


GPUCPU의 통합


LlanoGPUCPU를 통합한 AMD 최초의 CPU


AMDLlano의 다이 레이아웃도 분명히 했다. 아래는 현재의 쿼드 코어 Athlon II X4(Propus) 과 비교한 그림이다. CPU코어의 아키텍처는 거의 같아서 CPU코어의 사이즈를 프로세스의 미세화에 준해 축소하고 축척을 추정. 거의 동축척과 추정되는 크기에 가지런히 해 보았다. 그 결과 LlanoPropus die size(면적)은 거의 같은 정도라고 볼 수 있다.

LlanoPropus die size는 거의 같다

라고 하면 32nm이 되면 AMD는 현재의 4코어 CPUGPU코어를 넣을 수 있게 된다는 계산이다. 가격 레인지도 동일한 정도로 100달러 클래스로 가져 올 수 있을 것이다. Llano 같은 32nmGPU코어 통합의 IntelSandy Bridge와 비교한 것이 아래의 그림이다. 이쪽도 추정으로 동일한 정도라고 생각되는 축척에 가지런히 해 있다.

LlanoSandy Bridge die size 비교

LlanoSandy Bridge에서는 GPU코어는 동일한 정도의 사이즈가 된다고 추정된다. 메모리 컨트룰러도 거의 같다. CPU 코어에서는 Sandy Bridge측이 크고 캐쉬는 Sandy Bridge측이 훨씬 크다. 그 때문에 Sandy Bridge측이 다이가 한층 크다고 추정된다.


Llano의 주된 특징


 CPUGPU의 로드맵도 쇄신


AMDCPU 로드맵도 쇄신 했다. 로드맵 자체는 작년(2008)Analyst Day로부터 크게 차이가 나지 않는다. 세부가 보다 명확하게 되었다.


데스크탑에서는 2011년에는 Bulldozer 코어의 엔스지아  데스크탑 CPUZambezi(잠비지)」가 등장한다. 작년은 「Orochi(오로치)」라고 하는 코드네임이었다. Zambezi4 또는8코어이므로 Bulldozer Module2 또는 4라고 하는 계산이 된다. 플랫폼은 「Scorpius(스콜피어스)」로 GPU 아키텍처도 신세대가 된다. 메인 스트림 데스크탑에서는 2011년에 Llano APU를 베이스로 한 「Lynx(린스)」플랫폼으로 이행한다.


메인 스트림 노트북 PC에서는 2011년에 Llano APU베이스의 「Sabine(세바인)」플랫폼이 등장. 넷북이나 울트라신 노트북 PC전용으로는 Bobcat 아키텍쳐의 Ontario APU의 「Brazos(브라조스)」가 등장한다.


서버 사이드에서는 2011년에 12 또는 16코어의 「Interlagos(인터라고스)」가 등장. Bulldozer코어로 MCM(Multi-Chip Module)으로 2 다이를 1패키지에 넣는다고 보여진다. 플랫폼은 Opteron 6000계 전용의 「Maranello(마라넬로)」로 2 또는4소켓 전용의 「소켓G34」지원.


또 같은 시기에 6 또는 8코어의 「Valencia(발렌시아)」가 등장한다. 플랫폼은 Opteron 4000용의 「San Marino(산마리노)」로 1 또는 2소켓 전용의 「소켓C32. 현재는 2 소켓과 4소켓 전용의 플랫폼이 공통의 소켓 F베이스의 「Fiorano(피오라노)」로 1소켓 전용만이 데스크탑과 같은 소켓AM2베이스로 차이가 났지만 구분이 바뀐다. CPU소켓 수의 상한 이외와 G34C32의 최대의 차이는 메모리 인터페이스다. G344채널메모리, C322채널메모리가 된다.



GPU에서는 DirectX 11세대의 R800계 아키텍처로의 이행이 급격하게 진행된다. 듀얼 GPUHemlock(헴락)」가 다음 주 등장하는 것 외에 내년(2010) 14분기에 메인 스트림과 밸류 전용의 「Redwood(레드 우드)」와 「Cedar」가 투입될 예정이다.

모바일 전용의 DirectX 11계도 내년(2010) 14분기에 등장한다. 코드네임은 NY맨하탄 지구의 스트리트명 시리즈로 「Broadway(브로드웨이), Madison(매디슨), Park(파크)」가 예정되어 있다.


GPU의 로드맵


AMD CPUdie size의 이행도





AMD가 차기 아키텍쳐 「Bulldozer」와「Bobcat」의 개요를 공표 - 1
AMD가 차기 아키텍쳐 「Bulldozer」와「Bobcat」의 개요를 공표 - 2
출처 : http://pc.watch.impress.co.jp/docs/column/kaigai/20091112_328392.html
저작자 표시
신고
by 흥배 2009.11.15 10:00


다채로운 발표였던 Analyst Day

AMD는 어젯밤(미국 시간에1111)에 애널리스트를 위한 컨퍼런스 「2009 Financial Analyst Day」를 개최했다. 동 컨퍼런스에서 AMD는 차기 CPU 아키텍쳐인 「Bulldozer(bulldozer)」와 Atom대항의 저 소비 전력 CPU 아키텍쳐 「Bobcat(보브캣)」의 개요를 발표Bulldozer가 효율적으로 멀티 스레딩을 실현하는 클러스터(Clusters) 아키텍처를 취하는 것을 공식으로 분명히 했다.


CPU에 GPU 코어를 통합하는 「APU(Accelerated Processing Unit)」의 최초의 제품이 되는 「Llano(리아노)」의 다이 레이아웃을 공개. CPU 로드맵을 갱신하고, 넷북 시장용으로 Bobcat 베이스의 「Ontario(온타리오)」를 사용한 「Brazos」플랫폼을 도입하는 것 등을 분명히 했다.

게다가 GPU의 신제품으로서 다음 주 R800계의 듀얼 GPUHemlock(헴락)」을 발표하는 것이나 내년(2010년) 제14분기에 모바일 전용 DirectX 11 GPU  「Broadway(브로드웨이)」 등을 도입하는 일도 밝혔다.


Llano의 다이




클러스터 아키텍처를  취한 Bulldozer 코어

AMD2011년에 투입하는 차세대 마이크로 아키텍쳐 Bulldozer의 개요를 마침내 분명히 했다. Bulldozer는 우선 디스크리트 CPU로서 서버&데스크탑 전용의 세그먼트(segment)에 투입된다. 종래의 K8이나 K10(Hound) 아키텍처의 후계로서 완전하게 새롭게 개발된 CPU 아키텍처. 제조 프로세스는 32nm SOI에서 시작한다.


AMDBulldozer에 클러스터(Clustered)형태 마이크로 아키텍쳐를 취한다고 소문이 나고 있었다. 이번에 AMD는 클러스터 아키텍처를 공식적으로 분명히 했다. Bulldozer의 클러스터 아키텍처에서는 CPU 코어가 클러스터화 되고 있다. 구체적으로는 두 개의 CPU코어가 융합되고 있어 부동 소수점 연산 유닛이나 명령 디코더 등의 자원이 두 개의 코어/스레드에서 공유되게 되어 있다.


Bulldozer 아키텍처에서는 2 코어의 융합한 클러스터를 「Bulldozer Module」이라고 부르고 있다. 2개의 스레드를 병렬로 실행할 수 있는 모듈이 Bulldozer의 기본 단위다. Bulldozer는 이 유닛을 복수 모으는 것으로 멀티 코어 구성을 실현한다고 보여진다. 예를 들면 4 코어의 Bulldozer CPU라면 두 개의 Bulldozer Module을 탑재할 것이다.


Bulldozer의 클러스터 아키텍처는 1개의 모듈로 2개의 스레드를 동시에 실행할 수 있다. 이것은 1개의 CPU 코어 중에서 2게의 스레드를 실행할 수 있는 IntelHyper-Threading과 닮아 있는 것처럼 보이지만 크게 다르다.


IntelHyper-Threading에서는 CPU 전체의 자원을 명령 단위로 2개의 스레드에서 공유한다. 그에 비해 AMD에서는 CPU의 자원 중 정수 연산 파이프는 2개의 스레드가 각각 전용 파이프를 가진다. 그러나 명령 디코더나 부동 소수점 연산 유닛 등은 2개의 스레드에서 공유한다. 정수 연산에서는 스레드간의 경합이 없기 때문에  throughput가 높다.


AMD에 의하면 CPU의 용도에서는 실제로는 부동 소수점 연산은 Idle 상태가 많고 정수 연산 파이프가 Busy가 된다고 한다. 그 때문에 경합이 일어나는 정수 연산 파이프를 이중화 하여 경합이 적은 부동 소수점 연산 파이프는 공유로 했다고 설명한다. CPU 중에서 자주 사용되는 부분은 2 스레드로 각각 분리하고, 공유로 하는 것이 효율이 좋은 부분은 싱글로 한 것이 Bulldozer의 클러스터 아키텍처이다.


Bulldozer의 아키텍쳐




나머지 내용은 다음에 또 올리겠습니다.^^;;

저작자 표시
신고
by 흥배 2009.11.12 23:51
| 1 |

티스토리 툴바