Sandy Bridge는 인텔 제품 중 처음으로 CPU GPU가 결합된 것.

 

GPU 성능을 종래의 제품보다 대폭 강화. 이때까지는 독자적인 아키텍처였지만 지금부터는 타사(NVIDA, AMD)와 공통점이 많은 아키텍처로 변화.

 

기존의 인텔의 그래픽스 코어는 CPU의 발상으로 저 가격을 가장 중시해서 성능과 효율, 범용적인 프로그램성에서 약했다. 그러나 Sandy Bridge에서는 GPU적인 발상으로 가격보다는 성능과 저전력을 중시하고 범용성을 고려하면서 만들고 있다.

 

목표는

1. 프로세서에 고정 기능 유닛을 내장 해서 효율적인 3D 그래픽스 실현

2. 프로세서에 범용 컴퓨팅이랑 미디어 처리용 명령이랑 기능을 추가

3. 미디어 처리를 위해서 고정 기능 유닛 강화

 

위의 목표를 위해서 타사의 GPU 코어가 발전해 왔던 것을 쫓아간다. 인텔의 독자적인 부분도 있지만 타사의 GPU 코어와의 갭을 메우기 위한 기술이 많다

 

Sandy Bridge의 그래픽스 코어는 일반적인 GPU의 유닛을 갖추고 있다. 이것은 같은 인텔 아키텍처라도 고정 처리 기능 블록을 거의 가지지 않고 소프트웨어 처리 중심인 Larrabee와는 크게 다르다. Larrabee는 레스터라이저나 ROP 유닛과 같은 GPU에서는 필수라고 이야기하는 블록을 가지지 않고 있다.

 

기본 구성은 종래의 인텔 그래픽스 코어를 담습하고 있지만 3D 그래픽스와 미디어 처리에 있어서는 종래와 큰 차이가 있다. 그것은 프로세서에서 소프트웨어 처리를 했던 것을 고정 기능 유닛으로 하드웨어 처리로 이행한 부분이다.

 

프로세서에 의한 소프트웨어 처리는 다이 면적당 성능은 높지만 전력에 있어서는 불리하다 전력에서는 보통 고정 기능 유닛이 가장 저 소비전력이고 프로그래머블 프로세서는 전력을 많이 먹는다.

고정 기능 유닛을 사용하는 것은 전력 효율과 처리율을 첫 번째로 생각할 때의 당연한 수단이다.

고정 기능 하드웨어화에 의한 효율 향상은 일반적인 GPU 코어에서는 너무 당연한 말이지만 인텔로서는 새로운 것이다. 인텔의 설계 정책이 180도 바뀌어 ‘GPU 같은 그래픽스 코어를 만드는 것으로 바뀌었다.

 

레지스터 증량

범용 프로그램이랑 복잡한 쉐이더 프로그램은 레지스터를 많이 필요로 하기 때문에 레지스터 파일을 압박한다. 그 상황에서 일정 수의 스레드를 시동하기 위해서는 물리 레지스터에 들어가지 않는 데이터를 내외의 메모리에 일단 대피시킬 수 밖에 없게 된다. 이것이 지금까지의 인텔 그래픽스의 상황이라고 할 수 있다.

레지스터 파일을 확장하면 이 문제는 해결할 수 있다. 물론 레지스터를 증가시키는 만큼 다이 영역을 먹는다. 실제 NVIDA AMD GPU는 다이의 어느 정도의 부분은 레지스터에서 점하고 있다. 인텔 그래픽스도 그것에 근접하고 있다.

 

 

출처 : http://pc.watch.impress.co.jp/docs/column/kaigai/20101207_412173.html

 

저작자 표시
신고
by 흥배 2010.12.16 09:00

IDF2010에서 Sandy Bridge에 대해서 알려진 것은 다음과 같습니다.

 

Sandy Bridge는 동일 다이 상에 CPU 코어, 공유 캐쉬, iGPU(Processor Graphics)가 통합

 

CPUiGPU는 캐쉬를 공유한다.

 

터보 부스트 시에는 CPUiGPU의 열과 전력 여유를 이용할 수 있다. 네할렘의 터보 부스터 보다 향상

 

iGPU도 성능이 향상하여 Blu-ray 3D 재생도 가능

 

Sandy Bridge에는 비디오 encode의 가속화 기능이 탑재. 이것을 사용하는 것으로 텔레비전이나 소형 디바이스 용의 비디오를 보다 단 시간에 encode 가능.

 

Sandy Bridge의 데모로 화상의 「HDR(High Dynamic Range imaging)변환이나 비디오의 encode의 데모 피로.

데모에서는 현행의 Core i7 머신에서는 4분이 걸리는 encode 처리를 겨우 2초에 완료.

또 새롭게 탑재된 AVX 명령에 의해 부동 소수점의 SIMD 연산 기능이 2배로 강화되어 예를 들어 3D CG의 렌더링과 같은 처리도 단시간에 행할 수 있다.

 

Sandy Bridge 마이크로 아키텍처는 PC 분야 뿐만이 아니라 임베디드에서 서버까지의 Computing Continuum에 대응. 지금까지 DSP나 전용 프로세서를 사용하고 있던 패킷의 리얼타임 감시와 같은 작업도 Sandy Bridge로 가능

 

복수의 HD 영상을 감시하고, 그 중에서 물건이 가지고 사라져진다고 하는 움직임을 검출하는 데모도 시연

 

미국 Sixense Entertainment CTO 제프 베링하우젠(Jeff Bellinghausen)씨에 의한 데모에서는 동사의 모션 콘트롤러와 Sandy Bridge를 조합한 데모가 피로. 이 콘트롤러는 양손으로 들고 그 움직임을 검출할 수 있다. 데모에서는 3D의 리얼타임 표시를 자유롭게 움직이거나 3D 오브젝트의 일부를 잘라내고, 다른 오브젝트와 합성하는 작업을 콘트롤러로 행해 보였다.

 

Nehalem 마이크로 아키텍처는 Core 2 아키텍처(architecture)의 마이너 체인지에 지나지 않고, 단순하게 말하면 「64bit 대응을 강화한 Core 2」라고도 말할 수 있다. 그러나 Sandy Bridge는 내부의 링 버스 등에서 CPU 코어, iGPU 그리고 통합된 메모리 콘트롤러 등 주변 회로를 묶는 새로운 아키텍처(architecture)로 변경되었다.

 

SIMD명령 AVX를 탑재. 이것에 의해 큰 성능 향상을 실현하고 있다. 그러나 SSE가 아닌 AVX로 기술하지 않으면 CPU 본래의 성능을 낼 수 없는 등 꽤 소프트웨어 개발자에게 의존하는 부분도 있다.

 


저작자 표시
신고
by 흥배 2010.09.23 10:00
| 1 |

티스토리 툴바