화상 인식은 실제 게임에 어떻게 살려지고 있는 것일까?

 

CEDEC 2010에서는 「화상 인식 기술과 게임 인터페이스」라고 제목을 붙인 강연이 열렸다. 작년도의 CEDEC에서 행해진 동명의 강연을 스텝 업 시킨 내용으로 전회와 같은 알기 쉬운 해설로 회장의 만족도도 높았던 것 같다.

 

주식회사 소니 컴퓨터 엔터테인먼트 JAPAN 스튜디오 테크놀로지부의 토모카즈씨는 작년도의 강연을 「화상 인식이라는 것은 뺄셈이다」라고 요약한다.

 

현재의 화상으로부터 과거의 화상을 당기는 것으로 차분(이 경우는 어디가 움직였는지)을 요구할 수 있다. 이것은 플레이 스테이션 2의 「EyeToy」에서 사용되는 「움직임 차분」이라고 부르며 저 부하와 높은 안정성으로 게임에 향한 처리가 되고 있다.

 

플레이 스테이션 3의 「EyePet(일본판은 「MeMy Pet)은 카메라로 찍은 현실의 풍경에 AR(가상 현실)의 애완동물을 합성, 애완동물에 손대거나 하는 커뮤니케이션을 즐길 수 있다.

 

당초는 움직임을 검지하는데 「배경 차분」이라고 불리는 방법이 사용되었지만 카메라로부터의 정보는 움직임 투성이로 예를 들어 융단의 털끝이 어긋난다면 그것을 모두 검지해 버린다···라고 하는 상태로 몇 분 지나면 노이즈로 가득 찼다고 한다.

 

여기서 「EyeToy」와 같은 「움직임 차분」으로 회귀하여 「스위치가 화면에 설치 되어 있다」라고 하는 이미지를 근본으로 「움직이고 있는 것에 흥미를 나타내고 시선을 움직이거나 달려들거나 한다」버추얼 펫의 세계가 만들어 내졌다.

 

버추얼 펫을 어루만진다고 하면 섬세한 처리를 연상하지만 실은 큰 영역에 「매우 엉성한 처리를 실시하고 있다」 라고 한다. 애완동물의 위치에 따라 스위치(접하면 변화를 가져오는 부분)가 변화하고 있지만 스위치를 세세하게 해도 편안함은 나오지 않으므로 엉성한 것이 인간에게는 유저 프렌들리. 인간은 언제 어루만지는 것을 그만두는지, 언제 강하게 어루만질까를 모르기 때문에 버추얼 펫의 움직임에는 언제라도 제지 당하는 애니메이션이 채용되고 있다고 한다.

 

EyePet」에서는 카메라에 보이면 화면 내에 가상 아이템이 출현하는 「매직 카드」가 사용되고 있다. 카메라는 카드가 어디에 있는가 라는 정보를 깊이까지 검지할 수 있지만 「EyePet」에서는 굳이 이용되고 있지 않다.

 

예를 들어 가상 볼을 「매직 카드」 위에 태운다고 하는 놀이가 있다고 해서 「매직 카드」의 깊이까지 체크하고 있던 것은 게임으로서 재미있는 것은 되지 않는다고 판단했다고 한다.

 

반대로 「매직 카드」의 위치는 묻지만, 깊이는 관계없다고 하는 게임 디자인이라면 제대로 놀 수 있는 것이 되어 깊이는 검지할 수 있지만 굳이 평면 세계에 세우는 것도 중요하다고 한다.

 

 

소니 주식회사 시스템 기술 연구소 조사원인 요코노 순씨는 「물체 인식」이라고 하는 기술에 관해서 해설한다.

「매직 카드」를 카메라로 인식하려면 전술의 뺄셈 방식이라면 곤란하다. 각도가 바뀌거나 시간에 일부가 숨겨져 조명의 상태에 의해서 카드의 보이는 방법이 변화하기 때문다.

거기서 사용되는 것이 「물체 인식」. 예를 들어 주차장에 멈추어 있는 많은 차를 보고 특정의 1대를 인식한다, 반대로 다른 차종의 여러 가지 차를 보고 「이것은 차이다」라고 인식한다는 기술.

「물체 인식」 트랜드는 윤곽을 보는 선화 매칭, 화상 전체를 보는 글로벌 매칭···이라고 시대와 함께 변천했지만 2000년대의 트랜드는 화상의 일부의 특징을 보는 「로컬 매치」. 인식을 위해서 그 밖에 없는 특징이 나타날 장소 「특징점」이 사용된다. 「특징점」은 물체나 도형의 코너가 이용되어 한층 더 코너 주변의 화상 패턴(국소 특징량)을 대면시키는 것으로 보다 정확한 인식이 가능해진다. 많은 포인트의 「국소 특징량」을 보존하는 것으로 물체의 일부가 숨겨지거나 해도 인식할 수 있다.

어떤 차종의 차를 봐도 「차」라고 인식하는 인식은 「물체 카테고리 인식」이라고도 불려 대량의 데이터를 주는 통계학습에 의해서 정도를 높일 수 있다 한다.

「물체 인식」의 트랜드는 한해 한해 변화하고 있어 향후는 「관절을 가지는 동물의 전신을 인식한다」 「하늘은 위에 있고 · 차는 도로에 있다고 하는 문맥을 사용한 인식」 「깊이를 인식한다」 「하나의 인식 엔진으로 차나 인간의 얼굴, 빌딩 등 많은 물체를 인식」하는 것 등이 트랜드가 되어 간다고 한다.

 

 

출처 : http://www.gamebusiness.jp/article.php?id=2054

저작자 표시
신고
by 흥배 2011.01.17 10:14