구글 인공지능, 이제 스스로 학습한다
구글 인공지능, 이제 스스로 학습한다
  • 승인 2016.11.20 18:59
  • 댓글 0
이 기사를 공유합니다

언리얼 알고리즘 연구결과 공개
[비즈트리뷴] 인간과의 바둑대결에서 승리하며 세상을 놀라게 했던 구글의 인공지능이 이번에는 가르침 없이도 스스로 학습하는 능력이 가능해졌다.

18일(현지시간) 지디넷,엔가젯 등 외신에 따르면 구글 딥마인드는 최근 논문(관련링크)을 통해 '비지도, 강화, 보조학습( UNsupervised REinforcement and Auxiliary Learning)의 앞 글자를 딴 '언리얼(UNREAL)'이라는 알고리즘을 연구한 결과를 공개했다.

언리얼은 동물들이 꿈을 꾸면서 빠르게 먹이를 찾는 방법을 배우는데서 착안했으며, 더 복잡한 업무를 빠르게 수행할 수 있게 됐다.

연구원들은 아타리가 제작한 게임과 3D게임인 레비린스를 활용해 테스트를 수행했고, 언리얼이 해당 게임들을 이전 알고리즘 보다 10배 빠르게 다룬다는 결과를 얻었다.

레비린스의 경우 이 게임 전문가와 비교해 평균 87% 수준까지 게임능력을 따라잡았다는 분석이다.

▲ 출처=씨넷
 
■ 동물의 수면상태 비지도 학습에서 착안  

딥마인드 연구원들은 이전에 알파고를 훈련했던 것과 마찬가지로 바둑이나 아타리가 제작한 2600여개 게임을 대상으로 강화학습을 시켰다.

언리얼은 여기에 ▲동물이 꿈을 꾸는 렘(REM) 수면 시간 동안 음식을 찾기 위한 경로를 학습하는 과정 ▲아기들이 운동기능을 훈련하는 과정의 2가지 추가적인 업무를 수행하며 학습능력을 강화했다.

논문에 따르면 "동물들이 꿈을 꾸는 동안 긍정적인 혹은 부정적인 보상을 받는 과정을 더 빠르게 수행하는 방법에 착안해 이러한 과정을 반복하도록 했다"는 설명이다.

최근까지 학습을 통해 얻은 경험을 바탕으로 시각적인 단서에 집중해 더 빠르게 목표를 수행할 수 있는 지름길을 찾으면 더 많은 보상을 주는 방식을 활용했다는 것이다.

또 다른 작업은 화면에 비친 픽셀을 제어하는 방법으로 주어진 게임에서 어떻게 하면 더 높은 점수를 받을 수 있는지를 스스로 학습하게 했다.

딥마인드 연구원들은 이런 학습 과정을 57개 아타리 게임과 레비린스 13레벨에서 테스트를 수행했다.

딥마인드의 연구원들은 그들의 핵심 목표가 "인공지능 프로그램이 사람이 가르치는 일 없이 스스로 알아서 복잡한 문제를 처리할 수 있도록 하는 것"이라고 말했다.

이들은 "새로 개발한 알고리즘이 더 복잡한 환경에서 많은 일들을 해낼 수 있을 것"이라고 기대했다.

[비즈트리뷴 권안나 기자 kany872@biztribune.co.kr]