GoogleのAI開発子会社DeepMindが、2本足の棒人間風モデルにまるでパルクールのような走り方を覚え込ませています。これは強化学習の報酬システムを用いて方法で、複雑な環境下で報酬がどのようにはたらくかを調べているとのこと。
2本足しか無いモデルは画面上をひたすら右に向かって走ります。途中には段差やハードル、さらに底なしの谷などがレイアウトされており、それらをうまく避け、乗り越え、くぐり抜けられればそれに応じた報酬が得られる用に設定されています。
動画はすでにかなり強化学習が進んだ状態のもので、まるでゲームを人間が操作しているようにもみえるほど。中には高い塀のような傷害を乗り越えるために、まず膝をかけてからよじ登るといった動作も見られるものの、これらすべてがこの棒人間(AI)の独学による行動です。
DeepMindはこの実験で、強化学習が複雑な動きを覚えさせるためにも有効利用できることを示しました。おそらく、このように強化学習されたAIは将来、家の中にある階段や段差を自由に乗り越える必要がある家事ロボットなどに搭載されるのではとも考えられます。
Oriol Vinyals?認証済みアカウント@OriolVinyalsML
Agents having fun in Parkour! Cool paper from colleagues at DeepMind https://arxiv.org/abs/1707.02286
https://video.twimg.com/ext_tw_video/884327315752329217/pu/vid/992x720/SXDqw8CNRp3NJTN3.mp4
https://twitter.com/OriolVinyalsML/status/884328832320368644
DeepMindはこの研究を「Emergence of Locomotion Behaviours in Rich Environments」と題した論文にまとめArxiv.orgに発表しました。
https://www.youtube.com/watch?v=hx_bgoTF7bs
腕の振りも独学なのか...?
ソース
Google DeepMind、強化学習でAIが障害物の回避・乗り越え方を体得。パルクール風の動きに進化 - Engadget 日本版
http://japanese.engadget.com/2017/07/10/google-deepmind-ai/