【AI】Google DeepMind、強化学習で障害物の回避・乗り越え方を体得する

GoogleのAI開発子会社DeepMindが、2本足の棒人間風モデルにまるでパルクールのような走り方を覚え込ませています。これは強化学習の報酬システムを用いて方法で、複雑な環境下で報酬がどのようにはたらくかを調べているとのこと。

2本足しか無いモデルは画面上をひたすら右に向かって走ります。途中には段差やハードル、さらに底なしの谷などがレイアウトされており、それらをうまく避け、乗り越え、くぐり抜けられればそれに応じた報酬が得られる用に設定されています。

動画はすでにかなり強化学習が進んだ状態のもので、まるでゲームを人間が操作しているようにもみえるほど。中には高い塀のような傷害を乗り越えるために、まず膝をかけてからよじ登るといった動作も見られるものの、これらすべてがこの棒人間(AI)の独学による行動です。

DeepMindはこの実験で、強化学習が複雑な動きを覚えさせるためにも有効利用できることを示しました。おそらく、このように強化学習されたAIは将来、家の中にある階段や段差を自由に乗り越える必要がある家事ロボットなどに搭載されるのではとも考えられます。

Oriol Vinyals?認証済みアカウント@OriolVinyalsML
Agents having fun in Parkour! Cool paper from colleagues at DeepMind https://arxiv.org/abs/1707.02286
https://video.twimg.com/ext_tw_video/884327315752329217/pu/vid/992x720/SXDqw8CNRp3NJTN3.mp4
https://twitter.com/OriolVinyalsML/status/884328832320368644

DeepMindはこの研究を「Emergence of Locomotion Behaviours in Rich Environments」と題した論文にまとめArxiv.orgに発表しました。

https://www.youtube.com/watch?v=hx_bgoTF7bs

腕の振りも独学なのか...?

ソース

Google DeepMind、強化学習でAIが障害物の回避･乗り越え方を体得。パルクール風の動きに進化 - Engadget 日本版
http://japanese.engadget.com/2017/07/10/google-deepmind-ai/

人型の動きがふらふらしてるのは
エネルギー効率を無視すれば現実にもこの動きが最速で最安定だからこうなっちゃうんだと思うんだよ
だから消費エネルギーを損失関数に入れるといいと思う

高度な掃除ロボットを商品化しても
購入できるのは一定の消費力ある層だろうから
本当にそれが必要な低賃金&長時間労働者の負担軽減になるかどうかだな

>>2
ランダムで複製した中から厳選されていくだけだしただ残ってるってだけじゃね
最速ならふらつかない方が絶対早い

オタ芸のような走り方が実は人類にとっての最適解なのか

https://www.youtube.com/watch?v=hx_bgoTF7bs#t=1m27s

人類にとっての最適解が見つかったとしても、一人分の人生じゃ習得できないと思う

このスレッドは過去ログです。