【AI】Google DeepMind、強化学習で障害物の回避・乗り越え方を体得する

1番組の途中ですがアフィサイトへの転載は禁止です:2017/07/12(水) 22:58:22.49 ID:k1DxJ6GY

GoogleのAI開発子会社DeepMindが、2本足の棒人間風モデルにまるでパルクールのような走り方を覚え込ませています。これは強化学習の報酬システムを用いて方法で、複雑な環境下で報酬がどのようにはたらくかを調べているとのこと。

2本足しか無いモデルは画面上をひたすら右に向かって走ります。途中には段差やハードル、さらに底なしの谷などがレイアウトされており、それらをうまく避け、乗り越え、くぐり抜けられればそれに応じた報酬が得られる用に設定されています。

動画はすでにかなり強化学習が進んだ状態のもので、まるでゲームを人間が操作しているようにもみえるほど。中には高い塀のような傷害を乗り越えるために、まず膝をかけてからよじ登るといった動作も見られるものの、これらすべてがこの棒人間(AI)の独学による行動です。

DeepMindはこの実験で、強化学習が複雑な動きを覚えさせるためにも有効利用できることを示しました。おそらく、このように強化学習されたAIは将来、家の中にある階段や段差を自由に乗り越える必要がある家事ロボットなどに搭載されるのではとも考えられます。

Oriol Vinyals?認証済みアカウント@OriolVinyalsML
Agents having fun in Parkour! Cool paper from colleagues at DeepMind https://arxiv.org/abs/1707.02286
https://video.twimg.com/ext_tw_video/884327315752329217/pu/vid/992x720/SXDqw8CNRp3NJTN3.mp4
https://twitter.com/OriolVinyalsML/status/884328832320368644

DeepMindはこの研究を「Emergence of Locomotion Behaviours in Rich Environments」と題した論文にまとめArxiv.orgに発表しました。

https://www.youtube.com/watch?v=hx_bgoTF7bs

腕の振りも独学なのか...?

ソース

Google DeepMind、強化学習でAIが障害物の回避・乗り越え方を体得。パルクール風の動きに進化 - Engadget 日本版
http://japanese.engadget.com/2017/07/10/google-deepmind-ai/

2番組の途中ですがアフィサイトへの転載は禁止です:2017/07/13(木) 05:54:53.31 ID:2BoAdivP

人型の動きがふらふらしてるのは
エネルギー効率を無視すれば現実にもこの動きが最速で最安定だからこうなっちゃうんだと思うんだよ
だから消費エネルギーを損失関数に入れるといいと思う

3番組の途中ですがアフィサイトへの転載は禁止です:2017/07/13(木) 06:03:12.31 ID:ubVuIEmq

高度な掃除ロボットを商品化しても
購入できるのは一定の消費力ある層だろうから
本当にそれが必要な低賃金&長時間労働者の負担軽減になるかどうかだな

4番組の途中ですがアフィサイトへの転載は禁止です:2017/07/13(木) 11:20:42.97 ID:8hJfdfYB

>>2
ランダムで複製した中から厳選されていくだけだしただ残ってるってだけじゃね
最速ならふらつかない方が絶対早い

5番組の途中ですがアフィサイトへの転載は禁止です:2017/07/13(木) 19:33:41.21 ID:e2TauhDU

オタ芸のような走り方が実は人類にとっての最適解なのか

https://www.youtube.com/watch?v=hx_bgoTF7bs#t=1m27s

6番組の途中ですがアフィサイトへの転載は禁止です:2017/07/13(木) 23:21:12.48 ID:2vkV8YCn

人類にとっての最適解が見つかったとしても、一人分の人生じゃ習得できないと思う


このスレッドは過去ログです。