OpenAIが開発したロボットハンド(動画あり)

米国の非営利団体OpenAIが開発したとされるロボットハンドについて解説したいと思います。

どういった技術なのか。使われているアルゴリズムについて私の意見を交えて解説します。

そして最後にロボットハンドの動画を載せてさらに理解を深めようと思います。

OpenAIの目的

OpenAIは安全性を重視した汎用人工知能(AGI)を作ろうとしています。

人工知能というと危険なイメージを持っている人がたくさんいます。SF作家などが描いた人工知能は正に危険なロボットに立ち向かっていくような描画がたくさんあるのですが。

ちゃんとルールを決めてあげることが大切です。これをしてはいけないという制約を作ってそれをプログラムして危険を回避していくのが人工知能を育てていく上で必要になるでしょう。

OpenAIの研究員らはシミュレーション上でロボットハンドがブロックを動かしています。それを現実のロボットハンドにブロックの動かした手順をそのまま再現してもらおうと情報を送信しているのです。

人が物をつかむ特徴をロボットに覚えさせたということになります。

用いられている技術

このロボットハンドには強化学習が用いられていて正解の動きをすると報酬を与えるという仕組みです。

なのでロボットが正解に近い動きをしたら報酬を与えて続けてもらい、ブロックを落としたり、間違った動きをすると罰が与えられます。

この研究のうまみはシミュレーション上で行ったこと

このロボットハンドを最初から現実空間で動かすのではなく最初にシミュレーションで動かしました。

シミュレーションでは物体の質量や重力設定ができるので、あらゆる場を想定してロボットに環境に慣れさせるということができます。

つまり私たち人間が持っていない別の正解を導き出せる可能性を含んでいることが言えます。

これもロボットだからできることなのだと思います。

最後に動画を載せます。

ロボットがルービックキューブを完成させるまでの動画です。

これをもっと発展させれば人間よりも早く完成させたり少ない手数で完成させたりできるようになるのかもしれません。

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA