- トップ
- 科学技術・大学ニュース
- 記事詳細
[ 科学技術・大学 ]
(2017/6/16 05:00)
米グーグル傘下の英ディープマインドは、多段階の反応や行動を解く「自動計画」と、さまざまな手法の中から良い手法を見つけさせる「強化学習」を融合した新しい人工知能(AI)技術「PREDICTRON」(プレディクトロン)を開発した。AIが学習しながら長めの計画を立てられる。簡易化したビリヤードでは従来の約3倍となる50回中、27回でボールをポケットに落とすなど、既存の深層学習を使う手法より高い予測性能を実現した。
プレディクトロンでは、自動計画と強化学習を融合し、多段階の各段階で報酬を与えて最適な手法をみつけさせつつ、報酬を累積させるなどして学習が破綻しないようにした。
簡易型ビリヤードで性能を検証。四つのボールをランダムに配置し、その中の白玉を転がして他のボールをコーナーに落とす。ボールを転がす角度や速度によって壁や別のボールにどう跳ね返り、ボールが転がるかAIに予測させる。その結果、50回中27回でコーナーに落とせた。従来技術では10回だった。
従来のAIでは連続的な問題を解く際に、1段階での学習を繰り返していたため、全体としての成功率が上がりづらかった。プレディクトロンでは、多段階で長めの計画を立てられるようになった。
日本でのAI研究の第一人者である東京大学の松尾豊特任准教授は、「AIにとって新たなブレークスルー。ただ情報空間が粗い点が課題」と評価する。
詳細は8月にオーストラリア・シドニーで開催する機械学習の国際会議(ICML)で発表する。
(2017/6/16 05:00)
関連リンク
科学技術・大学のニュース一覧
- 英ディープマインド、深層学習より高い予測性能を実現 長期課題担うAI開発(動画あり)(17/06/16)
- 早大、電子波動関数を可視化 アト秒技術の発展に貢献(17/06/16)
- 超小型衛星が拓く・宇宙開発(18)九州工大−電離圏環境変動解明に挑む(17/06/16)
- 東芝など、燃料デブリ調査ロボ公開 福島第一原発3号機に来月投入(動画あり)(17/06/16)
- 産総研、加工用レーザーの出力の揺らぎを0.1%以下に精密制御(17/06/16)
- 九州工大、IoT活用し介護施設で行動認識実証(17/06/16)
- 経営ひと言/東北大学災害科学国際研究所助教の寅屋敷哲也さん「地方対策も」(17/06/16)