[ ロボット ]
(2016/11/11 05:00)
ロボットに意味のある動作を伝えるディープラーニング
ロボットが社会に溶け込むためには、リアルタイムに変化する周囲の状況をロボットが的確に認識することが不可欠となる。近年、ディープラーニングをはじめとする機械学習の進化によって、ロボットの認識技術にも大きな注目が集まっている。現実世界に適応する機械知能の実現をテーマに研究を続ける、早稲田大学の尾形哲也教授に聞いた。
リカレントニューラルネットワークの可能性
──現在の研究テーマである「ロボットの行動系列学習」に取り組まれたのはいつ頃からでしょうか?
尾形 1993年の学部の卒論から一貫して、学習と神経回路をロボットにつなげることをテーマにしているのですが、20年以上同一の研究テーマに取り組めていることは非常に幸運だと思います。当時、神経回路モデルによるロボットの研究をしたいと考えていたところ、ロボット工学者の加藤一郎先生から「“心”をテーマにするのはどうか」とアドバイスを受けました。学習して賢くなるロボットの研究をしたいと考えていたのですが、より広いテーマを設定されたと言えます。いまでもロボットに「心」という表現を直接的に使う研究者は少ないと思いますが、加藤先生はそこまで注目していました。認識・認知、行動の決定、意思などのレベルをロボットの持つ機構と人間の脳科学などの知見を関連付けて考えようというのは、いまの人工知能研究にもつながるテーマです。
──加藤先生といえば、「WABOT(ワボット)※1」が有名で、二足歩行や楽器演奏などヒューマノイドロボットを中心とした動きを専門にされていた印象があります。
尾形 加藤先生は、晩年、ロボットを使って人間の心理や感情の研究ができると言っておられました。いまでこそ、「認知発達ロボティクス」という概念も一般的になっていますが、当時としてはちょっと変わった発想だったと思います。そういった流れもあって、ロボットと人間がコミュニケーションをするようになるというのが私の博士論文でした。当時ロボットはツールとして捉えられることがほとんどで、「コミュニケーションしてどうする」という考え方もあって、なかなか受け入れられませんでした。そんなときちょうど1997年にソニーの「AIBO(アイボ)」が登場して、人間のパートナーとしてのロボットという考え方に現実感が出てきたと言えます。
──尾形先生は研究に「リカレントニューラルネットワーク(再帰型ニューラルネットワーク:RNN)」を使用していますが、これはどういうものなのでしょうか。また、採用した経緯は。
尾形 RNNは、特に自然言語処理などで採用されていますが、連続した情報の処理に向いたニューラルネットワークと言えます。RNNの影響を受けたのは、私が理化学研究所の脳科学総合研究センターいた頃、チームリーダーの谷淳先生の理論に触れたことがきっかけです。ロボットと人間の認知プロセスを関連付けて理解し、最終的には意識についてまで議論しようというポジションでした。RNNが非線形なフィードバック系になったときに、ものすごくリッチで面白い現象を引き起こすということを見せていただいて、そこからはずっとRNNにはまっていますね。
──RNNが意識の再現に有効ということでしょうか?
尾形 ロボットの動作を構築するときに「意識」や「感情」という言葉を使うかはさておき、当時非常に興味深いアプローチだと思いました。ニューラルネットワークでは、その層を多くしていくと人間の一部の認識機能を超えると言われています(深層学習)。でもRNNの場合、層はそれほど多くなくてもいい。自分の出力をそのままフィードバックするという自己参照が特徴になっています。外からの入力がなくても自分自身に影響を与えて出力が変わるので「ダイナミック(変化する)ニューラルネットワーク」とも呼ばれています。通常のニューラルネットワークは、入力から出力への流れが決まっているので、画像のように固定された情報の認識には向いています。一方RNNは、外部からの情報だけでなく処理中の情報も入力として利用できるため、入力と出力が1:1ではありません。入力が似通ったものでも自分自身の状態によって出力が変化します。過去の経験を使って情報を処理できるともいえます。
──処理の内容を時間的に変化させられるということですね?
尾形 「このタイミングでは、この値はどうなっていなくてはいけないのか」という予測が当たるように変わっていく。そうすると、いまはこのシーンだからこの処理で、違うシーンなら別の処理でというように、自分の行動を決定している情報を学習によって決めていくことができます。コンテキスト(前後の文脈)によって処理を変えることができるため、一気に応用が広がっているというのが現在の流れです。さらに最近では、長くコンテキストを保持するニューロンと、短期的にコンテキストを切り替えるニューロンを、両方利用するマルチタイムスケール(ロングターム、ショートターム記憶)の採用によって学習能力がぐっと上がってきました。1つのニューラルネットワークの中で一様なニューロンではなくて、保持する時間のバリエーションを持つことができるようになったということです。
(※1 WABOT)早稲田大学理工学部の4つの研究室からなる生物工学研究グループにより、1970(昭和45)年に始められた人間型知能ロボットプロジェクト。
【Profile】
尾形 哲也(おがた・てつや) 早稲田大学理工学術院 基幹理工学部 表現工学科教授
1993年、早稲田大学理工学部機械工学科卒業。日本学術振興会特別研究員、早稲田大学助手、理化学研究所脳科学総合研究センター研究員、京都大学大学院 情報学研究科准教授を経て、12年より現在に至る。09年、さきがけ領域「情報環境と人」研究員兼任。15年、産業技術総合研究所人工知能研究センター招聘研究員兼任。ニューラルネットワークおよび人間とロボットのコミュニケーション発達に関する研究に従事。13年、日本ロボット学会理事、16年、人工知能学会理事。日本機械学会、情報処理学会、人工知能学会、IEEEなどの会員。
(2016/11/11 05:00)