ＡＩ、ポーカー対戦も人間に勝ち越し−実社会での活躍は？

トップ
ICTニュース
記事詳細

[ ICT ]

(2017/3/30 05:00)

ポーカーでも人間に勝ち越したＡＩ。実社会での活躍には人間との協議がカギ（イメージ＝ラスベガスのカジノ、ブルームバーグ）

人工知能（ＡＩ）がゲームを舞台に人間との腕試しを重ねている。囲碁に次いでポーカーでもプロを下すまでに成長した。ゲームで人間と競うのは勝敗やルールが明確な上、大量のデータを集められるためだ。このデータが近年ブレークスルーになったディープラーニング（深層学習）と極めて相性が良い。だがしょせんはゲームとも批判される。ＡＩはいつゲームの世界を飛び出して実社会の問題を解くのだろうか。（小寺貴之）

【プロ３３人と対戦】

米科学誌「サイエンス」にカナダ・アルバータ大学らの研究チームが開発したポーカーＡＩ「ディープスタック」の論文が掲載された。ＡＩが３３人のポーカーのプロと対戦し、全体では大幅に勝ち越したという内容だ。

ポーカーはＡＩにとって難しい種類のゲームだ。相手の手札が見えず、駆け引きが重要な「不完全情報ゲーム」に分類される。チェスや将棋、囲碁のように相手の手も自分の手も見える完全情報ゲームは計算資源を無限に使えれば最善手を計算できる。先手と後手のどちらが勝つか理論的に証明できるゲームだ。だが不完全情報ゲームには一つの正解はなく、計算すべき局面もより複雑だ。今回、カナダの研究チームは深層学習をポーカーに応用した。ネットワーク構造の学習器を二つ組み合わせた。それぞれ１０００万と１００万の訓練データを学習させて性能を高めた。深層学習は膨大なデータを学習できる分野で力を発揮する。囲碁でも米グーグル傘下のディープマインドの「アルファ碁」は３０００万局の盤面を学習してトップ棋士を下した。

【異なる不完全性】

囲碁とポーカーに共通するのは局面の多さだ。「ディープスタック」は「テキサスホールデム」というルールのポーカーでプロと対戦した。テキサスホールデムの局面数は１０の１６０乗、囲碁の局面数は１０の３６０乗とされる。ともに人間ではすべての状況を検討できない。プロでも“正解”を説明できず、「感性」や「直感」と表現する。この感覚に頼る領域において、人間の打ってきた手を学習すればＡＩが人間に勝る。

ただ実社会で活用するにはＡＩは人間に勝てば終わりではない。例え人間より間違いが少なくても、ミスが発生するようなら仕事は委ねられない。産業技術総合研究所人工知能研究センターの辻井潤一センター長は、「ポーカーと実社会では不完全性が根本的に違う」と説明する。

【協業形式探る】

ポーカーは相手の手札の中身こそわからないが、トランプ札数（５２枚とジョーカー）の域を出ない。不完全ではありながら計算しうる範囲内に収まる。ところが実社会では例えば疾患と病因など、想定外の因子が関係してくる前提で問題を解く場合では難度が跳ね上がる。麻生英樹副研究センター長も「ポーカーを解くだけでは、実問題をＡＩ単独で解くのは難しい」と声をそろえる。

そこで注目されるのは実社会の問題をポーカーなみに単純化して切り取る力だ。ＡＩがシミュレーションできるように社会から一定ルールを見いだし、ルールから逸脱する領域との相互関係を示すことにより、人間がＡＩの答えを解釈できるようにする能力だ。これはＡＩ研究者には難しく各分野の専門家に頼っている。現場との連携が求められている。

(2017/3/30 05:00)