[ 科学技術・大学 ]

【電子版】囲碁電王戦、趙名誉名人が勝利−国産AIソフトに2勝1敗

(2016/11/23 22:30)

  • AI囲碁ソフトに勝利した趙治勲名誉名人(右)

ドワンゴと日本棋院などが開発した人工知能(AI)囲碁ソフト「DeepZenGo(ディープゼンゴ)」と、趙治勲(ちょう・ちくん)名誉名人による第2回囲碁電王戦3番勝負の最終戦が23日、日本棋院(東京都千代田区)で行われ、趙名誉名人が2勝1敗で勝ち越した。日本の囲碁AIがプロ棋士とハンディなしで対局するのは初めて。趙名誉名人は「まるで人間と打っているよう。ポカミスもする。Zenが挑戦した打ち手が確立されれば、自分が55年間学んできた碁が覆る」とZenをたたえた。(小寺貴之)

深層学習で短期間に棋力プロ並み

初戦は趙名誉名人がAIを下し、対策としてZenは一手あたりの計算時間を1.6倍に増やした。第2戦は序盤に趙名誉名人が打った悪手が中盤まで響いた。終盤に趙名誉名人がZenの手を見落とし勝敗が決まった。Zen開発チームの加藤英樹代表は「趙先生の最後ミスがなければ勝負はわからなかった。勝つことができて感無量」と振り返る。

最終戦でZenはさらに計算時間を伸ばし、第1戦の2倍に増やした。より多くの手を探索したが、趙名誉名人には届かなかった。Zen自身の勝率予測が50%まで下がったところで加藤代表が投了した。加藤代表は「完敗だった。分が悪くなりZenが変な手を打っていた」と説明する。一方で趙名誉名人も「自信はなかった。このまま負ければ、これまで勉強してきた碁は何だったのかと思っていた」と振り返る。

Zenは趙名誉名人と渡り合い、解説のプロ棋士も盤面の優劣がわからない勝負に持ち込んだ。第2戦では序盤から中盤にかけて「人間には地を数えられないので優勢劣勢はさっぱりわからない」と説明していた解説者が、終局後に「終始、Zenが優勢だった」と発言を翻したほどだ。

Zenの棋力をプロ棋士並みに引き上げたのはディープラーニング(深層学習)という技術だ。プロやアマチュアの大量の棋譜を学習し、序盤の布石バランスを身につけた。趙名誉名人は「6カ月前のZenの棋力は話にもならなかった。この短期間で人間の200年分の進化をみせた」と評価する。

「失敗しない」アルファ碁と対照的

「まだたくさんミスをするが全体としては強い。ミスは直せる。碁は王銘琬(おう・めいえん)九段に似ていて、中央を厚く打つ。この打ち方が確立されれば、自分が学んできた碁を根底から見直さないといけない」という。王九段は立ち会いを務め、「Zenは殺気だった碁を打った。対戦相手はとてもスリリングで勝てば手応えは大きい。グーグル・ディープマインドのアルファ碁が、そつなく失敗しない手を打つのと対照的だ」と表現する。高尾紳路名人は「Zenとは打ちたくない。考えていることがわからない手を打ってくる相手は苦手」と苦笑いする。

プロ棋士たちがこぞってAIの打ち手に個性を認めている。趙名誉名人は「Zenは感性が良い。布石のバランスが良い」と表現する。加藤代表は「高度な統計処理に感性が見えるのは面白い。Zenのもととなったデータは人間の棋譜。人間が打ってきた膨大な試行錯誤の上澄みとして、感性や個性が表現できているのかもしれない」と説明する。

本来、AIの計算結果は勝利を求めるかぎり一つの最適解に収束するはずだ。棋士は「神の一手」や「真理」と表現する手だ。だが碁の手のバリエーションは膨大で、10の30乗とも50乗とも言われる。加藤代表は「3000万の棋譜を学習しても、とても足りない。最適解を見つけるのに数百年はかかる」という。

囲碁ソフトの個性が付加価値に

現在のAIはどれも局所最適に留まるため、当然違いは生まれる。個性を分けているのは、囲碁AIの深層学習ではカバーできないルールベースのプログラムの部分だ。人間の棋士が常識や定石として身につけているルールをプログラムに落とし込んである。ドワンゴの川上量生会長は「人間に例えると理詰めで計算できず、なんとなく適当に選んでいる部分でAIの個性が生まれている」と表現する。

これがZenの個性となり、スリリングな展開を演出したのだろう。棋士とAIが互いの腕を高めあうことにもつながりそうだ。井山裕太六冠は解説中Zenの手に対して「この手を打てる棋士はいない。いい手になればZenの力は本物だ」と驚き、趙名誉名人は「楽しい。勉強になる」と強調した。

王九段は「囲碁は二人で一つの作品を作るために対局という仕掛けを使う。棋士は神の一手に近づけるならばAIからも学ぶ。AIの個性は敬意を含めたアイデンティティーにつながるのではないか」と予想する。川上会長は「個性を商品として設計することは十分可能」という。今後、いくつものAIが出てきたときに技術的に発生する個性がサービスや製品などの付加価値になるかもしれない。

一方で、ルールベースの部分がAIソフトの棋力を落としていることも、今回の対戦で明らかになった。深層学習で大局観を身につけてプロ棋士並みにはなったが、「ルールベースが周囲に悪さしている。ただ、ルールと深層学習はいわばデジタルとアナログ。二つを融合させるのは至難の業で方法論も見えていない」と加藤代表は明かす。これに対し、ディープマインドのアルファ碁は二つの接続にあたる部分を秀逸に仕上げてあるようだ。

今後、Zenは韓国のイ・セドル九段を倒した時点のアルファ碁超えを目指す。すでに「論文掲載時のアルファ碁は超えた」(川上会長)というZenだが、現在の棋力は3100-3200程度。これを3600以上に引き上げる。そのとき、Zenの打つ碁は周囲をハラハラさせてくれるのか、味気ないものになるのか。勝ち負けの先に何を目指すのかによって決まる。

(2016/11/23 22:30)

おすすめコンテンツ

「現場のプロ」×「DXリーダー」を育てる 決定版 学び直しのカイゼン全書

「現場のプロ」×「DXリーダー」を育てる 決定版 学び直しのカイゼン全書

2025年度版 技術士第二次試験「建設部門」<必須科目>論文対策キーワード

2025年度版 技術士第二次試験「建設部門」<必須科目>論文対策キーワード

技術士第二次試験「総合技術監理部門」択一式問題150選&論文試験対策 第3版

技術士第二次試験「総合技術監理部門」択一式問題150選&論文試験対策 第3版

GD&T(幾何公差設計法)活用術

GD&T(幾何公差設計法)活用術

NCプログラムの基礎〜マシニングセンタ編 上巻

NCプログラムの基礎〜マシニングセンタ編 上巻

金属加工シリーズ 研削加工の基礎 上巻

金属加工シリーズ 研削加工の基礎 上巻

Journagram→ Journagramとは

ご存知ですか?記事のご利用について

カレンダーから探す

閲覧ランキング
  • 今日
  • 今週

ソーシャルメディア

電子版からのお知らせ

日刊工業新聞社トピックス

セミナースケジュール

イベントスケジュール

もっと見る

PR

おすすめの本・雑誌・DVD

ニュースイッチ

企業リリース Powered by PR TIMES

大規模自然災害時の臨時ID発行はこちら

日刊工業新聞社関連サイト・サービス

マイクリップ機能は会員限定サービスです。

有料購読会員は最大300件の記事を保存することができます。

ログイン