Alpha Goが人の手を借りずに最強になったことが意味すること

Published: October 24, 2017

最近、人工知能の開発ブレーンであるDeepMindは「AlphaGo Zero」が、データなしの学習で、AlphaGoの以前のバージョンよりも高いレーティングを達成したと発表しました。AlphaGo Zeroは自己対局のみでスキルアップし、人間の手を借りていません。つまり、囲碁やそれに類する完全情報ゲームに関しては多量のトレーニングデータなしで優秀なモデルを作れることが明らかにされました。

オセロ: (探索空間の大きさ: 10の60乗) チェス: (探索空間の大きさ:10の120乗) 将棋: (探索空間の大きさ:~10の220乗) 囲碁: (探索空間の大きさ:~10の360乗)

この常識を破ってしまったのがアルファ碁です。アルファ碁は世界で最も強い棋士の一人、韓国の李セドル九段や柯潔九段などに勝利しました。

アルファ碁同士の対局の棋譜が公開され、機械たちが人間の常識を打ち破るような手筋を打っていたことに注目が集まりました。アルファ碁は人間の棋譜をトレーニングデータとした後は、ニューラルネット同士の対局を繰り返すことで進化したのです。

アルファ碁同士の対局の棋譜が公開され、機械たちが人間の常識を打ち破るような手筋を打っていたことに注目が集まりました。アルファ碁は人間の棋譜をトレーニングデータとした後は、ニューラルネット同士の対局を繰り返すことで進化したのです。

20171019173953

fig01 by Takushi Yoshida

でも、今回のAlpha Goは最初の人間のトレーニングデータを利用していないのです。それにもかかわらず、李セドルに勝利したバージョンを超すのに、学習に要したのは3日です。それよりも格段に強いバージョンであるAlpha Go Masterに勝利するのにも21日のみです。

「有望さ」を足がかりにする探索

アルファ碁は一手指すために有望そうな手を中心に、複雑な方法をとりながら膨大なシミュレーションを進めていきます。アルファ碁の力がある地点を超えた後は、そのシミュレーションは人間が想定もしていない手を含んでおり、人間には奇妙に見えます。

20171019174336 (1)

完全情報ゲームと不完全情報ゲーム

アルファ碁のとった探索方法が他の分野、あるいは現実世界にどれだけ応用可能か、はとても興味深い問いです。この応用可能性を考える際に重要なのが完全情報ゲームと不完全情報ゲームというカテゴリの違いです。

完全情報ゲームはプレイヤーはゲームの情報のすべてを得ることができます。自分がしたことの影響や周辺要因のすべてが明らかなゲームです。オセロ、将棋、チェス、囲碁などがこれに当たります。

不完全情報ゲームはゲームの情報の一部分がプレイヤーから見えないようになっているものを指します。麻雀やポーカー、バカラのようなカードゲームがこれに類します。

不完全情報ゲームでは、実力だけでなく運も勝敗を左右します。プレイヤーが取得できる情報は限られており、限られた情報からリスクや成功可能性などを推測しないといけません。さまざまな不確実性に覆われています。プレイヤーは戦略の立て方がとてもむずかしいのです。

今後はAIが不完全情報ゲームでどれだけ人間にキャッチアップできるかが重要になるでしょう。極めて条件の限られたポーカーのゲームでは、AIが人間に勝つという事象が出てきています。この限定的なルールのもとでは、AIは人間よりもリスク算定に優れているようでした。ポーカーは投資のゲームと言われますが、AIは自分の優位を確信すると容赦なく他のプレイヤーにプレッシャーをかけます。今後はAIが人間に迫る時期が来るかもしれません。

Alpha Goの登場は何を意味しているのか?

  • 完全情報ゲームではAIは人間の知見を頼らずして人間を超えてしまう
  • 条件が限られたタスクに関しては機械が人間に勝るという未来は近い

AIが得意な仕事は、AIに取って代わられる日が来るでしょう。AIが得意な領域も拡大していくかもしれません。でも、それでいいのです。社会は生産性を劇的に向上させることができます。私たちは働かずして稼ぐことができるでしょう。

でも、人間社会の仕組みがそのままなら、大量の失業者が生まれ、所得格差が異常なレベルに達します。スラム街から英雄が現れ、コンピュータを破壊する宗教をはじめるかもしれません。

私たちの社会や考え方が、急激な生産性の向上や、さまざまなサービスに安価にアクセスできるというAI時代の利点を受け入れられるようにしないといけません。それはこの社会がどんなものであるべきかということを根本から考え直すことでしょう。

Alpah Go Zeroが人間のトレーニングデータを必要としなかったように、今後私たちは、バイアスにさらされる人間の頭脳ではたどり着かない手法や解決策を手に入れられるようになります。そのときに混乱せずに、新しいコンピューティングのちからを活かせる社会こそ、最も必要なものなのです。脳みその外側で考えましょう。

eyecaytch image via Wikimedia commons