『人工知能はどのようにして「名人」を超えるのか?』を読んで将棋AI開発の考えを知る | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

『人工知能はどのようにして「名人」を超えるのか?』を読んで将棋AI開発の考えを知る

中国で行われた対局で、 Google の囲碁AI、 AlphaGo が世界ランキング1位の柯潔氏を破りました。3局とも AlphaGo の勝ちという完全勝利です。(記事はこちら
また、将棋の世界でも将棋AI PONANZA(ポナンザ) が電王戦二番勝負で佐藤天彦名人を破っています。(記事はこちら
こちらも2局ともPONANZA(ポナンザ) が勝った完全勝利であり、奇しくも2017年の5月に将棋、囲碁と、つい数年前まではコンピュータには難しいとされていた伝統的ゲームにおいて、最強ランクの人間プレイヤーに AI が相次いで勝利した事になります。

PONANZA(ポナンザ)の開発者による初の著書

今回ご紹介するのは、その将棋 AI “PONANZA(ポナンザ)” を開発した山本一成氏の著書『人工知能はどのようにして「名人」を超えたのか?』です。

この本はもともと cakes で連載されていた『人工知能はどのようにして「名人」を超えのか?』を単行本化したものです。電王戦での勝利、著者がTBS系のドキュメンタリー「情熱大陸」に出演したのに合わせての発売で、とてもタイムリーです。

「情熱大陸」では人にフォーカスする番組なので、当たり前といえば当たり前なのですが… AI に関する著者の考え方の紹介は消化不良だったので、この本の出版は素直に嬉しいです。
(番組で山本氏が繰り返していた「足し算できたら嬉しいじゃないですか」の意味が、本書を読んでよく分かります。)

期間限定かどうかはわかりませんが、出版社のページに本文の一部があるので、そちらもごらん下さい。

まんまとマーケティングにノせられたところで(笑)内容を紹介します。

本書の内容

章立ては以下の通りです。

第1章 将棋の機械学習 ― プログラマからの卒業
第2章 黒魔術とディープラーニング ― 科学からの卒業
第3章 囲碁と教科学習 ― 天才からの卒業
第4章 倫理観と人工知能 ― 人間からの卒業

おわりに
巻末付録 グーグルの人工知能と人間の世紀の一戦にはどんな意味があったのか?

第1章から第3章までは、著者自身のことよりも、圧倒的に弱かった PONANZA(ポナンザ)がどういった進化をたどり、名人に勝つところまできたのか?について、人工知能の進化の歴史を踏まえながらコンピュータの知識が無い人にもわかりやすく解説されています。
第4章は人工知能の限界と、人工知能が人間を超えた時、何をすべきか、が著者の人工知能開発の経験をもとに語られます。

キーワードは「探索」と「評価」

著者は「探索」と「評価」をキーワードに、自身の PONANZA(ポナンザ)、そして人工知能全般がどのような進化を遂げていったかを説明します。

「探索」はコンピュータの得意技でデータを端から端まで探すことです。コンピュータが生まれたときから、人間よりも得意な分野で、将棋の場合は「一般的なノートPC 1秒間に何百万」もの局面を読んでしまうそうです。

しかし、それでも将棋すべての手のパターンを組み合わせで考えていくと、膨大すぎて、進歩した最新型のコンピュータをもってしても「探索」を最後まで行えないほどのパターン数になります(これを「組み合わせ爆発」といいます)。

本書によると将棋の場合は10の226乗通りであり、これは観測可能な範囲の宇宙に存在している原子の数よりも多い(Google 社の名前の由来にもなり、10の100乗を意味する)1グーゴルよりもさらに多い数だそうです。 天文学的どころの話ではないですね。

しかし、実際にコンピュータは人間が我慢できる程度の時間で将棋を打っています。つまり、将棋AIの作り手は、何らかの工夫を加えることでこの時間を短縮しています。

そのカギが「評価」です。「評価」とは本書によると「探索」の「目星をつける」こと。つまり膨大なパターンの中から相手に勝てそうな手に限って「探索」をおこなうことだそうです。

ですので、将棋AIの進化は普通にやっていては到底不可能な「探索」をいかに適切な「評価」を行うことで、効率よく「いい手」を指して勝てるようにするかという面からなされてきた、といえそうです。

そして、本書で語られているその進化の過程をまとめて並べると以下のようになります。
1.「いい手」を人間がいちいちコンピュータに教えていた
———この間がブレイクスルー———————
2.「いい手」を過去の棋譜からコンピュータが学習するようになった(「機械学習」)
3.「いい手」を過去の棋譜がなくても勝手にコンピュータが考えるようになった(「強化学習」)

詳しい内容は本書を読んでいただくとして、現在の将棋・囲碁 AI の開発は、2, 3 のやり方の絶妙な配合で行われており、作っている人間も中で何が行われているかわからず、どうすれば強くなるかも手当たり次第にいろいろ試してみなければわからない。と、ある意味面白い、ある意味衝撃的な内容が語られています。

人工知能の未来

1〜3章とは変わり、4章は、そんな人工知能との付き合い方を著者が語っています。大まかにまとめると、「物語」としてものごとのつながりを理解し「目的」を考えられるのがコンピュータにはできない人間の能力であり、人工知能に「目的」を与えるのが人間の役目である、ということです。個人的には、グーグル翻訳のディープラーニングにより、コンピュータが人間の「偏見」を学習しているという事例が非常に興味深かったです。

人間によるプログラミングから、機械学習へ、将棋 AI の開発手法の変遷については下記の SiTest ブログもごらん下さい。

将棋ソフトにみるAIのアルゴリズム (http://sitest.jp/blog/?p=6152)
将棋ソフトにみるAI強化の手法 (http://sitest.jp/blog/?p=6563)
将棋ソフトにみるAIとの生き方 (http://sitest.jp/blog/?p=6897)