久保田論文 第四章
KUBOTA STUDY CHAPTER 4
第四章 AlphaGo
自分がcomputerの持つintelligenceを有形なものとして実感出来るような応用を試みたのは1980年代の前半であったが、1980年代の後半からは職務が変って computerの据付とかinternet桟器の据付保守の仕事をするようになった。AI的な試みとは無縁になった。 自分はさらに1987年よりAIには全く関係のない部門に移り、次にAIに関心を持ったのは、 AlphaGoが碁の世界チャンピオン であったイ・セドルに勝った時である。 2005年に仕事から離れてリタイヤした。第2の青春とも言える時が来た。そこでテニスとか碁とかに 時間を自由に使えるようになった。 そのうちテニスはともかく碁はテニスクラブで一番強いと言はれるよ うになった。
ところがである、2016年に突然Alphabet の子会社でイギリスにある Deep Blue というスタートアップ(ベンチャー企業)がAlphaGoという AIソフトを開発して韓口のトップ棋士イ・セドルに勝ったという話が世界中を駆け廻ったのである。IBMがチェスのゲームソフトを 開発したとか 将棋ソフトが現役プロ棋士に勝ったとかいう話は時々耳にしたが碁はちょっと別の話であろうと思っていた。 ゲーム始めの2手目の手数はチェスが400手、将棋 は900手であるのにくらべて、碁は約 129,960手あるといわれている。だからAIが人間のプロ棋士に勝つには、後10年はかかるだろう と言われていたのだ。 そして2017年には世界1位の中国出身のプロ棋士 柯潔と対戦して3連 勝した。
自分もそれ以降プロ棋士とAlphaGoの対局を 注意して観戦するようになった。 そして自分が最初に感じたのは一体この“人” は何を考えているのだろうかという事であった。 自分で は到底考えつかないような手を打ってどんどん勝っている。 その一方で中盤以降の入り組んだ局面で いとも簡単に人間にしてやられもしてる。 要するに神様ではない。 最近の出来事として例をあげると、令和4年の名人戦7番勝負で井山名人と辻野挑戦者と対 戦、2勝3敗で後の無い井山が終盤にさしかった時にAIも別室の検討も気付かなかった 妙手を 放って逆転して対に戻した快挙があった。 AIは何か次元の違った視点に立って勝負しているような 印象を得たのである。
ちょっと立止まって振り返ってみる。 碁は江戸時代に幕府の庇護の許に家元制があり発達した。本因坊道策、本因坊秀策というその道の巨人が夫々大きな飛躍を遂げた。 しかし長い伝統の中で思考が硬くなっていった面があったのだろう。
さてAIはどのように次の手を選ぶのだろう。先に 述べたように序盤での候補となる手数が多すぎ終局までの手数が多いので展開予測が難しいのではないか。どうするのか。
- ⚫ 先ずポリシーネットワークといって次の手として確率の高い候補を複数選定する。
-
⚫ 次に現在の局面での確率を計算する。(これをバリューネットワークという。)
- ⚫ 夫々をモンテカルロ法で計算して候補手を絞り込む。
一昔前であれば解説者が”それが形です“と言って解説はそこで一区切りすることが多かった。だが今AI であれば現時点でバリューネットワークの値が51%でも他の候補手がポリシーネットワークでは52%の手があるなら、その手を選択するだろう。 要するにAlphaGoは常に良い手を打っている訳ではなく、少しずつ修正したりして確率が動いてる のだ。
呉清源がこんなことを言っている。一部を省略して引用して みよう。 「私が1992年に発表した21世紀の碁の基本理理念は、盤全体を見て定石に囚われてはいけ ないというものです。 日本では棋聖道策の時代、定石は少なくとも強い時代でした。それが、あれも これも定石と言い出して定石を覚えなければならぬと半ば強制するようになりました。 例えば戦前は 大斜百変といわれたのに、戦後は 大斜千変といわれるように日本は多くの定石の渦に埋没してしま い、どれを選択すればよいか迷うばかりとなりました。そうこうしているうちに、定石に囚われない 定石 を知らない中国や韓国の若い人達に追い越されて しまいました。 定石というものはヨセにしかなく、 序盤には無用なので、 序盤では定石を知らずに少しくらい損をしても 方向さえ間違えず自由に打 てばよいのです」 そうだと、方向さえ間違えなければ勝負は確率の中を漂っているので、形や定石で決まるものではな いのかと思った。
呉清源が昭和4年に14才で来日して、19才にして 新布石を提唱し大きなインパクトを与えたのである。呉清源の生誕が1914年で2016年の AlphaGo出現は約100年後となる。まさに歴史は繰り返すである。
