昨日は職場の学園祭でゲームAIの展示をしておりました。
華やかな活動が多く我々のような展示は流し見程度かと思っていたのですが立ち寄られた方は思いの外しっかりと説明を聞いていただいていました。
過去の戦績なども披露してあったのですが,早口で説明しているとちょっと出木杉感があって笑ってしまう人が出ます。
ところで,最近以下のようなものが公開されたようです。これが今日の本題です。
Adversarial Policies in Go - Game Viewer
本文はあまり見ていないのですが冒頭でKataGoが探索無しでa top-100 European Go playerの強さであるとか,64visitsでthe best human Go playersの強さであるとか書かれています。
囲碁の欧州トップ100選手ですかよく分かりません。将棋だと3段4段クラスが欧州選手権に出られていたのでその辺りかなぁと推察します。(間違ってたら教えて下さい)
囲碁の人類トップはAlphaZeroなどで概ね有名になりましたよね。将棋は恐らく今は藤井さんでしょう。
で,先日たまたま二番絞りの探索無しってのを試して,一応高段者クラスの強さがありそうと確認しておりました。じゃあってことで,64visitsを計測しました。
floodgateで2800強と言ったところ。
これ実は結構つらいのが上下にある100万局面制限のエンジンです。64局面制限では探索が桁違いに少ないので最終盤の詰めろや詰みの精度が相当異なります。
え~っとほぼ人類トップ級でいいんじゃないかと思っています。以前,プロ棋士の千田七段がfloodgateで2800くらいを記録したことがあると仰っていたので間違いないでしょう。プロ棋士だと一手指す間に脳内に何局面くらいイメージするものなのでしょうか?64局面より多いでしょうか少ないでしょうか?
ちなみに私は調子のよい局面で5手先7手先程度ですので分岐入れて十数局面でしょうか。(話題がそれますが昨晩丼王戦というものがありました)
ちなみに上記論文の主旨は完全に固定化された指し手に対して嵌め殺しを行うものです。そういえば私も2017年の最初に電王トーナメントに参加した際に技巧2相手にそういう定跡生成を行っておりました。勝率ですか?当時で先手番100%後手番96%(但し無敗)くらいです。
上記論文では対人では役に立たないと結論付けされていますが,私の定跡は電王トーナメント本番でもその後の世界選手権でも十分役に立ちました。敵対相手の探索アルゴリズムに依るところが大きそうです。
久しぶりに対面で説明をすると色々と思い出すものです。
---
追記:
最強の囲碁AI「KataGo」相手に99%勝つことができるAI学習手法が考案される、特殊すぎてAI相手にしか効果なしhttps://t.co/AioWoVJ7tI
— GIGAZINE(ギガジン) (@gigazine) 2022年11月6日