将棋倶楽部24の思い出と顛末の話

将棋倶楽部24が年内で活動終了するそうです。

指し手としては昔からあるサイトのひとつで変な色気を出さない硬派と認識していました。

 

 

個人的というよりこのBlog的には二番絞りの計測が印象深く記憶しています。

2022年の世界選手権予選一位、決勝最終戦まで一位。最終戦で劇的な逆転負けで準優勝となった二番絞りの評価関数です。予算規模が3,4桁違うので接戦できただけでも万々歳という感じでした。

 

 

このモデル結局ポリシー(ニューラルネットワークの出力に乱数を加えた)だけで将棋倶楽部24の八段認定を頂きました。プロか奨励会員しかいないレート帯域です。

2010年代の将棋エンジンが最大性能でこの帯域だったそうです。

 

個人的には計測がメインであったのですが、一部のマニアに気に入られて一日数百局も対戦することがありました。1エンジンでこの対局数です。

高段者は将棋倶楽部24でも少なく、フリーでいつの時間でも自由に対局できるのがありがたかったのかもしれません。

最初の集計で4000局程度、最終的に10000対局を超えました。特にお正月の深夜に連続3時間くらい連戦している方もおられましたが、5回に1回くらい勝っているのを見る限りおそらく中高生の奨励会員有段者でしょう。

 

席主の久米宏さんと面識はありませんが、上記のエンジンを放り込む際に「電脳」と称号をつけたアカウントを用意いただきました。人間ではないことを明確に表示するためです。

その後、同一手順の棋譜が大量に発生していることでレート破壊につながると連絡があり二番絞りの実験を終えました。

このレート破壊の件ですが、当初から心配していたため乱数を多めにいれて温度係数が3と一般的に1前後で入れる係数を相当大きくとってありました。そのため初手30種類を全て制覇しています。終盤の頓死も昨今のAIに比べて随分と多い印象です。

しかしながら、数%から十数%の確率で主に横歩取りの同じパターンに誘導できるようでその形の棋譜が大量に発生したようです。

普通であれば数回に1回程度の勝ち星はどうってことはないのですが、将棋倶楽部24において大きく格下の挑戦者は30回に1回勝つだけでもレートが上がります。

執拗に同じ棋譜を作ってレートを稼ぐような方が実際にいたようで問題となったわけです。実力以上の評価を欲しがる人のことを良く分からないのですが結構居るのだと聞きました。

 

簡単な探索や短期学習などを実装すれば回避できますが、それではレートが上がりすぎて計測ではなくなるので終了としました。

本実験は誰でも対局可能な対局場があって成立するもので、かつ実際統計処理が十分可能な対局数もあり、将棋AI界隈で恐らく歴史的な記録となります。

貴重な計測の機会を頂けたことに改めて感謝いたします。

 

---

追記:

貴重な対局場を失ってしまって類似の実験をどこですればいいのかと悩ましいところです。

2024年にDeepMindがチェスで似たようなことをやっています。将棋よりチェスの方が特徴量的には楽な気がします。

[2402.04494] Amortized Planning with Large-Scale Transformers: A Case Study on Chess