スクラッチ勢の行方

先々週に終わりましたが今年の電竜戦TSECの予選が行われました。

コブラさんが大量投入した上に勝ち星を集めるスクリプトを用意していたようで決勝に残られました。ルールの穴を堂々と予算をかけて突いてくる辺りが持ち味だなと感心するばかりで,運営としては今後対策を考えます。

ついでの宣伝ですが決勝は今週末17,18日です。

阿部健次郎七段のライブ解説を準備しております。

B級対局を含めると膨大な対局がありますのでご期待ください。

 

golan.sakura.ne.jp

 

また,別件で話題になったのがスクラッチ勢です。

うちの地ビール含めてスクラッチ勢は少数派になってしまいましたが,コンピュータ将棋の世界でスクラッチは結構楽しい領域です。

何もないところから自分ですべてのコードを書き下ろして対戦が出来た時の感動はなかなか味わえません。

 

ところが,当然ながら過去の叡智の塊と言える強豪ライブラリには当然勝てません。

floodgateにおいても近頃レーティング計測すら難しい状況です。

まず,レート基準が2016年世界選手権準優勝の技巧2です。

クラッチで勝つのは相当な難易度です。

floodgateではレーティング付ソフトに一勝でも上げなければレーティングが付かないことになっています。

 

低位でどのくらいまでレートが付くか確認してみました。

go_test10cが地ビールの最新型で一応2223とレートを付けてもらえるくらいです。

やねうら王の駒得のみ評価関数Lv2でも2357と数字はついています。Lv2ですと持ち駒と盤面の駒に差をつけた程度ですので非常に簡単な評価関数ですが探索部がやねうら王ですので大変高速です。探索深さ20とか出ます。

他にもAobaZeroの一手につき10局面評価,二番絞りの一手につき3局面評価などが似たような辺りですがレート計測可能な領域です。これらは本当に先を読めていませんが深層学習で序盤の定跡が上手にトレースされています。上記やねうら王と両極と言っていいでしょう。

 

LesserKaiに勝てるようになってからfloodgateに放り込みましょうというのが今までのコンピュータ将棋の入門でしたが,ギリギリ勝つ程度ではレート計測対象にもならないことが様々な実験で分かりました。

最後に,最下位にLesserKaiが二ついますが一つは私が改造した物,もう一つはオリジナルの作者である池さんの改造した物ですがこれがラッキーもあってギリギリレートが付いた感じです。普通なら数日放置してもつかないくらいです。もちろん無改造のLesserKaiはレート計測不能です。スクラッチ勢用に適当なサンドバッグを作成しようとしている段階です。

 

ちなみにYSSが2500付近におりますし,過去にGPSfishもこの付近だったと思います。これらも相当なノウハウの塊で,フルスクラッチでこれらを目標にするのは結構大変です。

f:id:the48:20210712173717j:plain

 

クラッチと申しましたが,既存のソフトを写経するようなものであれば同じ強さが得られますのでそういうのもアリかと思います。スクラッチになるかどうかの判断はお任せします。

---

7/15:追記

ちょっと長くなりますが追記で続けます。

f:id:the48:20210715110543p:plain

なのはさんから提案がありました。なのはmini,なのはnanoはどうかとのことでした。さっそく放り込んだ結果が以上です。2016年正月なので私が参入する前のものということで当時の感覚が分かりませんがYSSより強いようです。ただ,1スレッドだとAobaZeroの方が強いってのが結構時代だなって感じはしますね。

なのはは実はざっとソースを読んだことがあって,盤面の利き情報を保持する工夫をしていて結構難解な構造だった記憶があります。それにしては実に高速化も施されており可読性が高ければ非常に素晴らしいベース素材だなぁと思っています。バージョンは当然古くなりますがStockfish由来の探索部なので,これに対してフルスクラッチで勝とうとするのは相当な難易度に思います。サンドバッグ的には高過ぎという感じでしょうか。

上記のように別件でcshogiの追加機能の動作テストをしたのですが,やりそうでやらないLesserKaiとのガチマッチに勝ちました。そういえば人間で勝てるんですよね。段位者の方は自身を自作AIの対戦相手にするのもいいのかもしれません。 

私レベルでこんなもんですから,特別高段者でなくても暇があれば生身の人間でもfloodgateのレートは付きそうです。