p800という制限

f:id:the48:20210420092124p:plain

 

AobaZeroでp800を基準で投入されてます。最近になってポリシーのみの対局でレート2150程度と実験されてます。

コンピュータ将棋や囲碁の掲示板

 

うちの子もfloodgateで5b, 15b, 40bを投入してみました。

15bと40bは代り映えがしない感じでAobaZeroと同じゾーンにおりますね。5bは2800しかありませんので,探索ノード数を4倍にしてみましたが結局3000に満たない感じです。(ただ,これ3200ノードにしてもGTX1060で1秒未満です)

 

大凡分かるのが15bと40bはAobaZeroと遜色ないくらい学習ができている感じです。(贔屓目に見ると15bとか勝ってるようにも見える)

5bは同ノード比較すると論外だけど15bの三倍速く計算可能なので時間当たりノード数は相当伸びます。同GPUでノード制限なしならAobaZeroよりやや強いところまで行くかんじです。

 

で,ノード制限ってのが相当弱くなるのが分かりますが,これでいいのかってことですね。例えばp800だとKristallweizenの1000kとelmoの10Mとgikou2_1cが三枚僅差のレートで抑え込む形になってます。たまたまレート順に探索ノード数が多く,これは探索深さ順にもなっていると思われます。

そこでふと考えてみるとp800ってどこまで深く探索可能だろうかと。もしかして評価関数関係なくp800でこれら(特に後者二つ)を打ち負かすのって相当高難易度なんではないかと考えました。

 

真面目に書いてると卒論くらいのネタにはなるでしょうか?

---

 さらに4倍してp12800放流中です。こういうのを見る限りp800では頭押さえられるんじゃないかという仮説が強化されます。