p800という制限 - 48's diary

f:id:the48:20210420092124p:plain

AobaZeroでp800を基準で投入されてます。最近になってポリシーのみの対局でレート2150程度と実験されてます。

うちの子もfloodgateで5b, 15b, 40bを投入してみました。

15bと40bは代り映えがしない感じでAobaZeroと同じゾーンにおりますね。5bは2800しかありませんので，探索ノード数を4倍にしてみましたが結局3000に満たない感じです。（ただ，これ3200ノードにしてもGTX1060で1秒未満です）

大凡分かるのが15bと40bはAobaZeroと遜色ないくらい学習ができている感じです。（贔屓目に見ると15bとか勝ってるようにも見える）

5bは同ノード比較すると論外だけど15bの三倍速く計算可能なので時間当たりノード数は相当伸びます。同GPUでノード制限なしならAobaZeroよりやや強いところまで行くかんじです。

で，ノード制限ってのが相当弱くなるのが分かりますが，これでいいのかってことですね。例えばp800だとKristallweizenの1000kとelmoの10Mとgikou2_1cが三枚僅差のレートで抑え込む形になってます。たまたまレート順に探索ノード数が多く，これは探索深さ順にもなっていると思われます。

そこでふと考えてみるとp800ってどこまで深く探索可能だろうかと。もしかして評価関数関係なくp800でこれら（特に後者二つ）を打ち負かすのって相当高難易度なんではないかと考えました。

真面目に書いてると卒論くらいのネタにはなるでしょうか？

---

最終盤でひっくり返されるやつ。＞elmo_WCSC27_479_1000k vs. 5b_n007_p12800 (2021-04-20 12:00) https://t.co/SqKnErs5CC
— 48 (@bleu48) 2021年4月20日

さらに4倍してp12800放流中です。こういうのを見る限りp800では頭押さえられるんじゃないかという仮説が強化されます。