探索制限入りMCTSの件

前回に続いて探索制限の話

 

bleu48.hatenablog.com

 

甘く考えておりました。

5b_007_1060がレート3600超えてました。

Player Statistics

これを基準に探索制限を800, 12800, 50000と三つやったのですが全部随分下です。

 

思ったよりも酷いことになる感じですね。

探索ノード制限は想像以上に終盤弱くなっているみたいで,特にレート3300の番人技巧にやられています。

 

加えて最弱としてポリシーのみのエンジンも投入しています。

これは最もポリシー精度が高い40ブロックにしてありますが,レート保持エンジンには全然勝てません。

AobaZeroのポリシーのみが2000台(山下さんのBBSより)ってのはうちの子より高精度ってことなんでしょうか?探索して5手詰見逃すエンジンが探索なしで詰ますのは偶然なんでしょうか。 

---

追記:

結局40ブロックのポリシーのみでは100戦以上やってもレートが付きませんでした。どこかで偶然回戦切れとかで1勝できればって感じでした。

やねさんも同意見でそのまま棋譜覚えた序盤は初段以上あるだろうけど中盤以降両取りは見えないし級位レベルだろうなとの話でした。 

やはり将棋の華は中終盤ですね。