AobaZeroで遊ぼう

f:id:the48:20190722123329p:plain

出張中のマシンが空くのでfloodgateにaobazeroを投入して以下の実験をしておりました。

レーティング表の通り学習が頭打ちに近いことが前提です。

AobaZero_w626_n_p1600ってのが,命名そのままですがオリジナルの二倍考えるってやつです。レーティングが200ほど上になってますので,二倍考えると200くらい上がるってのがαβ法と同じくMCTSでも求まったんじゃないかなってことです。

AZ_CPUってのも入れておきました。本当はp400って半分のを入れたかったのですがGPU搭載マシンがふたつ無かったので勘弁してください。CPUだとデフォルトのp30です。p800に対して16分の1と32分の1の間くらいですね。800~1000下回る位置に居ればいいのですが,この層は対戦相手が少ないので数値は荒く信頼性は低いと思っておきます。ちなみに評価関数はw640でした。

 

ということで次にp400の実験を開始します。

---

先日任意局面を探索できるようにsfen対応をしてみたのだが,dコマンドで局面は読まれているのに探索開始すると落ちる状況。何か初期化抜けのようなものがあるんだろうか?

もちろん実装出来れば評価エンジンとして使えることになる。