前回挙げた問題点を順番にぼちぼち潰していこうというところです。
時間制御はちょいちょい弄っています。酷い読む抜けを心配して最小考慮時間を3秒(以前は2秒)としています。
相変わらず酷い頓死してる。>az_kai_test vs. Miacis_1060 (2020-03-04 21:30) https://t.co/4HcjSyRMzg
— 48 (@bleu48) 2020年3月4日
頓死は相変わらずでどうにかして探索パラメータくらいで改善しないかなぁと試行錯誤をしておりますが,甘く無いなぁってのが実感です。
ポリシーネットの評価を落として一時的に幅広い手を探索するようにすると深さが全然伸び無くなったりして弱体化が激しくなります。
遊んだ結果を利用して試行錯誤中ですが今は指し手を最終的にLCBで選ぶようにしています。LeelaZeroが(囲碁で)採用しているようです。
時間制御部分との整合性は怪しくなってますし,レーティングは上がってませんが,気持ち評価値を大切にしてる感があります。
色々改造していると組み合わせ変更のためにビルドしなおすのもアレなので外部から設定変更可能にしたいわけですが,AobaZeroが基本的に起動オプションを使っています。普通の将棋エンジンはusiプロトコルのoptionですよね。う~む,どうしたものか。
もう少し考えます。
floodgate上位陣は相変わらず試行錯誤のようで名前を変えて何度もトライしているようです。うちの子が7位まで下がってましたが上位は全て一敗でした。
こういうのを楽しんでいる人も居るんですね。