AobaZeroで遊ぼう21(バージョン43リリース記念編)

AobaZeroネタは随分と御無沙汰です。

前回から2年近くになりますか。

bleu48.hatenablog.com

 

その間の更新で目ぼしいのを上げますと

2022年7月 v37 平均playout数が772から1568に

2022年11月 学習率を大きくして序盤や早い投了棋譜の学習割合を減らす

2022年12月 v39 cPUCTを動的に変更、王が逃げる手1手を延長。棋譜にNNの生のValueとPolicyを記録するように。

2023年3月 互角の局面の学習確率を減らす

2023年12月 v41 平均playout数を1600から3200に

2024年1月 先手勝ちの学習確率を減らす(先手勝率7割超のため)

2024年2月 v43 WindowsNVIDIAのドライバを更新したときのエラーとCPU内蔵のGPU(Intel Iris Xe)でもOpenCLが動作するように修正

 

2022年7月と2023年12月と2回のplayout数の倍増で元の4倍になっています。

これで教師データが相当強くなりますが棋譜生成速度が随分と遅くなり更新頻度が落ちることになります。特に2023年12月の変更の効果は先月に入ってからやっと効果が出てきたかどうかという雰囲気です。

教師データ生成に参加できるのですが、個人的には新規マシンの負荷テストに用いて長いときは2,3日ぶん回しています。電竜戦のハードウェア統一選の前に負荷テストを簡単にしておこうとして、NVIDIAのドライバアップデートから正常動作しなくなったのに気づき報告しておりましたら先月末にv43で対応いただきました。OpenCLの型定義の件で同様のことがAoba駒落ちでもありましたのでこちらの更新もお願いしておきました。

AobaZero

Aoba駒落ち

Aoba駒落ちもv27で対応いただきました。最新のGPUで強くなるということです。

 

新ネタとして仕入れた8700Gでもテストしてみたところ、700nps程度は出ることが確認できました。

8700Gの話その1(Ryzen AI評価の基準確認) - 48's diary

floodgateに放り込んでいたのですが長時間走らせていたためか途中から異常がみられ連敗しておりました。レート計測を乱した件各方面にお詫びします。

v41でもv43でも見られましたのでその間の修正とは無関係な不具合のようですが、以前の5700GなどのAPUでも熱暴走的な挙動は見られましたので同様の熱暴走かもしれません。確認した温度は常に60度程度なので断定は避けますが、長時間運用向きではないとしておきます。

記憶の範囲では安定動作している間のレートはkld_avg_3200pを上回っておりました。固定10秒ですので7000p相当と考えれば妥当です。

 

同タイミングでIntel Iris Xe(i5 1240P)でも同様なテストをしたところこちらは400nps程度で200戦ほどでレート3608といったところです。固定時間10秒としましたので、KL情報量制御を加えた方がレートにして100程度は有意に強いと言えるでしょう。

 

徐々に二番絞りのアドバンテージはなくなってきている感じですね。

今年の選手権ではどうなることやら。