続bullet-shogiの話

前回のfloodgateの話題の続きを書こうとしたのですが、追記が伸びるのも読みにくいうえに趣旨がずれてきているので新しく立てます。

 

前回はfloodgateのデザイン変更やbullet-shogiの習作を放り込んだ話

bleu48.hatenablog.com

 

このbullet-shogiの習作ですが、WCSC36決勝入りしていた奏乗のアピール文にある教師データを768-16-64のモデルで学習させただけのものです。

https://www.apply.computer-shogi.org/wcsc36/appeal/sojo/sojo_WCSC36_appeal.pdf

https://huggingface.co/datasets/washiun/Knowledge_distilled_dataset_by_DLSuisho15b_unique

(サイズが大きいので注意)

 

AobaNNUEが約二週間程度学習させたとのことに対して、bullet-shogiでノートPC一晩です。正確には1ステップ80~90秒の500ステップで12時間弱。20時に仕掛けて翌朝終わっている感じですね。

AobaNNUEが強い - 48's diary

bullet-shogiの話 - 48's diary

 

教師データ作成の計算コストが莫大なのでこれだけで喜んではいけないのですが、モデルの形を様々テストするには十分な環境が整ってきた感じですね。

 

あ、重要な物的証拠です。同じN150マシンで100戦以上行いほぼ有意差なしの範囲かと思います。実行バイナリはVisualStudioの通常ビルドなので少々甘いかもしれません。

 

お試しにしては案外強いなぁといったところ。

これは計算機次第で決勝狙えますね。