酔猿の件(電竜戦予行5の顛末)

ABEMAトーナメント開幕でしたね。

船江先生がひとり満足気な表情だったので勝負師の気質ってものを感じました。

ずっとそっちを見てたので電竜戦予行5は対戦開始を確認しただけで放置プレイでした。運営に不具合はなかったようですね。

カツ丼さん乙です。

 

こっちはと言うと,3つ投入しておりました。

 

二番絞りは深層学習系で最新モデルです。マシンはRTX2060のノートなので昨年の電竜戦決勝と同じPCです。同じモデル(40ブロック10週目)がRTX3070で現在floodgateに放流中です。

地ビールは以前からGo言語で0から作ってあるエンジンでアルゴリズムのテスト等に使っております。半年くらい放置してどこまで更新したか自分でもメモ見ないと忘れています。

予行4のshotgunは不評のようで,今回の3つ目が酔猿です。

 

白ビール系列で放り込んでもよかったのですがKristallweizenは一般ユーザでもfloodgateでも広く普及して2年ですから見飽きている感があるのでちょっと変えてみました。

二番絞りのインフラとして用いているdlshogiですが,指し手生成や局面データ構造の部分はAperyから流用されています。そこでバックポートを試みました。

 

考えたことは単純です。

二番絞りの逆ですね。最新の深層強化学習で生成した教師データを今やクラシックと言える三駒関係のモデルに適用するとどうなるかという実験です。

AperyのソースをダウンロードしてきてLEARNオプションを有効にしてビルドするくらいのことですので技術的にも簡単ですし,数億局面のデータも一晩くらいで学習を終えました。

簡単に確認してみたところApery SDT5といい勝負をする感じです。当時もやねさんが絶賛されていましたがApery SDT5は三駒関係では抜群の逸品です。膨大な計算量か高度な統計処理か詳細は知りませんが滑らかでバランスの良いものです。

これに対して数億程度の流用データで作成したものはさすがに対戦中でも粗が目立つくらいの変動具合です。それに深層学習系でありがちな初期局面相当先手有利評価ですし振り飛車に辛い点付けです。しかしながら戦型選択はモダンになっています。その辺で相殺されて互角級になっているのでしょう。

想定より弱いイメージでしたので,普通のPCと言いながらRyzen 1700搭載ノートPCを選択しておきました。(2018年選手権現場でクジラ養分になってたやつ)

命名が毎回苦労しており,今回は映画酔拳のDrunk Monkeyをもじりました。

結果は御覧の通りです。

第2回世界将棋AI 電竜戦 予行演習5 勝敗表

 

42チーム参加で,10位二番絞り,21位酔猿,30位地ビールです。

 

bleu48.hatenablog.com

ええ,予行4と同じで3つ放り込んでほぼ四分点を押さえてます。

計算通りですね。(事後諸葛亮