最近AobaZeroの棋譜生成が劇的に早くなっています。
プロセス間バッチの実装を進めています · Issue #24 · kobanium/aobazero · GitHub
複数対戦を束ねることでGPUの利用効率を上げているようです。個別の対戦では有用ではない可能性があるにしてもかなりの高速化ですね。
月頭からFloodgateの対戦数が少ないうちに次の評価関数が来る感じです。
AobaZeroの学習ペースアップしてるな。w928が70戦足らずで次のw933が来てる。https://t.co/tmXwEN0auz
— 48 (@bleu48) 2020年4月1日
そうこうしているうちにひとつ大金星がありました。
p800が100mに勝ったのって初じゃないかしら。>AobaZero_w948_n_p800 vs. Krist_483_473stb_16t_100m (2020-04-04 03:30) https://t.co/80pOMYQ76t
— 48 (@bleu48) 2020年4月3日
p800って言うのは中堅のGPUで5秒程度の思考時間でレートは3000弱と言ったところです。比較して100mってのは16スレッドの探索のKristallweizenで4000程度のレーティングですね。1000違うと別世界なのでまぁ対戦するだけ無駄な組み合わせなはずなんですが,一発入ったようです。
AobaZeroメンバーの山下さんもただのラッキーとコメントされていますが,コンピュータゲームの類が好きな方だと攻略物は全滅と1回ラッキーパンチが当たることの差を理解していると思います。ブレイクスルーと言って構わないでしょう。比較して適当かどうかは微妙ですが,昨今流行りのAIの世界ではラッキーパンチの打率を上げる努力が今のブームに繋がったと言って過言ではないのです。
特にAobaZeroなどのディープラーニング勢は学習した局面がうまくヒットすれば強い弱いという議論ではなく簡単に対局を進めることができます。ですから格上に勝ったラッキーな局面を多く集めることができれば次の次元へ学習が進むと考えられます。(もちろん自己対戦縛りであるAobaZeroプロジェクトの本筋から外れます)
そういえばもう一つ金星がありました。
az_kai_testは私がAobaZeroを少しずつ改造しながら時々対戦させているもので中身は一定しておりませんがGPUは1050Tiか1060のどちらかです。一世代前の中堅GPUですね。
主に探索時間制御・可視化情報・ハイパーパラメータ・指し手選択などを弄っています。
test1dは最近買った2ソケットのXeonの負荷テスト目的にKristallweizenを流しておりました。置換表サイズとスレッド数しか弄ってない素の状態です。25Mnpsくらいだったかな。
レーティング差こちらも1000ほどありますね。ディープラーニング勢も一発入れる可能性があるんだなぁと言った感じです。
ところで,以下のように最近連絡がありました。
第30回世界コンピュータ将棋選手権 開催中止のお知らせが4月7日に出ておりますが,代わりにオンライン大会が開かれるそうです。今年はこれが世界一を決める大会になるということになります。基本的にハードウェア・ソフトウェアの制限が特にない大会ですのでリモートで何か反則をして強くなることはないと考えられます。盛り上がるかどうかはわかりませんが一応勝ちに行こうかなぁと思っています。対戦相手次第ではエコモードとしてAWSを封印するかもしれません。
現場見学者は多くないので一般向けのインパクトは同様なのかもしれないなぁと思っています。記事にする際に写真がないくらいかな。