先週の追記でもいいんですが長くなるので新ページ,ネタ的には連続しています。
昨今SlackやDiscordで多くのやり取りがあって,そこで回答することも増えているのですが個人的には恩恵を受けた経験からオープンな場で記録を残すべきと考えております。
前回は40ブロックの6000nps程度でfloodgateレーティング4000に達している件に触れました。
基本構造はCNN層が80層あって演算数量の大半になりますのでこれは囲碁などでも同じくらいのデータ数量かと思います。囲碁は19路ですので単純に4倍くらいでしょうか。
ファイルサイズは200MBくらいになります。
KPPT時代を経験していれば可愛いものでしょうか。
演算は結構大変でGTX1050Ti級で秒200回くらいです。10ブロックではこの4倍ほど出ますので他にボトルネックがないことは確認できます。
つい最近気づいたのですがAMDのRX580のOnnxruntime-DirectMLが結構改良されておりこちらが秒300回ほど計算できます。市場的にはGTX1060対抗とされていたのですが推論のみでは若干優位なのかもしれません。
(注:これらはモバイル用のGPUです)
低スペックマシンが遊んでいるので,それらをfloodgateに放り込んでみました。
200npsや300npsでまともな探索になっている感じはしないのですが,意外にも基準レートであるgikou2_1cには完勝のようです。この技巧2は以前調べたときにRyzenの1スレッドと言うことで700,000nps級です。しかも概ね中終盤で勝っている感じが見受けられます。
今まで探索ノード数が少ないと読み抜けて逆転を許すと言うのが通説でしたがどうも思っていた感じと違いますね。特に技巧は終盤力が優れているとの評判のソフトです。
この辺も深く調査してみると面白いかもしれないなと,構想が広がり始めているのが二番絞り効果でしょうか。
実は来週UEC杯の囲碁もあるんですがそっちは勝ち負けを争う気がないので(笑)
正直囲碁の方は強さ計測法すら確立していないので調整手段すら未定です。大きなバグは無いだろうくらいの準備加減で妥協してます。