二番絞りの計測の件(GX1080Ti編)

思ったより長くなり過ぎました。

流れ的に前回の続きになります。

二番絞り@将棋倶楽部24の戦型分析 - 48's diary

 

余談ですが二番絞り作成前年には自分でこんなこと書いているんですね。面白い。

コンピュータ将棋の本質は木探索なので枝の数とかその性質とかが重要ですね。

合法手の話 - 48's diary

 

探索無しモデルがfloodgateで2380台、将棋俱楽部24で七段ってお話でした。

他にも手元計測で技巧2depth6や7と接戦するなどの計測も行っており妥当かと思います。

乱数を多めに加えても対人ではあまり影響なさそうというか寧ろ楽しんで頂ける要素になっているんじゃないかと思っています。ちょっと強すぎるかもしれませんが終盤に頓死するAIっていうのも珍しがって遊んで頂ける点かもしれません。

 

軽い探索でもCPUだけで50nps程度出るので人外レベルには届きそうなイメージですね。

で、先日からハードウェア統一戦を行った勢いで,2017年に行われたハードウェア統一戦の第5回電王トーナメントを思い起こして、4コア8スレッドの電王ぽんぽことGTX1080Tiの二番絞りをfloodgateに放り込んで、もし二番絞りが当時の電王トーナメントに出ていたらの公開模擬戦を想定して行ってみました。

 

 

ハードウェア的にはもうそろそろリプレイス時期です。こういう実験も最後でしょう。細かい話だと電王トーナメントでは正確にはKなしのi7 6700でした。(第4回が6700Kですね。)

で、上図ですとぽんぽこが3600台、二番絞りが4500台となっていますが、これは対戦数が少ない初期の話で、結局ぽんぽこは当時の計測と同じ3800台になりました。

二番絞りも4200程度で落ち着いたようです。(若干ややこしいのが上記のツイート直後の高レートエンジンを大量に投入されたようで急落しています。)

いずれにしてもほぼ想定外に差がついた感じです。もう少し近いレートを事前予想しておりました。

 

この理由です。GTX1080Tiは当時のハイエンドではあるのですが、今のNVIDIAが急激に機械学習分野で強くなった理由の一つであるTensorコアを積んでいない世代です。具体的に数字を出すと二番絞りではGTX1080Tiで1000nps程度の推論速度です。次世代ではRTX2060のノートPCでもこの二倍近いの推論速度が出ます。ハイエンドのRTX2080Tiではさらに倍程度でしょうか。

昨年の計測ではRTX3070でRTX2080Tiと同程度の速度が出ており上記と同じくらい4200程度のレートが計測されていました。ただ、この際実は多くのプレイヤーで定跡生成ブームのようなものが起こっておりfloodgate由来の定跡をfloodgateに放り込むような循環が起こっていたようです。当然長期常駐者はじりじり削られるという酷い目にあっていたということですね。

 

これで私が世界コンピュータ将棋選手権前に本モデルに自信がなかった理由がはっきりしました。floodgate上ではwcsc32モデルがwcsc31モデルとほぼ同等のレート計測だったのです。

 

ただ、先入観無く普通に考えても変なことですね。探索しないでプロ級だとか僅か1000npsで数千万npsは出てそうなエンジンに勝ってしまうとか。

もちろん、現状の二番絞りが完璧であるわけでもありません。少なくとも選手権決勝やマイナビ杯の決勝で大きな読み抜けがあったことは明白です。(もちろんこれが無ければ優勝してた感じですね)

 

最後に補足資料ですが、前回の記事の初手分布が気になったのでオリジナルの確率分布も提示しておきます。

前記事と比較してみるとnumpy.random.choiceも4000程度のサンプリングだと甘いのかと思われます。

    初手    確率分布(%)
─────────────────────────────
1.▲7六歩     16.2%
2.▲2六歩     16.2%
3.▲7八金     6.6%
4.▲1六歩     5.2%
5.▲7八飛      5.1%
6.▲6八銀      5.0%
7.▲6六歩      5.0%
8.▲6八飛      4.7%
9.▲5六歩      4.5%
10.▲7八銀      3.9%
11.▲4八銀      3.6%
12.▲3八銀      3.3%
13.▲6八玉      3.0%
14.▲9六歩      2.9%
15.▲5八飛      2.4%
16.▲5八金右    1.7%
17.▲5八玉    1.3%
18.▲4八玉    1.2%
19.▲3六歩      1.1%
20.▲4六歩      1.1%
21.▲6八金      1.0%
以下は1%未満

ちなみに初期温度を1.0とすると26歩、76歩が43.8%、78金が2.9%と三候補で90%を超えます。当然戦型選択は狭くなりますね。

 

ということで、二番絞りの戦いはまだはじまったばかりだ!