非GPU勢DL組

新ジャンルです。

 

以前よりfloodgateに幾つか放り込んであります。

AobaZeroの4スレ。

  

秒10ノードは相当つらいです。floodgateで平均20秒級と考えてもp200相当です。

AobaZeroの場合探索スレッドが4つになってそれぞれのモデルを担当CPUが演算することでこの程度に遅くなります。

比較的早い段階で対応を咎められてfrenzy_humanに4敗してますね。

学習時の欠点があってもp200程度では修正できないみたいです。

p800でも修正出来ていないそうでfrenzy_humanはp800にも勝たれています。

 

次に以下の群ですが,これらはdlshogiおよび二番絞りのモデルをFukauraOu(dlshogiクローン)のMKLビルドで走らせたものです。CPUビルドは全CPUを使ってしまうのでMKLで使用スレッドを絞っています。探索スレッド1,評価バッチサイズ1です。

dlshogi_wcsc31_4t

dlshogi_wcsc31_1t

nibanshibori_wcsc31_1t

 

最初に走らせたのはdlshogi_wcsc31_4tでした。旧世代の4コアのCPUで10ブロックのモデルが100nps程度出ます。10秒でp800を超えるのでAobaZero_p800や3300の技巧辺りとどうなるかを確認する感じで投入しました。

結果楽勝でしたね。

 

ということで,1スレッドしか使わないものを投入中です。

dlshogi_wcsc31_1tが50nps程度,nibanshibori_wcsc31_1tは11nps程度です。

二番絞りが同じ40ブロックのAobaZero_4t級ですね。

使用スレッド数の差がありますが,この辺りは演算の最適化の問題なのでOnnxruntimeかIntel-MKLが優秀なのでしょう。

 

floodgateの底辺レートが今は3000前後なんですよね。

この辺りを盛り上げて参ります。

人間も高段者なら偶に勝てたりするんでしょうか?

---

追記:

現在二番絞りが11nps程度でレート3000超を確認。秒10局面程度なら並の人間に近い数字と言われており結構驚異的な数字かと。

それよりも驚きが50nps程度のdlshogiが技巧に全勝ペースです。この技巧はRyzenの1スレと聞いてまして700knps程度だそうです。面白いのはこのレートより下のAobaZeroと互角でKristallweizenには負け越しって辺りでしょうか。

何か面白げな現象が起こっている可能性があります。

f:id:the48:20210513084022p:plain

 追記2:

撤退時の記録だけ残しておきます

f:id:the48:20210515090838p:plain