前回
二番絞りのp3(指し手毎に3局面評価する)がfloodgateでなんとかレートを付けてもらえるという話をしておりました。将棋界には三手の読みという格言がありますが,これは三手先のパターンを複数考えてから指しなさいという教訓ですね。本件のAIは3局面しか局面評価関数を呼びません。アルゴリズム上はモンテカルロ木探索の形ですが,実質一手も指さない静止評価での最善手がよほどひどいときに次善手を選ぶ程度の効果しかありません。
中盤はこちらが明らかに悪くなっていて(悪手あり)
— frenzy (@floodgate_mania) 2021年7月31日
しかし私のアバウトな終盤力でギリギリ逆転できました。
次回は居飛車で挑みたいと思います。
体感として nibanshibori_p3 は倶楽部24の三段程度はある気がします(あくまで個人の感想)
高段者と対戦頂いたのちに上記の感想を頂けました。三段ありますか!?
探索が浅いので素抜き系のトラップとかすぐに掛かります。
それでも局面評価精度が相当高いので形にはできているようです。ところで,人間の高段者は一手ごとにどのくらいの局面を脳内にイメージするのでしょうか?
探索数が少なくてもAIの方が強いとなると局面評価精度もAIの方が良いということになります。
この辺りは「人間の評価」を要するので実験方法を改めて考えなければなりません。
どういった手法がいいのか思案中です。ヒントあれば是非ご提案下さい。
ところで,この辺のネタは非GPU勢と言って始めましたが二番絞りの40ブロックはCPUのみでも1スレッドで秒11局面程度評価可能です。
簡単な指標ですが,CPU内蔵のGPUでも試してみたところ8世代のi5ノート程度でもこの5倍,Zen2世代のAPU(Ryzen5 3400GE)で10倍程度は出るようです。
1スレッドでfloodgateレート3200程度でしたので,この300~400程度上が狙えるイメージです。
ところが,内蔵GPUに大きな負荷をかけるとリミッターが働くようで,floodgate連戦できませんでした。数分程度なら大丈夫でしょう。
GPU勢でもそうですが本来GPUとはビデオ出力用ですので100%近い負荷がかかるように設計されておりません。ゲーム用で特別だなどとかかれたGPUなどでも良いところ負荷50%程度です。デスクトップのオーバークロッキング品や薄型のノートPCなど熱設計の限界を攻めたような商品は基本機械学習に向かないものと考えて下さい。デスクトップ用ならお勧めは定格に近い安価なものです。ノートPCはそもそも機械学習に向きませんが筐体の熱設計に余裕があるものなら少々は使えると思います。