前回に続きます。
この後,二手目84歩の設定でfloodgateでも投入してみました。同じplayout 800なのですが,対戦記録やレーティングを見る限り優位に強いようです。ということで近いうちに学習するでしょう。
ついでに気になった点として矢倉戦は学習していないのか下手な気がします。
ところで,頓死の話です。
以下の論文にも書かれていることですがモンテカルロ木探索の終盤が酷いのは既知のようです。
関栄二, et al. "将棋におけるモンテカルロ木探索の特性の解明." ゲームプログラミングワークショップ 2012 論文集 2012.6 (2012): 68-75.
実際,floodgate上でも選手権の対戦でもモンテカルロ木探索を用いている勢は序盤優位を築いても負けてしまうケースが大変多いようです。
そうこうすると,やね師匠の試算もある通り一般的な家庭用PCでは同アルゴリズムで技巧に勝てるかどうか程度であるという話に信ぴょう性が増しております。
AlphaZero Shogi弱すぎクソワロタ | やねうら王 公式サイト
AlphaZeroの論文中では評価値の優位が確認できた時点で勝ちとして対戦を打ち切っているそうですが,残念ながら相当恣意的なものと考えなければなりません。
否定的意見を挙げるのが目的ではなく,改良の余地があると考えて頂ければ前向きになります。
具体的な取り組みのひとつがやはり山岡さんですね。
しかしながら,コンピュータ将棋では20手近い詰めろが頻発しているため効果は微妙なようです。
何かよい方法はないものかと思案案件のリストに入れておくという自分用のメモでした。
---
先日の叡王戦の羽生藤井戦,86歩が奇跡的な長手数の詰めろ逃れの詰めろでしたね。
こういうのが将棋の醍醐味ですよねぇ。