シリーズ13まで続いています。
2020年も7月に入りリアルタイムで強化学習中のAobaZeroにも少し変化がありました。
学習率をさらに下げられました。AlphaZeroの追試としては最終段階になります。
既に計測レートが向上しているのがグラフで分かります。
ただ,目標値の3500までは少し遠いことは明白でしょう。
また,今年は新型コロナウイルスの影響で世界選手権が中止,オンライン大会として5月に開催されました。優勝は水匠でした。
その中でオンライン大会なら比較的容易に開催可能ではないかとの機運でカツ丼将棋さんを中心に年一のオンライン大会を計画しております。理想的には春の選手権,秋の電竜戦(新しいオンライン大会)となるように目指しております。
そこで,現在予行演習として対戦手続きの練習を行っており先週末第二回の予行演習がありました。第一回の予行演習では参加者が少なかったために人間による指し手などバラエティに富んで愉快なものでしたが第二回は質量ともに結構なメンバー構成でした。
リンク先に飛んでいただければ分かるのですが,GPU6枚を用いたAobaZeroがエントリーされており春の大会で優勝した水匠を圧巻の将棋で押し切りました。
全勝のいない混戦ですがAobaZeroがそれなりのハードウェアを投入すればトップレベルで戦えることの証明にはなったと思われます。来年の選手権が実に楽しみですね。
ところで,その最新のAobaZeroも手元で試すことが出来るので遊んでみました。
先手AobaZero後手二番絞りの50手目,1九角成りとしたところです。
次の手,AobaZeroは驚くことに9一馬と香車を取りました。
なんてことでしょう。
人間なら成ったばかりの馬の効きに馬を動かすような真似はしないと思うのですが・・・
テストしやすいようにusiプロトコルの局面を置いておきます。
AobaZeroは最新のw1554,エンジン部はsfen改造したものでした。
startpos moves 7g7f 3c3d 2g2f 8c8d 2f2e 8d8e 6i7h 4a3b 2e2d 2c2d 2h2d 8e8f 8g8f 8b8f 2d3d 2b3c 5i5h 5a4b 3g3f 3a2b 2i3g 8f8b P*8d 2b2c 3d3e 8b8d P*2b P*3d 3e6e 6c6d P*8e 8d9d 6e7e 3b2b 9g9f 7a6b 3g4e 3c8h+ 7i8h B*3g 9f9e 9d7d 7e7d 7c7d B*8c 6a5a 8c7b+ 6d6e 7b8a 3g1i+
数万ノード程度まで読ませましたが,9一馬で先手良しの評価は動きませんでした。
また,指した局面を検討させても同馬と取られると読んでませんでした。
まだまだ穴があるようです。