土日でざっくり目を通しました。
概ね前回の書籍から正常進化と思って読み進めていると後半から加速と言うかdlshogi本体に話題が飛びますね。これは予想以上に踏み込んでいます。前書籍に無かった加納さんパートという感じですね。
ただ,前から読んだ人がどこまで理解してここまで到達するのかやや心配なペースです。
同じ厚みの上下巻にした方が良いくらいの濃密さで,恐らく初学者には行間を埋めるのが難しいのではないかと思うくらいです。
ただ,出版の都合もあってこういうまとめとなったのだと認識しております。
適当に個人的なことを言っておくと,所謂PV-MCTSの仕組みは一通り理解できると思います。そこから強化学習の話が無く配布された教師データで学習する工程になるのが本書です。また,序盤の仕組みにおいてもプリミティブな実装に終わっています。
少し強化学習や探索部の最近の工夫などコメントあれば発展課題としてよかった風に思います。まぁ,私がボチボチblog書けばいいんだな。来年度学生さんと一緒にやってみようと企んでいます。
前回上の記事を書いた後の進捗です。
書籍通りの学習はそのままやっても面白くないので,さっそく弄ったものを学習させています。一応今のところ先手で横歩をとる条件付きですが技巧2にCPUで勝てました。(トータル勝ち越しとは言ってない。終盤の技巧は鬼強です。)
こんな風にCPUだけでも結構なところまで来ました。
思えば2017年4月に以下の記事を書いて以来のdlshogiとの付き合いになります。
プロ棋士の棋譜を入れた山岡さんに早々にfloodgate棋譜を入れた私。そしてKristallweizenやAobaZero棋譜を入れた二番絞りと劇的に強くなってきました。
今後は書籍の読者も交じって混沌とした争いになることを楽しみにしております。