叡王戦予選の見届け人をやってきました。

live.nicovideo.jp

 

クラウドファンディングの発表があって即申し込んで正解でした。

どの枠にしようかと考えたときに思い浮かんだのが七段の棋士が多かったので,七段予選の決勝枠にしました。愚かなことに菅井先生がシード枠と気づいたのは申し込んだ後です。

 

連休中ということや技術書典というイベントがあることも考慮して前日入りし,いろいろな人と交流することができました。特にコンピュータ将棋関係の人と会うのは年一くらいなのですが,これが年二になるくらいの感覚の集まりでした。

将棋会館の近くでゆっくりしてまいろうかと思っていたのですが,連休中の千駄ヶ谷では営業している飲食店が少なく食べたら即出ることにして,14時開始の対局を控室で観戦するくらいの前乗りぶりでした。

何故か翌日対局予定の千田七段のお出迎えがありました。準備等大丈夫なのかと現場ではそんな心配をする関係者ばかりで(笑)

 

で,今回申し込んだ段階では他の出資者と同じでしたが,当日の評価関数をKristallweizenでお願いしますと可能なら解説の棋士の先生と控室でいいので雑談させて下さいと要望しておきました。前者は快諾頂き,中継ご覧の方はお気づきの通り上枠の評価値と電王盤の評価値の両方がKristallweizenになってました。(両方はもったいないと自分でも思います)それに,せっかくの話は聞きたい人がいるだろうから中継枠を取りますとの連絡がありアノようになった次第です。

 

振り駒は私が振って,記録係が数える段取りだったのですがついうっかり私が数えてしまいました。中継的に不自然でなかったでしょうか?

対局の中身は是非動画を頭から見て下さい。無茶苦茶楽しいです。

ただ,対戦棋士は両者激戦の後でしたので相当な疲労のようで対局前から顔が赤みを帯びて玉の汗が浮き出たままでしたので相当疲労感が見える感じでした。そして気迫・緊迫感が半端じゃないです。

 

後で聞いたのですが叡王戦に魔物が住んでいると言われる理由が少しわかりました。プロ棋士の公式対局はすべて全力ではあるわけですが,一般棋戦は新聞掲載の割合も少なく専門誌での露出しかないのに比べNHK戦などは視聴者数が多くファンの反響が大きいようです。叡王戦ニコニコ生放送ですので同様に視聴者数が多いうえ,動画として残るためにここでの活躍は特別目立つということです。そのため活躍をアピールしたいベテラン勢の意気込みがすごいのだというお話を聞きました。負けるにしても粘るわけです。

 

ということで,七段予選Aブロック決勝の対局を未視聴の方は午前からガチおすすめです。私の出番は無視して結構です。

(帰りの新幹線の車内にて)

---

割と反響があるようなので追記しときます。

Q1.(定番ユニフォームの)バレルハウスのTシャツじゃないのか?

A1.当然スーツ指定されてます。

 

Q2.7万円って高くない?

A2.コンピュータ将棋の賞金で黒字なので(スポンサードワンゴですしおすし)

 

Q3.ハゲとるやん

A3.思ったより進行してますね。美少女に限らずアバター使う人の気持ちがわかりました。

前日駅に傘を置き忘れたために一度ずぶぬれになったのがくたびれ感を増長してると言い訳しておきます。

叡王戦将棋会館の中で行われているのでメイク室のようなものはないようで・・

 

Q4.痺れた?

A4.親方の駆け引きですかね.それと何年ぶりの正座だったのか・・

 

千田先生の七段予選決勝が始まるのでこの辺にしときます。

いやぁ,昼に千田先生負けたら前日に我々が色々気を遣わせたせいかなぁとか心配しておりました。

---

追記:

割と大きく出てるもんですね。

第5期叡王戦 支援者の皆様 | 第5期 叡王戦

手本

なんでも新しいことを学ぶのに手本があった方がいい。

将棋の世界では入門書と言うのがある。

それから中級者向け,上級者向けと難易度が上がる。

 

強い人の棋譜を並べてみてそれぞれの指し手の意味を考えるのも棋力向上に繋がるらしい。

昨今囲碁も将棋も若手が手本にするのはAIの手らしい。

個人差あるがもうメディア上でもそういった発言を憚ることもなくなっている。

 

手本があった方がいいのは確かなのだがプロがそれでいいのかってのは以前から思っている。

個人的にはソフト開発側の立場もあるので妙な心境である。

特に定跡ファイルの公開は危険すぎると以前から言っている通りである。

自動生成のアルゴリズム自体はワークショップで発表済みなので真似すれば生成可能だがそれを公式戦で使うのはどうだろうか。

 

プロ未満の奨励会員の間でウチのソフトが流行っているとか噂で聞く範囲ならまだかわいいが,あるタイトル戦ではソフトの代理戦争のような局面だったという話もあるらしい。

観る将としては気にすると面白くないので聞き流すことにしている。

 

ただ,トレーニング用にどういった教材があると良いかなどのことは普段から考えている。今のところ要望はアマチュアからしか出ていない。

百折不撓

live.nicovideo.jp

 

昨日もKristallweizenの出番がありました。

小林健二九段は最後まで「なんとなくクリスタル」とか茶化して正式名称を読んで下さらなかったのでちょっと残念です。

色々思うところはあり言語にしづらいのですが,木村九段最終局までよくひっぱりました。

おじさんの夏は終わりません。

 

百折不撓はもちろん木村一基九段の揮毫される文言です。

百が数の多いことを表しており,何度失敗しても志を曲げないという意味です。

 

今回解説されていた自称小林健29段は志在千里と書かれていました。

中国だなってのはすぐ気づくんですが,これ曹操なんですね。

乱世の奸雄と悪く評されるのは三国志演義の影響でしょうか三国志随一のカリスマの言葉ですが,実は晩年の作のようです。

50歳を過ぎた曹操が自分も年をとったが志はまだまだ大きく持っていると言う詩を詠んだわけです。

ということで,小林九段もまだまだ志高くタイトルを狙われていると思います。

 

そう言えば叡王戦の九段予選では小林九段を下した塚田九段が残っており,次の対戦相手が木村九段と森内九段の勝者となっています。

叡王戦予選も大詰めですね。

モンテカルロ法の精度の話

若い頃,はじめて就いたボスの勧めで電子状態をモンテカルロ法を使った空間積分する手法を少々触った。

私の結論は簡単だった。精度の低い荒い解を求めるのには高速だが我々の欲しい精度のエネルギー状態などを得るのには使えない。

 

昨今,ガチャというものが流行っている。ルール上のもので確率が表示されていたりするが,ドラクエXでダイスが等確率でなかったりとか不透明なものであっても気づきづらい。つまり,ある程度の数の実験を行わないと精度が出ないのである。

 

具体的な式に関してはWikipediaにもあるので略すが,実験数が増えると精度が単調に上がるし,絶対的な収束性は保証されているのでうっかりしやすい。

精度が上がるためのコストの方が爆発的に上がるのである。

6面ダイスの各面が出る確率を0.16666の桁まで実験で求めろと言われると何回の試行が必要になるだろう。

 

ところで,逆もある。

世の中には運のいい人もいるので初めて行った競馬場で3レース連続で勝つ人も少なくはない。ビギナーズラックと言われるものだが,こういうのは話のネタになるので特別広まりやすい。

 

もっとひどい話もあるだろう。麻雀で初心者が役満上がったとか,適当に埋めたマークシートの試験で90点取ったとか可能性は0ではない。

 

で,100%同じ環境が再現できるなら以下のようなことが可能になる。完全情報ゲームであれば容易だ。

 

  

こういうのを自動化するのも比較的容易だ。昨年はソニック・ザ・ヘッジホッグを題材に大会があったようだ。

contest.openai.com

 

将棋では「待った」と言う。対戦では禁じられているが,学習には非常に有効に思うのだが・・・

寝起きで書いたのでイントロとオチの整合性がない。

 

AobaZeroで遊ぼう6(頓死編)

bleu48.hatenablog.com

 

前回に続きます。

この後,二手目84歩の設定でfloodgateでも投入してみました。同じplayout 800なのですが,対戦記録やレーティングを見る限り優位に強いようです。ということで近いうちに学習するでしょう。

ついでに気になった点として矢倉戦は学習していないのか下手な気がします。

 

ところで,頓死の話です。

以下の論文にも書かれていることですがモンテカルロ木探索の終盤が酷いのは既知のようです。

関栄二, et al. "将棋におけるモンテカルロ木探索の特性の解明." ゲームプログラミングワークショップ 2012 論文集 2012.6 (2012): 68-75.

 

実際,floodgate上でも選手権の対戦でもモンテカルロ木探索を用いている勢は序盤優位を築いても負けてしまうケースが大変多いようです。

 

そうこうすると,やね師匠の試算もある通り一般的な家庭用PCでは同アルゴリズムで技巧に勝てるかどうか程度であるという話に信ぴょう性が増しております。

AlphaZero Shogi弱すぎクソワロタ | やねうら王 公式サイト

 

AlphaZeroの論文中では評価値の優位が確認できた時点で勝ちとして対戦を打ち切っているそうですが,残念ながら相当恣意的なものと考えなければなりません。

否定的意見を挙げるのが目的ではなく,改良の余地があると考えて頂ければ前向きになります。 

 

具体的な取り組みのひとつがやはり山岡さんですね。

 

tadaoyamaoka.hatenablog.com

 

しかしながら,コンピュータ将棋では20手近い詰めろが頻発しているため効果は微妙なようです。

何かよい方法はないものかと思案案件のリストに入れておくという自分用のメモでした。

---

先日の叡王戦の羽生藤井戦,86歩が奇跡的な長手数の詰めろ逃れの詰めろでしたね。

こういうのが将棋の醍醐味ですよねぇ。

KPPTについてふと考えた

ある休日に珈琲を飲みながらふと気が付いた。

イデアが浮かぶのはオフィスでも会議室でもないのだが,これは一般的だろうか。

 

コンピュータ将棋でKPPの三駒関係の評価関数が作られた経緯をざっくり学んだ後,少し検証してみた。あれの一番の利点は差分計算が高速に行われることにある。

KPPTになったときも手番分を加え二倍の計算をして最後に和か差を取ることになる。手番と非手番を独立させると差分計算がうまくできないからだ。さらにSIMD命令で計算時間は二倍にはならない。

 

で,KPPは先手後手のKと任意のPの組み合わせなので2*38*37/2と回数ループを回す。手番分評価も同様である。

 

しかし,考えてみて欲しい。一回で動かす駒はひとつだ。手番分の評価値が多すぎないか?動かさない駒の分も手番ペナルティがあるのは妙な気がした。

ってことで,「ある駒を含むKPPの手番分評価」が最大(非手番では最小)となる駒の分だけ評価するのが筋ではないだろうか。

 

これはネタだけで未実装である。差分高速化を放棄する上に比較コストまで払うことになるからねぇ。

 

諸刃の剣

もろはのつるぎである。

雑に言うと効果的であるが大きなリスクを背負うと言う意味。

ドラクエ世代なら絶大な攻撃力の見返りに毎回使用者にダメージがある剣と記憶があるだろう。(まぁ,最強の武器でもないので使わない人の方が多いだろうけど)

 

近代の製造設計では高機能のために少々のリスクをとるスタイルが普及している。構造計算や制御技術が高まったためにリスク管理ができているのが前提である。航空機や大型建造物など普通に初歩的な力学を学んだ人だと驚くようなものが多い。

 

数値計算においても似たような問題がある。ある仮説をおいて数値を設定すると高確率で計算時間が大幅に短縮できる。逆に低確率であるが収束が困難になる。巨視的に見れば利益があるので導入するしそれが一般的になって普及するが,計算機の能力が桁違いにに上がってくると低確率の事象が無視できなくなり除外して計算する方がよくなることもある。両方計算して早い方を取る的なアルゴリズムもある。

素人目には停滞期で伸びていないように見えるだろうがアルゴリズム的な過渡期ではよくあることだ。

 

木探索において諸刃の剣と言えば前向き枝刈りである。

詳細は多くの文献があるので省くが,先日ふと思い立って自前のアイデアを実装してみた。比較的安全サイドから少し刈っただけで一桁くらいの速度向上が得られたが対戦成績は微妙である。つまり,既に弊害が拮抗している。

手軽に使える実装が既に普及しているので簡単に考えていた部分もあったが,さすがに既存のソフトはよくできているんだなぁと感心することになった。

よく分からないマジックナンバーには歴史があるってことだろう。