まぐれ度計測の話

選手権優勝の件,やはり出来過ぎ感があります。

ネタっぽく世界チャンピオンですと言ってもなんか笑い以外のモノが混じる感じです。

 

昨年と同じように順番に検証していきたいと思います。

今回の我々のチームはエンジョイ勢なので何より楽しめるかどうかに重点が置かれています。私の部分においては例えばMulti Ponderを見てもらいたいなと思っており,昨年の懇親会など面白いことをアピールし続け,今大会はクジラちゃんとの合体を打診したこともあります(フラれましたけど)。先行読み部を上手に可視化すると面白いんじゃないかと思ってますが,何分そういうのは苦手で止まったままです(この辺はドワンゴさんに話してあります)。Tamaさん部はもちろん人造棋士18号の評価関数合成ツールを皆に使ってもらいたいとのことです。今大会の懇親会においてはコブラさんと並んで,評価関数「何してるか分からん」群に入っていたようです。

もちろん,ある程度勝たないと面白みは伝わらない(気にもされない)のでネタの0秒指しでも勝たないとダメとの認識でした。0秒指しはLANとWANの両方の通信遅延のチェックも兼用してるのでちょっと賢いメソッドです。

 

github.com

 

また,ふたりの共通の敵はたぬきとHoneyWaffleなので(理由はSDT5参照)二次予選のたぬき戦と決勝のHoneyWaffle戦が終わった段階で軽い祝勝会を行いました。ミッションコンプリートです。

残念ながら,大将軍には土を付けられたままになっておりますので今後のターゲットは「大将軍」となります。PALとコブラ相手には2勝1敗なので勝ち越しカウントです。

 

では,本題の事後検証です。

とりあえず,公表の早かったクジラちゃんとAperyで測定を行いました。うちで選手権直前で調整に用いた4コアのPCで30分切れ負けとしてあります。(一手20秒固定より時間の無駄が少ないかと思ってます)

クジラちゃんとは決勝戦で当たったのですが,棒銀に上がったところで切れ負けされてしまったので勝負は勝ちですが,戦った気がしません。要検証の相手です。

Aperyとは二次予選で得意の横歩を取ったにも関わらず引き分けまで粘られてしまいましたのでこれも要検証の相手のひとりです。特にそれほど改良してきていないとの平岡氏の言葉が真実なら,高パフォーマンス戦においては枝狩り過剰による読み抜けの方が危険とのことを検証する機会になります。

 

6700HQ,4コア8スレ,30分切れ負け,ResignValue 3000、hash 4096,定跡なし

対局数300 先手勝ち173(61%) 後手勝ち109(38%) 引き分け18

Boo13
勝ち149(52%) 先手勝ち91(64%) 後手勝ち58(41%)

GodwhaleChild-5.0.5 KPPT 4.80 64AVX2 TOURNAMENT
勝ち133(47%) 先手勝ち82(58%) 後手勝ち51(35%)

 
6700HQ,4コア8スレ,30分切れ負け,hash 4096,定跡入り

対局数300 先手勝ち155(58%) 後手勝ち111(41%) 引き分け34

shot_gun 0.32 ←(定跡入りPonder無し仕様のやつ)
勝ち176(66%) 先手勝ち100(74%) 後手勝ち76(58%)

Apery_WCSC28
勝ち90(33%) 先手勝ち55(41%) 後手勝ち35(25%)

 

とりあえず,両方ともPonder無しでも思ったほど分が悪くないようです。

クジラちゃん相手に後手だと危ない感じですか。

対Aperyは長時間戦を用意していたのですが先週の私がボケてたのか設定ミスのためこれから再計測します。また,公開されたのは決勝バージョンのようで,一次予選や二次予選でうちが使った棋譜が丸ごと取り込まれていてAperyの名の通り平岡さんの柔軟かつ迅速な対応に驚かされました。(決勝でAperyがうちの横歩定跡をなぞったらしいです。)

 

次は河童と河童巻きですが,河童の方がマシンが落ちてしまったため勝率が出ておりません。棋譜が残っているので後ほど(スクリプトで)集計します。手動嫌です。しました。(uuunuuun様ありがとうございます。)

定跡アリもやってみたいところです。

 

Ryzen7 1800X,15スレ、一手10秒、ResignValue 3000、hash 4096,定跡なし

対局数201 先手勝ち108(55%) 後手勝ち86(44%) 引き分け7

Boo13
勝ち70(36%) 先手勝ち41(41%) 後手勝ち29(30%)

QQR
勝ち124(63%) 先手勝ち67(69%) 後手勝ち57(58%)

 

6700HQ,4コア8スレ,30分切れ負け,ResignValue 3000、hash 4096,定跡なし

勝敗 Boo13 58 Qhapaq_wcsc28 88 レート差 62
先手勝 Boo13 : 32 Qhapaq_wcsc28 : 48
後手勝 Boo13 : 26 Qhapaq_wcsc28 : 40
千日手 15 持将棋 7 平均手数 140 対局数 168

(300戦分なかったのは途中落ちたんでしょうか遅延書き込みでしょうか。)

 

やはりQhapaqもQQR強いですね。今期のレーティング覇者でしょうか。(300戦予定を途中で切ったのは仕事のためです。御容赦下さい。)

 

最後にelmoです。直接要望がありましたので一手10秒固定にしました。こちらもSDTでは当たったら負けを覚悟してた昨年チャンピオンですので強敵認識です。

 
4コア、一手10秒、ResignValue 3000、hash 4096,定跡なし

対局数300 先手勝ち114(41%) 後手勝ち162(58%) 引き分け24

Boo13
勝ち160(57%) 先手勝ち67(49%) 後手勝ち93(66%)

elmo_wcsc28
勝ち116(42%) 先手勝ち47(33%) 後手勝ち69(50%)

 

後手勝ちが多いですね。何なのでしょうか。ちょっと精査しなくてはなりません。相性問題意外とややこしいですね。

  

今のところ,とりあえず以上です。主に評価関数部分のみですが,優勝がまぐれでもない結果にはなってるかと思います。Mutli Ponderクラスタについては来月の第40回ゲーム情報学研究会で一部発表予定です。その他追加計測も出していきますが,そこそこ長くなったので追記にするか新規に立てるかは未定です。

現在計測対象の評価関数は棋人ブゥ13番だけですが,サブエース12番や定跡部生成で頑張った7番9番などがそこそこ面白い動きと勝率を誇ります。魔改造技巧も一軍登板へボチボチ詰めていきたいものです。

また,巷では既にYaneuraOuにNNUEが取り込まれるなど多数の改造が加えられているとの話もありますので今後もコンピュータ将棋業界はどんどん進化していきそうです。