情報公開について

情報公開について

まぐれでも強豪と言われると情報公開の要求圧が来ます。
PR文には嘘は書いていませんし分岐探索の話はしてるつもり。

対戦後,自動スクリプトによる定跡の自動生成についても書いてあります。

floodgateで対戦した後定跡拡張をオートで仕込んでます。

そういうのがウチの独自性。

 

Ponanzaの情報秘匿に関しても以前はケチ臭いなぁと思ってましたが,
現場で開発者の皆さんの意見も聞きつつ
多面的に考えなければならないことがわかりました。

 

結論から言うとソースは出しません。(エントリー時に独自性の証明として当時バージョンを運営には送ってあります)
大会PCには最新版が残ってるでしょう。

それが定跡の最終更新以外floodgateのsg_test08aです。

 

技術的な実装部分やアイデアなどは懇親会で色んな開発者の人と情報交換はしました。
これに関してはオープンで行きます。
激しく同意された方や即応してそれに加えるアイデアを出された方については懇親会等の意義を強く感じます。
神の一手に近づく行為については皆同志です。

 

うちのエンジン公にを出さない理由を簡単に挙げます。

1.定跡はヤバい。
うちの定跡は大きさがウリです。これが流通すると私の主戦場であるfloodgateが互角局面スタートの対戦場になってしまいます。
しかも,分岐はあまり多くないので互角局面は種類が非常にすくないと思われます。(未確認だが確認用スクリプトは当然作成済み)
それって意味ないですよね。うれしい人がいたら御意見下さい。

一発勝負の大会だから面白いんです。
たぶん,まふさんとか同意見じゃないかな?

是非お話してみたいです。

 

2.エンジンにオリジナリティがない
使ったのは,技巧2とやねうら王,それと主に定跡用のsfen文字管理にpython-shogiです。皆さんオープンソースなのでエンジョイしてください。
思ったより面白いですし,さらに深いところに別の面白さがあります。

Yorkieさんとのponder当て合いとか現場で見てるとシビアです。相手のponderがすべて当たるとうちの分岐先読みが無価値になります。つまり,評価関数を公開した瞬間,ボクシングがサンドバッグになります。

3/8のスレッドで相手の2倍の時間をもらうのがうちの戦いです。そのための5/8だと御理解ください。

 

3.開発者なら私のアイデアを実装することは可能
基本的なツールは上記のものです。組み合わせた動機についてはPR文はざっくりですが懇親会では多くのテーブルで何度も話しました。
パラメータは各自チューニングする方が多様性があって良いと思います。
分岐上限5ってのは9割って言いたかっただけです。
4コア8スレじゃなかったら,どうなってたかは私も分かりません。

懇親会でも多くの人に話ましたが,5月の選手権でくじらちゃんの62番のノードに接続した私が分散管理部分を実装するとしたらこういう感じになるというのがアイデアのスタートです。

一応短時間の切れ負けでコア数多いルールが有利ってイメージです。

双方100台のクラスタで戦うとかのルールなら負ける気がしません。
私も今回使った固定値で入っていて気に入らないパラメータがあるので,余裕があるときに弄ってみるつもりです。

 

4.非開発者には
しらんがな。
そっち向けのオモチャじゃないとしか言いようがない。
ドワンゴの方にも説明しておきましたが,うちは今回の対戦ルール特化しただけで
探索だけなら「やねうら王」がウチの御本尊です。

 

5.ガチ棋士の方
プロ棋士で私が手伝うことがあれば御依頼ください。当然プロとして。
マチュアでもそれに準じます。
いい大人の真剣な遊びは嫌いじゃないです。

タモリさんの「遊びなんだから真剣にやれ」との言葉を引用しておきます。

 

6.対戦したい人
floodgateには割と流してますし,今後もそこそこ続けようと少なくとも今は思ってます。
個人が個人の範囲で行った行為ですが社会的影響があれば何かしら状況の変化が生じるのは必然です。優先度の高い約束はできません。
また,通信遅延などで切れたりするのは御容赦下さい。有線だとマシですが無線だとなんか切れることが多いようです。

 

出張先で疲労感の残ったまま書き残しますが,こういうのは熱いうちにうたないとね。

修正・加筆が入るかもしれません。 

---

追記:

恥部なので入れてなかったが隠してるのもアレなので追加しておく。

multi ponderの準備をしてるときに相手に指されると落ちることがある。

つまり全く思考時間を使わない相手だとフリーズしたり反則手が出ることもある。

具体的にどういう相手かと言うとこっちより定跡が多く入ってる相手,ディープラーニング系で即指しするタイプのエンジン,そしてponderを当ててくるタイプ。

python-shogiの合法手判定などで苦肉の策に近い対応でバージョンアップのたびに発生を抑えて来てるが,このバグがまだ完全に取れていない。今はgps_lくらいまでの早指しなら大丈夫。

一般に配布すると自分自身と戦う機会がでるのでたぶん不具合報告祭になるだろう。

評価関数が流通するとponderhit率が劇的に上がることは自明。

そして定跡拡張がスナイパーとしての攻撃性と上記バグへの苦肉の生存策であることが御理解頂けると思う。

multi ponderの説明も書いたので自分で実装する人は私より上手に実装してください。

思えば山岡さんか大渡さんだと思うけどfloodgateでディープラーニング系によく殺されてました。少しはレーティングを献上してたと思う。