前回の続きです。
早々に100人以上ダウンロード頂いているようですが特にクレームも無いので皆さんの手元でも普通に動作しているんでしょう。
M1のMacが絶賛されていましたが手に入れてから色々調べてみましたが,案外普通のPCで拍子抜けしております。
手元のベンチマーク的にはそんな感じですが他で出ていないデータだけ出しておきます。
M1Macでビルドしたついでにfloodgateに放り込んでますが,これベンチマークでは4Mnps近く出るのに数分経つと500knpsくらいまで落ちますね。設定間違えたかと思うくらい。これが省電力の証でしょうか。 https://t.co/bIxrYe5AAL
— 48 (@bleu48) 2021年12月24日
上記スリープを切ってやると一応連続運転には耐えますが,パフォーマンスが落ちるのは熱なのか省電力機構なのかはっきりしません。
そもそも1スレッド辺り1MnpsですとIceLake以降ならもう少し出る感じです。Armにしては速いってことでしょうか。
M1には高性能コアと高効率コアがあります。(以下,インテルにならってPコア,Eコアと呼びます。)
現行M1はPコア4つ,Eコア4つです。普通に考えると全部使った方が性能が出るはずですがスマホ的な使い方はハイパフォーマンスなパラレルコンピューティングとは違うので色々遊べる雰囲気がありました。
まぁ,ざっと試した結果Pコアだけ使うのが正解のようです。
木探索などは線形予測できない分野ですので本件ちょっとやねうら王ベンチマークでも計測しておりましたが,実際の強さが反映されないのも事実ですので実測するしかないわけですね。
floodgateに放り込んで計測していたものも4スレッド,8スレッドで共にレート4000弱と大差ないという結論にしておきます。実際はメインスレッドがEコアで動いていた可能性もあるので劣化するケースも考えられます。
一応8スレッドにした方が見た目上npsは上がりますがほぼ無意味ということです。Eコアは数分の一程度の性能しか無いようです。
もちろん,これインテルのAlderLakeでは全く異なる結論になるようです。インテルのEコアは相当速いので近いうちにひとつ仕入れて試したいものです。
ところで,私が送ったM1用のオプションは本家へのプルリクが通ったようでMizarさんが自動ビルドしてくれています。
Release やねうら王 実行ファイル詰め合わせ v7.0.0+20211226i.macostest · mizar/YaneuraOu · GitHub
何故か実行ファイル属性がついていないので,解凍後にchmodで実行属性(+x)付けてあげて下さい。
インテルMacはavxの方で,M1Macはapple-m1の方をこちらでも動作確認してあります。
一応開発環境はウチの方が最新ですが,今のところバイナリに大差ないようです。
M1オプションでビルドしたら速くなるようなことが今後あるのでしょうか?