メモ書きだけど,誰かの役に立つかもしれないし,忘れたころ自分が探すかもしれないので公開しておく。
私は機械学習Windows派である。Linux環境の人が多いようだけど,基本的にリソース管理が楽だから使っているように聞いているので成果を出すにはどちらでもいい。共用マシンはWindowsじゃない方がいいだろうとは思う。
私個人的には学生さんも閉ざされた環境より,低パフォーマンスでも権限持って一台使う方が学びが多いと思っている。
で,昨今Windows用のNVIDIAのGPUドライバがアップデートされたときに古いCUDAが入っているマシンで明確なパフォーマンス低下があった。一応動いてはいる。山岡さんも経験済みのようだ。
Windows11+WSL2+Dockerでdlshogiを動かす - TadaoYamaokaの日記
Windows11+WSL2+Dockerでdlshogiを動かす 続き - TadaoYamaokaの日記
一般向けドライバがWSL対応したとの話とCUDA旧バージョンで遅くなったとの話がリンクしているようなので,CUDAの方を上げるのもいいが,この際WSL導入もいいかもしれないと一台だけWindows11のCUDA環境を構築しようとしている。
(バックアップも取らず進めた)Windows11へのアップデートはあっけなく終わり,WSLからnvidia-smiのコマンドもすぐにはいったが,ここでCUDAバージョン11.6との応答が出る。他の方も報告されているがまだCUDA入れてないぞとw
ここからdocker使うかどうかまだ悩んでいる。(加筆予定)
公式もdocker推奨なのよね。
CUDA on WSL :: CUDA Toolkit Documentation
---
1月26日追記:
結論から言うとdocker無しで動くようになった。
但し,理由は分からないがLTSのPyTorchにしたら動作した。1.10はダメだった。
くどいが理由は分からない。