(追記 2023.2.20) 公式のDiscordで Ubuntu 22.04 は問題があるのでverifyしないと書かれていました。20.04を使うようにとのことです。ご注意ください。
イーサリアムのマイニングが終了してGPUレンタル価格が暴落してるみたい。RTX3090が1時間0.5ドル程度(ホストを提供してくれている人の値段設定に依存しているので日によって違うかも。これにネットワークとストレージ使用料が追加されるはず)でレンタルできるのは格安?
マシンを使う方はアカウント登録して、SSH public key登録して、クレジットカードを登録して、チャージして、マシン選んでレンタル申し込んで、sshでログインしてって感じだったはず。
ホストとして登録するための方法メモ
少し前に試した方法なので今もきちんと動くかは未テストだけど、日本語の資料がほとんどないみたいなので。 よく考えたらこのメモで分かる人は英語の資料を読める人だろうから意味ないかも。 あとvast.ai公式の推奨は18.04LTSなので注意。
マシン構成
公式参照。
NvidiaのGPU必須。ディープラーニング用ワークステーションが推奨されてるが、GTX1060 3Gで動いたのでGTX10xx以降ならたぶん動く。 SSD1(ルートパーティション用)、SSD2(Docker用)。 個人的にメモリはECCにしている。GPU一枚あたり4G必要らしい。 ルータからのポートフォーワードもできればやった方がいいらしいが、前はやらなくても動いた。
OSインストール
https://ubuntu.com/download/server
前はUbuntu Server 22.04 LTS でインストールしたけど、最新のUbuntu Server 22.04.1 LTSは未テスト。 sshdを入れておこう。 nvidiaのドライバがUbuntu任せにできるので楽になった。 インストール完了後リブート。
sudo apt install linux-oem-22.04
たぶんサーバ版ドライバが入ってるのでデスクトップ用の最新に入れ直し。
ubuntu-drivers devices sudo ubuntu-drivers autoinstall
で、最新のデスクトップ用?ドライバが推奨されているのを確認してオートインストール。サーバ用ドライバはなんかアプリが足りなかったので注意。
X , xinit , nvidia-settings のためのインストール。
sudo apt-get install xserver-xorg-core xinit libgtk-3-0 libxv1 --no-install-recommends --no-install-suggests
X の設定。
sudo nvidia-xconfig -a --cool-bits=28 --allow-empty-initial-configuration --enable-all-gpus
リブート。
nvidia-settingsでGPUの設定を変更できるかテスト
sudo xinit /usr/bin/nvidia-settings -a [gpu:0]/GPUFanControlState=1 -a [fan:0]/GPUTargetFanSpeed=80 -- :0 -once
docker のインストール
dockerのテストもやっておこう。
nvidia-docker のインストール
nvidia-dockerのテストもやっておこう。
python2 のインストール
インストーラーが未だにpython2なので。はよpython3に書き直してほしい。
sudo apt install python2
SSD2をxfsでフォーマットしてdocker用にマウントしてリスタート
sudo fdisk /dev/sdb
g,n,y,w で新規パーティション作成。 xfsでフォーマット。UUID確認。
sudo mkfs -t xfs /dev/sdb1 sudo blkid
/dev/sdb1: UUID="hogehoge"
fstabの末尾に書き込み。
sudo nano /etc/fstab
UUID="hogehoge" /var/lib/docker/ xfs rw,auto,pquota 0 0
マウントしてdockerリスタート。
sudo mount -a sudo systemctl restart docker
vast.ai のインストール
事前にアカウントを登録してSSH public keyを登録してvast.aiが指定するkeyを取得しておいてください。 インストーラーがpython2なのに注意。nvidiaドライバとdockerはインストール済みであることをオプションで指示。
wget https://vast.ai/install -O install; sudo python2.7 install [your_key] --no-driver --no-docker
インストール後はベンチマーク
とりあえずこれが完走すればソフトウェア的には大丈夫。原因不明のフリーズとかはたぶんハードウェアの問題。