ザキンコのブログ

ザキンコの日記のはてなブログ版です。

vast.ai を Ubuntu Server 22.04 LTS に入れるメモ

(追記 2023.2.20) 公式のDiscordで Ubuntu 22.04 は問題があるのでverifyしないと書かれていました。20.04を使うようにとのことです。ご注意ください。


イーサリアムのマイニングが終了してGPUレンタル価格が暴落してるみたい。RTX3090が1時間0.5ドル程度(ホストを提供してくれている人の値段設定に依存しているので日によって違うかも。これにネットワークとストレージ使用料が追加されるはず)でレンタルできるのは格安?

マシンを使う方はアカウント登録して、SSH public key登録して、クレジットカードを登録して、チャージして、マシン選んでレンタル申し込んで、sshでログインしてって感じだったはず。

ホストとして登録するための方法メモ

少し前に試した方法なので今もきちんと動くかは未テストだけど、日本語の資料がほとんどないみたいなので。 よく考えたらこのメモで分かる人は英語の資料を読める人だろうから意味ないかも。 あとvast.ai公式の推奨は18.04LTSなので注意。

マシン構成

公式参照。

vast.ai

NvidiaGPU必須。ディープラーニングワークステーションが推奨されてるが、GTX1060 3Gで動いたのでGTX10xx以降ならたぶん動く。 SSD1(ルートパーティション用)、SSD2(Docker用)。 個人的にメモリはECCにしている。GPU一枚あたり4G必要らしい。 ルータからのポートフォーワードもできればやった方がいいらしいが、前はやらなくても動いた。

OSインストール

https://ubuntu.com/download/server

前はUbuntu Server 22.04 LTS でインストールしたけど、最新のUbuntu Server 22.04.1 LTSは未テスト。 sshdを入れておこう。 nvidiaのドライバがUbuntu任せにできるので楽になった。 インストール完了後リブート。

最新ドライバ等でOEMカーネルを入れたい人は以下参照。

wiki.ubuntu.com

sudo apt install linux-oem-22.04

たぶんサーバ版ドライバが入ってるのでデスクトップ用の最新に入れ直し。

ubuntu-drivers devices
sudo ubuntu-drivers autoinstall

で、最新のデスクトップ用?ドライバが推奨されているのを確認してオートインストール。サーバ用ドライバはなんかアプリが足りなかったので注意。

X , xinit , nvidia-settings のためのインストール。

sudo apt-get install xserver-xorg-core xinit libgtk-3-0 libxv1 --no-install-recommends --no-install-suggests

X の設定。

sudo nvidia-xconfig -a --cool-bits=28 --allow-empty-initial-configuration --enable-all-gpus

リブート。

nvidia-settingsでGPUの設定を変更できるかテスト

sudo xinit /usr/bin/nvidia-settings -a [gpu:0]/GPUFanControlState=1 -a [fan:0]/GPUTargetFanSpeed=80 -- :0 -once

docker のインストール

dockerのテストもやっておこう。

docs.docker.com

nvidia-docker のインストール

nvidia-dockerのテストもやっておこう。

nvidia.github.io

docs.nvidia.com

python2 のインストール

インストーラーが未だにpython2なので。はよpython3に書き直してほしい。

sudo apt install python2

SSD2をxfsでフォーマットしてdocker用にマウントしてリスタート

sudo fdisk /dev/sdb

g,n,y,w で新規パーティション作成。 xfsでフォーマット。UUID確認。

sudo mkfs -t xfs /dev/sdb1
sudo blkid
/dev/sdb1: UUID="hogehoge"

fstabの末尾に書き込み。

sudo nano /etc/fstab
UUID="hogehoge" /var/lib/docker/ xfs rw,auto,pquota 0 0

マウントしてdockerリスタート。

sudo mount -a
sudo systemctl restart docker

vast.ai のインストール

事前にアカウントを登録してSSH public keyを登録してvast.aiが指定するkeyを取得しておいてください。 インストーラーがpython2なのに注意。nvidiaドライバとdockerはインストール済みであることをオプションで指示。 

wget https://vast.ai/install -O install; sudo python2.7 install [your_key] --no-driver --no-docker

インストール後はベンチマーク

とりあえずこれが完走すればソフトウェア的には大丈夫。原因不明のフリーズとかはたぶんハードウェアの問題。

github.com