ザキンコのブログ

ザキンコの日記のはてなブログ版です。

ST31000520AS メモ

古いハードディスクについて。なんかSATAコントローラーと相性があるのか認識しない場合があるのでメモ。初期化中に無反応になる感じ。SASボードにつないでも動かないことがあった。
Lenovo H520s の起動ドライブにしようかと入れ替えてみたら、ピーピーピーブーと運命の悲しいビープ音が鳴り続けました。
他のPCにつないだりUSB-SATA変換でつないだら動くしエラーは出ないから謎。ファームウェアアップデートもこのシリアルの個体は対象外だからどうしようもないなあ。捨てるか。

Ubuntu 16.04 LTS に CUDA Toolkit (同時にnVidiaのドライバ)を入れるメモ

vast.ai のホストを立てるのに必要なのでメモ。

Ubuntu自体はServer版をインストールする方が余計なアプリが入らないので安定するっぽい。でも、カーネルが古いのでとりあえずHWEカーネルを入れましょう。
wiki.ubuntu.com

apt update
apt upgrade

ssh でリモートログインできるように設定。省略。
以下、sshでリモートログインして作業。

nouveau が有効になっているなら無効化。

lsmod | grep -i nouveau
/etc/modprobe.d/blacklist-nouveau.conf
  blacklist nouveau
  options nouveau modeset=0

sudo update-initramfs -u
sudo systemctl reboot

公式が推奨する方法でcudaのインストール。同時にドライバもインストールされる。現在は CUDA Toolkit 11.0 RC。
developer.nvidia.com

直接マシンにログインしてGUIを使っている場合は
CTRL+ ALT+F1 でコンソールにしてGUIを停止してからインストールする必要があるみたい。
GUI停止は、

sudo service lightdm stop

今風は

sudo systemctl stop lightdm.service

ちなみにこの方法で入れた nvidia-settings は正常に動かないので、必要な場合は18.04LTSのnvidia-settingsを入れる。

vast.aiのインストール。省略。

sudo docker info で警告が出るので、dockerのswapの設定。
unix.stackexchange.com
これでvast.aiでホストとして登録されて問題なく動くはず。

(追記 2020.7.30)
メモリを食うアプリが動いた場合、強制的にkillしてしまうのでswapは積んでおいた方が良いかも。

最強NAS箱 Helios64 メモ

Linuxを入れられてかなり良さそうなNAS箱を見つけたのでメモ。
wiki.kobol.io
wiki.kobol.io
アルミで頑丈そうな筐体。冷却ファン2個。
SATA3.5インチが5スロットもあって前面からカートリッジで入れられる。
LANは2.5Gと1Gの2ポート。
USB TypeCにUSB Type-C to DisplayPort cableを挿せば画面も出る。
SoCはRockchip RK3399で、メモリは4G。メモリはもっと欲しいな。
値段はプレオーダーで295ドル。日本に発送してくれるのかなあ?
LinuxNAS箱は、4ポートの中古NAS箱を買ってカスタマイズして使うのが簡単なんだけどねー。

docker-ce をアップグレードしたら動かなくなったメモ

不具合があったので、docker-ce 5:19.03.6~3-0~ubuntu-xenial にダウングレードしていたのだが、
最新版( docker-ce 5:19.03.9~3-0~ubuntu-xenial )が出たので入れてみた。
そしたらapt upgrade でコケる。結構めずらしい。

sudo dpkg --audit

で docker-ce がトラブってることを確認したのだが、すでに docker がインストールされていて /var/lib/docker が、xfs で使われていることが原因っぽい。
でも、消して作り直したくはないので、

/lib/systemd/system/docker.service

に、ストレージドライバのオプション( --storage-driver=overlay2 )を明示的に追加したら修正インストール( dpkg --configure docker-ce )がうまくいった。
docker は動くようになったのに vastai 関連は正しく動かないのでログを見たりいろいろ試したりしてたが、( --runtime nvidia )オプションなんて知らんって言われてて、あれ?って思った。

docker: Error response from daemon: Unknown runtime specified nvidia.

原因はたぶん nvidia-docker2 がなくなったこと。互換性のために残されているので明示的にインストールすれば古いのスクリプトも動くようになるはず。

github.com

docker run --gpus all nvidia/cuda:10.0-base nvidia-smi         # 動く
docker run --runtime nvidia nvidia/cuda:10.0-base nvidia-smi   # 古いオプション nvidia-docker2 を入れないと動かない
nvidia-docker run nvidia/cuda:10.0-base nvidia-smi             # 古いコマンド  nvidia-docker2 を入れないと動かない

qiita.com


(おまけ)
Ubuntu16.04 用の nvidia-smi の deb は壊れているので、18.04 を強制インストールして使ってくれとのこと。笑った。
forums.developer.nvidia.com

(追記 2020.5.29)
Ubuntu 16.04 LTS Server をクリーンインストールしてアプリを入れていってみたら特に問題なく動いた。アップグレードは注意ってことかな。

(追記 2020.5.31)
docker-ce 5:19.03.10 はアップグレードでも問題ありませんでした。結局、docker-ce 5:19.03.9がバグだらけだったってことで。

btrfs に RAID1C34 が来た

btrfsのRAID1が3台4台ミラーに対応。
RAID5,6はまだ不安定なんでRAID1を使ってるけど、ディスクの台数を増やして大きいプールを作っていると、
2台ミラーだとリビルド時にコケるかもと心配になってくるので3,4台のミラーができるようになるとありがたい。
RAID5,6は今時のSMRなハードディスクには向かないし。
kernel は v5.5 から、btrfs-progs は v5.4 からなので、buster-backports のパッケージが少し古いみたいで、
Debian10でRAID1C3を指定してもそんなオプションは知らんて言われる。もう少し待ってみるか。

btrfs.wiki.kernel.org

Folding@home に参加

vast.ai で動かしているマシンのdockerをPrimGrid の解析から Folding@home に変更。
Team Japanに参加したら10位くらいになりました。思ったより参加人数少ないです。
マシンは Ryzen5 2600 + RTX 2070SUPER、Ryzen 7 1800X + RTX 2070SUPER の2台です。
stats.foldingathome.org
foldingathome.org

openmediavault でリモートマウントした共有ドライブをUnionfsでまとめる時メモ

Windowsの共有フォルダとLinuxのSambaの共有フォルダをまとめて扱いたい時に便利なので使っていたが、最近エラーが出るようになったので調べてみた。

リモートマウントプラグイン(remotemountプラグイン)を使って以下のフォルダにマウント。フォルダ名は自動で付けられるので指定できない。

/srv/0123456789ABC # ネットワーク内のWindows共有フォルダ

それをUnionfilesystemプラグインを使ってローカルディスクとまとめて透過的に同じパスにマウントする。fstabにfuse.mergerfsでマウントの設定が追加される。

そうしたら、systemdにコンフリクトを起こしているよと怒られるようになって、うまくマウントできたりできなかったりするので調べてみた。
fstabのマウント設定にx-systemd.requiresを入れろと書いてあったので見てみたらすでに設定されていた。
結局単純にネットワーク回りが起動するのを待つオプションの _netdev を追加指定したら怒られなくなったのでメモ。
systemd難しい。