ザキンコのブログ

ザキンコの日記のはてなブログ版です。

HDAT2 V7.0 メモ

hdat2.com

お世話になっているHDAT2のバージョンが上がって7.0になっていてSMRの検出機能が追加されたのだが、ST6000DM003 はSMRとは判定されませんでした。あれ?
HDAT2 release notesにはこう書かれていたが。

 - simple detection of SMR devices
   see Device data menu - Device data and Magnetic recording

おまけ。
HDAT2はDOSツールなので、rufus使ってFreeDOSで起動可能なUSBメモリを作って、HDAT2.EXE programをダウンロードしてUSBメモリの中に保存。
BIOSUEFIの設定でUSBメモリから起動できるようにして、起動したらHDAT2_70.EXEを実行すれば使えます。
HDAT2によるテストではハードディスクの内容を書き換えることもあるので、起動するPCには気を付けてください。
自分はHDAT2専用のPCを用意しています。SATAケーブルとSATA電源ケーブルを延長して筐体から出して、試験するハードディスクを簡単に接続できるようにしています。

ST31000520AS メモ

古いハードディスクについて。なんかSATAコントローラーと相性があるのか認識しない場合があるのでメモ。初期化中に無反応になる感じ。SASボードにつないでも動かないことがあった。
Lenovo H520s の起動ドライブにしようかと入れ替えてみたら、ピーピーピーブーと運命の悲しいビープ音が鳴り続けました。
他のPCにつないだりUSB-SATA変換でつないだら動くしエラーは出ないから謎。ファームウェアアップデートもこのシリアルの個体は対象外だからどうしようもないなあ。捨てるか。

Ubuntu 16.04 LTS に CUDA Toolkit (同時にnVidiaのドライバ)を入れるメモ

vast.ai のホストを立てるのに必要なのでメモ。

Ubuntu自体はServer版をインストールする方が余計なアプリが入らないので安定するっぽい。でも、カーネルが古いのでとりあえずHWEカーネルを入れましょう。
wiki.ubuntu.com

apt update
apt upgrade

ssh でリモートログインできるように設定。省略。
以下、sshでリモートログインして作業。

nouveau が有効になっているなら無効化。

lsmod | grep -i nouveau
/etc/modprobe.d/blacklist-nouveau.conf
  blacklist nouveau
  options nouveau modeset=0

sudo update-initramfs -u
sudo systemctl reboot

公式が推奨する方法でcudaのインストール。同時にドライバもインストールされる。現在は CUDA Toolkit 11.0 RC。
developer.nvidia.com

直接マシンにログインしてGUIを使っている場合は
CTRL+ ALT+F1 でコンソールにしてGUIを停止してからインストールする必要があるみたい。
GUI停止は、

sudo service lightdm stop

今風は

sudo systemctl stop lightdm.service

ちなみにこの方法で入れた nvidia-settings は正常に動かないので、必要な場合は18.04LTSのnvidia-settingsを入れる。

vast.aiのインストール。省略。

sudo docker info で警告が出るので、dockerのswapの設定。
unix.stackexchange.com
これでvast.aiでホストとして登録されて問題なく動くはず。

(追記 2020.7.30)
メモリを食うアプリが動いた場合、強制的にkillしてしまうのでswapは積んでおいた方が良いかも。

最強NAS箱 Helios64 メモ

Linuxを入れられてかなり良さそうなNAS箱を見つけたのでメモ。
wiki.kobol.io
wiki.kobol.io
アルミで頑丈そうな筐体。冷却ファン2個。
SATA3.5インチが5スロットもあって前面からカートリッジで入れられる。
LANは2.5Gと1Gの2ポート。
USB TypeCにUSB Type-C to DisplayPort cableを挿せば画面も出る。
SoCはRockchip RK3399で、メモリは4G。メモリはもっと欲しいな。
値段はプレオーダーで295ドル。日本に発送してくれるのかなあ?
LinuxNAS箱は、4ポートの中古NAS箱を買ってカスタマイズして使うのが簡単なんだけどねー。

docker-ce をアップグレードしたら動かなくなったメモ

不具合があったので、docker-ce 5:19.03.6~3-0~ubuntu-xenial にダウングレードしていたのだが、
最新版( docker-ce 5:19.03.9~3-0~ubuntu-xenial )が出たので入れてみた。
そしたらapt upgrade でコケる。結構めずらしい。

sudo dpkg --audit

で docker-ce がトラブってることを確認したのだが、すでに docker がインストールされていて /var/lib/docker が、xfs で使われていることが原因っぽい。
でも、消して作り直したくはないので、

/lib/systemd/system/docker.service

に、ストレージドライバのオプション( --storage-driver=overlay2 )を明示的に追加したら修正インストール( dpkg --configure docker-ce )がうまくいった。
docker は動くようになったのに vastai 関連は正しく動かないのでログを見たりいろいろ試したりしてたが、( --runtime nvidia )オプションなんて知らんって言われてて、あれ?って思った。

docker: Error response from daemon: Unknown runtime specified nvidia.

原因はたぶん nvidia-docker2 がなくなったこと。互換性のために残されているので明示的にインストールすれば古いのスクリプトも動くようになるはず。

github.com

docker run --gpus all nvidia/cuda:10.0-base nvidia-smi         # 動く
docker run --runtime nvidia nvidia/cuda:10.0-base nvidia-smi   # 古いオプション nvidia-docker2 を入れないと動かない
nvidia-docker run nvidia/cuda:10.0-base nvidia-smi             # 古いコマンド  nvidia-docker2 を入れないと動かない

qiita.com


(おまけ)
Ubuntu16.04 用の nvidia-smi の deb は壊れているので、18.04 を強制インストールして使ってくれとのこと。笑った。
forums.developer.nvidia.com

(追記 2020.5.29)
Ubuntu 16.04 LTS Server をクリーンインストールしてアプリを入れていってみたら特に問題なく動いた。アップグレードは注意ってことかな。

(追記 2020.5.31)
docker-ce 5:19.03.10 はアップグレードでも問題ありませんでした。結局、docker-ce 5:19.03.9がバグだらけだったってことで。

btrfs に RAID1C34 が来た

btrfsのRAID1が3台4台ミラーに対応。
RAID5,6はまだ不安定なんでRAID1を使ってるけど、ディスクの台数を増やして大きいプールを作っていると、
2台ミラーだとリビルド時にコケるかもと心配になってくるので3,4台のミラーができるようになるとありがたい。
RAID5,6は今時のSMRなハードディスクには向かないし。
kernel は v5.5 から、btrfs-progs は v5.4 からなので、buster-backports のパッケージが少し古いみたいで、
Debian10でRAID1C3を指定してもそんなオプションは知らんて言われる。もう少し待ってみるか。

btrfs.wiki.kernel.org

Folding@home に参加

vast.ai で動かしているマシンのdockerをPrimGrid の解析から Folding@home に変更。
Team Japanに参加したら10位くらいになりました。思ったより参加人数少ないです。
マシンは Ryzen5 2600 + RTX 2070SUPER、Ryzen 7 1800X + RTX 2070SUPER の2台です。
stats.foldingathome.org
foldingathome.org