SDXLのLoRA学習をVPSで行うメリットとおすすめサーバー
筆者の結論(まずここだけ読んで)
月数本ペースでLoRAを作るなら、RTX 4090を買うよりGPU VPSの時間課金のほうが安い。損益分岐点を計算したら6〜8年後だった。
自分もローカルでやろうとした側の人間なので、気持ちはわかる。RTX 4070(12GB VRAM)でSDXLのLoRAを回そうとしたら、バッチサイズ1でもメモリ不足でコケた。「じゃあRTX 4090か」と思ったけど約25万円。そこで先に時間課金を計算してみたら、2000stepで2〜5時間、GPU VPSなら1本あたり200〜500円で済むとわかった。年間50本作っても2〜3万円。25万円には全然届かない。
それと、学習中にローカルPCが完全に使えなくなるのが地味に痛い。GPU・CPUを100%持っていかれるので、ブラウザすら重くなる。VPSならtmuxでバックグラウンドに流して切断してOK。ローカルPCでYouTube見ながら別のことができる。これだけでも乗り換える価値がある。
RTX 4090の購入を検討しているなら、先にVPSで1本試してほしい。数百円で「自分の使い方に合うかどうか」がわかる。
LoRA学習に必要なスペックとは
はっきり書いておきます。SDXL(ベース解像度1024×1024)でまともなLoRAを作るには、VRAM 16GB以上が実質必須。12GBでも動かなくはないが、解像度を落としたりオプションを細かく調整したりが必要で、品質面で妥協が出る。「12GBでいける」という情報もネットには転がっているけど、SDXLに限ってはあまり信用しないほうがいい。
| 設定 | 最小構成 | 推奨構成 | 高速構成 |
|---|---|---|---|
| VRAM | 12GB | 16GB | 24GB以上 |
| RAM | 16GB | 32GB | 64GB |
| ストレージ | SSD 50GB | SSD 100GB | NVMe 200GB |
| 学習時間(1000step) | 約90分 | 約40分 | 約15分 |
自分の場合、最初に12GB構成で試して失敗した。VRAM不足はエラーメッセージすらわかりにくいことがあって、「なんか動かない」で何時間も潰した。同じ轍は踏まないでほしい。最初からVRAM 24GB以上のVPSプランを選んだほうが、試行錯誤の時間ごと節約できる。
ローカルPCでLoRA学習するデメリット
RTX 3060(12GB)やRTX 4070(12GB)持ちの人が「とりあえずローカルで試してみるか」となるのはわかる。ただ、正直に言うとSDXLのLoRA学習に関しては、12GBは厳しい。
- VRAM 12GBでは解像度を落とさざるを得ない:1024×1024のSDXLで学習するにはバッチサイズ1でもギリギリ、または失敗する
- 学習中はPCが使えない:GPU・CPUを100%占有するため、学習中はブラウジングすら重い。「学習が終わるまで待つ」という時間の使い方になる
- 学習時間が長い:RTX 3060で2000step回すと2〜3時間かかることも
- 熱と電力:夏場の連続学習は室温にもダメージ。RTX 4090なら電気代は1時間で約30〜40円。1日8時間回したら月に1万円近くなることもある
「学習中に別のことができない」これだけでもVPSに切り替える理由として十分だと思っている。学習に2〜3時間かかるとして、その間ずっとPCの前で待つのか、という話。
VPSで学習させるメリット
一番大きいのはローカルPCが完全に自由になること。tmuxでバックグラウンドに流して切断すれば、あとは放置でいい。寝てる間に終わってる、というのが普通にできる。
| 比較項目 | ローカルPC | GPU VPS |
|---|---|---|
| ローカルPCの占有 | 学習中は完全占有 | ゼロ |
| VRAM | 自分のGPU依存 | 24GB〜80GB選択可 |
| 電気代 | ユーザー負担 | VPS料金に込み |
| 騒音・発熱 | あり | なし |
| スケール | GPU 1枚固定 | 必要に応じて変更 |
| 初期コスト | GPU購入費(数万〜数十万円) | ゼロ |
「今月はLoRAを1本だけ作りたい」という月に、RTX 4090を25万円かけて所有している必要はない。時間課金で必要な分だけ借りて、終わったら切ればいい。頻度が低い人にとっては、これが圧倒的に合理的な選択。
VPSにkohya_ssをセットアップする手順
コマンドが多いけど、一回通せばあとは使い回せる。順番通りにやれば詰まるポイントは少ない。特にtmuxのデタッチだけは最初に覚えてほしい。これを知らずに切断してLoRAが途中で止まる、というのが初心者のやらかしパターン1位だと思ってる。
ステップ1:VPSにSSH接続してGPUを確認
ssh root@あなたのVPS_IP
nvidia-smi
# VRAM容量とGPUモデルを確認
まずここでGPUが認識されているか確認する。認識されていなければドライバの問題なので、先に進まず対処する。「なんとなく先に進める」のが一番時間を無駄にするパターン。
ステップ2:Pythonとcondaのインストール
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b
source ~/miniconda3/etc/profile.d/conda.sh
conda init bash && source ~/.bashrc
ステップ3:kohya_ssのクローンと環境構築
git clone https://github.com/bmaltais/kohya_ss.git
cd kohya_ss
conda create -n kohya python=3.10 -y
conda activate kohya
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
ステップ4:学習データを転送
# ローカルPCから画像を転送(scp)
scp -r ./training_images root@あなたのVPS_IP:/root/lora_data/
ステップ5:LoRA学習を実行(バックグラウンド)
# tmuxで切断しても学習継続
tmux new -s lora_train
accelerate launch train_network.py \
--pretrained_model_name_or_path="/root/models/sd_xl_base_1.0.safetensors" \
--train_data_dir="/root/lora_data" \
--output_dir="/root/lora_output" \
--resolution=1024,1024 \
--train_batch_size=1 \
--max_train_steps=2000 \
--network_module="networks.lora" \
--network_dim=32 \
--network_alpha=16 \
--learning_rate=1e-4 \
--mixed_precision="fp16"
# Ctrl+B, D でデタッチ。切断してOK
tmux new -s lora_trainでセッションを作って、Ctrl+B, Dでデタッチするのがポイント。これをやらずにSSH切断すると学習が止まる。自分も最初にやらかした。一度やれば体で覚えるので大丈夫。
ステップ6:完成したLoRAをダウンロード
# 学習完了後、ローカルにダウンロード
scp root@あなたのVPS_IP:/root/lora_output/*.safetensors ./
コスト比較:VPS vs RTX 4090購入
正直に言う。「RTX 4090を買った方が長期的にお得」というのは、毎日ガンガン学習する人の話。月数本ペースなら全然元が取れない。これを計算せずに買ってしまう人が多いので、ちゃんと数字を出す。
| コスト | GPU VPS(時間課金) | RTX 4090購入 |
|---|---|---|
| 初期費用 | ゼロ | 約25万円 |
| LoRA 1本あたりのコスト | 約200〜500円(GPU VPS 2〜5時間) | 電気代のみ(約30〜60円) |
| 月10本学習した場合 | 約2,000〜5,000円/月 | 約300〜600円/月 |
| 損益分岐点 | — | 約6〜8年 |
具体的に計算してみる。
- GPU VPS(A100クラス)を1時間借りると約100〜150円
- 2000stepで3時間かかるとして、1本あたり約300〜450円
- 月10本作ると月3,000〜4,500円 = 年間36,000〜54,000円
- RTX 4090(約25万円)の損益分岐点:25万円 ÷ 年間コスト差(約3〜4万円)= 約6〜8年
6〜8年後のRTX 4090に価値があるかどうかも怪しい。「元を取る前に次世代GPUが出る」というのがほぼ確実なスケジュール。自分が買うかどうかを判断するなら、まずこの計算を自分のペースで当てはめてみてほしい。
月50本以上、毎日ガンガン学習するなら購入の選択肢が出てくる。でもそのレベルになったら、もう趣味じゃなくて仕事の話なので、判断基準も変わってくる。ほとんどの人は月50本には届かない。
よくある質問(FAQ)
まとめ:あなたの使い方で選ぶ
| あなたの状況 | 判断 | 理由 |
|---|---|---|
| 月1〜5本ペースでLoRAを作りたい | GPU VPS一択 | RTX 4090の損益分岐点は6〜8年。VPSで十分すぎる |
| 月20〜30本以上、毎日学習する | RTX 4090購入を検討 | この頻度になると時間課金がかさむ。買うなら計算してから |
| 今すぐ試してみたい・まだ何本作るかわからない | GPU VPS(時間課金)で始める | 初期費用ゼロ。1本300〜500円で試せる。合わなければやめればいい |
| ローカルPCをLoRA中も使いたい | GPU VPS | tmuxで切断放置できる。PCが完全に解放される |
| VRAM 12GBしかない・SDXLで詰まっている | GPU VPS(VRAM 24GB以上プラン) | 12GBでSDXLは厳しい。試行錯誤の時間ごと節約できる |
| 月数万円はさすがに高い | まず1本だけ時間課金で試す | 1本300〜500円。試してから判断すればいい |
SDXLのLoRA学習をVPSで行う最大のメリットはローカルPCを占有しないことと高VRAM環境をすぐ借りられること、この2点に尽きる。
月数本ペースなら、RTX 4090購入は費用対効果が合わない。計算してみればわかる。まず1本、VPSで試してみてほしい。「思ったより簡単だった」か「やっぱり自分には合わない」か、どちらかが数百円でわかる。これが最終回答じゃないんだから、まずはやってみてください。