Stable Diffusion WebUIの最小スペックと推奨スペックを考えてみた。
こんにちは、画像生成AIでひたすら猫のイラストを生成している じょじお(@jojio‗illust)です。
この記事では、Stable Diffusion WebUIを快適に使うための最小スペックを考える記事となっています。
Stable Diffusion WebUIのGitHubの情報を見ながら、私自身の体験もふまえて、個人的な推奨スペックを考えました。
これからStable Diffusionのローカル環境を整えたい方の参考にしていただければ幸いです。
▲AI画像の大量ファイルをプロンプトと一緒に簡単に整理する方法はこちら。
Stable Diffusionのプロンプトエンジニアリングの基本について理解したい方には、初心者向けのプロンプトガイドを作りましたのでそちらを見てください!
PCの最低スペック・推奨スペック
Stable Diffusionはオープンソースのソフトウェアなので、「このスペックなら絶対動くよ!」という保証された数値がありません。
そこで、この記事でPCの各パーツごとに、推奨スペックを考えてみることにしました。
結論から知りたい方のために、まずは結論をまとめた表をお見せします。
推奨スペック | 最小スペック | |
ノート・PC | デスクトップ | ノート・デスクトップ |
Windows | Windows10か11の64bit版 | Windows10か11の64bit版 |
CPU | Intel Core-i シリーズ・AMD Ryzenシリーズ | Intel Core-i シリーズ・AMD Ryzenシリーズ |
メインメモリ | 16GB以上 | 8GB |
GPU | NVDIA製 12GB以上 | NVDIA製 4GB~8GB |
ディスク容量 | 80GB以上 | 27GB以上 |
ディスク種類 | SSD | SSD |
以上が私が勝手に考えた推奨スペックです。
次の項から各パーツ単位で詳しくお話していきます。
1.ノートPCかデスクトップPCか。
まずは、ノートPCかデスクトップPCか問題についてです。
ゲーミングノートPCは、同じスペックのデスクトップPCと比較した場合、コスパが悪いですし、音も大きくなりやすいのでデスクトップPCを選ぶことをおすすめします。
デスクトップPCでも大きいサイズの画像を生成しようとするとファンの音が気になる時がありますので。
どうしてもノートPCでStable Diffusionしたい人には、デスクトップPCでStable diffusionを動作させて、サブのノートPCでリモートで画像生成をする方法もあります。この場合、実際にStable diffusionが実際に動作するのはデスクトップPCなので、リモートアクセスする端末のスペックは何でも構いません。スマホからでも操作可能です。Stable diffusion WebUIが動作するPCを、スマホやノートPCで遠隔操作する方法はこちら。
2.Windowsのバージョンの推奨要件は?
Windowsは64Bit版を選びましょう。32Bit版のPCではメモリを多く積んでもフルに使用できません。とはいえ最近のPCは64Bit版のPCがほとんどですので、よほど古いPCを買う予定でない限り、気にしなくても大丈夫です。
3.メインメモリの推奨スペックは?
Stable Diffusion WebUIは、メインメモリが16GB以上であることが推奨されています。
The program needs 16gb of regular RAM to run smoothly. If you have 8gb RAM, consider making an 8gb page file/swap file, or use the –lowram option (if you have more gpu vram than ram).
Troubleshooting – Stable diffusion WebUI
8GBでも動作します(検証済み)。ただ、モデルファイル1つが、およそ5GB程度あることを考えると8GBでは心もとないです。
4.CPUの推奨スペックは?
CPUについての情報は少ないです。
というのも、AI画像生成は、グラフィックボード(GPU)のVRAMの性能に依存する部分が大きいので、GithubのコミュニティをみてもCPU性能についての議論があまりされていません。
もちろん予算に余裕があれば、最新の上位クラスを選べばパフォーマンスが向上すると思われますが、古いCPUでの動作報告もあるので優先度は低いでしょう。
Intel製でもAMD製でも動作するようです。
5.グラフィックボード(GPU)の最低要件は?
Stable Diffusion WebUIには、グラフィックボード(GPU)が必須です。Stable Diffusionのスペックを語る時に一番議論されるのがグラフィックボードについての話題です。
画像生成マシンのパーツの中で一番重要で、一番高価だからだと思います。
もし、ご自分のPCのグラフィックボードのスペックが分からない場合は、下記で確認方法を解説していますのでご覧ください。
グラフィックボード(GPU)のおすすめメーカーは?
Stable Diffusion WebUIでは、NVDIA(推奨)とAMDの2つのメーカーのグラフィックボード(GPU)に対応しています。
- NVDIA製グラフィックボード(GPU)へのインストール手順:Install and Run on NVidia GPUs
- AMD製グラフィックボード(GPU)へのインストール手順:Install and Run on AMD GPUs
ただ、もともとStable Diffusion WebUIはNVDIA製のグラフィックボードに向けて作られていますのでNVDIA製が推奨されています。AMD製のグラフィックボードへの導入は通常のものと異なり、ネットの情報も少ないため(特に日本語は)、何か不具合があったときに情報を取得できない可能性があります。
このため、これから購入するのであれば、絶対にNVDIA製のグラフィックボードを選択することをおすすめします。
一応、私のTwitterのフォロワーさんの中には、MacbookのM1チップで使っているという声も聞いたことがあります。
グラフィックボード(GPU)の最小スペックは?
グラフィックボードのVRAM容量も重要です。
Stable Diffusion WebUIのGithubのドキュメントには4GBのVRAMにも対応という記載があります。
4GB video card support (also reports of 2GB working)
(訳)4GBビデオカード対応(2GBの動作報告もあり)
https://github.com/AUTOMATIC1111/stable-diffusion-webui
ただし、これは、512×512サイズの画像を生成するための最低スペックであり動作も不安定です(下記Github引用参照)。
When running on video cards with a low amount of VRAM (<=4GB), out of memory errors may arise.
(訳)VRAMの容量が少ない (4 GB以下) ビデオカードで実行すると、メモリ不足エラーが発生することがある
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Troubleshooting
–lowram didn’t work because the full model takes maybe ~6gb which is more than your GTX970 has (4gb)
older gpus may not be able to run f16, or half-precision, which is what webui uses by default. Once you get past the intitial launch by using swap, Try adding –precision full –no-half –lowvram if you are getting black images. Bump –lowvram to –medvram if it works to get bigger images.(訳)–lowram完全なモデルでは、GTX970 が持っている (4 GB) よりも大きい ~6 GB かかる可能性があるため、機能しません
https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/6779
でした。古い gpu では、f16 または半精度 (webui がデフォルトで使用するもの) を実行できない可能性があります。スワップを使用して最初の起動を過ぎたら、–precision full –no-half –lowvram黒い画像が表示される場合は追加してみてください。–lowvramより大きな画像を取得できる場合は、 –medvram に移動します。
それから、大きな画像やアップスケールという高精細化機能は、専用の起動コマンド(–medvramや–lowvram)で使用できますが、これらは、安定性を得る代わりに生成速度を犠牲にします。
以上のことから、現実的な最低スペックは8GB以上のVRAMと言えるかなと思います。
ただ、VRAM 8GBのグラフィックボードを今から購入するのでしたら、そこまで価格差のないNVIDIA GeForce RTX 3060(12GB)がおすすめです。グラフィックボードはメインメモリのように後から追加が簡単ではないので・・・・。
私もRTX 3060(12GB)をメインPCで使っていますが快適です。
NVIDIA GeForce RTX 3060の最新の価格はこちら(Amazonへ飛びます。)
グラボのメモリがAI画像生成で6GBじゃ全然足りなかったので買い替え。
Amazon レビュー
Stable diffusionで安定しているし、高画質画像が出力できるようになって大変満足です。
Nvidia Canvasも問題なく使えました。
ASUS様々。
グラフィックボード(GPU)だけ購入する場合、ご自分のPCに搭載可能か確認してから購入しましょう!
PC知識がなくてパーツ単体購入に不安な方は、こちらのPC単体の購入がおすすめ。
6.ディスク領域(HDD・SSD)の最低スペックと推奨スペックは?
ディスクタイプは?
ディスクタイプは、HDDよりも高速に処理をするためにはSSDがおすすめです。
ディスク容量の推奨スペック
Stable Diffusion WebUIは12GB程度のディスク要領が必要です。
これはもちろん最低限の必要容量です。Stable Diffusionでは、画像を簡単に生成できますので画像の保存スペースも必要になります。
私の場合、ざっと計算したところ1日平均50枚の画像を生成していました。1枚のサイズが280KB程度ですので、1日に14MBです。1年間画像を生成し続けると約 5.1GB程度消費することになります(これは画像生成者の中では少ない見積もりかも)。
さらに、Stable Diffusionにはたくさんのモデルファイルがあります。モデルファイルとは、生成する絵のスタイルを決めるためのファイルです。Stable Diffusionの元ファイルはリアル系な写真のような絵が得意なモデルですが、Twitterのタイムラインに流れてくるようなアニメの絵は、アニメ絵を追加学習させたモデルファイルを使った絵がほとんどです。
つまり、あなたがもし、Twitterで見かけたアニメ絵を生成したいのであれば、モデルファイルを何個か試したくなるでしょう。このモデルファイルが1個3GB~5GB程します。3個使う場合、15GBです。
さらには、最近流行のControlnetという構図を思うようにコントロールする機能をフルで使う場合は40GBです。
HDDの最低スペックと推奨スペックは?
以上をふまえてHDDの最低スペックと推奨スペックは下記のようにしてみました。
用途 | 推奨スペック | 最低スペック |
WebUI | 12GB | 12GB |
追加のモデル | 25GB(1個5GB程度x5個) | 5GB(1個5GB程度x!) |
画像保存領域 | 5GB(1年分) | 5GB(1年分) |
Controlnet | 40GB | – |
合計 | 82GB | 22GB |
最低スペックは22GB、推奨スペックは82GBとしました。
ただ、私はモデルファイルをたくさんDLしてたら、画像生成を初めてから3か月程度で500GBの容量が埋まりましたw
保存領域は多ければ多い方がいいのは間違いないです。
SSD単体購入を検討されている方は、個人的には下記のWestern Digital社製のブルーモデルがおすすめです。Western Digital社製のディスクは壊れにくいという評判があります。新規購入される際は、WindowsOSが使用する領域が最低40GB程度必要になることも忘れないでください。
▲スマホでもPCでも使える。シリコン素材なのでポータブル用途でも安心です。
Stable diffusion WebUIの推奨スペックを満たしたパソコンは?
これまで、Stable diffusion WebUIの推奨スペックについて紹介させていただきました。
ここでは、実際にStable diffusion WebUIの推奨スペックを満たしたPCをAmazonで探してみました。
価格が安いもので探さすと17万円前後でみつけることができました。
▼ASUS
▼パソコン工房
私のPCの紹介
私はマウスコンピュータのG-tune(RTX3060搭載)をStable diffusion用に購入してみました。
国内メーカーで24時間サポートなので安心感があります。
▲クリックするとG-tuneのその他のモデルを確認できます。
今のところ快適に動作中です。
下記の記事で、画像生成周りのベンチマークも紹介していますのでよろしければご参考になさってください。
Stable Diffusion の始め方
ローカル環境でStable Diffusion を始めたい方のためにガイドブックを作っています。良かったら参考にしてください。
まとめ
以上、Stable Diffusionの必要スペック・推奨スペックをまとめました。
最後まで読んでくださってありがとうございます!
この記事がお役に立てましたら、シェアボタンからシェアしていただけたら嬉しいです!
コメント
コメント一覧 (4件)
Stable Diffusionのローカル環境での導入を考えています。
記事すごく参考になりました。ありがとうございます。
もしよろしければお尋ねしたいのですが、グラフィックボード(GPU)で
RTX3060とRTX3060Tiはどちらの方がよろしいでしょうか?
VRAMがRTX3060は12GBでRTX3060Tiが8GB。
しかしRTX3060Tiの入ったパソコンの方が少し高いです。
お時間あれば、よろしくお願いいたします。
コメントありがとうございます。
Tiシリーズは無印版の上位モデルなので、基本性能はTiの方が上です。
ただし、Stable Diffusionにおいては「VRAMの量を最も重要視するべき」というのが一般的な説のようです。
田中さんと同じ悩みを多くの人が持っていて、Redditでも議論されています。
下記の2つのスレッドが参考になると思います。(英語の記事です)
https://www.reddit.com/r/StableDiffusion/comments/z0f5k0/stable_diffusion_rtx_3060_12gb_vs_rtx_3060ti/
https://www.reddit.com/r/StableDiffusion/comments/yzk10t/is_the_base_3060_worth_it_over_the_3060ti_for_the/
このスレッドをまとめると、3060Tiの方が少しだけ画像生成スピードが速い。ただし、モデルのトレーニングをするのであればVRAMの多い3060ほうを買うべき。って皆さんいってますね。
なので結論として、私は3060Tiよりも3060をおすすめします。個人的な意見ですが3060でも全然遅いと感じることはないですよ。
ありがとうございます。
悩んでいたので、助かりました。
スレッドの方も参考にさせていただきます。
はい。ありがとうございます。