MENU
\ ポイント最大45.5倍! /

Stable diffusion 初心者を救うためのガイド・使い方解説

こんにちは、画像生成AIのプロンプトを研究している じょじお(@jojio‗illust)です。

この記事は、初心者のStable diffusion WebUI(ローカル・無料クラウド)ユーザー、そしてこれからStable diffusion を使ってAI画像生成を始めたいと思っている方を救うために書いています。

私は、環境構築でのトラブルや、苦手な英語での情報収集に多くの時間を使いました。その情報をここに共有することで、これからAI画像生成を始められる方のお役に立てればと思っています。

この記事は現在更新中です。

目次

Stable diffusion とは?

Stable Diffusionは画像を生成してくれる画像生成AIです。Stability AI社が開発しました。

画像生成AIはジェネレーティブAIに含まれます。

その他の画像生成AI

(ここに比較表を設置)

  • NovelAI
  • Midjourney・にじジャーニー
  • Dall-E2
  • Bing Image Generator

参考

Stable diffusion は無料で使える?

Stable Diffusionは、Stability AI社からオープンソースとして公開されています。オープンソースというのは、「プログラムの中身を公開するから自由に使っていいし改造してもいいよー」という仕組みです。つまりStable Diffusionは誰でも無料で使えます。

ただし、無料で使おうとするとそれなりにハードルがあります。理由は後述。

Stable Diffusionを使用する方法

Stable Diffusionには2つの使用方法があります。

  1. Stable Diffusionを使ったWebサービスを使う方法
  2. Stable Diffusion WebUIをパソコンにインストールして使う方法

1.Stable Diffusionを使ったWebサービス(有料)

Stable Diffusionは無料で使えるとお伝えしたばかりですが、導入にはいくつかのハードルがあります。

ゲーミングPCレベルのPCスペックが必要であったり、環境構築が面倒であったりするのです。オープンソースのシステムは無料で使える反面、問題が起きたときは自分でトラブルシュートしなければいけません。

そこでStable Diffusionを簡単に利用できる方法があります。それはStable Diffusionを使ったWebサービスを利用する方法です。この場合、サービス使用料が必要になる場合があったり、画像生成枚数などに制限があったりする場合があります。

▼Stable Diffusionを使ったWebサービスは下記にまとめています。

2.Stable Diffusion WebUIをインストールする(無料)

前項で、Stable diffusionを使ったWebサービスについて紹介しました。Webサービスは、簡単に利用開始できる反面、利用コストや制限があるとお伝えしました。

好きなモデルを使って好きなだけAI画像生成を行いたいと考えるのであれば、「Stable Diffusion WebUI」をインストールする方法があります。

Stable DiffusionをPCにインストールする場合、WebUIと一緒にインストールするのが一般的です。Stable DiffusionのAIモデル単体だけをPCにダウンロードしても、ノンプログラマーでは扱うのが難しいからです。

WebUIは、本来黒い画面でコマンドを打って操作しなければいけないAIモデルを、誰で簡単にマウスやキーボードだけで操作できるようにしてくれる部品です。

WebUIは、数人の有志によって開発され、いくつか無料で公開されています。

  • NMKD Stable Diffusion GUI
  • Stable Diffusion automatic1111 WebUI

人気のUI「Stable Diffusion Automatic1111 WebUI

圧倒的に人気なUIは、Stable Diffusion automatic1111 WebUIです。

Automatic1111とは、開発者さんの名前(Githubネーム)です。

圧倒的に人気でユーザーが多いため、拡張機能の数も多いですし、情報も多いです。初心者の方はこのAutomatic1111さんのWebUIを使うことになると思います。私もこれをメインで使っています。

今後の解説もautomatic1111 WebUIに絞って解説します。

Stable Diffusion WebUIの推奨スペックを確認する。

前項で、Stable diffusionをパソコンにインストールして使う場合には「WebUI」が必要になることをお伝えしました。

WebUIをPCにインストールしたいと考える場合、ご自身のPCのスペックを確認する必要があります。

先にもお伝えしましたが、Stable diffusion WebUIは、事務作業用のPCでは快適に使うことができないからです。

Stable Diffusionを利用するためのパソコンの推奨スペック

Stable Diffusion WebUIの動作スペックについては下記の記事にまとめているのでご参考になさってください。

▼画像生成PCにおいて、特に重要になるのはグラフィックボード(GPU)の性能です。おすすめはRTX3060 VRAM12GBがコスパが良いと思います。ネットで多くのユーザーが推奨する声を聞きますし、私もこれをメインで使っています。

もし、ご自身のPCスペックとStable diffusion WebUIの求める推奨スペックを確認して落ち込んでしまったあなた。安心してください。まだStable Diffusion WebUIを無料で利用する方法あります。次で紹介します。

Stable diffusion WebUIをインストールする2つの方法

Stable Diffusion WebUIをインストールする方法には2つの方法があります。

  • 自分のPCにインストールする。
  • クラウドサーバーを借りてインストールする。

もっとも快適なのは自分のPCにインストールする方法ですが、PCスペックが足りない場合でも方法があります。それはクラウドサーバーをレンタルして、そこにインストールする方法です。無料のクラウドサーバーもあります。

1. 自分のPCにインストールする方法

Stable Diffusion WebUIの推奨スペックを満たしている場合は、自分のPCにStable diffusion WebUIを自分のPCにインストールする方法が快適です。インストール下記の記事を参考になさってください。

2. Google Colabにインストールする方法

PCスペックをクリアしていない方は、無料のクラウド上で動作するプログラム実行環境サービスであるGoogle Colabを使う方法があります。

この方法を使えば、PCスペックが足りなくても、GoogleのハイスペックサーバーであるGoogle ColabにWebUIをインストールすることで、Stable diffusionを使うことができます。

ただし、いくつかストレスを感じることがあるのでお伝えしておきます。

Google Colabのストレスポイント
  • HDDディスク領域は、Googleドライブの領域を使用します。Googleドライブの無料枠は15GBしかありません。Stable Diffusionは、とても多くのディスク領域が必要になるので、15GBだけでは結構カツカツです。やり繰りには工夫が必要です。
  • セッションが度々切れることがある。
  • 現在公開されているGoogleColab用のWebUIは利用の度にインストール処理が実行されるので起動が遅い。

これらのストレスは、Google Oneへの課金(ディスク領域の増加)や、Google Colabへの課金によって少し解消することができます。

このように、無料とお伝えしましたが、無料枠のみで利用する場合には少しストレスがあるかもしれません。ストレスを軽減するためには課金推奨です。

Google ColabにStable diffusion WebUIをインストールする方法は下記の記事を参考になさってください。

インストール時のエラー

ローカルPCへのWebUIインストール時に、よくあるエラーは下記にまとめています。

Stable Diffusion WebUIの設定

WebUIをインストールしたら基本設定を行います。下記の記事を参考にしてください。

  • 基本設定
  • 起動オプションの設定(ローカルPCにインストールした人のみ)
やっておきたい設定
  • 起動オプション「xformers」:処理が高速になる。
  • 低VRAMのPCを使う場合は、起動オプション「–midvram」「–lowvram」の設定が必要になる場合がある。画像生成を試しながら判断して。

▲起動オプションの設定方法はこちら。

▲起動オプションの設定方法と高速化の設定方法はこちら。

Stable Diffusion WebUIに拡張機能(プラグイン)のインストール

基本設定が終わったらStable Diffusion WebUI拡張機能(プラグイン)をインストールします。

プラグインとは、WebUIを便利に使うために機能を拡張できる仕組みです。日本語化するためのプラグインや、動画を生成できるプラグインなど、いろいろなものがあります。

画像生成するだけでしたら必須ではないですが、効率的に画像生成を行うためにはいくつか入れておくといいと思います。

拡張機能のインストール方法

拡張機能のインストール方法や、基本的な使い方については下記の記事を参考になさってください。

おすすめの拡張機能

実質必須レベルの拡張機能や、おすすめの拡張機能などを下記の記事で紹介しています。

Stable Diffusion WebUIで画像生成する流れ

以上で、準備がととのいましたので画像生成を行います。

AI画像生成作業のステップを紹介します。この流れは人によってさまざまだと思います。参考程度にしてください。

AI画像生成のステップ
  1. モデルとVAEを選択する。
  2. パラメータ設定(スケール値、サンプラー、)
  3. プロンプトを作る。
  4. ネガティブプロンプトを作る。
  5. コントロールネットで構図決める。
  6. インペイントで細かな修正をする。
  7. 仕上げにアップスケールする。

ちょっとしたお遊びでTwitterでアップするだけの画像でしたら、1~4のステップだけで画像を完成させます。綺麗な画像にしたい場合や、AI画像が苦手な「キャラクターの手」の修正などを行う場合には、6~7の作業を行います。

1.Stable Diffusion のモデルを決める。

モデルファイルは、画像のスタイルを決める一番重要な要素です。

VAEもインストールしよう

モデルによってはVAEファイルが必要です。VAEがない場合、画像がぼやけたり発色が悪くなったりします。VAEについては下記の記事を参考にしてください。

2.Stable Diffusion WebUIのパラメータ設定

(この項は工事中です。)

画像生成には、いくつかのパラメータ設定が必要です。

パラメータ調整には答えはありません。モデルによっても異なります。

最初はすべてのパラメータをデフォルト値で生成しても問題ないでしょう。

3.プロンプトを作る。

AI画像生成に重要なプロンプトを入力します。

プロンプトは、AIに対して、どのような絵を作りたいかを伝えるためのテキストです。

こちらも作り方は人それぞれです。下記に簡単なガイドを作りました。参考程度にお読みください。

4.ネガティブプロンプトを作る。

ネガティブプロンプトは、画像の中に含めてほしくないものをAIに伝えるためのテキストです。つまり、プロンプトと逆の役割をします。

たとえば、ネガティブプロンプトに「low quality(低品質な画像)」と記述すると、低品質な画像が出力されにくくなります。

ネガティブプロンプトを空っぽにしても画像生成はできますが、理想の画像を早く生成するためには必須といっていいでしょう。

5.Controlnetで構図を決める。

イラストの構図は、今までプロンプトだけで行い、あとは運に頼るしかありませんでした。しかし、Controlnetの登場で幻覚な調整が可能になりました。

Controlnetは必須ではありませんが、構図をきっちり決めたい人には協力なツールになります。

Controlnetは、WebUI用の拡張機能を使って利用します。使い方は下記を参考になさってください。

6.アップスケール

アップスケールとは、画像を大きなサイズにリスケールし、解像度をアップ(高精細に)します。

アップスケールをすることで、細かい部分の描き込みが増えて綺麗な画像になります。ちょっとした手の崩壊はアップスケールによって改善する場合もあります。

ただし、イラストのスタイルによっては違和感が出る場合もあります。例えばラフスケッチ風のイラストでは、ラフさが消えてしまうかもしれません。

アップスケールには下記のように様々な方法があります。

  • Hi res fixによるアップスケール(記事作成中)
  • Image-to-Imageによるアップスケール(記事作成中)
  • 拡張機能(SDアップスケールなど)を使ったアップスケール(記事作成中)

(この先工事中)

Stable Diffusion WebUIでエラーが起きたときの対処方法

エラー原因の多くはWebUIのアップデート時や、拡張機能を追加した時です。

エラーが良く起きるとき
  • WebUIのアップデート時
  • 拡張機能を追加した時
  • 処理の重たい作業をするとき(大きなサイズの画像生成・動画作成など)

(この項は工事中です。)

  • Githubをみよう。
  • 英語でググろう。

Stable Diffusion WebUIのFAQ

(この項は工事中です。)

頻繁に画像生成が途中で止まる。

PCのVRAMが足りないのかもしれないです。

起動オプション「–midvram」か「–lowvram」のいずれかを試してみてください。これらは速度を犠牲にするかわりに安定した画像生成を提供します。12GB以上のVRAMがある場合は不要です。

設定方法は下記を参考にしてください。

画像のプロンプト忘れちゃったけど後から見れる?

PNGInfoで見れます。下記の記事を参考にしてみてください。

生成したAI画像の保存場所はどこ?

画像はダウンロードしなくても、自動的にインストール場所の「outputs」フォルダに保存されます。

保存場所は「Settings>左上の1つ目か2つ目あたりのメニュー」から変更することができます。

Stable Diffusion WebUIはスマホやタブレットから使える?

起動オプション「–listen」を付けることによって、PC外部からのアクセスが可能になります。これによって、Stable Diffusion WebUIをインストールしたPCを、スマホやタブレットで遠隔操作することは簡単です。

ただし、–listen中はプラグインのインストールができません。プラグインをインストールするときだけは–listenオプションをオフにして起動する必要があります。インストール後に–listenオプションを付けることでプラグインの使用が可能です。

画像がぼやける・にじむ・薄い・発色悪いけどどうしたらいい?

使用しているモデルが、VAEを必要とするモデルかもしれません。VAEを推奨するモデルで、VAEを使わないで画像生成を行うと発色の悪い画像が生成されます。

モデルの公開元のディスクリプションを読み、推奨されるVAEをダウンロードしましょう。

推奨されるVAEがよくわからない場合は、StabilityAI社が公開する汎用的に使用できるVAEを試してみるといいと思います。他にもいろいろあるので試してみてください。

拡張機能がインストールできない。

起動オプションに「–listen」を指定している場合、拡張機能を一時的にインストールできなくなります。おそらくセキュリティ対策のためだと思います。

拡張機能をインストールするときは、「–listen」オプションを外してWebUIを起動し、インストール後に起動オプションを付けなおせばいいでしょう。起動用のバッチファイルを2つ作っておくと、切り替えが楽になります。

NSFW画像(エッ〇な画像)ばかり生成される。

Stable Diffusionのモデルには、学習データの中にエッ〇な画像が含まれていたモデルがあります。このため、特に指示をしていないのに裸の女性の画像が出力されることがあります。

これを防ぐには、ネガティブプロンプトに「nsfw, undressed(脱衣)」などを含めるといいです。下記の記事を参考になさってください。

逆にNSFW画像を生成したい場合は、プロンプトのほうに「NSFW」と含めることからスタートです。

Stable diffusion WebUIをもっと便利に使うテクニック。

下記にStable Diffusion関連の記事をまとめています。

Stable Diffusion 用語集

  • Stable Diffusion WebUI(Stable Diffusion Automatic1111 WebUI)
    • Stable DiffusionをPCで誰でも使えるようにしたツール。Automatic1111さんが作った。
  • Google Colab
    • Stable Diffusion WebUIを動かすことができる無料のサーバー。Stable Diffusion WebUIが動作するPCを持っていない人でも使える。

まとめ

以上、Stable diffusion WebUIの初心者向けガイドでした。

じょじお

最後まで読んでくださってありがとうございます!
この記事がお役に立てましたら、シェアボタンからシェアしていただけたら嬉しいです!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


目次