【2023年版】Stable Diffusion モデルまとめ
こんにちは、画像生成AIでひたすら猫のイラストを生成している じょじお(@jojio‗illust)です。
この記事にStable Diffusionのモデルをぼちぼちとまとめています。随時更新予定です。
Stable Diffusionのプロンプトエンジニアリングの基本について理解したい方には、初心者向けのプロンプトガイドを作りましたのでそちらを見てください!
▲AI画像の大量ファイルをプロンプトと一緒に簡単に整理する方法はこちら。
▲素材に関連する英単語100個以上まとめました。
▲すべてのプロンプト関連記事はこちらにまとめています。
▲Midjourneyユーザー向け。専用Discordサーバーを作って画像生成作業を効率化する方法。
▲Stable Diffusionのネガティブプロンプト(反対呪文)まとめ
モデルを探す場所
Stable Diffusionのモデルは下記のサイトでダウンロードできます。
下記のサイトから「SafeTensorsファイル(セーフテンサーズ)」か「ckptファイル(チェックポイント)」を探しましょう。
ただ、SafeTensorsやckptファイルの中には、モデル用ファイルじゃなくて追加学習ファイルだったりすることがあります。両者は扱い方が異なりますので気をつけてください。下記の記事で、モデルのファイルの見つけ方について詳しく解説しています。併せてご覧ください。
モデルファイルの種類と違いを知る方法
モデルファイルをダウンロードしようとすると、似たようなファイルがたくさんあって迷うことがあるかと思います。
それぞれの違いについて知っておくと、どれをダウンロードすべきかが、なんとなく判断できるようになります。
まずは、モデルのディスクリプションを確認しよう。
モデルにどんな種類があるのかについては、モデルによって違います。
このため、必ずモデルのディスクリプションを確認しましょう。
▲ディスクリプションには、モデルファイルの違いについての説明書きがあることが多いです。ここを読むことで、自分がどのファイルを使うべきかの判断がざっくりとできます。
モデルのファイルの拡張子の違い
モデルファイルには2つの拡張子(Safetensorsとckpt)があります。どちらもStable Diffusionでモデルファイルとして利用できます。
基本的にSafetensorsが安定版となるようです。ですので、同じモデルにckptファイルとsafetensorsファイルの2つがある場合は、safetensorsを選んでおくと良いかもしれません。
また、SafeTensors版は、セキュリティ面も安全で、読み込み速度も若干速いといわれています。
- ckptファイル:チェックポイントファイルの略
- SafeTensorsファイル:安定版。
モデルファイルの名前の違い(fp16・fp32・pruned)
モデルによっては、モデルファイルの名前についても複数ある場合があります。
それはprunedという名前のファイルです。prunedとは「枝切り・剪定」という意味の英単語で、その名前のとおり、フルファイルから不要な部分を取り除いてファイルサイズを抑えたファイルです。
モデルファイルは、数GBのファイルサイズとなっており、ファイルサイズが大きいのが基本です。多くのモデルをインストールするとPCのHDDを圧迫してしまう原因になります。そこで、少しでもHDD容量を節約したい方はprunedという名前のファイルを選ぶと良いでしょう。
そして、そのprunedファイルにもいくつかのファイルがある場合があります。例えば、下記はモデル「Anything v4.0」の例です。
- Anything-V4.5.safetensors:無印。フルサイズの安定版
- Anything-V4.5-pruned.safetensors:prunedの安定版
- Anything-V4.5-pruned.ckpt:prunedのチェックポイントファイル
- Anything-V4.5-pruned-fp16.ckpt:fp16(半精度浮動小数点演算)。ファイルサイズは一番小さい
- Anything-V4.5-pruned-fp32.ckpt:fp32(単精度浮動小数点演算)
fp16というファイルが一番サイズの小さいファイルであることが多いです。
で、結局どれを選べばいいの?
私は、基本はフルサイズのSafetensorsがあればそれを選ぶようにして、ちょっとお試しで使う時はHDDを節約するためにpruned.safetensorsを選ぶようにしています。
HDDの容量によって下記のように選べばいいかなと思います。
- HDDサイズに余裕のある方:無印のSafetensors
- HDDを節約したい方:prunedのsafetensors
サイズが小さいからと言って、出力される画像のレベルがあきらかに低下するということはなく、ハッキリと体感できるレベルの違いはないことが多いです。ただ、モデルによっても違いますので気になる方は比較検証してみるといいと思います。
▲HDDの増設を考えている方には、ウエスタンデジタル製のHDDがおすすめです。他のHDDメーカーと比べて壊れにくいという評価を多くみます。いくつかのラインナップの中でもブルーがコスパがいいです。私はバックアップ用に使っています。
▲SSDはこちら。SSDはHDDよりも価格は高くなりますが、データの読み込みが高速なので快適です。
二次元が得意なモデル
各モデルの横の()の数字は、ダウンロードサイトのlikeの数です。
likeが多ければ人気のモデルということですね!
自動更新ではないので参考程度にみてください。
Waifu Diffusion
Waifu Diffusionは、二次元絵が得意なモデルです。
https://huggingface.co/hakurei/waifu-diffusion-v1-4/tree/main
Hentai Diffusion
Hentai Diffusionは、二次元絵が得意なモデルです。Waifu Diffusionをもとに作成されました。今は非公開になっているようです。
OrangeMixs(1.96k)
OrangeMixsは、下記の複数のマージモデルをパッケージ化したモデル集です。
それぞれに個性があります。
- マージモデル集
- CreativeML Open RAIL-Mライセンス
Anything v3(340)
Anything v3は、超ハイクオリティな2次元絵が生成できるモデル。v3とv4では絵のテイストが違います。Linaqrufさんが公開しています。
https://huggingface.co/Linaqruf/anything-v3.0/tree/main
Anything v4・Anything v4.5(1.38k)
Anythingは、超ハイクオリティな2次元絵が生成できるモデル。v3とv4では絵のテイストが違います。anditeさんが公開しています。
- CreativeML Open RAIL-Mライセンス
- danbooru ベースのプロンプトに対応
- フルサイズ:5.98GB
Counterfeit-V2.5(786)
Counterfeitは、ハイクオリティな二次元絵が生成できるモデル。特に緻密な背景の描写の美しさには定評があります。
- 二次元絵特化モデル
- 背景のクオリティが秀逸
- NSFW向けバージョンあり
- 似たような女の子がでやすい。
- フルサイズ:5.98GB
https://huggingface.co/gsdf/Counterfeit-V2.5
PastelMix(738)
Pastelmix(パステルミックス)はパステル調のイラスト特化モデルです。anditeさん公開。
ダウンロードするときは、better-vaeバージョンがおすすめです。VAEがマージされているので別途VAEファイルを用意する必要がありません。
- パステル調イラスト特化モデル
- danbooru ベースのプロンプトに対応
- フルサイズ:5.98GB
https://huggingface.co/andite/pastel-mix/tree/main
Trinart Diffusion(277)
日本語小説AI「AIのべりすと」の作者さんが公開しているモデル。二次元絵が得意
https://huggingface.co/naclbit/trinart_stable_diffusion_v2/tree/main
リアル系・写真系が得意なモデル
Stable Diffusion(1.48k)
Stable Diffusionを開発したStability AI社が公開する本家のモデルです。
現時点では2.1が最新のようです。
https://huggingface.co/stabilityai/stable-diffusion-2-1
ChilloutMix(26k)
リアリスティックなアジア系女性の絵が得意なモデル。日本人の方が作成しHugging Faceで公開されていましたが公開終了、その後、civitaiに管理が移管されたようで、civitaiにてダウンロードが可能です。
商用利用はNG、生成した画像をネット上に公開する場合はモデル名の表記が必要です。
- 超ハイクオリティなアジア人女性特化モデル
- 商用利用はNG
- フルサイズ:7.17GB
https://civitai.com/models/6424/chilloutmix
basil mix(672)
- 超ハイクオリティなアジア人女性特化モデル
- 商用利用:?
- danbooru ベースのプロンプトに対応
- 単純なプロンプトの方が良い。大量の品質タグと否定的なプロンプトは、悪影響を及ぼす可能性があります。
- フルサイズ:GB
https://huggingface.co/nuigurumi/basil_mix/tree/main
Cats Musical Diffusion(40)
映画「キャッツ」(2019年)のスクリーンショットのみでトレーニングされた実写系が得意なモデル。
ハリウッド俳優の名前や映画の名前を使うと、あたかもキャッツの登場人物のような猫耳コスプレだらけの世界観の絵を生成してくれます。
実写の猫耳を生成するには、プロンプトの先頭に 「(ctsmscl)」をつけます。使い方にはちょっとクセがあるので詳細は下記の記事で解説しています。
>Cats Musical Diffusionの使い方(記事作成中)
- なんでもキャッツ風の絵にして生成できるモデル
- 2.13GB
https://huggingface.co/dallinmackay/Cats-Musical-diffusion/tree/main
Realism Engine 1.0(328)
高解像度な写真系に特化したモデルです。パブリック ドメインの画像の膨大なコレクションを使用して微調整されているようです。
- 高解像度写真特化モデル
- フルサイズ:2.43GB
loulou-cat-diffusion(17)
“楼楼”という実写の猫に特化したモデル。tilakeさんが公開。
https://huggingface.co/tilake/loulou-cat-diffusion
アート系のモデル
Openjourney(like: 1.71k)
Midjourneyライクなアーティスティックな絵がでやすいモデル。Midjourney公式とは関係ないようです。
Midjourneyは、絵画テイストの絵、フォトリアリスティックな絵が得意な画像生成AIサービスです。私もメインで使っています。(Midjourneyの初心者向けの解説はこちら。)
利用方法は、プロンプトに「mdjrny-v4 style」を含めるとMidjourney風になります。
モデルのインストール方法
モデルファイルはStable Diffusionのインストールフォルダの中の下記に保存します。
モデルを設置してもStable Diffusionに認識されない場合は、
(インストールフォルダ)\stable-diffusion-webui\models\Stable-diffusion\ここにモデルを保存!
画像がモヤモヤする・思ったのと違う時は?(VAEについて)
モデルによっては、VAEの使用を推奨するモデルがあります。
VAEとは、ざっくり説明すると「きれいな画像生成を助けるためのファイル」です。
VAEがない状態で画像生成を行うと、モデルの紹介ページにあるサンプル画像とはちょっと違った雰囲気になることがあります。モヤモヤと靄がかかったようなぼやけた感じです。
このような症状に困ったときは、モデルのディスクリプションを確認し、推奨するVAEファイルが明記されていないか確認し、あればVAEを適用しましょう。
具体的な手順については下記の記事で解説していますので参考になさってください。
VAEが不要なモデルや、VAEを使うことで逆に品質が下がるモデルもあるので必ずモデルのディスクリプションを確認してください。
まとめ
以上、Stable Diffusionのいろいろなモデルを紹介しました。
コメント