【画像生成AI】プロンプトにカメラに関する言葉を使って写実的な画像を生成する。
こんにちは。画像生成AIを楽しんでいるじょじお(@jojio_illust)です。
この記事は、画像生成AIのプロンプトで使用できる写真ライクな絵を出す時に使えるキーワードをピックアップして紹介していきます。
▲画像生成で作成した大量の画像を、プロンプトと一緒に楽しく管理する方法はこちら!
はじめに
この記事はMidjourney(v4)を使って生成した画像を掲載していますが、Stable diffusionなどの他のAIでも使えるものがあるかと思います。
写真:photo
シンプルにphotoと入力すれば写真テイストの画像になりやすいです。
photoをMidjourneyで使った印象
- 写真
画像生成AIで使える写真・カメラの種類
ピンホールカメラ:pinhole camera
pinhole cameraは最も歴史の古いカメラです。
pinhole cameraをMidjourneyで使った印象
- 15世紀頃~
- 古い
- モノクロ
- ボケ
カメラオブスキュラ:camera obscura
camera obscura(カメラオブスキュラ)は、ピンホールカメラの原理を利用した暗室に映像を映し出す装置です。
Midjourneyでは、camera obscuraで撮影したような絵は生成できませんでした。
ダゲレオタイプ:Daguerreotype
Daguerreotype(ダゲレオタイプ)は、1839年に誕生したカメラです。
1839年がカメラ生誕の日と呼ばれるほど、カメラの歴史の中では重要な存在です。
1839年8月19日にフランス学士院で発表された世界初の実用的写真撮影法であり、湿板写真技法が確立するまでの間、最も普及した写真技法
ダゲレオタイプ – Wikipedia
DaguerreotypeをMidjourneyで使った印象
- 1839年~
- モノクロ
- 歴史写真
- 古い
オートクローム:Autochrome
Autochrome(オートクローム)は、世界最古のカラー写真技法です。
autochrmeで使った印象
- 1907年頃~1935年頃
- 全体的にぼけた印象
- 古い・ヴィンテージ
- レトロカラー
コダクローム:Kodachrome
Kodachromeは、世界最古のカラーフィルム写真です。オートクロームが、ガラス乾板を使っていたのに対し、コダクロームはカラーフィルムを使うことを可能にしました。
KodachromeをMidjourneyで使った印象
- 1935年代~
- 古い
35㎜ film
35㎜ filmをMidjourneyで使った印象
- 1936年代~
- 古い
ポラロイドカメラ:Polaroid
Polaroidはポラロイド社が販売するインスタントカメラです。1948年頃に販売開始されたようです。
まわりに余白が出るので、ネガティブプロンプトを使って「–no frame, margins」と記述すると、余白を出力せずにカメラの風合いだけを楽しむことができます(frame:フレーム、margins:余白)。
「taken by polaroid」の「taken」を外すとインスタントカメラそのものが描画されることが多いです。カメラそのものの描写をキャンセルするには「–no camera」も記述しておくと良さそうです。
polaroidをMidjourneyで使った印象
- 1950年頃~
- 周りに白い縁どり
- 全体的に若干のピンボケ
- 古い・レトロカラー
使い捨てカメラ:Disposable camera
Disposable camera(ディスポーザブルガメラ)は、使い捨てカメラのことです。
いわゆる昔の「写ルンです。」で撮影したような昭和な雰囲気の写真の絵になりやすいです。
Disposable cameraをMidjourneyで使った印象
- 1980年頃~
- 全体的に若干のピンボケ
- 古い・レトロカラー
- 素人感の強い何気ない日常の写真・絵になりやすい。
インスタックス・チェキ:instax
Instax(インスタックス)は富士フイルムのインスタントカメラです。日本ではチェキという愛称の方が一般的かもしれません。
InstaxをMidjourneyで使った印象
- 1998年頃~
- 周りに白い縁どり
- 全体的に若干のピンボケ
- 古い・レトロカラー
- Disposable cameraと似ているが、こちらの方がポップでおしゃれな写真になりやすい気がする
ロモグラフィ:Lomography
Lomographyはレトロな風合いの写真が撮れる独特なカメラを販売する有名なカメラメーカーです。ロモグラフィ社のこと。
雰囲気のあるエモい写真が撮れます。
lomographyで使った印象
- レトロカラー
画像生成AIで使えるカメラレンズの種類
魚眼レンズ:Fish-eye lens、Fisheye
Fish-eye lens・fisheyeは魚眼レンズです。
広い範囲を湾曲した形で映します。ドアスコープから覗いた景色(図参照)のような画になります。
Fish-eye lens・fisheyeをMidjourneyで使った印象
- 湾曲した奥行のある構図
- 魚眼レンズ
近距離撮影・マクロレンズ:macro-lens
macro lens(マクロレンズ)は、接写用のレンズです。
虫や植物のディティールの写真に使われます。
macro lensをMidjourneyで使った印象
- 接写・ズームアップ
- 高精細
短焦点レンズ:fixed focal lens
fixed focal lensをMidjourneyで使った印象
- 背景のボケ
望遠レンズ:telephoto lens
telephoto lensをMidjourneyで使った印象
- ズームアップ
- 被写体も背景も全体的にシャープになる
チルトシフトレンズ:Tilt-shift lens・Tilt-shift camera
Tilt-shift lensはチルトシフトレンズを表す英単語です。チルトシフトレンズは、遠近感を操り独特な写真を作成します。
現実のチルトシフトレンズは色々な効果を演出しますが、Midjourneyでは「ミニチュア効果」と「背景のボケ」が強く出ます。
tilt-shift lensをMidjourneyで使った印象
- ミニチュア化
- 背景のぼかし
ワイドアングルレンズ:wide angle lens
wide angle lensは、奥行のあるダイナミックな構図になります。
動きを出したい戦闘シーンなどの写真・イラストの生成の時に使うと迫力のある絵になりやすいのでおすすめです。
wide-angle lensをMidjourneyで使った印象
- 奥行のある構図
- 湾曲した構図
- 広角レンズ
- 俯瞰・ローアングル
ピンぼけ:out of focus、Blur、Bokeh
ボディカメラ:Body camera
ボディカメラは体にマウントしてつけるカメラです。
一般的にボディカメラというと、海外の一部の警察官が防犯のために装備しているカメラのことを指すようです。そして、Midjourneyもそのイメージを強く持っている気がしています。
Body cameraをMidjourneyで使った印象
- ローアングル
- 日常の風景になりやすい。
- 画質はよくない
- シリアスな表情になりやすい
防犯カメラ:CCTV
CCTVとは「Closed-circuit Television:閉回路テレビ」のことです。特定のビルや施設などに整備された防犯カメラシステムを指すようです。
Midjourneyで使うとカメラそのものが映り込む傾向が強いので、防犯カメラ映像を出力したいときはネガティブプロンプト「–no camera」を使うと良さそうです。
CCTVをMidjourneyで使った印象
- 白黒・レトロカラー
- 低画質
- ノイズ・noisy
- ハイアングル
二重露出・多重露出:Double exposure・multiple exposure
Double exposureは二重露出を指す英単語です。
二重露光とは写真の技術のひとつで、異なる2枚の写真を重ねて1つの写真にすることで、普通の写真撮影ではできない画を作ることができます(二重露光・多重露光とも呼びます)。
Midjourneyではとてもコントロールが難しい言葉ですが、アーティスティックな絵をつくることができるので色々試してみると面白いと思います。
Double exposure・multiple exposureをMidjourneyで使った印象
- 2つの写真を重ねたような絵
- コントロールは難しい
カメラの設定
ここからはカメラの設定値を指定して変化があるかを確認します。
カメラの設定値についてはMidjourneyでは効果がわかりにくいため、Dall-E2で検証を行いました。ここの項で掲載している画像はすべてDall-E2で出力した画像です。
絞り値(Aperture):F値
F値を小さくすると、ピントの合う範囲が狭くなるので背景がぼけやすい。F値を大きくすると、全体的にシャープになる。
焦点距離(Focal length)
mmで表します。
ISO感度
ISO感度を低くするとシャッタースピードが遅くなり、ISO感度を高くするとシャッタースピードが速くなります。
ISO感度を高くすると暗い場所でフラッシュを使わないで撮影することができます。
設定値に渡す数字についての補足
私が知る限り、Midjourneyなどのほとんどの画像生成AIは、数字を画像として生成することはできるものの数字の概念は理解していません。1の次が2ということもわからないし、1より10が大きいという概念がないのです。
このため、例えば「ISO感度100で生成した画像が微妙だったから101にしてみよ!」と思ってプロンプトの値を101に修正しても、望んだ結果にならない可能性があります。
なぜなら多くのデジカメのISO感度は、予め指定できる数値が決まっていて100の次は200であることが多く、AIのトレーニングデータにISO感度101の写真はおそらく少ないだろうということが想像できるからです。(100、125、160という風に設定できるカメラもあるようですが1ずつ調整できるカメラは少ないと思います。)
こういった理由で、プロンプトに使用する数字は、実際の写真撮影で一般的によく使用される数値を使うのがいいのではないかなぁと思っています。
例:ISO感度の場合は倍数が多いです。100(デフォルト)、200、400、800・・・。
写真系画像のクオリティを上げるための言葉
画像生成AIにはクオリティを上げるためによく使わる言葉があります。
- 4k, 8k, 16k
- HDR
- hyper detailed
- ・・・etc
これらの言葉を使うことで、ディティールの書き込みが増えたり、全体的にリアルな仕上がりになったりすることがあります。
これらのワードについて下記の記事にまとめていますので、あわせてご覧ください。
まとめ
以上、カメラ・写真に関する言葉について紹介しました。
このブログで紹介しているMidjourneyは写実的な画像生成が得意です。皆さんもぜひ試してみてくださいね。
▲プロンプトまとめ記事
コメント