【誰でも簡単】AIで画像を動画化。原稿を読ませてみました！（リップシンク）

2023 5/03

2023年4月19日 2023年5月3日

こんにちは、画像生成AIのプロンプトを研究しているじょじお（＠jojio‗illust）です。

この記事ではAI画像を好きなテキストやレコード済み音声をしゃべらせることができるサービスを紹介します。

Stable Diffusion向け

あわせて読みたい

【Eagle】画像生成AIの大量の画像を管理するベストな方法大流行中の画像生成AI楽しいですよね。しかし、楽しみながら作成したAI画像が増え続けて、整理に頭を悩ませていませんか？今回の記事では、そんな課題を解決するコン…

▲AI画像の大量ファイルをプロンプトと一緒に簡単に整理する方法はこちら。

無料のプロンプトガイド

Stable Diffusionのプロンプトエンジニアリングの基本について理解したい方には、初心者向けのプロンプトガイドを作りましたのでそちらを見てください！

プロンプトガイド

【初心者向け】Stable Diffusionのプロンプトガイド！！！こんにちは、画像生成AIでひたすら猫のイラストを生成しているじょじお（＠jojio‗illust）です。超初心者向けのStable Diffusionのプロンプトガイドを作りました。こ…

AI画像に原稿を読ませる方法

AI画像に文章をしゃべらせた動画

こんにちは。
写真やイラストにテキストを読んでもらうサービスを紹介します。

紹介するサービスの名前は、Creative Reality™ Studioです。

このサービスは、AIのテクノロジーを使って、1枚の静止画を、文章を喋る動画にしてくれるサービスです。

じょじお

上の動画は、実際に私が作った動画です。
表情や口元の動きが滑らかでリアルじゃないでしょうか。

新人ブロガー

どうでもいいけどマグロバスターってなに？

じょじお

台本はChatGPTに考えてもらいました♪

あわせて読みたい

ChatGPTでできること・できないことこんにちは、画像生成AIでひたすら猫のイラストを生成しているブロガーのじょじお（＠jojio‗illust）です。「できること」や「できないこと」や「活用事例」をまとめま…

Creative Reality Studioとは？

Creative Reality Studioは、D-ID社というイスラエスの会社が運営するサービスです。

一枚の静止画を用意するだけで、原稿をとても流暢に読んでくれます。

Creative Reality™ Studioとは？

画像を渡すと動画にしてくれるサービス。
できることは、「原稿を読ませる」か「音声ファイルに合わせて口パク」の２つ
写真やイラストやAI画像が使える。
写真の眼や口を、AIが自動で認識して、滑らかに動かしてくれる。
基本有料だけど、無料で数クレジットあそべる。

じょじお

無料ユーザーでも、数クレジットだけお試しで使うことができるよ。

Creative Reality Studioを使うためのステップ

じょじお

Creative Reality Studioは、下記の４つのステップだけで簡単に動画をつくれます。
5分あれば1本の動画をつくることができるでしょう。

Creative Reality™ Studioを使うためのステップ

Creative Reality Studioにサインイン
画像のアップロード
原稿（テキスト）の設定
生成ボタンをクリック

Creative Reality Studioの使い方解説

じょじお

実際に使ってみます！

⓪サインイン

Creative Reality™ Studioにアクセスします。下記のURLからジャンプできます。

https://studio.d-id.com/editor

▲動画生成にはサインインが必要です。アカウントを作りましょう。Googleなどのアカウント連携ができます。

①画像素材の追加

▲自分のアカウントでログインしたら左側メニューのCreate Videoをクリックします。

▲画面真ん中に画像素材の一覧があります。既存の素材をいくつか利用できます。

自前の画像を使う場合は、素材の左上にある「＋Add」ボタンをクリックします。

ファイルダイアログが開くので、画像をアップロードしましょう。

画像アップロードができない。エラーが出る場合

エラーが出る場合。

▲画像によってはエラーが出てアップロードに失敗することがあります。

アップロード時に、喋らせることができるかどうかのチェックを行っているようで、喋らせることができない画像はアップロードできないようです。

失敗する画像の例としては、下記のようなものがあります。

人じゃないキャラクター・動物キャラ・擬人化キャラ
デフォルメされたキャラクターの画像
全身が写っていて、顔が小さい画像

成功しやすい画像は下記のような例があります。

シンプルな構図
キャラクターが正面を向いている
人間のキャラクター
ポートレイトスタイル（胸から上が大き目に映っている画像）

上記を満たしいてれば実写スタイルじゃない、アニメスタイルの画像でも画像でもアップロード可能です。

②原稿の設定（喋る文章とボイス設定）

▲画像のアップロードをしたら、原稿の設定です。右側のペインで行います。

▲原稿の設定を行います。

AIに喋らせる内容のテキスト（文字数が多くなるほどクレジットを多く消費します。）
各種ボタンです。
- 左：音声再生ボタン
- 中：ブレークの挿入（文中に挿入すると数秒ポーズします。原稿の合間に間を置きたい場合に使える）
- 右：AIで文章の続きを書けます。
言語設定：日本語や英語などかなり多様な言語に対応しています。
ボイス設定：男性や女性などのボイスを設定します。言語によって選べるボイスの数が違います。英語（米）が一番多いです。
ボイススタイル設定：読み手の感情の込め方・読み方を設定します。ボイスによって対応していないものがあります。

③動画生成実行

▲画像と原稿を設定をしたら右上の「Create Video」をクリックします。

▲消費クレジットと推定動画時間が表示されます。問題なければ「Generate」をクリックします。

Creative Reality Studioで作成した動画の紹介

日本語をしゃべらせてみた（イラストスタイル）

2chの有名コピペをAI画像に喋らせてみた。 #声に出して読みたい日本語 #AIイラスト好きさんと繋がりたい #Nijijourney #Midjourney pic.twitter.com/CXPpZqmSfl
— じょじお_AI（猫大好きおじさん）‗NFP公式アンバサダー (@jojio_illust) April 18, 2023