画像生成AI「Midjourney」に、同じ顔のキャラクターを生成できる新機能 Character Reference(略して cref)と、画風を統一できる Style Reference(略して sref)が追加されました。
この記事では、この2つの新機能の概要と使い方を初心者向けにわかりやすく解説します。
- 1 2つのカンタンな使い方と特徴
- 2 結論、これがよさそう!プロンプト2選
- 3 プロンプトを比較
- 3.1 sw100
- 3.2 sw1000
- 3.3 cw0
- 3.4 cw10
- 3.5 cw25
- 3.6 cw50
- 3.7 cw100
- 3.8 sw1 + cw10
- 3.9 sw25 + cw10
- 3.10 sw50 + cw10
- 3.11 sw75 + cw10
- 3.12 sw100 + cw10
- 3.13 sw500 + cw10
- 3.14 sw1000 + cw10
- 3.15 sw1000 + cw100
- 3.16 sw1000 + cw25 + stylize25
- 3.17 sw1000 + cw25 + stylize250
- 3.18 sw1000 + cw25 + stylize1000
- 3.19 sw100 + cw10 + stylize25
- 3.20 sw100 + cw10 + stylize250
- 3.21 sw100 + cw10 + stylize1000
- 4 使ってみたまとめと注意点
2つのカンタンな使い方と特徴
crefのほうが人物固定に特化した機能です。ただ、crefだけだと変な画像になりがちなので、後ほど具体的なプロンプトの作り方は解説します。
sref(Style Reference)って?
- 参考画像を指定して、そのスタイルや雰囲気を反映できる(顔以外にも重点を置く)
- 最大3枚までの画像を参照し、個別に比重調整も可能
- 統一感のある画風のイラストを連続生成するのに最適
- sref(Style Reference)の使い方
- 手順1:参考にしたい画像を用意し、URLをコピー
手順2:プロンプトの末尾に以下の書式で sref オプションを追記
/imagine prompt:<プロンプト> --sref <画像URL1>
応用1:必要に応じて各画像の比重を ::数値 で調整 (例:–sref image1::1 image2::2)
応用2:sref 全体の効果を –sw 数値 で設定 (0~1000、デフォルト100)
/imagine prompt:<プロンプト> --sref <画像URL1>::7 <画像URL2>::3 --sw 1000
cref(Character Reference)って?
- 一度生成したキャラクターの顔を固定して再利用できる
- 服装や表情、ポーズを変えつつ、同一人物を描ける
- キャラクターの一貫性を保ちつつ、様々なバリエーションを生成可能
- cref(Character Reference)の使い方
- 手順1:参考にしたい画像を用意し、URLをコピー
手順2:プロンプトの末尾に以下の書式で sref オプションを追記
/imagine prompt:<プロンプト> --cref <画像URL1>
応用1:必要に応じてキャラクターの特徴の反映度を –cw 数値 で調整(0~100、デフォルト100、0だと顔だけ固定、100だと顔以外に服装なども固定)
/imagine prompt:<プロンプト> --cref <画像URL1> --cw 0
sref(Style Reference)だけだと顔固定の精度が微妙
色んな記事を見ているとsrefだけ使う方法が紹介されていますが、srefだけだとまともに顔が固定されません。
今回使う画像はこれ(Midjournyで生成した画像です)
(URL使ってもOKですよ)→ https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png
それでは、以下のコマンドをコピーしてそのまま貼り付けてください。(別の画像で試したい方は、画像のURLは書き換えてください)
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 1000
そして生成された画像はこれ↓
なぜか男性が生成されたり、女性も顔が違いますね。
そこで、crefなど他のパラメータを使いながら色々検証していきます。
結論、これがよさそう!プロンプト2選
先に結論を書いておきます。どんな画像を作りたいか?の需要に合わせて2パターン用意しています。
元の画像の雰囲気をある程度保ちたい場合
画像のクオリティはある程度一定だけど、顔の一致度は結構ガチャ。あとプロンプトの効果は少し薄まる。
/imagine prompt:<プロンプト> --sref <画像URL> --sw 100 --cref <画像URL> --cw 10 --stylize 250
プロンプトに重きをおきたい場合
結構ガチャ要素が高く、いい画像は1割以下。でもたまにめっちゃいい画像が生成される。
うまくいかない場合は、–cwを10~30程度上下してみるとよさそう。
/imagine prompt:<プロンプト> --cref <画像URL> --cw 10
プロンプトを比較
以下にまとめる10倍くらい色んなパラメータを試したけど、違いが分かりやすいものだけリストアップしました。
sw100
全然ちがう…
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 100
sw1000
ちょっと近くなるけどまだ制度は低い
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 1000
cw0
イラスト調になる…
/imagine prompt:red T-shirt --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 0
cw10
かなり良い?プロンプトの反映度や顔の一致度、画像としてのクオリティもよさそう
/imagine prompt:red T-shirt --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10
cw25
ちょっと顔が変わる
/imagine prompt:red T-shirt --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 25
cw50
変になってきた
/imagine prompt:red T-shirt --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 50
cw100
プロンプトが反映されなくなった
/imagine prompt:red T-shirt --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 100
sw1 + cw10
変…
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 1 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10
sw25 + cw10
顔が違う?
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 25 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10
sw50 + cw10
変な画像が多い
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 50 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10
sw75 + cw10
ちょっといい感じ
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 75 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10
sw100 + cw10
顔がやっぱり違う?
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 100 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10
sw500 + cw10
画像の質が微妙?
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 500 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10
sw1000 + cw10
顔の一致度はいいかんじかも、でもちょっとクリアさがない
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 1000 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10
sw1000 + cw100
ちょっと変
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 1000 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 100
sw1000 + cw25 + stylize25
やっぱりぼやけてる
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 1000 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 25 --stylize 25
sw1000 + cw25 + stylize250
ちょっと違う
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 1000 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 25 --stylize 250
sw1000 + cw25 + stylize1000
惜しい気がする
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 1000 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 25 --stylize 1000
sw100 + cw10 + stylize25
プロンプトは反映されてる!
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 100 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10 --stylize 25
sw100 + cw10 + stylize250
画像がクリアだし、プロンプトも反映されてる!顔の一致度も可能性感じる。(ガチャでいけそう)
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 100 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10 --stylize 250
sw100 + cw10 + stylize1000
ちょっと画像のテイストがかわりすぎ?顔も違う
/imagine prompt:red T-shirt --sref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --sw 100 --cref https://ai-island-media.com/wp-content/uploads/2024/03/mid-pic1.png --cw 10 --stylize 1000
使ってみたまとめと注意点
以下ほぼ全パターンを検証した結果、思ったことです。
- まだ完璧には固定できない
- crefはcwの微調整が大事
- srefを使うと画像がぼやけやすい
- stylizeで画像がクリアになるけど、やりすぎると独創的な画像になっていく
- 顔の一致と画像のクオリティとプロンプトの反映度のバランスをとる意識が大事
さらに、Midjourney以外で生成された画像を参照して同じような人物を生成するのは苦手みたいです。雰囲気は似たような感じになりますが、ちょっと違うなーと感じる部分が大きいです。