みなさんの頭の中もこんなふうになっていませんか?
この記事に辿り着いたからにはもう大丈夫です!
生成AIを使ったサービス開発をしている私が、PCスペックに左右されず、IT知識が0の人でもStable Diffusionを使えるように画像つきで解説します。
あなたは、この記事の真似だけしておけば、簡単に質の高い画像を作ることができるようになれるので、そんなに身構えずにお菓子でも食べながら読んでください!笑
【スピード重視】画像の質にこだわらず早く画像生成したい方
Stable Diffusionを最短で試せるサイトを3つご紹介します。
とりあえず流行りのStable Diffusion使って画像生成してみたいという方はぜひ!
- Stable Diffusion Online
- Hugging Face
- Mage.space
Stable Diffusion Online
このサイトは完全無料・登録不要で利用できるブラウザ版のstable diffusionです。
「Get Started for Free」をクリックすると、下のような画面に遷移するので、「cat on the table」のように生成したい画像のイメージを英語で入力し、Generate imageをクリックすると10秒ほどでプロンプト通りの画像が生成されます。
※gifではローディング時間をカットしています。
モデルや細かい設定ができないので、もっとクオリティの高い画像を生成したい場合は、「【クオリティ重視】画像の質にこだわりたい方」を試してみてください。
注1. プロンプトとは | よく「呪文」と言われたりしていますが、自分が生成したい画像に関するキーワードのことです。 テーブルの上に猫がいる画像を生成したい場合は、「cat on the table」みたいなイメージです。 |
注2. ネガティブプロンプトとは | 画像から排除したい要素のことです。 例えば、「lowres」と入れておくと解像度の低い画像が生成されにくくなります。 |
Hugging Face
このサイトも完全無料・登録不要でstable diffusionをwebで利用できるサービスです。
Stabel Diffusion Onlineとの違いは、ネガティブプロンプトを入力できることです。
「lowres」を排除する=「高画質」になるってこと!
Mage.space
mage.spaceはStable Diffusion v1.5を完全無料・登録不要で利用することができます。
画像の質は低めですが、その分生成速度がはやいです。
【クオリティ重視】画像の質にこだわりたい方
Stable Diffusionを使うにはWindowsが必要という記事も目にしますが、結論Macからも利用できます。
Stable Diffusionはアプリが存在するわけではないので、Googleのサービスを利用してファイルを読み込み立ち上げる必要があります。
「え、なんか難しそう…」って思いましたか?
安心してください。非常に簡単なので、5つのステップに分けて丁寧に解説していきます。
Step1. モデルのダウンロード
まずはsd-1click-colabからモデルのダウンロードを行います。
今回使用するモデルは、majicMIX realisticというリアルな人物画像を生成できるモデルになります。
まず「Code」ボタンをクリックしてください。
次に「Download Zip」をクリックしてダウンロードします。
ダウンロードできたらzipを開いておいてください。
モデルとは? | アニメやリアル写真に特化したモデルなどたくさんの種類があり、使うモデルによって生成される画像が異なります。 |
Step2. Google Colaboratoryにアクセス
Google Colaboratoryにアクセスしてください。
※Googleのアカウントが必要になるのでまだアカウントがない場合はGoogleアカウントの作成から行いましょう。
Step3. 1でダウンロードしたモデルをGoogleコラボにアップロード
Google Colaboratoryにアクセスするとこのような画面が出てくるので、以下の手順を実行してください。
左上の「ファイル」をクリック。
②の「ノートブックをアップロード」をクリック。
すると、このような画面が出てくるかと思いますので、ここに先ほどダウンロードしたフォルダの中にある①「majicmixrealistic.ipynb」をドラッグ&ドロップで②にアップロードします。
アニメ画像を生成したい方はこのモデルを選択してください。
Step4. プログラムの実行
さあ、もう完成が見えてきましたよ!
ステップ3がうまくいっていると、こんな画面になるかと思います。
うまくいっていたら左上の再生マークボタンをクリックしてください。(立ち上がるのに10分ほどかかるので、ゆっくり待ちます。)
無事実行が終わると、Running on public URLが表示されるので、このURLをクリックしてください。
※実行が終わっても再生ボタンはクルクル回ったままなので、焦らなくて大丈夫です。スクロールしてURLが表示されているか確認しましょう。
Step5. 表示されたURLにアクセス
URLにアクセスするとこのような画面が出てくるので、赤枠で囲った部分にプロンプトを入れて「generate」ボタンを実行すれば画像が生成されます。
【利用したプロンプト】
best quality, masterpiece, (photorealistic:1.4), 1girl, close up
【利用したネガティブプロンプト】
nsfw, ng_deepnegative_v1_75t,badhandv4, (worst quality:2), (low quality:2), (normal quality:2), lowres,watermark, monochrome
【その他の設定】
Sampling method |
Euler |
Sampling steps | 30 |
Hires. fix | あり |
CFG scale | 7.0 |
リアルなイケメン男性(部屋)
【利用したプロンプト】
1boy, tough guy, silver hair, waist up, <lora:lowra_v10:0.5>, white shirt, room
【利用したネガティブプロンプト】
nsfw, ng_deepnegative_v1_75t,badhandv4, (worst quality:2), (low quality:2), (normal quality:2), lowres,watermark, monochrome
【その他の設定】
Sampling method | Euler |
Sampling steps | 30 |
Hires. fix | あり |
CFG scale | 6.5 |
リアルな浴衣女性(紫陽花)
【利用したプロンプト】
1girl, (kimono), updo, summer, cinematic, kanzashi, kamakura \(city\), hydrangea, looking at another, feminine gesture, smile, portrait, vivid,
masterpiece, top quality, best quality, official art, unity 8k wallpaper, highres, ultra-high res, ultra-detailed, beautiful and aesthetic, perfect detailed face, detailed eyes, highly detailed,
【利用したネガティブプロンプト】
ng_deepnegative_v1_75t, badhandv4, (worst quality:2), (low quality:2), (normal quality:2), lowres, watermark, monochrome, paintings, sketches, text, jpeg artifacts,
【その他の設定】
Sampling method | DPM++ SDE Karras |
Sampling steps | 30 |
Hires. fix | あり |
CFG scale | 6.5 |
アニメ画像を生成する方の設定
まずVAEの設定を変更するする必要があります。
「Setting」→「Stable Diffusion」→「SD VAE」→「anythingv4.5.vae.pt」
【利用したプロンプト】
masterpiece, ((ultra detailed background, delicate pattern, intricate detail)), (highly detailed, fine details), best quality, beautiful lighting, (portrait), Rebecca, 1girl, solo, braid, pink hair, long hair, ((slim girl, medium breasts, cowboy shot)), smile, yellow dress, fluffy dress, brown eyes, complex detailed background, sunflowers, field, outside, nature environment, blue sky, sky, tree, from behind, <lora:RebeccaEight:0.8>
【利用したネガティブプロンプト】
(worst quality:2.0), (low quality:2.0), (blurry:2.0), (deformed fingers:1.2), (long fingers:1.2), (interlocked fingers:1.2), watermark, signature, logo, username, low resolution, artifacts, jpeg artifacts, blurry, worst quality, low quality, normal quality, duplicate, text, error, digit, cropped, blurry, (((monochrome))), censored, black bars, sketch, drawing, un-detailed, malformed limbs, fused fingers, ugly fingers, ugly eyes, ugly mouth, big hands, long neck, cross-eyed, mutated hands, mutation, deformed, poorly drawn hands, poorly drawn face, extra limbs, extra arms, extra legs, extra fingers, extra digits, fewer fingers, fewer digits, too many fingers, bad anatomy, (((((bad hands))))), ((bad eyes)), bad legs, bad feet, bad body, bad proportions, gross proportions, missing fingers, missing arms, missing legs, multiple limbs, multiple fingers, ((poorly drawn face)), ((bad face)), (poorly drawn hands), (extra limbs:1.4), (((loli))), (((big ass))), painting, sketch, (normal quality:2), (simple background), lowres, normal quality, ((huge breasts, visible nipples, simple background, NSFW)), EasyNegative
【その他の設定】
Sampling method | Euler a |
Sampling steps | 50 |
Hires. fix | あり |
アニメ風の制服を着た少女(夜景背景)
【利用したプロンプト】
(8k, best quality, masterpiece:1.2), (finely detailed),anime coloring,kurumu,official style, 1girl, blue hair, purple eyes, cityscape,solo,looking at viewer,upper body, yellow sweater vest, white shirt, ((red bow:1.2)), (green plaid skirt),smile,waving,hand on hip,purple headdress, star \(symbol\),long sleeves,ponytail,short hair, city, (purple ribbon:1.1)
【利用したネガティブプロンプト】
bad-hands-5, (worst quality:2), (low quality:2),EasyNegative,lowres, ((realistic, 3d,brown belt,monochrome,bad eyes,bad hands,underwear:1.2,panties:1.2)), ((grayscale))
【その他の設定】
Sampling method |
DPM++ 2M Karras |
Sampling steps | 30 |
Hires. fix | あり |
CFG scale | 7.5 |
アニメ風の制服を着た少女(桜背景)
【利用したプロンプト】
kamisato ayaka, 1girl, skirt, school uniform, solo, serafuku, bag, holding, pleated skirt, smile, ponytail, blue eyes, long hair, cherry blossoms, blue skirt, sailor collar, shirt, long sleeves, looking at viewer, outdoors, school bag, sky, holding drink, bangs, white shirt, cup, thighs, holding cup, white hair, bow, drinking straw, blue sky, mole, neckerchief, mole under eye, blush, sidelocks, blunt bangs, white sailor collar, drink, tree, hair ribbon, ribbon, hair bow, ice, alternate costume, closed mouth, breasts, cowboy shot, petals, day, tress ribbon, cloud, blue bow, falling petals, wind, midriff peek, vision (genshin impact), ice cube, blue neckerchief, medium breasts, (masterpiece,best quality)
【利用したネガティブプロンプト】
EasyNegative
【その他の設定】
Sampling method |
UniPC
|
Sampling steps | 20 |
Hires. fix | あり |
CFG scale | 7 |
基本的な設定は以上ですが、よりクオリティの高い画像を生成するために、プロンプトや細かい設定の理解が必要となってきます。
なので、ここまでの設定が終わったら、次の「Stable Diffusionの用語説明」を読み、細かい設定を行えるようにしていきましょう。
Stable Diffusionの用語説明と使い方
プロンプトの下にあるいろんな設定を見て、混乱した方もいるかと思います。
ひとまず、この表に書いてある語句を理解しておけば問題ないです。
用語説明
名前 | 内容 |
---|---|
プロンプト | よく「呪文」と言われたりしていますが、自分が生成したい画像に関するキーワードのことです。 テーブルの上に猫がいる画像を生成したい場合は、「cat on the table」みたいなイメージです。 |
ネガティブプロンプト | 画像から排除したい要素のことです。 例えば、「lowres」と入れておくと解像度の低い画像が生成されにくくなります。 |
Sampling method | ノイズを消去する作業のことを「サンプリング」といい、サンプリングをどう進めていくかを定めるアルゴリズム |
Sampling steps | Stable Diffusionはノイズだらけの画像からノイズを除去していくことで絵を描いています。Sampling stepの回数だけノイズを引き算していって、残ったものが絵になるイメージ。 |
Width,Height | 生成する画像のサイズです。デフォルトの512×512 |
CFG Scale | 入力されたプロンプトに対してどれくらい忠実に画像を生成するかの数値です。デフォルトの7.0前後が推奨されています。 |
Batch count,Batch size | バッチカウントはそのプロンプトで何回画像を生成するか、バッチサイズは何枚作るかです。同じプロンプトで一気に何枚も画像を作りたい方はバッチサイズを増やすことで何枚も作れます。 |
Seed | シード値のことで、-1に設定すると毎回ランダムに画像が生成されます。生成がうまくいったときはそのシード値を固定することで同じような構図を再現できます。 |
ControlNet | 同じ顔や服装、ポーズを指定する時に使うもの。 |
VAE | 画像の彩度をあげて色を鮮やかにしたりできる。モデルによって適切なVAEがある。 |