ブログ
これまでに経験してきたプロジェクトで気になる技術の情報を紹介していきます。
生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ⑤
◆HPで使用する画像の生成 その①
前回では StableDiffusion の基本的な画像生成の手順について説明を行いました。
今回からは、ようやくHPで使用する画像の生成に入ります。
ここではHPで使用する画像の1、2枚目を生成していきます。
最終的にはメインビジュアル3枚と関連作品4枚で合計7枚生成します。
◆(1枚目)飛鳥時代をイメージしたアニメ
株式会社あすかで・・・という事情もあるので、最初は飛鳥時代っぽいアニメ画像を生成していきます。
1. 作りたい画像のイメージ決め
最初に作りたい画像のイメージを決めます。
具体的には下のような画像をイメージしてみます。
引用元:https://kids.shueisha.co.jp/nihonshi/
2. Checkpoint の設定
サンプルとして、デフォルトの Checkpoint となる「realisticVisionV51_v51VAE(SD 1.5)」で設定しておきます。
先に言っておくと、この Checkpoint はアニメ風ではなく実写に強いモノとなります。
後々にアニメに強い Checkpoint で作り直しますので、その辺りはご理解よろしくお願いします。
3. Prompt の設定
手順1.で選んだイメージになるように Prompt を設定します。
今回のイメージを生成したい場合は、下記のような Prompt になると思います。
※この Prompt に辿り着くまでに、それなりに タグの設定>画像生成>結果確認>タグの修正・・・の試行錯誤を結構繰り返しています(汗)
◆Prompt
best quality, masterpiece, shrine maiden, one person, black hair, pray, (folded hands:1.2), shrine maiden costume, comma-shaped jewels, looking down, cowboy shot, from below, shrine of Japan, autumn leaves, anime, anime screencap
【各タグの内容】
設定項目 | タグ内容 | Tag |
---|---|---|
品質 | 最高品質 | best quality |
品質 | 傑作 | masterpiece |
対象 | 巫女 | shrine maiden |
対象 | 一人 | one person |
対象 | 黒髪 | black hair |
ポーズ | 祈る | pray |
ポーズ | 手を合わせ、指を絡める | Folded hands |
衣装 | 巫女装束 | shrine maiden costume |
衣装 | 勾玉 | comma-shaped jewels |
構図 | 見下ろす | looking down |
構図 | 太ももから上 | cowboy shot |
構図 | ローアングル | from below |
背景 | 日本の神社 | shrine of Japan |
背景 | 紅葉 | autumn leaves |
絵柄 | アニメ | anime |
絵柄 | アニメ塗り | anime screencap |
ここで注目してほしいのが「(folded hands:1.2)」というタグの書き方です。
この書式で記載すると、AIはこの「folded hands」のタグを他のタグより1.2倍強調して認識します。
指定の仕方は簡単で、タグをダブルクリックして選択状態にし、「Ctrl+↑」で強調、「Ctrl+↓」で弱調となります。
複数回すれば、更に数値を調整することも出来ます。
このタグを強調した理由は、単純にAIが合掌ポーズのイラストをなかなか生成してくれなかったからです。
そのため、合掌ポーズになる確率を少しでも上げるために設定しています。
ちなみに強調を何も指定しない場合は、基本的に記載順(この場合左側から)で強いタグと判断されるそうです。
◆Negative Prompt
SD 1.5 系の Checkpoint の場合
EasyNegativeV2, negative_hand-neg
SDXL 1.0 系の Checkpoint の場合
negativeXL_D
【各タグの内容】
タグ内容 | Tag |
---|---|
品質低下防止(SD 1.5) | EasyNegativeV2 |
変な手防止(SD 1.5) | negative_hand-neg |
品質低下防止(SDXL 1.0) | negativeXL_D |
こちらはややこしい設定を「EasyNegativeV2」で省略しています。
もう一つ設定している「negative_hand-neg」は「EasyNegative」と同様のテキスト反転モデルの1つで、変な手の出力を抑制するモノです。
取得の方法は以前(生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ③)に紹介した EasyNegative と同じです。
なお、フォーマットが SDXL 1.0 の Checkpoint については「negativeXL_D」のみの設定となります。
4. 画像の生成
下が生成した画像となります。
※HPに使う前提なので、横幅(Width)を倍の1024にしています。
Checkpoint:realisticVisionV51_v51VAE(SD 1.5)
ただ、これだとアニメ調ではないのでアニメ制作会社のHPとして使うには不十分です。
なので Checkpoint をアニメ調の画像を出力するモノに変えて再出力します。
併せて Prompt を変えずに複数の Checkpoint で画像を生成してみます。
Checkpoint を変えると絵柄がこんなに変わるのか・・・といった参考になればと思います。
下が Checkpoint を変えて生成した画像となります。
Checkpoint:westernAnimation_v1(SD 1.5)
Checkpoint:kuronekoAnimemixV10_v10(SD 1.5)
Checkpoint:aniflatmixAnimeFlatColorStyle_v20(SD 1.5)
Checkpoint:Amalgam_Anime_XX(SD 1.5)
Checkpoint:aamXLAnimeMix_v10(SDXL 1.0)
Checkpoint:animaPencilXL_v400(SDXL 1.0)
一旦、1枚目の画像は Checkpoint「animaPencilXL_v400」で生成した画像を採用とします。
続いて2枚目の画像の生成していきます。
◆(2枚目)どっかで見た軽音学部をイメージしたアニメ
2枚目は実際にある作品を参考にて画像を生成していきます。
理由は実務をしていると「~を参考にして欲しい」といった要望を受ける事が多々あるからです。
今回はアニメ「けいおん!」を参考にしてみます。
1. 作りたい画像のイメージ決め
具体的には下のような画像をイメージしてみます。
引用元:https://www.kyotoanimation.co.jp/works/k-on/
2. Checkpoint の設定
今回使用する Checkpoint は「Amalgam_Anime_XX(SD 1.5)」となります。
いつくかの Checkpoint を試した結果、より「けいおん!」に近い画像が生成されたのが理由です。
3. Prompt の設定
◆Prompt
best quality, masterpiece, k-on!, 4 girls, cowboy shot, looking up, band, (keyboard_(instrument):1.2), drumming, (guitar:0.8), concert, school uniform , inside a school building, anime, anime screencap
【各タグの内容】
設定項目 | タグ内容 | Tag |
---|---|---|
品質 | 最高品質 | best quality |
品質 | 傑作 | masterpiece |
作品 | けいおん! | k-on! |
対象 | 女性4人 | 4 girls |
構図 | 太ももから上 | cowboy shot |
構図 | 見上げる | looking up |
対象 | バンド | band |
対象 | 鍵盤楽器 | keyboard_(instrument) |
対象 | ドラマー | drumming |
対象 | ギタリスト | guitar |
状況 | 演奏 | concert |
対象 | 学生服 | school uniform |
背景 | 校舎内 | inside a school building |
絵柄 | アニメ | anime |
絵柄 | アニメ塗り | anime screencap |
特定の作品を参考にさせるには、Prompt にその作品のタグを入れる形になります。
今回はアニメ「けいおん!」を参考にさせるために「k-on!」というタグを入れています。
◆Negative Prompt
こちらは1枚目と同じとなるので省略します。
特に出力したくない内容が出力されない限り、基本的には1枚目と同じです。
4. 画像の生成
下が生成した画像となります。
Amalgam_Anime_XX(SD 1.5)
正直、かなりの枚数を生成したのですが、ギターばかりが出力されてキーボードがなかなか出てくれませんでした。
タグの強弱でギターを弱めて、キーボードを強調したのですが、それでも尚・・・です。
なのでキーボード(っぽいもの)が出で、メンバー構成がイメージに近い構成になった1枚目を採用とします。
以上で HP「もし、株式会社あすかが「アニメ制作会社」だったら」に使用する画像の1、2枚目の画像生成は終了となります。
次回は引き続き HP に使用する画像の3枚目以降の画像を生成をしていきます。
引き続き、よろしくお願いします。
初回:生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ①
前回:生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ④
次回:生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ⑥
コメントはありません。