Chasing Shadows

じゃあ昨日の彼女

29 years old female Japanese IT Professional in a plain beige T shirt with short brown hair at a coffee shop, high quality, pink lips
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 870d7132aa, Model: agelesnate_v3, Version: v1.7.0

…のモデルをRealistic Visionに替えてやれば、写真みたいなイメージになるんじゃないの?とおもい、とうぜんやってみた。

29 years old female Japanese IT Professional in a plain beige T shirt with short brown hair at a coffee shop, high quality, pink lips
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

プロンプトで書かれていることは再現されてるんだけど、もうちょっともとのイメージに近い絵柄にできないものか。

それで、プロンプトをいじってみました。ほんとうは試行錯誤しながらやったのですが、わかりやすくするために、最終形(?)に至るまで、少しずつことばを足して途中経過をみていきましょう。

まずは”beautiful”。なにをもって美しい顔とするのかはひとそれぞれでしょうが、これがAIが考える”beautiful”みたいです。

29 years old beautiful female Japanese IT Professional in a plain beige T shirt with short brown hair at a coffee shop, high quality, pink lips
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

つぎは”full body”を加えて全身を写すようにする。

29 years old beautiful female Japanese IT Professional in a plain beige T shirt with short brown hair at a coffee shop, high quality, pink lips, full body
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

“holding a cup”で手にカップを持ってもらおう。

29 years old beautiful female Japanese IT Professional in a plain beige T shirt with short brown hair at a coffee shop, high quality, pink lips, full body, holding a cup
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

なんか顔の感じが変わったみたい。それはともかく、カウンターの横に立ってるイメージにしたいので、”along counter”を足してみる。

29 years old beautiful female Japanese IT Professional in a plain beige T shirt with short brown hair at a coffee shop, high quality, pink lips, full body, holding a cup, along counter
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

このTシャツはちゃんとフィットした女性用のものですが、もとのイメージはだぶだぶのTシャツを着ているようなので、”oversized”ということばを足してみよう。

29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with short brown hair at a coffee shop, high quality, pink lips, full body, holding a cup, along counter
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

変わったのかな(笑)。

顔の感じを似させるために、くちびるを”pink tiny lips”として、鼻を”small nose”と表現してみる。

29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with short brown hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

ちょっと目が変(笑)。Tシャツに柄が入ってるし。

明かりをすこし暗めにするために”dim light”を加える。

29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with short brown hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

Tシャツの柄がなくなったのはいいけど、あとは背景の照明が丸くなっただけのような気がします。

この段階で腕が細いのはわかるけど、”thin arms”を足してみる。

29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with short brown hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

ほとんど間違い探しレベルで違いがわかりませんな。

目線を変更するために”looking straight”を足してみます。

29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with short brown hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms, looking straight
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

ここで髪型を”short brown hair”から”light brown short choppy hair”に変えてみたんですが、ほとんど変化はなかった。

29 years old beautiful female 29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with light brown short choppy hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms, looking straight
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

で、最後に「妹属性」を追加するために、”sister”というのを足してみたけど、背景のライトが変わっただけかも。

29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with light brown short choppy hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms, looking straight, sister
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 00445494c8, Model: Realistic_Vision_V5.1, Version: v1.7.0

いちおうこれを最終形とします。もとのイメージとはちょっと違う雰囲気の女性だし、背景もぜんぜん違う。でも、これでいいことにします。なにをいいことにするのかわからんけど。

慣れてきたら、もうちょい自由に画像をあやつることができるんでしょうね。


(付記)Agelesnate V3の出力に似たイメージをRealistic Visionで出力するためにプロンプトを修正してきたわけですが、最終形のプロンプトをもう一度Agelesnate V3で処理させたらどうなるか?やってみました。

29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with light brown short choppy hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms, looking straight, sister
Negative prompt: low quality, big breast
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1757170746, Size: 512×512, Model hash: 870d7132aa, Model: agelesnate_v3, Version: v1.7.0

ちょっとヤバい方向にむかっているような気がします(笑)。

3 thoughts on “Chasing Shadows

  1. 凄い凄い。どれも上手な写真好きが撮った写真に見える。敢えて言えば、女の人のほうれい線が気になるが29歳設定だとこんなもんか。あと、やっぱり手が難しいみたいね。カップは宙に浮くまでいかないが握ってはないかな。小指親指が他の指と同じような長さで処理されて特に親指は他の指と反対側に回り込むことができる構造なのも無視されているから違和感があるのかな。腕の太さよりも要素として肩幅と腕の長さのバランスが崩れると細くしても男の腕みたいに見えるのかも。首もねじった筋肉とそれに伴う軸が表現されていないので顔を貼り付けただけみたいに首から下は別の物体みたいに見えるのかな。とまあ鑑賞中に思ったことをいろいろ書いたが、これだけのものをこんな短時間で生成できるのはやっぱり凄いなあ。
    ここからは全くのウソのでたらめな空想話だが、データ生成にハードウェアの構造が処理時間だけでなくコンテンツ内容に影響すれば面白いのに。つまり、データやプログラムは同じでも処理したハードウェアが違うと結果が違うみたいになれば面白いのに。例えば「ハードウェア内部のトランジスタの配列で分岐するデータの流れが変わりそれが数十億回積み重なることで生成されるデータの結果に大きな違いが現れそれが美人生成に影響するらしい」とか「CPU内部のそれぞれのコアのクロック数が均一でないと美人は生成されない。最初にブートする前にEコアはUEFIからdisable設定しないと女の子はブスばかりになるぞ」とか「トライダル電源トランス搭載しているから生成される女の子がピアな子ばかり」とか「AMDとNVIDIA だと生成される女の子がそもそも違うなあ。やっぱりCUDA系じゃないと美人出にくいなあ。でも見たことないけどROCmってたまに凄い美人が生成されることがあるらしいよ」とか「ASUS とGIGABYTEではグラボとマザーボードの組み合わせで変わるぞ。うちのは両方ASUS だからやっぱりASUSらしい女の子が生成された」とか「女の子生成に影響するのか!これがマザーの違いってやつなのか!」とか「やっぱりグラボにファンダ―ズ エディション版付けたら生成される美人すごいよ」みたいになればPCパーツにプレミアがつき価値が変わりアキバで毎日面白かったのに。ははは。

    Like

    1. 「完成形」はけっこう気に入っているんだけれど、手はともかく、よく見ると両目のバランスがちょっとおかしいようにも思える。全身イメージを出力して顔が小さくなるとそういうことが起こりやすいらしい。”Hires.fix”というのを使うと良くなるとか書いてあったのでやってみたけど、たしかにバランスは良くなるけど、別人の顔になってしまう。まぁ人間の顔って実は左右非対称だからそういうものだ、と思えばいいのかもしれんけど。

      LoRAモデルというのを使って、同一人物を出すようにするというのもあるらしくて、自分でLoRAモデルを作ることができるみたいなのでそれはぜひやりたいのだけれど、いろんなひとの顔が出てくるところがおもしろいというのもある。

      あとそもそもアジア系美女生成に特化したモデルを使うというのもあるが、常に美人がでてくるというのもどうしたものか(そのうちやるとおもうけど。笑)。

      ハードウェアごとに生成されるデータが違うとかいうのは、なんかオーディオの話みたいになるね。一時期真空管アンプを買おうかとおもっていて、しらべたら最近は 中国製のBluetooth対応の真空管アンプがあって、スマホのSpotifyの出力を真空管で増幅して聴けるらしい。便利、だが、なんか根本的に間違ってる気がする。クーラーしながら暖炉を点ける、みたいな。それで真空管熱はいまちょっと醒めてしまって、いっそのこと全ソリッドステートの激安(40ドルくらい)中国製アンプを買おうかとおもってるんだけれど、いまはStable Diffusionで忙しいからもうしばらく置いとこうか、という気持ちです。

      Like

Leave a comment