random seed= 440202368593999
今年の初めごろはStable Diffusionで画像生成をするのが面白くて 、ゲームもしないのにGeForce RTX 4080の載ったゲーミングPCを買ってしまったのだけれど、そのあとあんまりなんにもしないうちに夏になって、どうも世の中は画像生成するんだったらFLUX.1というのをやらなきゃいけないということになってるみたいなので、じゃあ久しぶりにやってみるか、ということでやってみたら、あまりのクオリティの高さに驚いた。
インストレーションの手順は、このBrowncatさんのnoteの記事 にしたがってやりました。使用した環境は、
PC: i9-13900KF + 32Gメモリ + RTX 4080 (16GB) OS: Ubuntu 22.04.4 LTS CUDA: 12.2 Python: 3.10.12 UI: ComfyUI Model (unet): flux1-dev-fp8.safetensors Model (clip): t5xxl_fp8_e4m3fn.safetensors & clip_l.safetensors Model (vae): ae.safetensors
“Model”のところは自分で書いていてなんのことやらわかってませんが(笑)、とりあえず使っているファイル名を書いておきました。 プロンプトは前回Stable Diffusionに対して使ったものと同じで、 29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with light brown short choppy hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms, looking straight, sister ただし、ComfyUIでどうやってネガティブプロンプトを与えるのかすぐにはわからなかったので、ネガティブプロンプトは与えていません。なんかやり方があるのかもしれません。
ランダムシードの値の異なる4つの画像をここに載せます。Stable Diffusionでは512×512ピクセルの画像を生成していたのに対し、今回は1024×1024ピクセルの画像を出力しているので、画像がより鮮明なのはあたりまえなんですが、それ以上により本物の写真っぽい画像を生成していることがはっきりわかる。Stable Diffusionでも十分びっくりしたけど、FLEX.1は確かに評判になるだけのものだなあと感心しました。
ちなみにflux1-schnell-fp8.safetensorsを使うともっと軽くなるということらしいんですが、やってみたら画像のクオリティがガクッと落ちたので、やめた方がいいとおもいます(←個人の感想です)。
random seed=269965826192135 可愛いけど左手の指が多い
random seed=225837849901092
random seed=1050900740056415 これもちょっと左手の指が変か?