

沖縄に来てます。2年前の暮れに台湾に行って気に入ったのでまた行こうかとおもったのですが、沖縄に行ってないのに台湾に2回行くのはどうかとおもって、今回は沖縄にしました。レンタカーを借りて今日は名護に泊まってます。
沖縄に行くなら臭いという評判のヤギ汁を食べなきゃ、ということで食べてみましたが、ぜんぜん臭くなかったですよ?ヤギ刺しもコリコリしていて噛むとよけいに味わいがあって美味しかったです。


沖縄に来てます。2年前の暮れに台湾に行って気に入ったのでまた行こうかとおもったのですが、沖縄に行ってないのに台湾に2回行くのはどうかとおもって、今回は沖縄にしました。レンタカーを借りて今日は名護に泊まってます。
沖縄に行くなら臭いという評判のヤギ汁を食べなきゃ、ということで食べてみましたが、ぜんぜん臭くなかったですよ?ヤギ刺しもコリコリしていて噛むとよけいに味わいがあって美味しかったです。

今年の初めに書いたように徒歩旅行をしたいなーと考えています。
日本でいちばん有名な徒歩旅行、四国八十八箇所巡礼の第五十八番札所仙遊寺の小山田住職は、
「遍路に行くときは、時計と名刺を置いていきましょう」
とおっしゃられるそうです。そのお言葉はじつにもっともだとおもうんですが、せっかく歩くんだったらGPSでログを取りたくないですか(笑)。
いまどきどんなスマホにもGPSがついてるので、わざわざ別にGPSを持つ必要はないという意見もあるでしょう。でも、長い時間ログを取っていると、電池を食うし、GPSロガーのアプリを間違えて停止させてしまったりもするので、やっぱり別デバイスとしてGPSを持ちたい。時計と名刺は置いていきます。
とはいえ、徒歩旅行では荷物を減らすのが最重要なのに、ログを取るだけのために余分に荷物を増やすのはいかがなものか?とも思った。でも好きなものはしょうがない、ということで、Garmin eTrex SEというハイキング用のGPSを買いました。以上、いいわけ。
●●●
前にeTrexを持っていたことがあって、いつ買ったんだっけ?と調べてみたら、2006年9月でした。20年前。iPhoneはまだ出てません。データ転送はUSBですらなくてシリアルでした。それとくらべるとこのeTrex SEは未来ですな。Bluetoothでスマホのアプリと同期されるようになってるんです。いまどきあたりまえか。
これは地図を入れることができない一番シンプルな機種なので、地図を入れることのできる上位機種を使うともっと未来感があるのかもしれないけど、正直地図はスマホで見ればいいし、こういう単機能のデバイスが好きなので、荷物は増えるもののたいへんに満足しています。

z-Image Turboには衝撃を受けたのですが、なんか同じ顔の女の子しか出てきませんよ?という気がしてました。一月前くらいに、蒸留モデルじゃないz-Image Baseというのが出たのでためしてみました。
z-Image Turboで使ったComfy-UIのWorkflowをそのまま使って、BaseモデルだとK-Samplerというやつのステップ数を増やしたほうがいいらしいので、増やしてみて(9になってたのを25にしました)。出てきたのが上の画像。お顔はいいけど手とかコーヒーカップとかが破綻してます(笑)。Turboで生成すると、

手もコーヒーカップもちゃんとしてますが、なんか見覚えのある顔だなー、という印象です。
Seedを1ずつ増やして画像生成すると違いが歴然。まずはz-Image Basモデル。





まぁ背景とか手とかカップはかなりめちゃくちゃですが、とりあえずいろんなタイプの顔の画像が生成されて、楽しい。これが、z-Image Turboになると、





手やカップも破綻してないし、背景もかっこよくボケていて、Baseモデルが生成した画像と比べると、間違いなくこっちのTurboモデルの生成画像の方がクオリティが高い。でも、同じ顔ばっかりですな。このモデルさんには悪いけど(AIにあやまる必要はないか、笑)。

61歳の誕生日の週末にニューヨークに行ってきました。ちょうど猛烈な寒波が来ていて、日中でも気温は華氏でひとけた、ということは、摂氏だとマイナス10度以下、ということで、外にいると文字通り凍りつくので、おもに屋内にいて、買い物したり、マイケル・ジャクソンのミュージカルをみたり、美術館に行ったりしてましたが、あんまり大都会に行くことはないので、街の雰囲気を味わえてよかったです。

このあいだためしたFLUX.2は”dev”モデルで、ぼくのGeForce RTX-4080 16GBではやや力不足だったのだけれど、もうすこしローエンドのGPUでも快適に動作する”klein”モデルというのが出たというのでためしてみた。使ったのは、
です。”klein”には”distilled”(蒸留)モデルと”base”(ベース)モデルがあって、蒸留モデルは爆速だそうですが、まずはベースモデルをためしてみました。
サンプル出力が上のイメージなんですが、けっこう良いんじゃないでしょうか。z-Image Turboの出力はきれいなんですが、なんかモデルっぽいというか愛想笑いしてるというかそんな感じがするのに対して、こっちは笑ってないし、より35ミリネガフィルムっぽくなってるし、リアルな感じがします。
●●●
いちおう蒸留モデルもためしてみようかということで、flux-2-klein-4b.safetensorsをつかってみました。フラッシュをたいて撮ったフィルム写真風ですね。


徒歩旅行のためにまずは10kgの荷物をかついで100kmくらい歩いてみようと年初におもいたって、休みの日は家のまわりを歩いてるけど、平日は仕事のまえに会社のあるDurhamの街を歩いている。

Durhamはとくに観光地というわけではないけれど、歴史がある街なので、朝日に照らされる建物がけっこう絵になります。

だいたい80kmくらい歩いたので、あと1週間くらいでとりあえずの目標は達成できそうです。

あけましておめでとうございます。ことしもよろしくお願いします。
去年60歳になって、先のことをかんがえるようになり、体が動くうちに徒歩旅行をしてみたいとおもって調べてみたら、10kgくらいのバックパックを背負って1日に20kmくらい歩けないといかんらしいということなので、仕事用のバックパックに重い本とかつめて10kgにして近所を歩いてみようというのを1週間前からやってます。
ぼくだけではないとおもうのですが、なにか始めようとするとき、始めるまえにまず道具(ギア)を揃えたくなる。かっこいいバックパックとか、いいハイキングシューズとか、トレッキング・ポールとかもあった方がいいらしい、とか。たとえば写真を撮るよりもカメラが好きとかいう倒錯も趣味なんだからいいけれど、今回はとりあえず手持ちのバックパックと靴でトータル100kmくらい歩いてからじゃないとあたらしいギアは買わない、と自分にしばりをかけてみました。1週間で25kmほど歩いたのであと75kmです。
今日は市内バスでUNC (University of North Carolina)のキャンパスまで行って、トレイルを歩いて家まで帰ってきました。いいお天気で、どうせわざわざどっかに出かけて行って歩いたところで、このへんのトレイルの景色とあんまり変わらなかったりするんじゃなかろうか、とか、それだったらこのトレイルを目的地ということにして、こんなだれに頼まれたわけでもない修行はやめにして重いバックパック抜きで身軽に歩いた方が人生楽しいんじゃないか、とか、そんな雑念を振り払いながら歩きました。


Z-Image TurboとGoogle翻訳の組み合わせがおもしろかったので、いろんな言語を試してみることにした。だいたいもとのプロンプトをGoogle翻訳がちゃんと翻訳できているのかどうか確認できないし、Z-Image Turboのワークフローで使っているLLM (qwen_3_4b.safetensors)がそれをちゃんと解釈できているのかわからんので、ただの遊びです。
まずはこのプロンプト
29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with light brown short choppy hair with natural skin texture, visible pores, and faint lines around her eyes at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms, looking straight, sister, 35mm negative film
をGeminiで生成AI用に最適化してもらう。それで出てきた”Structured & Tag-Based (Best for Stable Diffusion)”というバージョンがこれ。
35mm negative film photo, full body shot, 29 year old Japanese woman, IT professional, short choppy light brown hair, plain beige oversized T-shirt, thin arms, sitting at coffee shop counter, holding cup, looking at viewer, direct eye contact. Detailed face, small nose, tiny pink lips, natural skin texture, visible pores, faint crow's feet, unretouched, raw photo. Dim moody lighting, sister vibe, high quality, photorealistic, 8k.
これをつかって画像生成させると、

あとはこのプロンプトをGoogle翻訳に掛けて、Seedを固定して次から次へと画像生成させていくだけです。



















FLUX.2は重いし、結局いまのところはまだFLUX.1が最強かな〜というのが昨日の結論だったのですが、Z-Image Turboというのが話題らしいぞ、ということで試してみた。
まずは昨日のFLUX.2用にチューンしたプロンプト。

悪くない、というか、かなり良い。FLUX.1の出力でちょっと気になる肌のテカテカした感じがない。画像生成で遊ぶという意味では、Seedの値を変えてもほぼ同じ顔の女性しか出てこないみたい(どこかパラメータをいじればいいのかもしれない)なのが面白くないのですが、普通に自然な写真です。
これなら、FLUX.1のポストでも使ったオリジナルのプロンプト
29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with light brown short choppy hair at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms, looking straight, sister
でそこそこいけるんじゃないか?とおもって試したのがこれ。

ちょっと顔の表情と肌のツルツルさがAIっぽいか?とおもって、35mmネガフィルムで撮ったことにして(”35mm negative film”)、昨日FLUX.2用にプロンプトをいじっているときにGeminiが加えた肌のツルツルを抑える表現(”with natural skin texture, visible pores, and faint lines around her eyes”)を足して出力したのがトップの画像です。かなり良いんじゃないかと思うんですがどうでしょうか。
そのプロンプト、
29 years old beautiful female Japanese IT Professional in a plain beige oversized T shirt with light brown short choppy hair with natural skin texture, visible pores, and faint lines around her eyes at a coffee shop, high quality, pink tiny lips, small nose, full body, holding a cup, along counter, dim light, thin arms, looking straight, sister, 35mm negative film
をGoogle翻訳で日本語に翻訳させて、
29歳の美しい日本人女性ITプロフェッショナル。シンプルなベージュのオーバーサイズTシャツを着て、ライトブラウンの短いボブヘア。自然な肌質で、毛穴や目元の小じわが少し見える。カフェのカウンター席に座り、カップを持っている。薄暗い照明、細い腕、まっすぐ前を見つめている。妹のような雰囲気。35mmネガフィルムで撮影。
これで画像生成させたらどうなるか。

英語で”sister”というと姉か妹かわからないけど、Googleが妹だと翻訳したので、ちょっと妹属性が入ったのかな?じゃあ「妹」を「お姉さん」にしてみよう。

ものすごく微妙ですが、お姉さんになりましたか(笑)?
Z-Image Turboは中国製(アリババ)なので、最後に英語のプロンプトを中国語に翻訳してやってみよう。
一位29岁的漂亮日本女性IT专业人士,身穿一件宽松的米色T恤,留着浅棕色短发,皮肤自然,毛孔清晰可见,眼周有细纹。她坐在咖啡馆里,画质高清,嘴唇小巧粉嫩,鼻子小巧,身材匀称,手里拿着一个杯子,坐在吧台边,光线昏暗,手臂纤细,目光直视前方,像个姐姐,35毫米胶片拍摄。

いつまでも遊んでいられますな。
(付記)
アニメ調も追加しておきます。よくみたらプロンプトで「お姉さん」が指定されてますな。そつのない出力だとおもいます。


昨日のFLUX.2のポストをPublishしてから考えたのは、FLUX.2はFLUX.1よりもよりプロンプトに忠実に画像生成しようとしているのではないかということで、たとえば背景に他の客が入っていたほうがいいのなら、ちゃんとそれを指定して、あまりにAIっぽい美肌になっていたら、そうならないように指定するとか、細かく指示を出さなきゃいかんのではないか、ということ。それにしても、完璧な美人を完璧に写真に撮ることができても、AIっぽいと言われてしまうというのは、過酷な時代になりましたね。
それで、noise_seed (440202368593999)とguidance (4.4)の値は固定して、Google Geminiの助けを借りてプロンプトをいろいろいじってみました。上の画像はその中でもよくできたんじゃないかと思ってるやつです。
以下、いくつかサンプルをどうぞ。





(付記)
いろんなプロンプトを試してみたけど、それをFLUX.1で画像生成させてみたらどうなるかやってみました。
まずは、いちばん上の画像のプロンプト。

ちょっと露出不足だけれど、FLUX.2の出力よりも良くないですか。Seed を変えたバージョンではこんなのも出力されました。

FLUX.2だとモデルが大きいので一枚出すのに5分くらいかかるのですが、FLUX.1だと20秒くらいで出てくるのでいろいろ試せます。使っているワークフローが違うので単純比較できませんが、ぼくが遊んで使う分にはFLUX.1で十分だな、というか出力もFLUX.1の方が好み、というのが感想です。
アニメ調もFLUX.1で試してみました。FLUX.2の出力とは画風が違うのですが、いい感じじゃないでしょうか。
