
AIは大阪が好きなようですね。
Ollamaも結局はllama.cppをもとにしているらしいんですが、いろいろと試しているところです。

AIは大阪が好きなようですね。
Ollamaも結局はllama.cppをもとにしているらしいんですが、いろいろと試しているところです。

ワインを飲んだりしてましたが、ひさしぶりにおこなしてみました。

カリフォルニアに行って、はじめてワイナリー見学のバスツアーに参加しました。ワインについて語ることができるうんちくはありませんが、ほろ酔いのままいい景色をながめながらバスでワイナリーを巡るのは非常に愉快でした。今度はウイスキーの醸造所とか日本酒の酒蔵とかそういうツアーに行きたいです。
サンフランシスコのアップルストアでApple Vision Proを見ましたが、デモの予約をしなきゃいけないらしくて、勝手にためすことができなかったので、どれほど凄いのかわかりません。もともと3Dゲームをすると簡単に酔ってしまう体質なので、あまり購入意欲はないんですが。


Stable Diffusionで美女画像をつくっているだけでいつまでも遊べるんですが、ゲームもしないのにゲーミングPCを買ったんだから、ローカルでChatGPTみたいなチャットボットを動かしてみたいと思っていたら、NVidiaからChat with RTXというのが発表されて、わざわざ自分で設定することないじゃないか、とおもって試してみた。
Stable Diffusionの設定ではビデオドライバーやCUDAのバージョンが合わないとかいろいろと面倒なことがあったけど、これはサポートされているプラットフォームがWindowsだけなので、とくになにも考えなくてもインストールしたら動く。が、しかしダウンロードサイズが巨大で35GB以上、インストール後のディスク占有サイズは60GB以上。Linuxを入れるときに、Windowsは120GBくらいあれば十分か、とおもってパーティションを設定したけど、こういうやつが出てきたらぜんぜん足りなくなるので、急きょ300GBのパーティションを作ってDドライブにした。まだまだ大丈夫だけれど、そのうち1TBじゃ足りない、みたいなことになるんだろうな。
機能的にはChatGPTに慣れた目からすると、日本語も使えないしたいしたことないな、とも言えるんだけれど、これがローカルのPCで動いているというのはロマンですな。
上の画像ではノースカロライナの”haiku”を書かせてみました。
松の木がそよ風に揺れ
コオロギが夜に鳴く
平和なノースカロライナ
退屈で凡庸な作品ですが現実を的確に表現しているともいえるでしょう。

とりあえず子どものGaming PCでやっていたStable Diffusionの画像生成はできるようになりました。上の画像は前回の”29 years old beautiful female Japanese IT Professional”のプロンプトをCyberRealisticというモデルで処理してみたものです。悪くないけどやや目を強調しすぎ(プリクラの影響?)かな?512×512のイメージだと1枚1秒くらいで生成するので楽勝です。
すぐにバージョンが変わって情報が古くなるので、ちゃんとしたセットアップ・ガイドを提供するつもりはないんですが、いちおうやったことの概略をここにメモしておきます。
#!/bin/bash
# Function to handle cleanup actions
cleanup() {
# Perform cleanup actions here
echo "Performing cleanup..."
# Remove files named tmp*.png in /tmp folder
rm -f /tmp/tmp*.png
# Remove files named tmp*.jpg in /tmp folder
rm -f /tmp/tmp*.jpg
# Remove gradio folder if it exists
rm -rf /tmp/gradio
# Remove tmp* folders within /tmp directory
rm -rf /tmp/tmp*
}
# Trap SIGINT signal (Ctrl+C) and call cleanup function
trap cleanup SIGINT
# Change directory
cd /home/tami/git/AUTOMATIC1111/stable-diffusion-webui
# Run webui.sh script
./webui.sh
# Cleanup actions after Python script termination
cleanup
以上です。インストールをやり直したりしてちゃんとこの手順だけでインストールできるかどうか確認してないので、必要なステップが抜けてたらすみません。
Seedを固定していくつか他のモデルも試してみたので載せておきます。個人的にはRealisticVisionが好きですが、けっこうベースモデルもいいのではないかとおもいます。あんまり美人・美少女に特化しちゃうとリアリティが失われてしまう、ということかな。
Stable Diffusion 2.1ベースモデル



RealisticVision (前回のやつ)

Agelesnate (これも前回のやつ)





まだなんもやってません(ディスプレイもつないでない。笑)。
(更新: 2024-02-15) もちろんWindowsはなにもしなくても立ち上がるんですが、Linuxで使いたいなぁとおもい、1 TB SSDのうち120 GBくらいだけWindows用にのこして、あとは慣れているFedora 39を入れてやろうとおもってやってみたんですが、まだ子どものPCでやっていたStable Diffusionを動かすところまでたどり着けていません。どうもFedoraはなんでもかんでも最新バージョンを入れようとするみたいで、CUDAのVersion 12.3というのが入ってしまったんですが、11.8かせめて12.1にダウングレードしないと、PyTorchというライブラリが入らない。すこしダウングレードもためしてみたけど、この先なにかインストールしようとするたびにこんなことばっかりやるのも嫌になので、世の中の大勢にしたがって、Fedora 39からUbuntu LTS 22.04に乗り換えようかなーとおもってます。
で、乗り換えてみたんですが、CUDAのVersion 12.2というのが入りました。やっぱりこいつをダウングレードしてやらなきゃいかんみたい。きょうのところはここまでにして寝ます。

先週Elvis Costelloのコンサートに行ってきました。客は(自分のことはたなにおいて)年寄りばかりで、今年70歳になるコステロもなんかスコティッシュなスカート姿で現れて、途中椅子に座ってアコギを弾いたりしててどんなもんかとおもってたら、曲をやるたびに調子が出てきて、ロックンロール連発の終盤はまだやるんかい、という感じで圧倒された2時間半でした。
コステロに負けてられないので(?)ぼくも3月か4月に買おうかなと言ってたゲーミングPCをコストコのオンラインショップで注文しました。iBUYPOWER Y40 Gaming Desktop 13th Gen Intel Core i9-13900KF – GeForce RTX 4080 – Windows 11というやつ。定価$2,899が$500引きで$2,399。これだったらRTX 4070 Ti SUPERを待つことないよな、とおもった。日本ではHYTEというブランドでケースを販売しているようです。ケースの側面と正面が透明でカッコはいいけど排気性はどう?ともおもったけど、実際に動かして確認することにしよう。楽しみです。

先週ポケモンGoのレベル38に到達しました。37になったのが去年の5月なので8ヶ月掛かってます。このペースだと、今年中になんとかレベル39になって、来年とりあえずの目標であるところのレベル40にまで行けるんじゃないか。
いまだにどのポケモンが何系のポケモンなのかよくわかっていません。ポケモンバトルとかもほとんどしないし。それなのにほとんど毎日やってます。毎朝歯をみがくとかそういう感じ。
●●
今月のはじめ爆発的にやっていたAIの画像生成は、子どもがPCを使っているので中断中です。WindowsはServer版じゃない限り同時に複数同時ログインできないみたいで、子どもがログインしているのに、それを強制的にログアウトさせてどうでもいい画像生成を試しまくるというのも大人として(親として)どうかとおもうので。
このさい、自分用にゲーミングPCを買おうかなと考えていて、いつもだったら必要最小限のスペック(あるいは下から2番目くらい)のやつを狙うのですが、子どものPCにRTX 4070 Tiが載っているので、それよりしょぼいというのも悲しいので、ちょっといいのを買うつもりです(パンも自分で焼いてるし)。かといって、RTX 4090を買う元気もないから、最近発表されたRTX 4070 Ti SUPER搭載のデスクトップPCが出回ってきたらひとつ買ってみようかと考えてます(3月か4月くらい?)。
じゃあ昨日の彼女

…のモデルをRealistic Visionに替えてやれば、写真みたいなイメージになるんじゃないの?とおもい、とうぜんやってみた。

プロンプトで書かれていることは再現されてるんだけど、もうちょっともとのイメージに近い絵柄にできないものか。
それで、プロンプトをいじってみました。ほんとうは試行錯誤しながらやったのですが、わかりやすくするために、最終形(?)に至るまで、少しずつことばを足して途中経過をみていきましょう。
まずは”beautiful”。なにをもって美しい顔とするのかはひとそれぞれでしょうが、これがAIが考える”beautiful”みたいです。

つぎは”full body”を加えて全身を写すようにする。

“holding a cup”で手にカップを持ってもらおう。

なんか顔の感じが変わったみたい。それはともかく、カウンターの横に立ってるイメージにしたいので、”along counter”を足してみる。

このTシャツはちゃんとフィットした女性用のものですが、もとのイメージはだぶだぶのTシャツを着ているようなので、”oversized”ということばを足してみよう。

変わったのかな(笑)。
顔の感じを似させるために、くちびるを”pink tiny lips”として、鼻を”small nose”と表現してみる。

ちょっと目が変(笑)。Tシャツに柄が入ってるし。
明かりをすこし暗めにするために”dim light”を加える。

Tシャツの柄がなくなったのはいいけど、あとは背景の照明が丸くなっただけのような気がします。
この段階で腕が細いのはわかるけど、”thin arms”を足してみる。

ほとんど間違い探しレベルで違いがわかりませんな。
目線を変更するために”looking straight”を足してみます。

ここで髪型を”short brown hair”から”light brown short choppy hair”に変えてみたんですが、ほとんど変化はなかった。

で、最後に「妹属性」を追加するために、”sister”というのを足してみたけど、背景のライトが変わっただけかも。

いちおうこれを最終形とします。もとのイメージとはちょっと違う雰囲気の女性だし、背景もぜんぜん違う。でも、これでいいことにします。なにをいいことにするのかわからんけど。
慣れてきたら、もうちょい自由に画像をあやつることができるんでしょうね。
(付記)Agelesnate V3の出力に似たイメージをRealistic Visionで出力するためにプロンプトを修正してきたわけですが、最終形のプロンプトをもう一度Agelesnate V3で処理させたらどうなるか?やってみました。

ちょっとヤバい方向にむかっているような気がします(笑)。
週末になったので、引き続きStable Diffusionで遊んでます。前回の29歳の女性をもっと魅力的にできないものかちょっとプロンプトをいじってみました。
前回と全く同じではないんですが、これをベースに使います。

これで十分かわいいと思うんですが、Tシャツの模様がじゃまに思える。ほんとうならもっといい服を着てもらいたいのだけれど、ファッション系のボキャブラリーがないので、女性の服を英語でどう表現するのかわからん。しょうがないので、白のふつうのTシャツを着てもらおう。

なんかちょっと雰囲気が変わって、”IT Professional”というよりはサーファーみたいですが、これはこれでいいでしょう。
ちょっと線が太くてデッサンぽいのが気になる。しらべてみると”high quality”というのをプロンプトに加えて、”low quality”というのをネガティブ・プロンプトに入れてやるといいらしいので、それをやってみたら、これが効果抜群。

一般的にインターネットで出回っているAIで生成された女性の画像はどれも胸が強調されすぎていてリアリティに欠けるな、という印象を持っていたのですが、インターネットでサーチすると同じようなことをおもっているひとがほかにもいて、それを回避するためにはネガティブ・プロンプトに”big breast”というのを入れればいいことがわかったのでやってみた。

微妙な違いですが、こっちの方がいいのではないでしょうか(個人の感想です)。
これで完成としてもいいけど、どうせだから、ちょっと変化をつけることにして、Tシャツを白からベージュのものに変えて、”pink lips”というのもプロンプトに入れてみよう。

ほんとうにくちびるの色変わったの?ともおもうけど、化粧はちょっと濃くなった印象がある(頬とか)。やってるとキリがないし、きょうのところはここまでにしておくことにしようか。