J.log

jakeの日常

画像生成AIを使った体験記

お久しぶりです、まだ生きています。

だいぶ周回遅れな気がしますが、画像生成AIをさわってみたのでメモとして残します。
タイトルははてなブログのAI生成機能を使いました。こういうところもAIなのね。

 

自分が持ってる一番高速なPCを使いました。
OSも軽さ重視でUbuntuではなくXubuntuにしました。
たぶんUbuntuでも問題ないかと思います。

PCのスペック

使ったのはStable Diffusion 3 Mediumというモデル。
これをブラウザベースのUIを提供するソフトで動かしました。
実行時に要求されるPythonのバージョンが3.10.6と指定されているので、対応するためのツールを入れる必要があったのがちょっとハマリどころでした。

 

で、生成した画像をいくつか。

生成AI、イラスト調で、って指定したら出てきた謎の絵

実在しそうですが、これもAIで生成したもの。oldmanというプロンプトからスタートして徐々にキーワードを足しながら生成しました

イラスト調。よく見るとあちこちおかしい気がしますが、パット見はいい感じ。

思った点をいくつか

  • 指示を反映しながら絵が作られていく過程がけっこう楽しい
  • RTX3060だと1枚に30秒ぐらい待たされる。
  • とにかく変化が速い業界なので、現状のコレが正解かもわからない。たぶん3ヶ月ぐらいしたら常識が変わってる気がする。
  • けっこう長いプロンプトが指定できる。途中からDeepLで短文を英訳、それをコピペして生成した。
  • たくさん指示すると、いくつか抜ける。どれが抜けるかはまちまち
  • SD3MだとVRAMは8GBでもいけそうだけど、GPUを長時間フルパワーでぶん回すのでケース内の冷却が不安
  • RyzenのAPUもCPUコアもRTX3060も全部並列に使ったりできんのか?GPUだけガンガン動いて他は暇してる状況が多かった

 

もうちょっとやってみようと思います。

 

使ったGPUは以下。フルパワーだと熱を持つRyzenGeForceの組み合わせですが、ミドルタワーの大きなケースにいれてるので、なんとか動いてるようです