お久しぶりです、まだ生きています。
だいぶ周回遅れな気がしますが、画像生成AIをさわってみたのでメモとして残します。
タイトルははてなブログのAI生成機能を使いました。こういうところもAIなのね。
自分が持ってる一番高速なPCを使いました。
OSも軽さ重視でUbuntuではなくXubuntuにしました。
たぶんUbuntuでも問題ないかと思います。
使ったのはStable Diffusion 3 Mediumというモデル。
これをブラウザベースのUIを提供するソフトで動かしました。
実行時に要求されるPythonのバージョンが3.10.6と指定されているので、対応するためのツールを入れる必要があったのがちょっとハマリどころでした。
で、生成した画像をいくつか。
思った点をいくつか
- 指示を反映しながら絵が作られていく過程がけっこう楽しい
- RTX3060だと1枚に30秒ぐらい待たされる。
- とにかく変化が速い業界なので、現状のコレが正解かもわからない。たぶん3ヶ月ぐらいしたら常識が変わってる気がする。
- けっこう長いプロンプトが指定できる。途中からDeepLで短文を英訳、それをコピペして生成した。
- たくさん指示すると、いくつか抜ける。どれが抜けるかはまちまち
- SD3MだとVRAMは8GBでもいけそうだけど、GPUを長時間フルパワーでぶん回すのでケース内の冷却が不安
- RyzenのAPUもCPUコアもRTX3060も全部並列に使ったりできんのか?GPUだけガンガン動いて他は暇してる状況が多かった
もうちょっとやってみようと思います。
使ったGPUは以下。フルパワーだと熱を持つRyzenとGeForceの組み合わせですが、ミドルタワーの大きなケースにいれてるので、なんとか動いてるようです