Google Colab にStable Diffusionを用いた画像生成環境をpipで構築


オープンソースで開発されているPythonパッケージ「ImaginAIry」を使ってみます。

ImaginAIryは画像生成や編集をワンコマンドで実行できます。

この画像生成環境をpipで構築する方法はローカルにStable Diffusion 環境を構築するのに便利ですが、ここではGoogle Colab に構築してみます。

Google Colaboratoryを開きます。

 

 

 

 

 

 

 

 

 

ファイルー>ノートブックを新規作成
編集ー>ノートブックを設定ー>ハードウェアアクセラレータでGPUを指定して保存

新規のセルで以下を実行して接続・初期化し、割り当てられたGPUを確認してみます。

 

 

 

 

 

 

 

 

 

 

パイプラインで必要な環境を作ります。

最後にERRORが出ていますが気にしません。

 

 

 

 

 

 

 

 

画像生成ならimagineコマンドに続けて、生成用プロンプトを記述して実行するだけです。

3つの画像を生成してみます。サッカー選手とサングラスをしたワンちゃんと少女です。

Colabの環境では、/content/outputs/generatedフォルダー直下に、大体2分くらいで512×512の画像が3枚生成されます。

 

 

 

 

 

 

生成した画像をローカルにダウンロードして確認してみます。

例えば、上記で生成された少女の画像はフルパスで以下にあります。

/content/outputs/generated/000021_986290532_kdpmpp2m15_PS7.5_a_cute_girl_[generated].jpg

セルに以下を記述してダウンロードを実行します。

 

 

 

 

 

 

 

 

以下のような画像が生成されていました。

 

 

 

 

 

 

 

 

 

 

 

 

 

では、画像を編集して「サングラスをかけさせて」みます。

こんな感じになります。

 

 

 

 

 

 

 

 

 

 

 

 

プロンプトはいろいろな表現が可能です。上記では、少女の状態を記述していますが、makeを使った他動詞の記述も可能です。

ChatGPT にも使われるこういうプロンプト・テキストは、数多くこなすことでどういう表現なら意向に近づけるか分かってくるような気がします。

ただ、プロンプト・テキストの進歩がはやければ呪文など必要なく、趣旨を伝えるための正確な文章を人間が生成できればAIはそのとおりの画像を正しく生成できるようになるのでしょうけど…。

 

参考までに他の2枚の画像はこんな感じです。

{“prompt”: {“software”: “imaginAIry”, “model”: “SD-1.5”, “prompts”: [[1, “a soccer player”]], “prompt_strength”: 7.5, “negative_prompt”: [[1, “Ugly, duplication, duplicates, mutilation, deformed, mutilated, mutation, twisted body, disfigured, bad anatomy, out of frame, extra fingers, mutated hands, poorly drawn hands, extra limbs, malformed limbs, missing arms, extra arms, missing legs, extra legs, mutated hands, extra hands, fused fingers, missing fingers, extra fingers, long neck, small head, closed eyes, rolling eyes, weird eyes, smudged face, blurred face, poorly drawn face, mutation, mutilation, cloned face, strange mouth, grainy, blurred, blurry, writing, calligraphy, signature, text, watermark, bad art,”]], “init_image”: “None”, “init_image_strength”: 0.6, “seed”: 706540620, “steps”: 15, “height”: 512, “width”: 512, “upscale”: false, “fix_faces”: false, “sampler_type”: “k_dpmpp_2m”}}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

{“prompt”: {“software”: “imaginAIry”, “model”: “SD-1.5”, “prompts”: [[1, “a dog with sunglasses “]], “prompt_strength”: 7.5, “negative_prompt”: [[1, “Ugly, duplication, duplicates, mutilation, deformed, mutilated, mutation, twisted body, disfigured, bad anatomy, out of frame, extra fingers, mutated hands, poorly drawn hands, extra limbs, malformed limbs, missing arms, extra arms, missing legs, extra legs, mutated hands, extra hands, fused fingers, missing fingers, extra fingers, long neck, small head, closed eyes, rolling eyes, weird eyes, smudged face, blurred face, poorly drawn face, mutation, mutilation, cloned face, strange mouth, grainy, blurred, blurry, writing, calligraphy, signature, text, watermark, bad art,”]], “init_image”: “None”, “init_image_strength”: 0.6, “seed”: 56969110, “steps”: 15, “height”: 512, “width”: 512, “upscale”: false, “fix_faces”: false, “sampler_type”: “k_dpmpp_2m”}}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


超解像

under construction

 


 

 

Be the first to comment

Leave a Reply

Your email address will not be published.


*