stable diffusion入門

記事

IT・テクノロジー

NESMania1985

2024/07/31 16:39

・基礎知識[stable diffusionとは？]

英語、英単語とブラウザ上のGUIを使って理想のリアルなCGやマンガ・イラスト風のCGを作る技術。pythonとgitがよくつかわれる。

・必要なPCスペック

ハイエンドな高性能なNVIDEAを積んだRAM１８GB

のPCが必要になるが、一応、RAMが必要になるもののグラボを使わずにCPUパワーだけでも動かせるので一昔前のゲーミングPCなら打開策はある

・インストール法は

調べればわかるので後々で載せるつもり

・モデルとLORA

モデルは必須、LORAは学習済みデータ

モデルはCGを描く上で必要なデータが入っている。

LORAはモデルに対して加工するような形

モデルは、いろいろとあり、全部をインストールする物好きは

ほぼいないだろうが、間違いなくSSDのスペック高め。

モデルによって漫画・イラスト風に向いていたり、

リアルなCGに向いていたり、人形のような綺麗な女性にむいていたり、

いろいろと向き・不向きがある。

・英語って本当に必要なの？

google翻訳を使えば日本語を英語に翻訳してくれるので

それっぽくは出来なくはない。

あと、日本語でchatGPTに今から書く日本語表現を英語で

プロンプトにしてください！と頼めば自分の代わりに

やってくれるかもしれない。すぐ上の２つの方法で

日本語から翻訳した英語をコピーペーストすればOK。

もちろん、キーワードと禁止キーワードの区別は付ける

必要はある。それから、chatGPTはエロ系の質問は

一切受け付かないのでgoogle翻訳か、和英辞典、英和辞典を

使う他ないと思われる。

・モデルのインストール法（通常）

インストールフォルダ\stable-diffusion-webui\models\Stable-diffusion\

内に.safetensorsファイル(モデルファイル)を入れる

・モデルのアニメイラスト風特化ファイルと、実写に特化したファイルを紹介します。

アニメ風はdarkSushiMixMix_225Dです。

実写風はyayoiMix_v25です。

・操作方法の基本

例えばこれはあくまで例だが、

キーワードに

joy soccer,2girl

禁止キーワードにnsfw,odd face,not five fingers,ugly face

としてgenerateボタンをクリックしてしばらく経つと、

このような画像が出来る。かなり本格的な画質で写真と見間違えるほどの

質はあるかもしれない。

・乱数ガチャ（なかなか乱数のランダムで理想の画像が出ないので

乱数ガチャと呼ばれる）をストックしたい場合。

で理想の画像が出たらそれを使って別の操作をしたいから撮っておきたい

という場合があると思います。そんな時に重要なのが

まず画像をPNG形式で保存するということです。

何故かと言うと、その画像形式にその画像にまつわる情報が詰まっているからです。保存したデータから取り出したいのであればすぐ下の他の人の作ったデータで同じ画像データをPNGから読み取るから参照してください。

で、そうじゃなくてすぐにストックしたい場合は、すぐ下の画像の①のボタンをクリックしてください。すると、②のseedが値として表示されます。つまり、これはカメラが映す画像内の物体が基本的には同じ形状を保つ事を示します。

・他の人の作ったデータで同じ画像データをPNGから読みとる。

他の人が作ったとして、その方から自分が読み取りを

了承して許可を得ているならば恐らく良いと思うのですが、

こんな方法があります。

...すると、

さっき消したはずのパラメータから乱数の種まで表示するようになりました。

つまり、これは同じ画像を生成できるようになったということです。

・バッチ処理と変化をつける方法

・最後におまけ（謎）trump and bidenと入力した

#Stable #diffusion無料入門 #Diffusion

NESMania1985

ドット絵師 / 40代前半 / 男性

一覧に戻る