stable diffusion入門

記事
IT・テクノロジー
・基礎知識[stable diffusionとは?]
英語、英単語とブラウザ上のGUIを使って理想のリアルなCGやマンガ・イラスト風のCGを作る技術。pythonとgitがよくつかわれる。

・必要なPCスペック
ハイエンドな高性能なNVIDEAを積んだRAM18GB
のPCが必要になるが、一応、RAMが必要になるもののグラボを使わずにCPUパワーだけでも動かせるので一昔前のゲーミングPCなら打開策はある

・インストール法は
調べればわかるので後々で載せるつもり

・モデルとLORA
モデルは必須、LORAは学習済みデータ
モデルはCGを描く上で必要なデータが入っている。
LORAはモデルに対して加工するような形
モデルは、いろいろとあり、全部をインストールする物好きは
ほぼいないだろうが、間違いなくSSDのスペック高め。
モデルによって漫画・イラスト風に向いていたり、
リアルなCGに向いていたり、人形のような綺麗な女性にむいていたり、
いろいろと向き・不向きがある。

・英語って本当に必要なの?
google翻訳を使えば日本語を英語に翻訳してくれるので
それっぽくは出来なくはない。
あと、日本語でchatGPTに今から書く日本語表現を英語で
プロンプトにしてください!と頼めば自分の代わりに
やってくれるかもしれない。すぐ上の2つの方法で
日本語から翻訳した英語をコピーペーストすればOK。
もちろん、キーワードと禁止キーワードの区別は付ける
必要はある。それから、chatGPTはエロ系の質問は
一切受け付かないのでgoogle翻訳か、和英辞典、英和辞典を
使う他ないと思われる。

・モデルのインストール法(通常)
タイトルなし333.png
インストールフォルダ\stable-diffusion-webui\models\Stable-diffusion\
内に.safetensorsファイル(モデルファイル)を入れる

・モデルのアニメイラスト風特化ファイルと、実写に特化したファイルを紹介します。
アニメ風はdarkSushiMixMix_225Dです。
実写風はyayoiMix_v25です。


・操作方法の基本
例えばこれはあくまで例だが、
キーワードに
joy soccer,2girl
禁止キーワードにnsfw,odd face,not five fingers,ugly face
としてgenerateボタンをクリックしてしばらく経つと、
このような画像が出来る。かなり本格的な画質で写真と見間違えるほどの
質はあるかもしれない。

00101-3951370487.png

・乱数ガチャ(なかなか乱数のランダムで理想の画像が出ないので
乱数ガチャと呼ばれる)をストックしたい場合。

で理想の画像が出たらそれを使って別の操作をしたいから撮っておきたい
という場合があると思います。そんな時に重要なのが
まず画像をPNG形式で保存するということです。
何故かと言うと、その画像形式にその画像にまつわる情報が詰まっているからです。保存したデータから取り出したいのであればすぐ下の他の人の作ったデータで同じ画像データをPNGから読み取るから参照してください。
で、そうじゃなくてすぐにストックしたい場合は、すぐ下の画像の①のボタンをクリックしてください。すると、②のseedが値として表示されます。つまり、これはカメラが映す画像内の物体が基本的には同じ形状を保つ事を示します。

乱数ガチャ.png


・他の人の作ったデータで同じ画像データをPNGから読みとる。

他の人が作ったとして、その方から自分が読み取りを
了承して許可を得ているならば恐らく良いと思うのですが、
こんな方法があります。
タイトルなし.png
...すると、
タイトルなし02.png
さっき消したはずのパラメータから乱数の種まで表示するようになりました。
つまり、これは同じ画像を生成できるようになったということです。

・バッチ処理と変化をつける方法


・最後におまけ(謎)trump and bidenと入力した
00103-2371579575.png

サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す ココナラコンテンツマーケット ノウハウ記事・テンプレート・デザイン素材はこちら