Kohya's GUIの使い方マニュアル

記事
IT・テクノロジー
こんにちは。アイです。

本資料は、Stable DiffusionとLoRAを使用して、顔を固定しつつ髪型や服装、表情、背景などを自由自在に変えられるようになろうというものです。

アニメ系や実写系の両方に対して使える手法です。キャラクターや人物の表現の幅を広げることに使えるかと思います。

【注意事項など】
※本資料は主にStable Diffusionの上級者向けの資料となっています。初心者の方は理解が難しいかもしれません。
※人物及びキャラクターの規約にもよりますが、原則、二次創作物の公表や学習について、それぞれ著作権者から許諾を得る必要があります。記事で紹介する手法を試す場合は許諾を得てください。
※著作権者等にとって不利益となる利用をしないでください。
※著作権者等の許可なく学習済みモデルを第三者に提供するのはやめましょう。
※本資料で紹介する内容によって生じた損害などに対して、私は一切の責任を持ちません。自己責任、自己判断でお願いします

使用スペック(3種類試しました)
パターン1:CPU-12th Intel i7, GPU-RTX 3070, メモリ-96GB
パターン2:CPU-13th Intel 79, GPU-RTX 4090, メモリ-64GB
パターン3:Google Colab

課金は必要ですがGoogle Colabでも追加学習と画像生成ができたので、Macや低スペックPCでもできます。ローカル環境はGPUのVRAMが8GB、メモリが32GBあれば十分追加学習はできるかと思います。なお、GPUを積んでいないと基本的に学習はできません。これは余談ですが、RTX4090はRTX3070の3倍の処理速度で動きました。12000ステップで1時間です。

使用するツール

今回使用するのはKohya's GUIというツールです。
github.com/bmaltais/kohya_ss

学習~生成までの全体の簡単な流れ

1. Kohya GUIを導入する
2. 学習用画像を用意して、後述するフォルダに格納する
3. Stable Diffusionの拡張機能で学習用画像にタグ付けをする
4. Kohya GUIにパラメーターを入力してLoRAを生成
5. Stable Diffusionに4で生成したLoRAを読み込ませて画像生成
6. トライアンドエラー

本記事ではStable Diffusion及びKohya GUIを導入済みであることを前提としていますので、それぞれの導入手順については割愛させていただきます。

上記2~5の各ポイントについて説明していきます。

なお、以下のサービスでKohya GUIの導入はサポートしています。

この続きは購入すると読めるようになります。
残り:4,271文字 / 画像12枚
Kohya's GUIの使い方マニュ... 記事
IT・テクノロジー
6,000円
サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す