先日に続いて、Stable Diffusionでできそうなことその2。
NovelAIで課金しなくても、ネット情報を漁りつつ、いろいろ小細工すると、
なんとなくイラストっぽいものが出力されます。
呪文を使って、文字から画像を生成することはもちろん、
呪文を使って、画像を加工出力することもできます。
例えば、これは自撮りした自分の顔をアプリ使って加工したものですが、
これをベースに、「Cute girl,black hair, tsundere, moe, kawaii, beautiful,pixiv, niconico,fantasy scene, Illustrations drawn by xxx xxx, soft lighting」と呪文を唱えます。
すると、
こんな感じの画像ができたります。
というのが、巷で問題になっている部分ですね。
寄せたいイラストレーターさんの描き方、塗り方の特徴を学習させると、
今段階ではなんとなく、
それと似たような画風の画像が出力されちゃったりするわけです。
ただ、問題は現時点ではまだ破綻箇所が多い(手足が増えたり)のと、
呪文の作りこみが甘いと、
表情の差分などが作りにくい点や、ポーズを変えた全身の画像などが、
同じキャラクターにならないという点があると思います。
頑張って、キャラクターの特徴を色々考えて、
いっぱい盛り込んでも、「まだ」完璧にはならないわけです。
なので、どうしても人の「手入れ」が必要になります。
多分、今までココナラで発注してきた人は、
描いてほしい項目を色々イラストレーターさんに言葉で伝えて、
ラフ画を書いてもらい、そこから正式に制作を進めてもらうような感じで、
イラスト制作を依頼していたと思います。
けれどもそのラフ画の段階で、
もしイメージしていたものと違っても、
大幅な書き直しに(無料で)応じてくれる出品者さんは、
ほとんどいないと思います。
そこで、「呪文使い」の出番があるのではないかと。
発注者様とイラストレーターさんの間に作用する感じで、
発注者様のイメージをとりあえず、画像に押し込み、
ラフ画を作成するまでを、呪文使いが手伝い、
発注者はそれをもって、言葉ではなく、
イメージ画像で描いてほしいもの、
構図をイラストレーターさんにお願いする。
これは、受注者様の方にもメリットがあって、
構図とか配色に関して、悩む必要性が最小限に抑えられ、
また、依頼者の希望もヒヤリングしやすくなるのでは、と思う。
ただ、これは闇が深い問題も抱えているので、現時点では
「呪文使い」をサービスとして成立させるには、
生成物がそのまま表に出ないように色々な配慮が必要になると思う。
個人的には、Vroidにポーズをとらせて、画像を撮り、
image2imageで、「Denoising strength」を0.4から0.6ぐらいで設定すると、ポーズ(構図)は変えずに服や髪型の変更は出来そうかなっという印象を受けました。
デフォルトの0.75で生成すると、
奇麗な絵にはなるけど、こちらの意図はほぼ拡大解釈されて、
別物になってしまう気がする、、