記事を開いていただきありがとうございます。フリーランスPythonエンジニアのベナオと申します。
ココナラさんでは、PythonによるWebシステム開発や機械学習のプログラム作成をさせてもらっております。
今回は、最近話題の画像生成AIについて紹介したいと思います。今までのAIはプログラムの経験のない方が個人で利用するのは難しいものが多かったのですが、これの良いところはなんと”文章で生成したい画像の指定”ができるというものです。
2022年の夏から様々な企業からそれぞれの学習モデルが公開される流れが続いていて、今では既存のラフスケッチ画像を入力すると完成品のイラストが生成されたりと次々アップデートされています。
1. 画像生成AI Midjourney登場
2022年7月13日にオープンソース(システムが一般に公開されている)の画像生成AIであるMidjourneyのオープンベータ版が公開されました。画像のような美麗なイラストを文章による指示だけで誰でも自動生成できるということで、大変話題になりました。
Midjoueneyは最初の数回のみ無料で生成機能が提供されていますが、その後Stable Diffusionという基本利用完全無料のオープンソースプロジェクトが公開されました。こちらはソースコードが完全に無償公開されたので、これをもとに様々な派生の生成モデルが開発・公開されていきました。
これらのイラストは全て、私が文章による指示から機械学習モデルが自動生成したものです。仕組みとしては大量の風景や人物のイラストデータと、それらの文章による説明をタグ付けしたデータセットを用意します。そのデータセットをモデルに学習させることで、疑似的に文章中の単語を認識して生成するイラストに反映することができます。
2. 画像生成AIの様々な使われ方
画像の生成にはPythonというプログラミング言語を使いますが、Google Colaboratoryというクラウド上でGPUをつかったプログラミングができるサービスを使うのが一般的です。
環境さえ整えば職業エンジニアでなくても誰でも、作りたい画像のイメージを文章にするだけで画像生成ができます。どのようなことに使われているのか例を挙げてみましょう。
例えばPixivというイラスト掲載サイトには、既にAIで生成したイラストが投稿されています。もちろんAIで生成したというタグをつけることがルールになってはいますが、それがなければ僕の目には人間が描いたとしか思えませんでした。
またMidjourneyで生成された絵が米国の美術品評会で1位で優勝するという事件もありました。
(ITmediaから引用)
入力するテキストや画像によってさまざまな使い道があり、他には実写画像をイラスト風に変換するようなこともできます。
他にも生成した画像を複数組み合わせて、漫画を作って公開している方もいらっしゃいました。他に考えられるのは動画やブログの素材だったり、SNSのアイコン作成でしょうか。これからもまだまだ新しい使い道が出てきそうです。
興味をお持ちいただいた方がいらっしゃいましたら、環境構築をサポートするサービスを始めましたのでお気軽にご相談ください。一緒に絵を描いて遊ぶ仲間ができたら嬉しいです!