生成AIを使った企画力アップ

記事
IT・テクノロジー
今回は生成AIを使った企画立案のコツについて学ばせていただきましたので、ほぼ自分用ですがおいておきます。


【モダリティって何?】

まず「モダリティ」について説明しましょう。簡単に言うと、情報の形式や種類のことです。例えば:
・音声
・テキスト
・画像
・動画

これらはそれぞれ異なるモダリティです。人間の感覚で言えば、聴覚、視覚などに対応していると考えるとわかりやすいかもしれません。

【生成AIの魔法:モダリティ変換】

生成AIのすごいところは、このモダリティを自在に変換できること。例えば:
テキストから画像を作る(Midjourney、DALL-E)
音声をテキストに変える(Whisper,Gladia)
テキストから音声を作る(各種音声合成AI)
これらはすべてモダリティ変換の例です。

【モダリティ変換チェーンとは?】
ここからが本題。
モダリティ変換チェーンとは、これらの変換を連続して行うことで、より複雑で面白い結果を生み出す考え方です。
例えば:
テキスト → 画像 → テキスト
(文章を書く → イメージを生成 → そのイメージから新しいアイデアを文章化)

音声 → テキスト → 音声
(人の話を文字起こし → 内容を要約や翻訳 → 新しい音声で出力)
napkin-selection (1).png



この考え方を使うと、今までにない斬新なサービスや製品のアイデアが生まれやすくなります。

具体例:URLから動画を自動生成
ある会社が実際に開発した例を見てみましょう。
URL → テキスト&画像(Webスクレイピング)
テキスト → BGM生成用プロンプト → BGM
テキスト → 画像生成用プロンプト → 画像
テキスト → ナレーション文 → 音声
これらの要素を組み合わせて、最終的に動画を生成します。

一見複雑に見えますが、各ステップはシンプルなモダリティ変換の組み合わせです。

【なぜこの考え方が重要?】
斬新なアイデア創出:普通では思いつかないような組み合わせを考えられる
実現可能性の評価:各ステップが実現可能かどうかを簡単に判断できる
企画書作成の助け:プロセスを視覚化しやすく、説明しやすい

【実践のコツ】
まずは単純な変換から始める(テキスト → 画像、音声 → テキストなど)
徐々に複雑な変換チェーンを考える
各ステップで「思考」が必要な場合は、必ずテキストを経由する
(現状、複雑な思考ができるのは主に大規模言語モデル(LLM)なので)

【最後に】
モダリティ変換チェーンは、生成AIを使った企画立案の強力なツールです。この考え方を身につけることで、今までにない革新的なアイデアを生み出せる可能性が広がります。
ぜひ、自分の仕事や趣味の分野で、どんなモダリティ変換チェーンが考えられるか、アイデアを膨らませてみてください。きっと新しい発見があるはずです!

サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す ココナラコンテンツマーケット ノウハウ記事・テンプレート・デザイン素材はこちら