開発録】 12年間の経験を、“自分の声”でPodcast化しています。
記事
写真・動画
最近、ChatGPTや画像生成ツール、音声モデルを組み合わせて、
自分の回顧録をPodcastとして半自動生成するワークフローを構築していました。
テーマは、
越境医療、海外患者対応、日本での事業立ち上げ、
そしてこの12年間で見てきたことです。
ただ、一番大きかった壁は「音声」でした。
10万文字を超える原稿を、
一般的なクラウドTTSだけで生成しようとすると、
どうしてもコストと制限の問題が出てきます。
そこで今回は、
自作している「SGH Voice」の音声モデルを使い、
自分の声に近い形でクローン化。
大量のテキストを、
自分の声で継続的に生成できる環境を作っています。
編集や画像生成も、
今はChatGPTや生成AIだけでかなり完結できる時代になりました。
技術的なハードルは、
想像以上に低くなってきています。
だから最近ずっと考えているのは、
「技術がない」ではなく、
“自分の経験を世に出す覚悟があるか”
ということです。
もし、
・自分の経験を音声として残したい方
・Podcastを始めたい方
・AIを使った発信や自動化に興味がある方
がいれば、ぜひ情報交換しましょう。