ご希望いただいた人物の音声をAIに学習させ、その声でナレーションを作成します。
知人の声を利用する場合は、その知人の音声が10分ほど収録された何らかのデータ(音声または動画ファイル)をお送りください。
元の音質に依存しますため、クリアな素材であれば、書き出されるナレーションも同じく高音質になります。
人気声優に関しては、既存の学習モデルがあれば料金は変わりませんが、
新たに学習させなければならない場合は、知人の声と同様に、学習費用+¥5,000が発生します。
台本は必ず購入者様のほうでご用意ください。
また、実際に生成した際、学習音声と一部テキストの相性によっては不自然に聞こえることがありますため、その際は文言を修正してもよいかご相談させていただきます。
※現在のところ、声に対する著作権は認められておらず、
他者の声を無断で利用しても著作権侵害には該当しません。
あくまで、モラルや倫理的な問題に留まります。
ただ今後、法改正がされ、声に著作権が生じるようになった際、
そのナレーションを無断で利用して被った損害に関しては、
一切の責任を負いませんので、あらかじめご了承ください。
クオリティを上げようとすると、かなりの手間と時間がかかる作業のため
ナレーション音声の作成は、一口500文字までとさせていただきます。
「単にRVCに読み込ませるだけじゃないか簡単だろ」と思われるかもしれません。
確かにYouTubeなどにアップされているものは大抵がそうです。
しかし、声というものは、
イントネーションやクセなど、本人の口調や音域に合わせなければ
別人のように聞こえてしまうので、適当にボイスロイドなどで生成した音源を使っても
クオリティが低いものに仕上がります。
本人かAIか聞き分けられないほどのクオリティまで持っていくには、
モノマネのスキルや、ボイスロイドを完璧に調教するスキルが必要です。
さらにRVCは、5秒~15秒単位で切り分けて生成しなければ音声が乱れるため、
10分のナレーションを作るだけでも、
約1ヶ月近くかかるような非常に骨の折れる作業です。
よい音源ができたと思ってRVCに読み込ませてみたら、
全く違ったものに仕上がったなんてことはザラで、
何度もリテイクする忍耐力と、
精度を高める経験則が必要な作業ということをご理解ください。