2024-7-25 画像生成AIは難しいと知る

記事

写真・動画

2024/07/25 14:29

VrewやNoLangは動画作成の工数を劇的に低下させました。というより、動画作成の工数は全くのゼロになりました。動画部分はVrewやNoLangによって自動的に生成されます。ただし、AIによって自動生成された動画が作者の意図から大きく離れていることが多いです。

そこで、次のステップとして一旦VrewやNoLangから離れ、Davinci Resolveを使った動画編集を試してみることにしました。これがどの程度大変かを確認するためです。カメラ画像を使用せず、全て何らかの方法で画像を生成する予定です。

まず、台本を作成し、その文章をChatGPTに校正してもらいます。次に、その台本を基に音声を生成するためにVoiceVoxを使い、セリフを場面ごとに話し手を変えるなどして音声ファイルを生成します。このVoiceVoxの結果には大変満足しています。

Davinci Resolveを起動し、新しいプロジェクトを作成し、VoiceVoxから取得した音声ファイルをタイムラインに並べます。また、BGMとしてDOVA-SYNDROMEを使用します。これも結果に満足しています。これらもタイムラインに取り込みます。音声ファイルの文章を元に字幕を作ります。これにも満足しています。

ここまでは作業は順調でしたが、次に画像を生成する段になると、途端に作業が進まなくなりました。例えば20シーンの画面数を計画していても、一つとして完成しない状況となり、どこかが間違っていたことに初めて気付かされました。

youtu.be/HY4trKMYlK8

#Vrew #NoLnag #VOICEVOX #DOVA-SYNDROME #DavinciResolve

masamiti97

プログラマ / 70代後半 / 男性

一覧に戻る