AntigravityとGeminiを活用し、YMM4を自動化する
システム案をまとめてみます。
「YMM4とAIによる動画制作ワークフロー_0926」でも書きましたが。
ここ1年くらい構想をいろいろ検討してきまして私の能力で
可能な方法がまとまりました。
これから、実践していきたいということでメモの段階です。
1. 開発環境の構築とツールの準備
AIエージェント駆動の開発環境であるAntigravityを
インストール。
必要な機能がパッケージ化されており、初心者が環境構築に
悩むことなくAIコーディングを開始できるのが特徴です。
使用ツール: コード生成用のGemini、実行言語としてのPython、
データ管理用のGoogle スプレッドシート、そして
出力先となるYMM4を連携させます。
2. データの正規化(スプレッドシート)
Pythonプログラムが処理しやすいように、台本データを整形。
縦持ち形式への変換: 人間が見やすい横長の形式から、
1行1データの「データベース形式」に変換します。
関数の活用: 複雑な処理をAIに書かせるよりも、
スプレッドシートの標準関数(TRANSPOSE()やIF()など)を
使ってデータを整える方が、バグが少なく効率的です。
3. YMM4でのプロジェクト土台作り
プログラムが素材を配置するための「基準点」を、
あらかじめYMM4側で作成しておきます。
アンカーの設定: スプレッドシートから書き出した
CSVをYMM4に読み込ませ、配置されたボイスアイテムを
基準に、プログラムが音声の開始位置(Frame)や
長さ(Length)を取得できるようにします。
テンプレートの作成: 理想のエフェクトやアニメーションを
設定した「ひな形アイテム」をプロジェクト内に用意します。
プログラムはこのアイテムを「複製(Clone)」して素材を
配置する役割を担います。
4. AIによるプログラム開発(バイブコーディング)
人間が直接コードを書くのではなく、日本語の指示(擬似コード)
をGeminiに与えてプログラムを生成させます。
指示書の作成: 変数名、参照元、処理順序、分岐条件を明確に
定義した日本語の指示をGeminiに伝えます。
実装するロジック: YMM4プロジェクトからのキーフレーム取得、
同じ背景が続く区間を結合する素材の接着、抽象的なタグ
(「微笑み」など)を具体的なファイルパスに変換する
タグの展開などをAIに行わせます。
5. システムの実行と運用
非エンジニアでも運用しやすいように、UIを整えます。
GUIとバッチファイルの作成: Geminiに対し、
「操作画面(GUI) と、それを起動するための
バッチファイル(.bat)」を 作成するよう指示します。
これにより、黒い画面(ターミナル)を
操作することなく、ダブルクリックとボタン操作だけで
自動化システムを実行できるようになります。
最終調整: 自動処理は約10秒で完了します。
その後、人間が演出の微調整などのクリエイティブな
作業に集中して仕上げを行います。
「ロジックは日本語でGeminiに伝え、データの準備は
スプレッドシート関数で行い、実行はAntigravityに任せる」
ことで、プログラミング知識が乏しくても高度な
自動化システムを構築可能です。
スライド化も(ご参考)