AIVTuber、全レイヤーを自分で設計・改造できる制作者です
「動かせる」ではなく「設計できる・壊して作り直せる」人間です。
AIVTuber「零音ほのか」をゼロから一人で構築・運営しながら、各技術を業界水準以上に作り込んできました。
【強み:各レイヤーの深さ】
◆ AIキャラクター・LLM設計
キャラクターの思考・感情・自律行動を「人体の器官」として設計するアーキテクチャを独自構築。
クラウドLLMとローカルLLM(Qwen等)を役割分担させ、リアルタイム配信に耐える判断系を実装しています。
視聴者との記憶を持つRAG(ベクトルDB)も設計・構築可能です。
◆ 音声合成(狂気レベルの作り込み)
Style-Bert-VITS2とAivisSpeechの複数エンジンに対応。
学習スクリプトをゼロから設計し直し、感情別の加重サンプリングやバッチ処理を独自実装。
コーパスの収録・分割・ノイズ除去・文字起こし・確認まで、全工程を自分の耳と手で仕上げます。
WebUIではなくコードベースで動かし、標準の工程では出せない品質を実現しています。
◆ アバター制御・配信演出
VTube Studioの無人モーション制御は、業界内でも参考にされています。
リップシンクの既存の問題点を独自制御で解決済み。
OBSも「映すだけ」ではなく、LLMと連動した演出制御として組み込んでいます。
◆ フルスタック配信システム
TTS・LLM・RAG・YouTube/Twitch連携・Live2D制御・OBS連携・字幕生成を、
一つのシステムとして自作・統合しています。
【提供できること】
AI音声モデル制作
既存TTSでは出ない感情・質感を持つ完全オーダーメイドのAIボイス。
収録から学習・調整まで一貫対応。
AIVtuberシステム構築
キャラクター設計・LLM・TTS・アバター・配信連携まで、要件に合わせてフルスクラッチで構築。
AIツール・バックエンド開発
LLM組み込み・音声合成・自動化ツールの設計・実装。
中小規模でも実用に耐える形で作り切ります。
【環境】
GPU:RTX 4060 Ti 16GB/メモリ:128GB
機械学習・音声処理・動画制作を同時に回せる環境を完備。
「AIで何かしたいけど、どこから手をつけるか」という段階からでも相談できます。