深層学習黎明期から認識〜生成AIまで。文書・画像・音声・LLMを横断するシステム設計をお手伝いします
ディープラーニングの黎明期から機械学習・AI分野に携わってきました。もともとはコンピュータービジョン系の研究・開発が中心で、物体検出・認識・セグメンテーションといった基礎的な認識タスクから、現場の業務に組み込む応用システムまで幅広く経験を積んできました。
Stable Diffusionの登場をきっかけに生成AIに強く惹かれ、以降は画像生成、音声認識・音声合成・音声変換、LLMを用いた対話システムや文章生成など、モダリティを横断してさまざまな分野に手を広げています。認識系で培った評価・デバッグ・データ設計の感覚を生成系にも持ち込み、PoCで終わらせず実運用に耐えるシステムとして組み上げるところまで責任を持って設計できる点が強みです。
追加学習(SFT等)や蒸留、既製APIとの組み合わせなど、「作る/学ばせる/使う」のどのレイヤーで手を打つかの判断も得意領域です。
【ご相談いただける内容】
・文書・画像・音声を扱うAIシステムの方式選定・設計
・既製API / RAG / 追加学習 / 蒸留 / 従来MLの使い分け
・PoCから実運用への移行、精度・コスト・レイテンシのトレードオフ整理
・生成AIを核にした新規プロダクト・アプリケーションの構想壁打ち
・外注先の提案内容の妥当性レビュー
現在はCEO/CTOとして自社の開発を推進しながら、他社のAIシステム設計・レビューもお引き受けしています。方針が定まらないまま外注・開発を進めると、PoCは動いても実運用では使い物にならない、というのがこの領域でよくある失敗です。初期の方針整理を一緒に行うことで、その無駄を最小化するお手伝いができればと思います。
お気軽にメッセージからご相談ください。