大量のデータを分析する場合などに
・Cloud Vision API:画像分析
・Cloud Speech API:音声分析
・Cloud Video Intelligence API:動画分析
Webアプリでのリアルタイム分析などの場合に
・MediaPipe
等の機械学習APIを使用したプログラムを作成します。
(*サムネの画像は、スポーツ新聞をスマホで撮影し、その画像の中で、検索したい文字列(ここでは「沢村賞」)がどこにあるかを求めたものです。文字列の座標を取得し、その座標から文字列を四角で囲み、どこにあったかを示しています。)
Cloud Vision API、Cloud Speech API、Cloud Video Intelligence APIではGCPプロジェクトが必要になります。
各APIの料金体系↓
Cloud Vision API:https://cloud.google.com/vision/pricing?hl=ja
Cloud Speech API :https://cloud.google.com/speech-to-text/pricing?hl=ja
Cloud Video Intelligence API:https://cloud.google.com/video-intelligence/pricing