こんにちは!AI王子です。
毎週のように新型AIが爆誕する状況に、正直もう追いつけなくなってきました。僕自身、毎日時間かけて新しいAIツールを検証していますが、それでも把握しきれないほどの勢いです!
今回は、ここ1週間でリリースされた超強力AIツールとモデル、さらに最新AIニュースをまとめました。
この記事を読めば、今週のAI界隈の動きをバッチリキャッチアップできます!
この記事でわかること
超高品質な動画生成AI「KRING 2.0 Master」と「VEO2」の実力
GPT-4を超える性能「GPT-4.1シリーズ」が限定公開
使いやすさ抜群の最新AIツール群(WordPressのAIウェブサイトビルダーなど)
ChatGPTの快進撃など見逃せないAI業界ニュース
超高品質動画生成AI革命!KRING 2.0 MasterとVEO2の衝撃
動画生成AIの進化が止まりません。特に先週リリースされた「KRING 2.0 Master」は文字通り桁違いの品質を実現しました。AIプラットフォームのKRING AIは4月15日に大規模アップデートを行い、新たな動画生成AIモデル「KRING 2.0 Master」と画像生成AIモデル「Colors 2.0」を実装しました。
KRING 2.0 Masterはテキストや画像から動画を生成でき、従来のKRING 1.6と比べて入力テキストにより忠実に従うようになりました。最大の特徴は、AI動画によくあったスローな動きがなくなり、より自然に動く超高品質な動画を作れるようになったことです。
Colors 2.0も入力テキストにより忠実に従うようになり、画質が大きく向上し、様々なスタイルの画像を作ることができるようになりました。その他、AIを使って画像を編集したり、画像のスタイルを変更できる機能も実装されています。
僕自身、Krea 2.0 Masterを使って動画を作ってみましたが、テキストから生成される動画に関しては過去のモデルと比べて桁違いにクオリティが上がっていました。
一方、GoogleのVEO2も「Google AI Studio」で全てのユーザーを対象に実装され、無料で動画を作れるようになっています。Google AI Studioは、Googleの開発者向けページにあるGoogle AI Studioにログインボタンを押し、Googleアカウントでログインして利用規約に同意すれば無料で使えます。VEO2が実装されている場合はログイン後のGoogle AI Studioの画面の左側に「Video Generation」という項目ができているので、この部分を押せばチャット経由でVEO2を使ってテキストや画像から動画を作れます。
なお、GoogleのAIチャット「Gemini」の有料プランのユーザーにもVEO2が展開され始めているようです。
GPT-4.1シリーズが登場!
OpenAIは4月15日、API限定で最新のAIモデル「GPT-4.1シリーズ」を公開しました。このシリーズは「GPT-4.1」と低コストで小型版の「GPT-4.1 Mini」「GPT-4.1 Nano」の3つのモデルで構成されています。
最大の特徴は100万入力トークンに対応し、長文への対応力が大幅に向上したことです。特にコーディングやAIに指示を出す際のテキストを理解する能力が高いとされており、GPT-4.1に関しては各種LLMベンチマークでGPT-4を上回る性能を示しています。
GPT-4.1シリーズはAPIの価格も低価格に抑えられており、特に一番小さいモデルのGPT-4.1 Nanoの価格はかなり低めに設定されています。
OpenAIのAPIを試せるPlaygroundページで利用できるほか、コーディングの性能が高いということでWarpやCursorなどのAIコードエディターに実装されています。また、様々なAIツールを使えるAIプラットフォームの「POE」で無料でも使えます。
なお、今回のGPT-4.1シリーズのリリースに合わせて、AIモデル「GPT-4.5 Preview」のAPIの提供は7月14日に終了する予定です。
次々と登場する便利なAIツール!初心者でも簡単に使える最新サービス
WordPressのAIウェブサイトビルダー
コンテンツ管理システムのWordPress.comは、テキストからウェブサイトのUIを構築できるAIツール「AIウェブサイトビルダー」を公開しました。公式ページからアクセスでき、Googleアカウントなどでログインすると無料で利用可能です。
ログイン後の画面は日本語にも対応していて、フォームに作りたいウェブサイトのイメージをテキスト入力するとAIチャットが立ち上がります。チャットで会話しながらウェブサイトを構築でき、形成されたウェブサイトは文字や色を変更するなどの編集が可能で、AIチャット経由で編集することもできます。作ったウェブサイトはドメインの購入が必要ですが、サーバーに展開して公開することもできます。
Hics Field AIの新機能
動画生成AIツール「Hics Field AI」は、画像と特殊エフェクトを組み合わせて動画を生成できるAI機能を実装しました。ツールページからログインすると、初回に動画を作るためのクレジットが付与されるので数回無料で動画を作れます。
今回追加された新機能は、ログイン後の画面の左上にある「Create」の部分を押した先のページで利用可能で、「Image」の項目でプリセットエフェクトを選び、「Image」の部分に画像を、「Prompt」の部分に画像の説明文を入力し、「Generate」ボタンを押せば画像にエフェクトが反映された動画が生成されます。
Webアプリ生成ツール「heyBoss AI」
テキストからWebアプリを生成できるAIツール「heyBoss AI」は4月9日、Webアプリの生成を依頼すると複数のAI開発エージェントが話し合いながらアプリを生成してくれる仕様にリニューアルされました。
「heyBoss AI」は日本語にも対応しており、公式ページの右上部にあるログインボタンを押し、Googleアカウントなどを使ってログインすると1回だけ無料で利用できます。ログイン後の画面にあるフォームに作りたいアプリのイメージをテキスト入力し、「構築を開始」ボタンを押すと、複数のAIエージェントが話し合いながら9分くらいでWebアプリを構築してくれます。
より多くのWebアプリを作ったり、生成するWebアプリにYouTube、Google Mapsなどの機能を統合できるようになるサブスクプランも用意されています。
PICAの新機能
動画生成AIツール「PICA」は、他のものには手を加えずにアップロードした動画内のキャラクターやオブジェクトを操作できる「編集」機能を公開しました。この機能はPICAの無料ユーザーも利用できます。
PICAはツールページからGoogleアカウントなどを使ってログインすれば、ある程度無料で動画を作れます。今回追加された新機能については、ログイン後の画面にあるフォームの横の「編集」ボタンを押し、動画をアップロード後に動画内のどの対象をどのように変更したいのかをテキスト入力し、ボタンを押せば動画が生成されます。
GrokのWeb版新機能
xAIの最新AIモデル「GROK-3」がスタンドアロンで動くAIチャット「Grok」のWebブラウザー版の無料プランのユーザーに、画像編集機能とペルソナ機能が実装されました。
GrokのWebブラウザー版は公式ページの右上にある「Sign」ボタンを押し、XやGoogleアカウントなどを使ってログインすると無料でも利用可能です。ログイン後の画面のフォームの横にある「Edit Image」ボタンを押すと、画像をアップロードしてアップロードした画像の背景を変更したり装飾可能です。「Personas」ボタンを押すと、芸人や家庭教師などの様々なペルソナが出てくるので、好きなペルソナを選んでそのペルソナとチャットできます。
VL ThinkingのリリースとデモページO
中国のAI会社Moonshot AIは、オープンソースで軽量な大規模言語モデル「VL」と、VLの推論モデル「VL Thinking」を公開しました。
推論のVLの方は各種LLMベンチマークのほとんどの項目でAlibabaグループの大規模言語モデル「Qwen 2.5 VL 7B」を上回るスコアを出しています。両モデルのソースコードはGitHubで提供されていて、Hugging FaceにVL Thinkingの無料のデモが公開されています。
デモでは、ファイルの部分に画像をアップロードし、横のフォームに質問を入力してボタンを押すと、画像に関する質問に答えてくれます。なお、言語は日本語にも対応しているようです。
Firebase StudioのリリースO
Google Cloudは、テキストからアプリを構築、編集、実行できる開発者向けのAIツール「Firebase Studio」を公開しました。
Firebase StudioはGoogleの開発するオンライン開発環境である「Project IDX」とAIモデル「Gemini」、アプリ開発ツールの「Gen Kit」を一つにまとめたツールで、アプリの構築、編集、実行を一箇所で加速するために設計されています。
Firebase Studioの公式ページにアクセスし、「Try Firebase Studio」ボタンを押し、GoogleアカウントでログインするとFirebase Studioが利用可能で、ログイン後のフォームを使って自然言語でアプリを構築できます。
見逃せないAI業界ニュース!ChatGPT躍進からNVIDIAの巨額投資まで
ChatGPTのモバイルアプリが3月に世界で最もダウンロードされる件
テクノロジー系のメディアTechCrunchによると、3月のChatGPTのモバイルアプリがiOSとGoogle Playマーケットの合算で、これまで上位を争っていたInstagramとTikTokアプリを抑え、世界で最もダウンロードされたアプリになったとのことです。なお、このランキングにはモバイルゲームは含まれていません。
ChatGPTは3月下旬にGPT-4を使った画像生成・編集機能が実装されて世界中で大きな話題となりましたが、このような定期的なアップデートがアプリのダウンロード数に貢献していると思われます。
GoogleはGeminiとVEOを統合する計画
TechCrunchによると、GoogleのDeepMindのデミス・ハサビスCEOはポッドキャストに出演した際に、GoogleのAIモデル「Gemini」と動画生成AIモデル「VEO」を統合する計画を明らかにしたとのことです。
この統合により、Geminiの物理世界での理解を向上させることを目指しているようです。ちなみに、VEOは現在最新モデルのVEO2が提供されていますが、ハサビス氏によるとVEO2はYouTubeの動画を大量に視聴することで物理法則を理解できるようになったと語っているとのことです。
NVIDIAが米国内で5000億ドルのAIインフラの構築を発表
NVIDIAは4月14日、台湾の半導体製造企業TSMCなどと提携し、今後4年間で最大5000億ドル規模のAIインフラを米国内に構築すると発表しました。なお、NVIDIAの最新のGPUである「Blackwell」は米国のアリゾナにあるTSMCの工場で生産を開始しているようです。
この発表は、米国のトランプ政権が貿易赤字の解消を狙って中国や台湾の製品に高い関税を課した直後の動きとなります。
Anthropicがクロードの大学生の利用調査を実施
「Anthropic」は同社のAIチャット「Claude」の会話約100万件を分析し、大学生がどのような用途でAIを利用しているかのレポートを公開しました。その結果、エッセイの編集や資料の要約などの教育コンテンツの作成・改善が最も多く、全体の会話の39.3%を占めました。次いでコーディング用途での利用が全体の会話の33.5%となりました。
また、Claudeを最も頻繁に使っているのはコンピューターサイエンス分野で、全体の会話の38.6%を占めました。Anthropicによると、この分野の学生は大学生全体の数に対して少数にも関わらず、利用頻度の高さが目立っているとコメントしています。
Anthropicのこのレポートは、AIが学術的なワークフローにどのように役立つかを示すものとして注目されています。
Alphabetが新型AI半導体「Ironwood」を発表
ロイターによると、Googleの親会社Alphabetは4月9日、第7世代のAI半導体「Ironwood」を発表しました。この半導体はAIツールの推論を高速化する設計となっていて、例えばユーザーがChatGPTのようなAIツールに質問をする際に不可欠な大量のデータ処理に適しています。この半導体の導入により、GoogleはAI分野での競争力をさらに強化することが期待されています。
サムスンがGeminiを実装したAIロボット「Ballie」を発表
サムスンとGoogle Cloudは4月9日、Googleの生成AI技術を搭載した家庭用AIロボット「Ballie」を発表しました。2025年夏に米国と韓国で発売予定となっています。
「Ballie」は音声対話で照明の調節、来客への対応、スケジュール管理、リマインダー設定などを行ってくれ、音声やカメラからの映像、センサーデータをリアルタイムで処理・理解し、さらにはユーザーの発言や行動に基づいて睡眠の改善や運動のアドバイスを提供してくれるということです。
Eleven Labsが東京に初の海外拠点を設立
AI音声プラットフォームを運営する「Eleven Labs」は4月14日、初の海外拠点となる日本法人「Eleven Labs合同会社」を東京に設立したと発表しました。
Eleven Labsは今年1月に1.8億ドルの資金調達を実施していて、今回の日本への進出をグローバル成長戦略の重要な一歩と位置づけています。日本法人では、Eleven Labsの最先端の音声生成プラットフォームを日本と韓国市場向けに展開するほか、日本語の言語的・文化的な特性に対応したローカライズやサポートも強化していくとしています。
富士通がAI搭載のマグロ脂乗り判定装置を開発
富士通は4月9日、本マグロの脂の乗りをAIで自動判定する検査装置を開発したと発表しました。この装置は従来必要だった部分の切断や解凍といった工程を省き、検査時間を最大80%短縮できるということです。
この装置を使うことで、人が行っていた1本あたりの判定時間が60秒から12秒に短縮され、判定精度の向上も期待されるとのこと。この装置の導入により、水産業界全体の効率化と品質の向上が期待されます。
1週間でこれだけ進化!
この1週間だけでも、AIの進化は目覚ましいものがありました。動画生成AIが大きく進化し、よりリアルで自然な動きの動画が生成できるようになりました。また、OpenAIは「GPT-4.1シリーズ」を公開し、100万トークンの長文対応やコーディング能力の向上を実現しています。
AIツールの分野ではWordPressの「AIウェブサイトビルダー」、「Hics Field AI」の特殊エフェクト機能、マルチエージェントによるWebアプリ生成、「PICA」の動画編集機能など、初心者でも使いやすい新機能が次々と登場しています。
AIニュースに目を向けると、ChatGPTのモバイルアプリが世界で最もダウンロードされたアプリになったり、GoogleがGeminiとVEOの統合を計画したり、NVIDIAが5000億ドル規模のAIインフラ構築を発表したりと、業界の動きも活発です。
AIの進化スピードがここ数年で急速してきましたが、遅れることなく一緒に成長していきましょうね!そのためにも僕も変わらず毎日投稿頑張ります!