Googleは2023年12月6日、新しいAIモデル「Gemini」を発表しました。Geminiは、テキスト、画像、動画、音声のマルチモーダルに対応した次世代AIモデルです。中でも、Gemini Proは、OpenAIのGPT-4を上回る性能を誇るとされています。
今回は、Gemini Proを実際に試してみました。
Gemini Proとは
Gemini Proは、Geminiの3種類のモードのうちの1つです。Gemini Proは、Googleの生成AIであるBardに搭載されています。Bardは、テキスト、コード、翻訳、さまざまな用途に利用できるAIです。
日本語版BardはGemini Proに未対応
現時点では、日本語版BardはGemini Proに未対応です。
日本でもBardでGemini Proを使う方法
日本でもGemini Proを使いたい場合は、チャットで利用する方法とAPIを利用する方法の2つがあります。
Chromeの言語を英語に変更して使用する
Chromeブラウザの言語設定を英語に変更するだけで、英語版Bardが表示され、Gemini Proを試すことができます。
Chromeブラウザの言語設定を英語に変更します。
Google検索で「Bard」を検索し、BardのWebサイトにアクセスして利用可能です。写真をアップロードして、日本語の入力、応答にも対応しています。
APIを使用する
APIを使用する場合は、API TOKENを発行して、Google Colabでチュートリアルが可能です。通常の質問はもちろん、画像についてのやり取り、履歴を使った方法など、ChatGPT APIと同等の機能が実装されている印象です。
まとめ
Gemini Proは、Googleが発表した次世代AIモデルです。テキスト、画像などマルチモーダルに対応しており、OpenAIのGPT-4を上回る性能を誇ると言われています。
日本語版Bardでは未対応ですが、英語版Bardでは利用可能です。Chromeブラウザの言語設定を英語に変更するだけで、英語版Bardを利用できます。