Geminiを使ってみた！

記事

IT・テクノロジー

Googleは2023年12月6日、新しいAIモデル「Gemini」を発表しました。Geminiは、テキスト、画像、動画、音声のマルチモーダルに対応した次世代AIモデルです。中でも、Gemini Proは、OpenAIのGPT-4を上回る性能を誇るとされています。

今回は、Gemini Proを実際に試してみました。

Gemini Proとは

Gemini Proは、Geminiの3種類のモードのうちの1つです。Gemini Proは、Googleの生成AIであるBardに搭載されています。Bardは、テキスト、コード、翻訳、さまざまな用途に利用できるAIです。

現時点では、日本語版BardはGemini Proに未対応です。

日本でもGemini Proを使いたい場合は、チャットで利用する方法とAPIを利用する方法の2つがあります。

Chromeの言語を英語に変更して使用する

Chromeブラウザの言語設定を英語に変更するだけで、英語版Bardが表示され、Gemini Proを試すことができます。

Chromeブラウザの言語設定を英語に変更します。

Google検索で「Bard」を検索し、BardのWebサイトにアクセスして利用可能です。写真をアップロードして、日本語の入力、応答にも対応しています。

APIを使用する

APIを使用する場合は、API TOKENを発行して、Google Colabでチュートリアルが可能です。通常の質問はもちろん、画像についてのやり取り、履歴を使った方法など、ChatGPT APIと同等の機能が実装されている印象です。

Gemini Proは、Googleが発表した次世代AIモデルです。テキスト、画像などマルチモーダルに対応しており、OpenAIのGPT-4を上回る性能を誇ると言われています。

日本語版Bardでは未対応ですが、英語版Bardでは利用可能です。Chromeブラウザの言語設定を英語に変更するだけで、英語版Bardを利用できます。