Geminiを使ってみた!

記事
IT・テクノロジー
Googleは2023年12月6日、新しいAIモデル「Gemini」を発表しました。Geminiは、テキスト、画像、動画、音声のマルチモーダルに対応した次世代AIモデルです。中でも、Gemini Proは、OpenAIのGPT-4を上回る性能を誇るとされています。

今回は、Gemini Proを実際に試してみました。
スクリーンショット 2024-01-21 144931.png


Gemini Proとは

Gemini Proは、Geminiの3種類のモードのうちの1つです。Gemini Proは、Googleの生成AIであるBardに搭載されています。Bardは、テキスト、コード、翻訳、さまざまな用途に利用できるAIです。
スクリーンショット 2024-01-21 144853.png

日本語版BardはGemini Proに未対応

現時点では、日本語版BardはGemini Proに未対応です。

日本でもBardでGemini Proを使う方法

日本でもGemini Proを使いたい場合は、チャットで利用する方法とAPIを利用する方法の2つがあります。

Chromeの言語を英語に変更して使用する
Chromeブラウザの言語設定を英語に変更するだけで、英語版Bardが表示され、Gemini Proを試すことができます。

Chromeブラウザの言語設定を英語に変更します。

スクリーンショット 2024-01-21 145109.png

Google検索で「Bard」を検索し、BardのWebサイトにアクセスして利用可能です。写真をアップロードして、日本語の入力、応答にも対応しています。
スクリーンショット 2024-01-21 145300.png


APIを使用する
APIを使用する場合は、API TOKENを発行して、Google Colabでチュートリアルが可能です。通常の質問はもちろん、画像についてのやり取り、履歴を使った方法など、ChatGPT APIと同等の機能が実装されている印象です。
スクリーンショット 2024-01-21 101900.png

スクリーンショット 2024-01-21 134420.png

まとめ

Gemini Proは、Googleが発表した次世代AIモデルです。テキスト、画像などマルチモーダルに対応しており、OpenAIのGPT-4を上回る性能を誇ると言われています。
日本語版Bardでは未対応ですが、英語版Bardでは利用可能です。Chromeブラウザの言語設定を英語に変更するだけで、英語版Bardを利用できます。
サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す