絞り込み条件を変更する
検索条件を絞り込む

すべてのカテゴリ

1 件中 1 - 1 件表示
カバー画像

AI革命の到来! 「o2」が博士号テストで驚異の105%スコアを達成

OpenAIのCEO、サム・アルトマンが自身のXアカウントで「o2」が博士号レベルのベンチマークで105%のスコアを達成したことを発表しました。 この「o2」とは未だ正式名称が不明ですが、OpenAIが開発中の次世代AIモデルで、その驚異的な性能が期待されています。 GPQAというAI性能を測定するためのベンチマークは、生物学、物理学、化学の専門家によって作成された48問の選択問題から構成されています。 このテストは非常に難易度が高く、専門家でもGoogle検索を駆使しても34%しか正解できないという結果が出ています。 また、博士号取得を目指す学生でさえ65%のスコアに留まるとされています。 「o2」は既存のAIスコアを大幅に上回るとアルトマンCEOが述べており、AI業界にとってのゲームチェンジャーとなる可能性があります。 すでに「GPT-4o」や「Claude 3」、「Llama 3」といった他の高性能AIモデルは、いずれも53.6%、54.4%、48.8%というスコアを記録しています。 その中で「o2」は圧倒的な優位性を持ち、博士号保有者以上の回答能力を示唆しています。 しかし、登場時期については不明であり、今後のリリース予定に関するアルトマンCEOの発言によると、2025年中には「GPT-5」のリリースが計画されているとのことですが、新モデルの「Orion」に関してはOpenAIが否定しています。 ここまで高性能なAIモデルが続々と登場する中で、開発者としての自分の立ち位置を考えざるを得ません。 AIがますます賢くなる中、自分たちがどうやって彼らと共存し、仕事を進めていく
0
1 件中 1 - 1