すべてのカテゴリ

1 件中 1 - 1 件表示

AI革命の到来！　「o2」が博士号テストで驚異の105%スコアを達成

OpenAIのCEO、サム・アルトマンが自身のXアカウントで「o2」が博士号レベルのベンチマークで105%のスコアを達成したことを発表しました。この「o2」とは未だ正式名称が不明ですが、OpenAIが開発中の次世代AIモデルで、その驚異的な性能が期待されています。 GPQAというAI性能を測定するためのベンチマークは、生物学、物理学、化学の専門家によって作成された48問の選択問題から構成されています。このテストは非常に難易度が高く、専門家でもGoogle検索を駆使しても34%しか正解できないという結果が出ています。また、博士号取得を目指す学生でさえ65%のスコアに留まるとされています。「o2」は既存のAIスコアを大幅に上回るとアルトマンCEOが述べており、AI業界にとってのゲームチェンジャーとなる可能性があります。すでに「GPT-4o」や「Claude 3」、「Llama 3」といった他の高性能AIモデルは、いずれも53.6%、54.4%、48.8%というスコアを記録しています。その中で「o2」は圧倒的な優位性を持ち、博士号保有者以上の回答能力を示唆しています。しかし、登場時期については不明であり、今後のリリース予定に関するアルトマンCEOの発言によると、2025年中には「GPT-5」のリリースが計画されているとのことですが、新モデルの「Orion」に関してはOpenAIが否定しています。ここまで高性能なAIモデルが続々と登場する中で、開発者としての自分の立ち位置を考えざるを得ません。 AIがますます賢くなる中、自分たちがどうやって彼らと共存し、仕事を進めていく

IT・テクノロジー