OpenAI、ChatGPTの画像生成機能を大幅にアップデート
OpenAIは、ChatGPTの画像生成機能を大幅に強化し、新たにGPT-4oモデルを導入しました。このアップデートにより、以下のような改善が実現されています。
主な改善点
1. 複雑な指示への追従性の向上
GPT-4oは「人間のフィードバックによる強化学習(RLHF)」を活用し、100人以上のトレーナーがAI生成コンテンツの誤りを修正することで、複雑な指示に対する理解と対応力が向上しました。
2. 画像内のテキスト生成能力の向上
従来のモデルでは難しかった画像内のテキスト生成が改善され、より正確で読みやすいテキストを含む画像が生成可能になりました。
3. 多様なスタイルへの対応
GPT-4oは「オムニモーダル」モデルとして、さまざまなデータタイプを生成でき、多様なスタイルの画像生成に対応しています。
利用可能なユーザー
この新機能は、無料ユーザーを含むすべてのChatGPTユーザーが利用可能です。
補足情報
画像生成プロセスの変更
GPT-4oは、画像を左から右、上から下へと順次生成する「自己回帰的アプローチ」を採用しています。これにより、テキストのレンダリングや属性の結合(バインディング)の精度が向上しています。
生成速度と品質のトレードオフ
新しい画像生成システムは、従来よりも生成に時間がかかる場合がありますが、生成される画像の品質や世界知識の反映度が向上しており、待ち時間に見合う価値があるとされています。
安全対策の強化
OpenAIは、生成される画像の不適切な使用を防ぐため、ウォーターマークの削除防止や性的なディープフェイクの生成ブロック、児童性的虐待資料(CSAM)の生成拒否など、強固な安全対策を導入しています。
画像の所有権と利用
ChatGPTで生成された画像の所有権はユーザーにあり、OpenAIの利用規約の範囲内で自由に使用することが可能です。
これらの改善により、ChatGPTの画像生成機能は、より高度で多様なニーズに対応できるようになりました。
生成法がコピー機のような動きに変わったのがわかりやすくなるようにドット絵の生成しました