最近どんどん進歩している、画像生成AIですが 最新バージョン
「新生成AI」を使ってみると驚異的な状況になってます。
「新生成AI」の画像を生成するためめ、旧verの画像生成AIサービスに
比較してみましたので報告します。
以前に比べプロンプト理解力が大幅に向上。自然に書かれた
プロンプトも理解し、複雑なプロンプトを行わなくても、
出力を簡単に得ることができるました。
照明と構成が適切で、視覚的に豊かで高品質の画像を生成。
テキストレンダリング機能の大幅な改善。
データセット内の有害なコンテンツを最小限に抑え、有害な出力の
可能性を減らすために、広範なフィルタリングとデータラベル付け
を使用。
Gemini ap&web exp., ImageFX ,Vertex AI 経由で利用可能。
「技術レポート」には、自他社のモデル(DALL-E 3、SD3、
Midjourney 、SDXL、Imagen2)との、プロンプトと画像の整合性、
視覚上のアピールを指標としたベンチマークが掲載されており
、多くの場合「新生成AI」が他に比べ優れているとされています。
旧verは1日の生成回数に制約があるものの(回数は明示されてはいない)、
無料で利用可。
「新生成AI」の特質 「新生成AI」は非常にフォトリアルな画像が
得られます。もちろん最近の他のプラットフォームやモデルでも
綺麗なフォトリアル画像は得られますが、
「新生成AI」は本当に現実にいる人物のような表現です。
一方、プロンプト記述の戦略を他モデルとは根本的に変える必要があります。
また、画像サイズは(原稿執筆時点では旧verで生成する場合、
1024x1024ピクセルの正方形に限られます。ほかのアスペクト比にも対応してほしいところです。
最近のモデル・プラットフォームで、生成して比較してみました。
旧verで生成する画像サイズと比較画像も同じアスペクト比としました。
具体的には、まずはなるべく少ない単語数で始め、単語を徐々に増や
していくのがお勧めです。
以下のサービスでノウハウご提供します。
https://coconala.com/mypage/services_lists