ChatGPTの「画像生成」、どう進化? 開発者に聞く “文字化け解消”の秘訣(ITmedia NEWS)

OpenAIは4月21日、画像生成AIモデル「ChatGPT Images 2.0」を発表した。
前世代から複数の性能を強化しており、AI性能評価サイト「Arena」ではGoogleの競合モデルを上回るスコアを記録している。
主な強化点の一つが「テキストレンダリング」性能で、日本語を含むローマ字以外の文字体系にも対応し、細かい文字も乱れなく生成できるようになった。
ただし縦書き表示については横書きと同等の水準には達しておらず、今後の改善が予定されている。
今回初めて搭載された「Thinking機能」により、出力前に計画を立てて複雑なタスクに対応できるほか、Web検索によるリアルタイム情報の参照や、一つの指示からの複数枚生成も可能となった。
また、生成した画像をモデル自身が検証し、不正確と判断した場合は再生成する自己修正機能も備えている。
開発者は設計思想として「あらゆるユースケースへの対応」を掲げており、クリエイティブ・教育・法人向けビジネスなど幅広い分野での活用を想定している。
今後も現在の方向性を維持しながら進化を続けていく方針だとしている。
前世代から複数の性能を強化しており、AI性能評価サイト「Arena」ではGoogleの競合モデルを上回るスコアを記録している。
主な強化点の一つが「テキストレンダリング」性能で、日本語を含むローマ字以外の文字体系にも対応し、細かい文字も乱れなく生成できるようになった。
ただし縦書き表示については横書きと同等の水準には達しておらず、今後の改善が予定されている。
今回初めて搭載された「Thinking機能」により、出力前に計画を立てて複雑なタスクに対応できるほか、Web検索によるリアルタイム情報の参照や、一つの指示からの複数枚生成も可能となった。
また、生成した画像をモデル自身が検証し、不正確と判断した場合は再生成する自己修正機能も備えている。
開発者は設計思想として「あらゆるユースケースへの対応」を掲げており、クリエイティブ・教育・法人向けビジネスなど幅広い分野での活用を想定している。
今後も現在の方向性を維持しながら進化を続けていく方針だとしている。
コメントを投稿
まだコメントはありません。
コメントするにはLINEログインが必要です。