当前位置: 首页 > news >正文

刚刚!OpenAI发布图像生成模型 GPT Image 1.5,附上一手实测

面对Google Nanobanana Pro的强势出击,OpenAI终于坐不住了。

就在刚刚,OpenAI推出了新一代图片生成模型——GPTImage 1.5

此次OpenAI瞄准的核心是一个长期困扰用户的痛点:图片编辑的一致性问题。

此前的GPT-4o生图虽然在网上掀起过一场"吉卜力美学"的热潮,但其最大的软肋就是编辑时的一致性不行。

除了一致性的改进,新模型的生成速度也提升到了之前的四倍,同时新模型对指令的遵循也更加可靠。

还有大家关心的价格,GPT Image 1.5 的图像输入和输出成本比上一代降低了 20%。

此外,ChatGPT还给生图功能配套了一个全新的独立使用界面,内置了丰富的风格库和很多创意的玩法。

不过这里有一个坏消息,OpenAI明确指出,不支持中文。

在我们实测的过程中也发现了这个问题,中文生成的效果非常糟糕。

那它的其他的效果怎么样呢?老规矩,我们实际测试一番。

先来看GPT Image 1.5的一致性效果如何?

案例一:背景移除

提示词:移除背景中的任何人物,同时保持主要人物不变。自然地填补背景,使其看起来好像那些人从未存在过。

除了消除背景中的人物外,其他的物体都没有变化,而且它还补全了之前被人物遮挡的画面。

案例二:单属性编辑

提示词:把她的头发颜色换成金色/橘色/粉色/红色,保持发型和人物不变

这组会更加直观,除了发色变了之外,衣服上的花纹、纹理都没有任何变化。

案例三:三视技术图

提示词:请根据图片精细绘制cybertruck的标准三视技术图,并补充爆炸分解展示。所有主要部件用英文标注名称及功能说明,标明关键尺寸,布局清晰现代、具有科技感,整体规范符合工业工程制图标准。

效果依旧不错,整个画面是清晰、可读的。每部件都有英文标标签,分解部分也是专业。

案例4:黑白图上色

提示词:给图片进行上色

上色的效果很好,细节没有丧失。整个画面依旧充满故事性的,并不是看起来不自然。

案例5:YouTube封面

提示词:帮我生成youtube的封面图

整个图片构图非常好,无论是文字的主体突出、排版还是上色,都十分协调。

案例6:纸张修复

提示词:修复撕毁的纸张,还原完整清晰的文字和笔迹

这一组明显翻车了。根据第一张图看,"TH"和"DE"各自是一行的,但还原的图片同样把它们放到了同一行。

案例七:多人物一致性

提示词:制作一个好莱坞级别的真人英雄海报,这6个人都在海报封面上

其他人物还原的都很好。但山姆.奥特曼像是开了美颜似的,他的下颚线有这么锋利吗?

目前,GPT Image 1.5已经向全球所有 ChatGPT 用户和 API 用户推出,免费用户也可以使用,大概每天是生成8次,感兴趣的可以去试玩一下。

如果你还不会升级Plus,可以使用wildAI一键升级Plus。

相关阅读:wildAI一键升级GPT Plus

在看GPT Image 1.5的排名,已经在LMArena 的文本到图像中排名第一,而图片编辑是排名第四。

http://www.cnnetsun.cn/news/101584.html

相关文章:

  • vue基于springboot的土壤监测信息采集系统
  • vue基于springboot的小区停车场收费车辆计费管理系统的设计与实现
  • vue基于springboot的文创产品商城众筹平台设计与实现
  • vue基于springboot的物流运输仓储仓库采购信息系统平台的设计与实现
  • 基于SpringBoot的民宿管理系统的设计与实现毕业设计项目源码
  • 基于SpringBoot的民运会赛务管理系统的设计与实现毕业设计项目源码
  • PCB焊锡虚焊排查与预防全攻略
  • 保姆级教程!把AI大模型训练过程揉碎了讲给你听,小白也能秒懂!
  • 4-DE10-Nano的HDMI方块移动案例——I2C通信协议
  • 5款AI写论文哪个好?深度横评后我发现了宏智树AI学术圈隐藏的“六边形战士”
  • 软件测试认证体系全面分析
  • 局域网扫描工具 MyLanViewer v6.7.2 便携版
  • EmotiVoice能否支持实时变声聊天?技术可行性验证
  • 如何提升合成语音的韵律感?EmotiVoice提供完整方案
  • 办公室中的Python课 P03 【数据小仓库】变量与数据类型:文件柜里的不同标签
  • 计算机毕业设计|基于springboot + vue敬老院管理系统(源码+数据库+文档)
  • 基于EmotiVoice的语音合成应用实践全攻略
  • 微爱帮完成数百万种子轮融资,投资方未透露
  • 16、深入了解Linux工作站连接配置
  • 21、Linux 系统打印机配置与网络共享全攻略
  • 【Qt 5.14.2 新手实战】QTC++入门筑基——10 分钟做个文本编辑器:QLineEdit + QTextEdit 核心用法
  • 区块链智能合约测试方法论与实践路径
  • 椭圆曲线的群、子群和阶
  • EmotiVoice如何确保克隆声音不侵犯原声权?
  • 【Java毕设全套源码+文档】基于springboot的人力资源管理系统的设计与实现(丰富项目+远程调试+讲解+定制)
  • 【Java毕设全套源码+文档】基于Java的贫困地区儿童资助系统的设计与实现(丰富项目+远程调试+讲解+定制)
  • jQuery EasyUI 应用 - 创建展开行明细编辑表单的 CRUD 应用
  • 9、量子计算在供应链实时路线优化中的应用
  • 【JVS更新日志】物联网、低代码、项目管理12.17更新说明!
  • 网络安全证书合集,看这一篇就够啦!