主页 > 互联网 > 正文

OpenAI新模型来了!网友却叹气:还是输给谷歌

2025-12-17 14:25:07来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  作者 | 小小

  出品 | 网易科技

  参数依旧华丽,但体验真的能打吗?

  在谷歌Nano Banana的步步紧逼下,高傲的OpenAI最终不得不选择了“自降身价”。新版GPT-Image-1.5的上线,虽然打出了4倍生成极速和“像素级”控制的王炸,更直接祭出了API端降价20%的肉搏战术,但这一切难掩其防御姿态的仓促。

  舆论场瞬间撕裂。务实派大赞其“画质出色、控制精准,适用于实际生产”,认为这是工作流的福音;但权威专家却冷冷地泼下一盆冷水:“在处理复杂视觉内容时,其表现可能仍不及竞品Nano Banana Pro。”

  也有评论员尖锐地指出:当OpenAI试图用“军备竞赛”的方式回应竞争,它是否已经忘记了当初那个誓言要造出AGI的初心?当科技巨头们不再讲故事,而是专注于“堆料”和“降价”时,这究竟是技术的进步,还是创新精神的沦陷?

  带着这些疑问,让我们剥开GPT-Image-1.5华丽的速度外衣,它到底强在哪里?又有哪些“隐形短板”仍旧困扰着这位视觉霸主?

  1. 硬核评测:速度狂飙4倍,从“佛系等待”到“实时反馈”

  ChatGPT Images这次的产品策略非常清晰:用极致的速度和精准的控制力,直击专业级用户对效率与可控性的痛点。

  ——“极速”能力的质变:创作工作流的福音

  如果你是重度创作者或营销人员,那么GPT-Image-1.5在速度上的进化,无疑将成为你眼中的绝对主角。

  官方数据显示,新模型的生成速度最高直接飙升至原先的4倍!有网友评论称,这是“自从Nano Banana发布以来,AI图像生成领域在模型排名上最大的飞跃!”

  在追求实时交互和高效迭代的今天,这种速度的革命性意义在于:

  · 并行创作:用户可以在已有图像生成的同时,继续发起新的创作请求,彻底消除“等待时间”。

  · 降低试错成本:以前需要数分钟的尝试,现在可以在几十秒内完成多轮迭代,极大地提高了“试错效率”。

  这种速度的提升,使得图像生成从“被动等待”转向了近乎 “实时反馈”,为工作流的整合奠定了坚实的基础。

  ——独立创作空间:用户体验的颠覆性重构

  为了配合这种高速迭代的需求,OpenAI推出了独立的Images创作空间,不再让图像功能仅仅是聊天窗口中的“附属功能”。

  这个专属的“创意工作室”内置了多种预设滤镜、持续更新的流行提示词趋势以及创意模板。此外,用户还可以一次性上传个人形象(肖像),用于后续重复创作,从而降低了重复描述的成本。正如OpenAI应用负责人菲吉·西莫所说,新界面旨在让图像生成过程充满乐趣,使创意探索变得毫不费力。

  ——“精确编辑”的强悍实力:告别整体漂移

  在具体的编辑应用场景中,GPT-Image-1.5也有质的飞跃:

  · 一致性保持(核心):它能更准确地区分图像中 “需要改变的部分” 与 “应当保持不变的部分”,并在内部推理中“钉死”关键的视觉锚点。例如,你可以给人物换服装、换发型,而人物的五官、面部特征和光照条件依然纹丝不动,大大提升了“试穿试戴”和“角色一致性”的实用价值。

  · 指令遵循与文本渲染:模型在理解多约束、复杂组合要求时的稳定性有所提升。同时,它在文字渲染方面实现了进一步增强,能够更清晰地呈现密集文本与小字号内容,被视为图像模型“迈向实用化”的必要补课。

  世界顶尖免疫学家德里亚·乌努特马兹(Derya Unutmaz)用“惊艳”来形容使用体验,特别称赞了ChatGPT Images在指令执行的精准度和图像编辑的细致程度上的出色表现。

  2. 深度挖掘:光鲜背后的“隐形短板”与行业焦虑

  但我们不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的参数之下,也有一些值得警惕的短板和行业焦虑。

  ——技术“护城河”的消失与GPT-Image-1.5的定位

  这是奥特曼“红色警报”的核心原因之一。虽然OpenAI宣称GPT-Image-1.5在一致性方面有所突破,但行业现状是:差距已经微乎其微。

  谷歌Nano Banana Pro在精确编辑、背景移除等方面一直领先。Runway在视频生成领域甚至反超了Sora。

  有网友评论称,将版本号定为1.5而非2.0,本身就暗示了OpenAI的谨慎态度:这是一次重要迭代而非代际革命

  曾经,OpenAI领先对手一年甚至两年;现在,这个领先优势被压缩到了几周甚至几天。图像生成的底层范式已经成为行业共识,OpenAI不再拥有独门秘籍。

  ——复杂构图与结构化设计的挑战

  尽管模型在保持核心要素一致性上表现出色,但在面对复杂和结构化任务时,挑战依然存在。

  沃顿商学院教授伊桑·莫利克(Ethan Mollick)认为,在处理复杂视觉内容(如多图幻灯片、信息图表等结构化设计)时,ChatGPT Images的表现可能仍不及竞品Nano Banana Pro。

  前OpenAI研究员迈尔斯·布伦迪奇(Miles Brundage)则吐槽道,当提示词过长或过于复杂时,ChatGPT Images可能无法完全理解并协调所有细节,导致输出结果看起来随机或不准确。

  这说明,模型在“抽象理解”和“多元素逻辑协调”上,仍未达到完美状态。

  ——降本增效:商业突围的布局

  这次升级也是一场精明的商业突围。

  GPT-Image-1.5已通过API形式正式开放,其最大的亮点在于:图像输入与输出的整体成本降低了约20%! API定价为每百万输入Token 8美元、每百万输出Token 32美元。

  这对于预算有限的初创公司和电商企业来说,无疑是极大的利好。Wix、Canva等头部企业已开始集成该模型。

  正如Wix AI研究与数据科学负责人希拉·加特(Hila Gat) 所言,GPT Image 1.5画质出色、控制精准,能准确执行编辑指令,支持端到端迭代,适用于实际生产。

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
TechWeb微晚报:中国内地新增70位亿万富豪,《蛋 TechWeb微晚报:中国内地新增70位亿万富豪,《蛋

今日要闻一览: 消息称字节旗下火山引擎成2026年央视春晚独家AI云合作伙伴 豆

互联网2025-12-23

清华团队在具身智能领域取得新突破:类脑认知 清华团队在具身智能领域取得新突破:类脑认知

12 月 23 日消息,据新华社今日报道,清华大学智能产业研究院(AIR)研究团队

互联网2025-12-23

QM发布最新AI应用周活榜:豆包、DeepSeek、元宝、 QM发布最新AI应用周活榜:豆包、DeepSeek、元宝、

12月23日消息,研究机构Quest Mobile发布的《2025下半年AI应用交互革新与生态落地

互联网2025-12-23

马蜂窝AI数据揭示冰雪旅游变革:“冰雪+”体验 马蜂窝AI数据揭示冰雪旅游变革:“冰雪+”体验

12月23日消息,近日2025年冬季冰雪旅游与入境旅游创新发展会议在呼伦贝尔举行

互联网2025-12-23

中国内地新增70位亿万富豪:98%都是白手起家 中国内地新增70位亿万富豪:98%都是白手起家

12月23日消息,近日瑞银发布了第11份《亿万富豪报告》,其中中国内地新增70位

互联网2025-12-23

黑客能让AI发辞职信?OpenAI承认Atlas浏览器提示词 黑客能让AI发辞职信?OpenAI承认Atlas浏览器提示词

12 月 23 日消息,尽管 OpenAI 正致力于强化其 Atlas 人工智能浏览器的网络攻击防

互联网2025-12-23

充电宝、电动自行车等3C认证标志将新增追溯二维 充电宝、电动自行车等3C认证标志将新增追溯二维

12月23日消息,据市场监管总局官网发布的通知,我国将对充电宝、燃气燃烧器

互联网2025-12-23

Fortinet 2025年终媒体会:共赴AI驱动网络安全新时 Fortinet 2025年终媒体会:共赴AI驱动网络安全新时

12月22日消息,近日,专注推动网络与安全融合的全球性综合网络安全解决方案

互联网2025-12-22

新国标改写两轮车出行格局 限速25km/h原因重大 新国标改写两轮车出行格局 限速25km/h原因重大

12月22日消息,新国标正式执行后,可以说是改写了两轮车出行格局。 新国标相

互联网2025-12-22

理想汽车与国航达成跨界合作:新车主购车3年内 理想汽车与国航达成跨界合作:新车主购车3年内

12月22日消息,理想汽车官方今日宣布,近日,理想汽车与中国国际航空达成“

互联网2025-12-22