主页 > 互联网 > 正文

OpenAI新模型来了！网友却叹气：还是输给谷歌

2025-12-17 14:25:07来源：Techweb编辑：李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

复制网址

　　作者 | 小小

　　出品 | 网易科技

　　参数依旧华丽，但体验真的能打吗？

　　在谷歌Nano Banana的步步紧逼下，高傲的OpenAI最终不得不选择了“自降身价”。新版GPT-Image-1.5的上线，虽然打出了4倍生成极速和“像素级”控制的王炸，更直接祭出了API端降价20%的肉搏战术，但这一切难掩其防御姿态的仓促。

　　舆论场瞬间撕裂。务实派大赞其“画质出色、控制精准，适用于实际生产”，认为这是工作流的福音；但权威专家却冷冷地泼下一盆冷水：“在处理复杂视觉内容时，其表现可能仍不及竞品Nano Banana Pro。”

　　也有评论员尖锐地指出：当OpenAI试图用“军备竞赛”的方式回应竞争，它是否已经忘记了当初那个誓言要造出AGI的初心？当科技巨头们不再讲故事，而是专注于“堆料”和“降价”时，这究竟是技术的进步，还是创新精神的沦陷？

　　带着这些疑问，让我们剥开GPT-Image-1.5华丽的速度外衣，它到底强在哪里？又有哪些“隐形短板”仍旧困扰着这位视觉霸主？

　　1. 硬核评测：速度狂飙4倍，从“佛系等待”到“实时反馈”

　　ChatGPT Images这次的产品策略非常清晰：用极致的速度和精准的控制力，直击专业级用户对效率与可控性的痛点。

　　——“极速”能力的质变：创作工作流的福音

　　如果你是重度创作者或营销人员，那么GPT-Image-1.5在速度上的进化，无疑将成为你眼中的绝对主角。

　　官方数据显示，新模型的生成速度最高直接飙升至原先的4倍！有网友评论称，这是“自从Nano Banana发布以来，AI图像生成领域在模型排名上最大的飞跃！”

　　在追求实时交互和高效迭代的今天，这种速度的革命性意义在于：

　　· 并行创作：用户可以在已有图像生成的同时，继续发起新的创作请求，彻底消除“等待时间”。

　　· 降低试错成本：以前需要数分钟的尝试，现在可以在几十秒内完成多轮迭代，极大地提高了“试错效率”。

　　这种速度的提升，使得图像生成从“被动等待”转向了近乎 “实时反馈”，为工作流的整合奠定了坚实的基础。

　　——独立创作空间：用户体验的颠覆性重构

　　为了配合这种高速迭代的需求，OpenAI推出了独立的Images创作空间，不再让图像功能仅仅是聊天窗口中的“附属功能”。

　　这个专属的“创意工作室”内置了多种预设滤镜、持续更新的流行提示词趋势以及创意模板。此外，用户还可以一次性上传个人形象（肖像），用于后续重复创作，从而降低了重复描述的成本。正如OpenAI应用负责人菲吉·西莫所说，新界面旨在让图像生成过程充满乐趣，使创意探索变得毫不费力。

　　——“精确编辑”的强悍实力：告别整体漂移

　　在具体的编辑应用场景中，GPT-Image-1.5也有质的飞跃：

　　· 一致性保持（核心）：它能更准确地区分图像中 “需要改变的部分” 与 “应当保持不变的部分”，并在内部推理中“钉死”关键的视觉锚点。例如，你可以给人物换服装、换发型，而人物的五官、面部特征和光照条件依然纹丝不动，大大提升了“试穿试戴”和“角色一致性”的实用价值。

　　· 指令遵循与文本渲染：模型在理解多约束、复杂组合要求时的稳定性有所提升。同时，它在文字渲染方面实现了进一步增强，能够更清晰地呈现密集文本与小字号内容，被视为图像模型“迈向实用化”的必要补课。

　　世界顶尖免疫学家德里亚·乌努特马兹（Derya Unutmaz）用“惊艳”来形容使用体验，特别称赞了ChatGPT Images在指令执行的精准度和图像编辑的细致程度上的出色表现。

　　2. 深度挖掘：光鲜背后的“隐形短板”与行业焦虑

　　但我们不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的参数之下，也有一些值得警惕的短板和行业焦虑。

　　——技术“护城河”的消失与GPT-Image-1.5的定位

　　这是奥特曼“红色警报”的核心原因之一。虽然OpenAI宣称GPT-Image-1.5在一致性方面有所突破，但行业现状是：差距已经微乎其微。

　　谷歌Nano Banana Pro在精确编辑、背景移除等方面一直领先。Runway在视频生成领域甚至反超了Sora。

　　有网友评论称，将版本号定为1.5而非2.0，本身就暗示了OpenAI的谨慎态度：这是一次重要迭代而非代际革命

　　曾经，OpenAI领先对手一年甚至两年；现在，这个领先优势被压缩到了几周甚至几天。图像生成的底层范式已经成为行业共识，OpenAI不再拥有独门秘籍。

　　——复杂构图与结构化设计的挑战

　　尽管模型在保持核心要素一致性上表现出色，但在面对复杂和结构化任务时，挑战依然存在。

　　沃顿商学院教授伊桑·莫利克（Ethan Mollick）认为，在处理复杂视觉内容（如多图幻灯片、信息图表等结构化设计）时，ChatGPT Images的表现可能仍不及竞品Nano Banana Pro。

　　前OpenAI研究员迈尔斯·布伦迪奇（Miles Brundage）则吐槽道，当提示词过长或过于复杂时，ChatGPT Images可能无法完全理解并协调所有细节，导致输出结果看起来随机或不准确。

　　这说明，模型在“抽象理解”和“多元素逻辑协调”上，仍未达到完美状态。

　　——降本增效：商业突围的布局

　　这次升级也是一场精明的商业突围。

　　GPT-Image-1.5已通过API形式正式开放，其最大的亮点在于：图像输入与输出的整体成本降低了约20%！ API定价为每百万输入Token 8美元、每百万输出Token 32美元。

　　这对于预算有限的初创公司和电商企业来说，无疑是极大的利好。Wix、Canva等头部企业已开始集成该模型。

　　正如Wix AI研究与数据科学负责人希拉·加特（Hila Gat）所言，GPT Image 1.5画质出色、控制精准，能准确执行编辑指令，支持端到端迭代，适用于实际生产。

投稿邮箱：lukejiwang@163.com 详情访问豌豆财经网：http://www.wdyxw.com.cn

相关推荐

TechWeb微晚报：中国内地新增70位亿万富豪，《蛋

今日要闻一览：消息称字节旗下火山引擎成2026年央视春晚独家AI云合作伙伴豆

互联网2025-12-23

清华团队在具身智能领域取得新突破：类脑认知

12 月 23 日消息，据新华社今日报道，清华大学智能产业研究院（AIR）研究团队

互联网2025-12-23

QM发布最新AI应用周活榜：豆包、DeepSeek、元宝、

12月23日消息，研究机构Quest Mobile发布的《2025下半年AI应用交互革新与生态落地

互联网2025-12-23

马蜂窝AI数据揭示冰雪旅游变革：“冰雪+”体验

12月23日消息，近日2025年冬季冰雪旅游与入境旅游创新发展会议在呼伦贝尔举行

互联网2025-12-23

中国内地新增70位亿万富豪：98%都是白手起家

12月23日消息，近日瑞银发布了第11份《亿万富豪报告》，其中中国内地新增70位

互联网2025-12-23

黑客能让AI发辞职信？OpenAI承认Atlas浏览器提示词

12 月 23 日消息，尽管 OpenAI 正致力于强化其 Atlas 人工智能浏览器的网络攻击防

互联网2025-12-23

充电宝、电动自行车等3C认证标志将新增追溯二维

12月23日消息，据市场监管总局官网发布的通知，我国将对充电宝、燃气燃烧器

互联网2025-12-23

Fortinet 2025年终媒体会：共赴AI驱动网络安全新时

12月22日消息，近日，专注推动网络与安全融合的全球性综合网络安全解决方案

互联网2025-12-22

新国标改写两轮车出行格局限速25km/h原因重大

12月22日消息，新国标正式执行后，可以说是改写了两轮车出行格局。新国标相

互联网2025-12-22

理想汽车与国航达成跨界合作：新车主购车3年内

12月22日消息，理想汽车官方今日宣布，近日，理想汽车与中国国际航空达成“

互联网2025-12-22

头条资讯

推荐资讯