主页 > 豌豆AI > 正文

OpenAI最强AI智能体编程模型:GPT-5.3-Codex登场,基准测试全面霸榜

2026-02-06 10:28:33来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  2 月 6 日消息,OpenAI 昨日(2 月 5 日)发布公告,宣布推出 GPT-5.3-Codex,宣称这是其迄今最强的 AI 智能体编程模型。

  附上相关基准测试结果如下:

  在 SWE-bench Pro(公开版)测试中,该模型得分 56.8%,超越了前代的 56.4%;

  在 Terminal-Bench 2.0 测试中,其得分从前代的 64.0% 大幅跃升至 77.3%;

  最为显著的是在 OSWorld-Verified 智能体计算机操作基准测试中,得分从 38.2% 飙升至 64.7%,表明其在复杂环境下的操作能力实现了质的飞跃。

  官方数据显示,该模型不仅在多项编程基准测试中创下新高,运行速度也比前代 GPT-5.2-Codex 提升了 25%。

  OpenAI 致力于将 GPT-5.3-Codex 打造为更优秀的开发者协作工具。新模型支持用户在任务执行过程中进行“引导与交互”,且不会导致上下文丢失。

  在 Codex 应用中,模型会高频更新工作进度,允许开发者实时提问、讨论方案并修正方向。官方博文指出,Codex 正从单一的编程智能体演变为更通用的计算机协作者,大幅降低了构建应用的门槛。

  GPT-5.3-Codex 目前已全面向 ChatGPT 付费用户开放,涵盖 Plus、Team 及 Enterprise 等订阅计划。用户可通过 Codex 应用、命令行工具(CLI)、IDE 扩展插件及网页端立即访问,API 版本也将在近期上线。(故渊)

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
OpenAI组建广告诚信团队,为ChatGPT广告业务保驾护 OpenAI组建广告诚信团队,为ChatGPT广告业务保驾护

2 月 5 日消息,据 Business Insider 报道,OpenAI 正在组建一支团队,以确保不良广告

豌豆AI2026-02-05

OpenAI奥尔特曼批Anthropic超级碗广告“撒谎”,并 OpenAI奥尔特曼批Anthropic超级碗广告“撒谎”,并

2 月 5 日消息,当地时间周三,萨姆 · 奥尔特曼在 X 平台发文回应 Anthropic 全新

豌豆AI2026-02-05

法拉第未来发布具身智能机器人产品线,推出“ 法拉第未来发布具身智能机器人产品线,推出“

2 月 5 日消息,法拉第未来今天举办美国国家汽车经销商大会(NADA),活动中法

豌豆AI2026-02-05

从“基础设施”到“智能引擎”,亚马逊云科技 从“基础设施”到“智能引擎”,亚马逊云科技

2月4日消息,近日,弗若斯特沙利文联合头豹研究院发布的《2025年在华外商企业

豌豆AI2026-02-04

英伟达CEO黄仁勋:人工智能最终将降低能源成本 英伟达CEO黄仁勋:人工智能最终将降低能源成本

2 月 4 日消息,据报道,英伟达公司首席执行官黄仁勋表示,目前在许多地区给

豌豆AI2026-02-04

奥尔特曼:OpenAI可能会投资AI制药企业,并从科研 奥尔特曼:OpenAI可能会投资AI制药企业,并从科研

2 月 4 日消息,据报道,OpenAI 首席执行官萨姆・奥尔特曼表示,该公司可能会考

豌豆AI2026-02-04

OpenAI奥尔特曼评“AI专属社区”Moltbook:或为昙花 OpenAI奥尔特曼评“AI专属社区”Moltbook:或为昙花

2 月 4 日消息,据路透社报道,当地时间周二,OpenAI CEO 奥尔特曼表示,最近爆

豌豆AI2026-02-04

1.25万亿美元!xAI员工赢麻了:全员换股SpaceX,提 1.25万亿美元!xAI员工赢麻了:全员换股SpaceX,提

就在北京时间2月3日清晨,全球最强太空创企SpaceX官宣合并xAI!两家公司的掌舵

豌豆AI2026-02-04

年薪55.5万美元,OpenAI新的安全负责人来自竞争对 年薪55.5万美元,OpenAI新的安全负责人来自竞争对

2 月 4 日消息,去年 12 月,OpenAI 发布了一则安全防范负责人的招聘启事,其高

豌豆AI2026-02-04

OpenAI CEO:英伟达有全球最好的AI芯片 希望长期合 OpenAI CEO:英伟达有全球最好的AI芯片 希望长期合

2月3日消息,据外媒报道,在近几年大热的生成式人工智能热潮中,黄仁勋担任

豌豆AI2026-02-03