主页 > 豌豆AI > 正文

一周AI大事件：谷歌“杀红了眼”夺回王座，奥特曼罕见承认：正在追赶

2025-12-05 16:21:47来源：Techweb编辑：李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

复制网址

　　史诗级的一周！AI进化被狠狠按下了“快进键”。

　　谷歌、OpenAI、xAI三大巨头仿佛约好了一样，同时亮出“底牌”。尤其是谷歌，这次真的可以说是“杀红了眼”，誓要夺回王座。

　　话不多说，带你复盘这疯狂的一周，看看神仙打架到底有多狠。

　　一、重磅工具：谷歌Gemini 3全家桶炸场

　　毫无疑问，本周的主角属于谷歌。Gemini 3 Pro的发布标志着AI时代翻开新篇章，在多模态推理和整体性能上树立了新标杆。

　　1. Gemini 3 Pro：推理能力翻倍

　　这是谷歌迄今为止最先进的多模态AI推理模型。

　　· 性能超群：在推理、数学、编码、视觉理解等基准测试中均达到SOTA（最先进）水平。

　　· 数据炸裂：在最新的ARC-AGI-2基准测试中，开启“深度思考”模式的Gemini 3 Pro拿下了45%的惊人高分！这是此前所有AI模型得分的两倍以上。

　　· 实战无敌：在分析视频或编写用户界面代码等实际应用中，表现远超跑分数据。

　　2. Nano Banana Pro：图像生成的“精细狂魔”

　　Nano Banana迎来Pro级进化，这次绝不再是“小打小闹”。谷歌基于Gemini 3 Pro打造的这款图像生成模型主打“精准”和“真实”。

　　· 4K级画质：支持高达4K分辨率的高保真渲染。

　　· 文字渲染游刃有余：文本渲染错误率从56%暴跌至8%。

　　· 超强指令跟随能力：支持多达14张参考图的混合生成，非常适合制作复杂的信息图表、产品样机、建筑图纸和漫画。

　　目前付费用户已可在Gemini App中使用，开发者也可通过API调用。

　　3. Antigravity：AI原生编程IDE

　　这款AI编程IDE（集成开发环境）堪称重新定义编程，看来程序员们的生产力工具要换代了。Antigravity IDE不仅拥有代码补全、内联编辑等标配功能，更引入强悍的智能体能力。

　　· 多智能体工作流：拥有专门的修Bug智能体、文档智能体，甚至集成了浏览器。

　　· 智能体管理器：开发者可以像管理员工一样管理AI。虽然原生支持Gemini 3 Pro，但也兼容其他模型。

　　谷歌这把王座，基本是坐稳了。据报道，上个月竞争对手OpenAI的研究员们就听说谷歌已经开发出新AI，而且这种新AI在技术路径上似乎已经超越了OpenAI。CEO萨姆·奥特曼（Sam Altman）在内部备忘录中坦言：“我们知道还有很多工作要做，但正在快速追赶。”他特意告诫员工，“我预计外界氛围短期内会比较糟糕。”

　　然而冰冻三尺非一日之寒。

　　本周，谷歌CEO桑德尔·皮查伊（Sundar Pichai）发了一条只有五个字母的推文：“iykyk”（懂得都懂）。配图是一张由AI生成的、鲜美多汁的芝士汉堡。

　　看似玩梗的背后，是谷歌重回科技巅峰的霸气宣言。这表明，在Gemini 3的理解中，现实终于回到正确轴线——芝士被完美地融化在了肉饼之上。

　　普通人可能觉得这没什么了不起，但在科技大佬眼里，这代表了AI技术的重大飞跃。

　　前Coinbase首席技术官、知名投资人巴拉吉·斯里尼瓦桑（Balaji Srinivasan）一针见血地指出：“通常情况下，AI模型在处理空间方位，尤其是物体相对位置时非常吃力。但这张图表明Gemini 3解决了这个问题。如果AI能精确地知道芝士该放在哪，它就拥有了真正的空间推理能力。”

　　市场本周给出了最直接的反馈：谷歌股价飙升至历史新高，市值一举超越微软。

　　科技媒体BI认为，这是皮查伊长达十年的“AI优先”战略终于开花结果。正如斯里尼瓦桑所评价的那样：“谷歌真的做到了‘放下一切’去专注AI。Gemini 3标志着他们夺回领先优势的时刻。皮查伊不仅将谷歌的收入翻倍至1000亿美元，现在更在技术和商业上将公司带到了前所未有的高度。”

　　二、强敌环伺：OpenAI与xAI的反击

　　谷歌虽然风光，但AI领域的对手们也绝非吃素。

　　1. OpenAI：GPT-5.1来了

　　本周OpenAI也发布了GPT-5.1-Codex-Max和GPT-5.1 Pro，显然不甘让谷歌独占风头。

　　· Codex-Max：专为长周期软件工程设计，能处理长达24小时的任务，并能自动压缩上下文。在SWE-Lancer等基准测试中拿下SOTA成绩。

　　· Pro升级： ChatGPT Pro升级至GPT-5.1 Pro，被称为“研究级”模式，推理能力大幅增强。

　　ChatGPT还面向全球所有用户开放群聊功能，这意味着你可以拉朋友和AI一起聊天了。

　　用户热评：程序员经过一周体验GPT-5.1 Pro，总体评价认为GPT-5.1是具备怪物级能力的最强模型。推理深度惊人，适合复杂任务，却有安全过滤过度、输出偶尔僵硬的痛点；Codex-Max执行长任务的效率提升30%，但需优化上下文管理。

　　2. xAI：Grok 4.1极速进化

　　马斯克麾下的xAI打法非常激进，本周发布了Grok 4.1及其Fast版本。

　　· Grok 4.1：在情商和创意写作上大幅提升。其思考模式在LMArena上得分1483，仅次于Gemini 3 Pro。

　　· Grok 4.1 Fast：提供200万token的上下文窗口，不仅便宜，还配备强大的Agent Tools API（智能体工具接口），支持联网、搜索X帖子、执行代码等，定位为“最适合深度研究的AI智能体”。

　　用户热评： “非思考”的Grok 4.1达到了大多数顶级模型仅通过“思维链”模型才能达到的智能水平。

　　三、硬核工具与开源生态

　　Meta SAM 3 & SAM 3D：堪称视觉领域的重磅炸弹。Meta发布第三代“分割一切”模型（SAM 3），能检测并分割视频中的任何物体。全新的SAM 3D更是能将单张静态照片转化为3D模型。这套技术已经应用在Facebook Marketplace的“实景预览”功能中。

　　用户热评：生成速度非常快，但生成多个物体时排列略显混乱，暂无法下载生成文件。

　　AI2 Olmo 3：艾伦人工智能研究所发布全开源的SOTA模型Olmo 3（有7B和32B两个版本），不仅开源权重，还开源完整训练流程和数据，真正造福开源社区。

　　用户热评：基础模型性能与Qwen 2.5处于同一水平。

　　Replit Design Mode：有效利用Gemini 3 Pro的能力，只需一段文字就能生成配色、排版精美的复杂UI界面。

　　用户热评：半个小时就出设计作品。没有AI的痕迹，没有千篇一律的紫色渐变，效果真的很好。

　　Google WeatherNext 2：谷歌发布的新一代AI气象模型，将集成在Pixel手机和搜索中，让天气预报更准、分辨率更高。

　　用户热评： AI的预测速度现在比天气变化的速度还要快。

　　四、机器人与科学前沿

　　Sunday Robotics Memo：斯坦福华人团队创立的具身智能公司Sunday Robotics展示了一款名为Memo的人形机器人，它没有复杂的五指手，而是采用双夹爪设计，却能熟练完成洗碗、洗衣和倒咖啡等家务。配合ACT-1“零数据”基础模型，公司期望通过低成本训练降低机器人门槛。

　　用户热评：为什么机器人公司如此痴迷于制造恐怖玩意儿？这些机器人里只有Memo一个看起来不会在睡梦中杀了我。你可能会觉得“看起来不致命”应该是家用机器人的首要考虑因素，但显然事实并非如此。干得漂亮！

　　GPT-5助力科研： OpenAI发布论文，展示GPT-5在数学、物理和生物领域的应用，它甚至帮助研究人员发现了4个此前未解数学问题的证明。

　　用户热评：这份长达80页的论文犹如一记警钟，唤醒了科学界。

　　五、商业与政策风向

　　英伟达势不可挡：英伟达最新季度财报营收达570亿美元，超华尔街预期。CEO黄仁勋坦言：“Blackwell芯片供不应求，AI正无处不在。”

　　用户热评：利润率50%的生意！这是地球上的事儿吗？

　　Genspark获巨额融资： AI智能体搜索公司Genspark完成2.75亿美元B轮融资，估值达12.5亿美元。

　　用户热评：区区30人团队，短短6个月估值就10亿美元。

　　政策两重天：美国白宫正准备由联邦政府接管AI监管权，防止各州“各自为政”；而欧盟则在放宽限制，推迟了高风险AI模型的合规期限，旨在为创新松绑。

　　六、深度观察：AI音乐的隐忧

　　Deezer和益普索（Ipsos）合作的一项最新调查揭示有趣现象：97%的听众无法区分人类创作的音乐和AI生成的音乐。

　　目前每天有超过5万首AI音乐提交Deezer平台。虽然大家都支持标注“AI生成”，但也有51%的人担心，未来流媒体平台会被低质量、通用的“AI口水歌”淹没。

　　人类的创造力会被海量的AI作品淹没吗？这将取决于我们每个人的选择。

　　用户热评：某个说唱歌手突然意识到，他的表现竟然不如一块GPU。

　　结语：你需要做什么？

　　这一周让我们清晰看到了未来：AI不再只是陪聊玩具，而是真正进入了“强推理”和“智能体落地”的阶段。

　　如果你是开发者，第一时间去试用Antigravity和Codex-Max；如果你是设计师，Nano Banana Pro可能会成为新的生产力外挂；如果你是普通用户，记得去体验一下ChatGPT的群聊功能。

　　在这个技术爆炸的时代，唯一的风险，就是停止学习。（辰辰）

投稿邮箱：lukejiwang@163.com 详情访问豌豆财经网：http://www.wdyxw.com.cn