主页 > 豌豆AI > 正文

一周AI大事件:谷歌“杀红了眼”夺回王座,奥特曼罕见承认:正在追赶

2025-12-05 16:21:47来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  史诗级的一周!AI进化被狠狠按下了“快进键”。

  谷歌、OpenAI、xAI三大巨头仿佛约好了一样,同时亮出“底牌”。尤其是谷歌,这次真的可以说是“杀红了眼”,誓要夺回王座。

  话不多说,带你复盘这疯狂的一周,看看神仙打架到底有多狠。

  一、重磅工具:谷歌Gemini 3全家桶炸场

  毫无疑问,本周的主角属于谷歌。Gemini 3 Pro的发布标志着AI时代翻开新篇章,在多模态推理和整体性能上树立了新标杆。

  1. Gemini 3 Pro:推理能力翻倍

  这是谷歌迄今为止最先进的多模态AI推理模型。

  · 性能超群: 在推理、数学、编码、视觉理解等基准测试中均达到SOTA(最先进)水平。

  · 数据炸裂: 在最新的ARC-AGI-2基准测试中,开启“深度思考”模式的Gemini 3 Pro拿下了45%的惊人高分!这是此前所有AI模型得分的两倍以上。

  · 实战无敌: 在分析视频或编写用户界面代码等实际应用中,表现远超跑分数据。

  2. Nano Banana Pro:图像生成的“精细狂魔”

  Nano Banana迎来Pro级进化,这次绝不再是“小打小闹”。谷歌基于Gemini 3 Pro打造的这款图像生成模型主打“精准”和“真实”。

  · 4K级画质: 支持高达4K分辨率的高保真渲染。

  · 文字渲染游刃有余: 文本渲染错误率从56%暴跌至8%。

  · 超强指令跟随能力: 支持多达14张参考图的混合生成,非常适合制作复杂的信息图表、产品样机、建筑图纸和漫画。

  目前付费用户已可在Gemini App中使用,开发者也可通过API调用。

  3. Antigravity:AI原生编程IDE

  这款AI编程IDE(集成开发环境)堪称重新定义编程,看来程序员们的生产力工具要换代了。Antigravity IDE不仅拥有代码补全、内联编辑等标配功能,更引入强悍的智能体能力。

  · 多智能体工作流: 拥有专门的修Bug智能体、文档智能体,甚至集成了浏览器。

  · 智能体管理器: 开发者可以像管理员工一样管理AI。虽然原生支持Gemini 3 Pro,但也兼容其他模型。

  谷歌这把王座,基本是坐稳了。据报道,上个月竞争对手OpenAI的研究员们就听说谷歌已经开发出新AI,而且这种新AI在技术路径上似乎已经超越了OpenAI。CEO萨姆·奥特曼(Sam Altman)在内部备忘录中坦言:“我们知道还有很多工作要做,但正在快速追赶。”他特意告诫员工,“我预计外界氛围短期内会比较糟糕。”

  然而冰冻三尺非一日之寒。

  本周,谷歌CEO桑德尔·皮查伊(Sundar Pichai)发了一条只有五个字母的推文:“iykyk”(懂得都懂)。配图是一张由AI生成的、鲜美多汁的芝士汉堡。

  看似玩梗的背后,是谷歌重回科技巅峰的霸气宣言。这表明,在Gemini 3的理解中,现实终于回到正确轴线——芝士被完美地融化在了肉饼之上。

  普通人可能觉得这没什么了不起,但在科技大佬眼里,这代表了AI技术的重大飞跃。

  前Coinbase首席技术官、知名投资人巴拉吉·斯里尼瓦桑(Balaji Srinivasan)一针见血地指出:“通常情况下,AI模型在处理空间方位,尤其是物体相对位置时非常吃力。但这张图表明Gemini 3解决了这个问题。如果AI能精确地知道芝士该放在哪,它就拥有了真正的空间推理能力。”

  市场本周给出了最直接的反馈:谷歌股价飙升至历史新高,市值一举超越微软。

  科技媒体BI认为,这是皮查伊长达十年的“AI优先”战略终于开花结果。正如斯里尼瓦桑所评价的那样:“谷歌真的做到了‘放下一切’去专注AI。Gemini 3标志着他们夺回领先优势的时刻。皮查伊不仅将谷歌的收入翻倍至1000亿美元,现在更在技术和商业上将公司带到了前所未有的高度。”

  二、强敌环伺:OpenAI与xAI的反击

  谷歌虽然风光,但AI领域的对手们也绝非吃素。

  1. OpenAI:GPT-5.1来了

  本周OpenAI也发布了GPT-5.1-Codex-Max和GPT-5.1 Pro,显然不甘让谷歌独占风头。

  · Codex-Max: 专为长周期软件工程设计,能处理长达24小时的任务,并能自动压缩上下文。在SWE-Lancer等基准测试中拿下SOTA成绩。

  · Pro升级: ChatGPT Pro升级至GPT-5.1 Pro,被称为“研究级”模式,推理能力大幅增强。

  ChatGPT还面向全球所有用户开放群聊功能,这意味着你可以拉朋友和AI一起聊天了。

  用户热评: 程序员经过一周体验GPT-5.1 Pro,总体评价认为GPT-5.1是具备怪物级能力的最强模型。推理深度惊人,适合复杂任务,却有安全过滤过度、输出偶尔僵硬的痛点;Codex-Max执行长任务的效率提升30%,但需优化上下文管理。

  2. xAI:Grok 4.1极速进化

  马斯克麾下的xAI打法非常激进,本周发布了Grok 4.1及其Fast版本。

  · Grok 4.1: 在情商和创意写作上大幅提升。其思考模式在LMArena上得分1483,仅次于Gemini 3 Pro。

  · Grok 4.1 Fast: 提供200万token的上下文窗口,不仅便宜,还配备强大的Agent Tools API(智能体工具接口),支持联网、搜索X帖子、执行代码等,定位为“最适合深度研究的AI智能体”。

  用户热评: “非思考”的Grok 4.1达到了大多数顶级模型仅通过“思维链”模型才能达到的智能水平。

  三、硬核工具与开源生态

  Meta SAM 3 & SAM 3D: 堪称视觉领域的重磅炸弹。Meta发布第三代“分割一切”模型(SAM 3),能检测并分割视频中的任何物体。全新的SAM 3D更是能将单张静态照片转化为3D模型。这套技术已经应用在Facebook Marketplace的“实景预览”功能中。

  用户热评: 生成速度非常快,但生成多个物体时排列略显混乱,暂无法下载生成文件。

  AI2 Olmo 3: 艾伦人工智能研究所发布全开源的SOTA模型Olmo 3(有7B和32B两个版本),不仅开源权重,还开源完整训练流程和数据,真正造福开源社区。

  用户热评: 基础模型性能与Qwen 2.5处于同一水平。

  Replit Design Mode: 有效利用Gemini 3 Pro的能力,只需一段文字就能生成配色、排版精美的复杂UI界面。

  用户热评: 半个小时就出设计作品。没有AI的痕迹,没有千篇一律的紫色渐变,效果真的很好。

  Google WeatherNext 2: 谷歌发布的新一代AI气象模型,将集成在Pixel手机和搜索中,让天气预报更准、分辨率更高。

  用户热评: AI的预测速度现在比天气变化的速度还要快。

  四、机器人与科学前沿

  Sunday Robotics Memo: 斯坦福华人团队创立的具身智能公司Sunday Robotics展示了一款名为Memo的人形机器人,它没有复杂的五指手,而是采用双夹爪设计,却能熟练完成洗碗、洗衣和倒咖啡等家务。配合ACT-1“零数据”基础模型,公司期望通过低成本训练降低机器人门槛。

  用户热评: 为什么机器人公司如此痴迷于制造恐怖玩意儿?这些机器人里只有Memo一个看起来不会在睡梦中杀了我。你可能会觉得“看起来不致命”应该是家用机器人的首要考虑因素,但显然事实并非如此。干得漂亮!

  GPT-5助力科研: OpenAI发布论文,展示GPT-5在数学、物理和生物领域的应用,它甚至帮助研究人员发现了4个此前未解数学问题的证明。

  用户热评: 这份长达80页的论文犹如一记警钟,唤醒了科学界。

  五、商业与政策风向

  英伟达势不可挡: 英伟达最新季度财报营收达570亿美元,超华尔街预期。CEO黄仁勋坦言:“Blackwell芯片供不应求,AI正无处不在。”

  用户热评: 利润率50%的生意!这是地球上的事儿吗?

  Genspark获巨额融资: AI智能体搜索公司Genspark完成2.75亿美元B轮融资,估值达12.5亿美元。

  用户热评: 区区30人团队,短短6个月估值就10亿美元。

  政策两重天: 美国白宫正准备由联邦政府接管AI监管权,防止各州“各自为政”;而欧盟则在放宽限制,推迟了高风险AI模型的合规期限,旨在为创新松绑。

  六、深度观察:AI音乐的隐忧

  Deezer和益普索(Ipsos)合作的一项最新调查揭示有趣现象:97%的听众无法区分人类创作的音乐和AI生成的音乐。

  目前每天有超过5万首AI音乐提交Deezer平台。虽然大家都支持标注“AI生成”,但也有51%的人担心,未来流媒体平台会被低质量、通用的“AI口水歌”淹没。

  人类的创造力会被海量的AI作品淹没吗?这将取决于我们每个人的选择。

  用户热评: 某个说唱歌手突然意识到,他的表现竟然不如一块GPU。

  结语:你需要做什么?

  这一周让我们清晰看到了未来:AI不再只是陪聊玩具,而是真正进入了“强推理”和“智能体落地”的阶段。

  如果你是开发者,第一时间去试用Antigravity和Codex-Max;如果你是设计师,Nano Banana Pro可能会成为新的生产力外挂;如果你是普通用户,记得去体验一下ChatGPT的群聊功能。

  在这个技术爆炸的时代,唯一的风险,就是停止学习。(辰辰)

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
任正非最新讲话曝光 1.4万字 信息量巨大 任正非最新讲话曝光 1.4万字 信息量巨大

12月5日消息,近日,华为创始人任正非在位于上海的华为练秋湖研发中心与IC

豌豆AI2025-12-05

瑞银证券熊玮:现阶段中国出现“AI泡沫”的可能 瑞银证券熊玮:现阶段中国出现“AI泡沫”的可能

12月5日消息,瑞银证券中国互联网行业分析师熊玮近日发表中国AI智见报告,以

豌豆AI2025-12-05

四天告别四位高管,苹果高层面临大换血 四天告别四位高管,苹果高层面临大换血

四天时间,苹果四位高管先后离职,其中包括两位核心竞争力负责人。虽然一位

豌豆AI2025-12-05

3天下载量破50万 蚂蚁8个月憋出的“灵光”大招到 3天下载量破50万 蚂蚁8个月憋出的“灵光”大招到

11月18日,蚂蚁集团正式发布全模态通用AI助手“灵光”,上线第一天下载量破

豌豆AI2025-12-05

2025开放原子开发者大会在京开幕 2025开放原子开发者大会在京开幕

11月21日,2025开放原子开发者大会在京开幕。大会以“一切为了开发者——AI共

豌豆AI2025-12-05

全球首发豆包深度思考大模型及场景,荣威M7 D 全球首发豆包深度思考大模型及场景,荣威M7 D

11月21日,第二十三届广州国际汽车展览会正式开幕。上汽荣威于发布会现场全

豌豆AI2025-12-05

消息称 OpenAI 正从苹果的硬件工程团队中大肆挖人 消息称 OpenAI 正从苹果的硬件工程团队中大肆挖人

IT之家 11 月 23 日消息,据彭博社记者马克・古尔曼今日报道,OpenAI 正在从苹果

豌豆AI2025-12-05

斑马与北京大学发展与比较心理实验室启动“中 斑马与北京大学发展与比较心理实验室启动“中

11月25日消息,近日,斑马儿童科教集团与北京大学发展与比较心理实验室达成

豌豆AI2025-12-05

Anthropic最新Claude Opus 4.5大模型上市,API价格大降 Anthropic最新Claude Opus 4.5大模型上市,API价格大降

11月25日消息,Anthropic最新的大模型Claude Opus 4.5今天上市。Anthropic团队表示,C

豌豆AI2025-12-05

百度新设两个大模型研发部,向CEO李彦宏汇报 百度新设两个大模型研发部,向CEO李彦宏汇报

11月26日消息,百度发布设立技术研发组织相关公告,新设基础模型研发部,负

豌豆AI2025-12-05