主页 > 豌豆AI > 正文

DeepSeek新模型MODEL1曝光

2026-01-21 10:29:08来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  1月21日消息,DeepSeek的下一代旗舰模型疑似提前曝光。在其官方GitHub代码库的更新中,一个名为“MODEL1”的新模型名称在多个技术文件中频繁出现,引发了人工智能社区的广泛关注。

  根据对代码库的深入挖掘,“MODEL1”的踪迹横跨了114个文件,共计被提及28次。尤为关键的是,它在代码逻辑中与当前已发布的“V32”(即DeepSeek-V3.2模型)并列出现,表明它并非现有模型的简单迭代,而极有可能是一个独立的新模型序列。

  技术分析显示,MODEL1与V3.2在底层架构上存在显著差异。代码对比指出,二者在KV(键值)缓存布局、稀疏性处理方式以及FP8精度解码等核心模块上采用了不同的实现方案。特别是在内存优化方面,MODEL1显示出多处针对性改进,这通常意味着它在处理效率或支持更长上下文方面可能有新的设计目标。

  此前有消息称DeepSeek计划在2026年春节前后发布其下一代重量级模型。因为,不少行业分析人士认为,此次MODEL1在开源代码中意外现身,就如同之前DeepSeek发布的优化残差链接“mHC”和AI记忆模块“Engram”两篇论文中提到的新技术一样,很可能正是为这次发布进行的技术准备。

  目前,DeepSeek官方尚未对此事发表任何公开评论。所有信息均来源于对公开代码的非官方分析,模型的具体技术细节、性能指标及正式名称仍需等待官方的最终揭晓。

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
2026支付宝集福新增“健康福”,AI扫马、全场景 2026支付宝集福新增“健康福”,AI扫马、全场景

2月2日消息,2026年春节“支付宝集福啦”活动将于2月3日0点上线,持续至除夕夜

豌豆AI2026-02-02

百度开源全新OCR模型 PaddleOCR-VL-1.5,性能超越De 百度开源全新OCR模型 PaddleOCR-VL-1.5,性能超越De

1月30日消息,百度在OCR领域再发力。 29日,百度正式发布并开源新一代文档解析

豌豆AI2026-01-30

DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑 DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑

1月27日消息,深度求索(DeepSeek)团队发布了论文《DeepSeek-OCR 2: Visual Causal Flo

豌豆AI2026-01-27

QuestMobile最新报告:文心助手登顶 AI 赛道用户规 QuestMobile最新报告:文心助手登顶 AI 赛道用户规

1月27日消息,QuestMobile发布的《2025 中国互联网价值榜》显示,百度App文心助手

豌豆AI2026-01-27

文心APP群聊功能开启新一轮内测,附操作方法 文心APP群聊功能开启新一轮内测,附操作方法

1月27日消息,百度文心APP推出的行业首个“多人、多Agent”群聊功能开启新一轮

豌豆AI2026-01-27

微软发布新定制AI芯片Maia 200:台积电3nm工艺,性 微软发布新定制AI芯片Maia 200:台积电3nm工艺,性

1 月 27 日消息,微软刚刚在官方博客正式发布了其定制 AI 加速芯片 Maia 200,旨

豌豆AI2026-01-27

“AI 教母”李飞飞初创公司洽谈5亿美元新一轮融 “AI 教母”李飞飞初创公司洽谈5亿美元新一轮融

1月24日消息,据外媒报道,由知名人工智能学者、有着“AI教母”之称的李飞飞

豌豆AI2026-01-24

百川启动「海纳百川」计划,新推出的最低幻觉 百川启动「海纳百川」计划,新推出的最低幻觉

1月22日消息,百川智能正式发布 Baichuan-M3 Plus,严肃医疗场景下的问答准确性、

豌豆AI2026-01-22

终于,机器人也成了房地产的“新叙事” 终于,机器人也成了房地产的“新叙事”

当几乎所有互联网公司都在围绕大模型及AI“超级入口”大张旗鼓地竞赛,其实

豌豆AI2026-01-22

TechWeb微晚报:DeepSeek新模型MODEL1曝光,央视曝光 TechWeb微晚报:DeepSeek新模型MODEL1曝光,央视曝光

今日要闻一览: 三星电子有望下半年开始为特斯拉代工AI5芯片 消息称关键设备

豌豆AI2026-01-21