主页 > 互联网 > 正文

蚂蚁灵波开源LingBot-Depth模型 让机器人精准抓取透明反光物

2026-01-27 13:25:15来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  1月27日消息,蚂蚁集团旗下具身智能公司灵波科技宣布开源高精度空间感知模型 LingBot-Depth。

  该模型基于奥比中光Gemini 330系列双目3D相机提供的芯片级原始数据,专注于提升环境深度感知与三维空间理解能力,旨在为机器人、自动驾驶汽车等智能终端赋予更精准、更可靠的三维视觉。

  据介绍,在NYUv2、ETH3D等权威基准评测中,LingBot-Depth展现出代际级优势:相比业界主流的 PromptDA与PriorDA,其在室内场景的相对误差(REL)降低超过70%,在挑战性的稀疏SfM 任务中RMSE误差降低约47% 。

  在家庭和工业环境中,玻璃器皿、镜面、不锈钢设备等透明和反光物体物体十分常见,但却是机器空间感知的难点。传统深度相机受制于光学物理特性,在面对透明或高反光材质时,往往无法接收有效回波,导致深度图出现数据丢失或产生噪声。

  针对这一行业共性难题,蚂蚁灵波科技研发了“掩码深度建模”(Masked Depth Modeling,MDM)技术,并依托奥比中光 Gemini 330 系列双目 3D 相机进行 RGB-Depth 数据采集与效果验证。当深度数据出现缺失或异常时,LingBot-Depth 模型能够融合彩色图像(RGB)中的纹理、轮廓及环境上下文信息,对缺失区域进行推断与补全,输出完整、致密、边缘更清晰的三维深度图。

  值得一提的是,LingBot-Depth 模型已通过奥比中光深度视觉实验室的专业认证。实验中,奥比中光 Gemini 330 系列在应用LingBot-Depth 后,面对透明玻璃、高反光镜面、强逆光及复杂曲面等极具挑战的光学场景时,输出的深度图依然平滑、完整,且物体的轮廓边缘非常锐利,其效果显著优于业内领先的3D 视觉公司 Stereolabs 推出的 ZED Stereo Depth 深度相机。

  LingBot-Depth 的优异性来源于海量真实场景数据。灵波科技采集约 1000 万份原始样本,提炼出 200 万组高价值深度配对数据用于训练,支撑模型在极端环境下的泛化能力。这一核心数据资产(包括 2M 真实世界深度数据和 1M 仿真数据)将于近期开源,推动社区更快攻克复杂场景空间感知难题。

  据了解,蚂蚁灵波科技已与奥比中光达成战略合作意向。奥比中光计划基于 LingBot-Depth 的能力推出新一代深度相机。本周蚂蚁灵波将陆续开源多款具身智能方向模型。

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
国产模型开源震撼老外,谷歌Genie 3紧急跟进?海 国产模型开源震撼老外,谷歌Genie 3紧急跟进?海

最近AI圈的一大看点,莫过于蚂蚁灵波和谷歌的“开源接力”。 先是蚂蚁灵波密

互联网2026-02-02

百度开源全新OCR模型 PaddleOCR-VL-1.5,性能超越De 百度开源全新OCR模型 PaddleOCR-VL-1.5,性能超越De

1月30日消息,百度在OCR领域再发力。 29日,百度正式发布并开源新一代文档解析

互联网2026-01-30

2026支付宝五福活动新增“健康福”,或将由蚂蚁 2026支付宝五福活动新增“健康福”,或将由蚂蚁

新浪科技讯 1月30日消息,新浪科技获悉,将于2月3日正式开启的2026年支付宝集

互联网2026-01-30

对标Genie 3 蚂蚁灵波开源世界模型LingBot-World 对标Genie 3 蚂蚁灵波开源世界模型LingBot-World

1月29日消息,蚂蚁集团旗下灵波科技今日宣布全面开源世界模型 LingBot-World。此

互联网2026-01-29

AI眼镜能付停车费了:小米眼镜联合蚂蚁GPASS上线 AI眼镜能付停车费了:小米眼镜联合蚂蚁GPASS上线

1月28日消息,近日,小米与蚂蚁集团合作,基于蚂蚁自研的全球首个智能终端可

互联网2026-01-28

蚂蚁灵波开源具身大模型LingBot-VLA 后训练代码全 蚂蚁灵波开源具身大模型LingBot-VLA 后训练代码全

1月28日消息,蚂蚁集团旗下灵波科技今日宣布全面开源具身大模型 LingBot-VLA。

互联网2026-01-28

DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑 DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑

1月27日消息,深度求索(DeepSeek)团队发布了论文《DeepSeek-OCR 2: Visual Causal Flo

互联网2026-01-27

X平台正式开源推荐算法,马斯克称没有其他社交 X平台正式开源推荐算法,马斯克称没有其他社交

1 月 20 日消息,埃隆 · 马斯克今日(1 月 20 日)宣布开源了新的 X 平台算法,

互联网2026-01-20

智谱联手华为开源新模型登顶Hugging Face,国产芯 智谱联手华为开源新模型登顶Hugging Face,国产芯

今日,智谱AI宣布,其与华为联合开源的新一代图像生成模型GLM-Image,在开源上

互联网2026-01-16

百川智能宣布开源全球最强医疗大模型Baichuan-M 百川智能宣布开源全球最强医疗大模型Baichuan-M

1月13日消息,百川智能宣布开源新一代医疗大模型 Baichuan-M3,该模型具有强推理

互联网2026-01-13