主页 > 互联网 > 正文

蚂蚁数科宣布开源数据分析智能体技术 当前登顶BIRD

2025-12-15 13:24:40来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  12月15日消息,在第二届CCF中国数据大会上,蚂蚁数科宣布开源旗下数据智能体关键技术Agentar SQL全套论文、代码、模型和使用指南。该智能体技术可让非专业人员通过日常语言进行商业数据查询和分析,为企业数智化提供更精准可用的智能数据分析基座。

  蚂蚁数科首期开源实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供一套开箱即用的数据查询方案,提升文本与数据库查询交互效率。2026年,蚂蚁数科将陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互技术框架,覆盖意图理解、业务理解到数据理解的全链路数据能力。

  今年9月25日,由该技术支持的蚂蚁数科数据分析智能体Agentar-Scale-SQL登顶全球最具权威性的自然语言转结构化查询语言(NL2SQL)评测基准BIRD-SQL,超越Google等诸多国内外厂商。目前,该智能体仍在执行准确率排行榜以及执行效率榜保持双榜第一,已持续领跑超两月。 BIRD-SQL要求AI模型将自然语言查询转换为SQL,并且在真实复杂的大规模生产级数据库中稳定执行。其数据集覆盖金融、电力、医疗等37个真实行业场景,总量33GB,包含超过1万条高复杂度查询任务,被认为是全球最难的NL2SQL测试。

  研究机构预测,全球商业智能市场规模2025年达474.8亿。中国商业智能与分析软件市场规模2025年达12亿。预计到2028年,中国商业智能软件市场规模将达到17.9亿美元,未来5年市场年复合增长率(CAGR)为12.7%,成为未来构建企业智能技术的重要且必要的投资领域。

  目前,中国企业对商业智能与分析产品的使用深度差异较大,大部分集中在报表、驾驶舱、仪表板、数据大屏等数据可视化和简单分析需求。而如何在保持准确性的前提下,提升在真实生产环境中的可用性被认为是NL2SQL在产业中规模化落地的普遍挑战。

  蚂蚁数科AI技术负责人章鹏在会上指出,NL2SQL在实际落地中面临四大严峻挑战:理解模糊多义的人类口语、注入庞大的行业专业知识、解析复杂的数据库结构与关联,以及生成准确无误的复杂SQL语句。这些挑战意味着,简单的模型“套壳”远不足以满足企业级应用的可靠性与准确性要求。

  例如金融领域从业者往往需要结合复杂业务规则与多条件组合进行数据查询才能有效地进行产品数据分析;业务管理中,非专业数据分析人员口语化提问,则需要背后的产品保证行业术语、询问意图的正确理解,再与数据库字段精准匹配,才能产出真实准确的结果。

  章鹏强调,BIRD-SQL主要评测SQL的复杂度生成能力(在线扩展OnlineScaling),但要真正实现产业可用的NL2SQL乃至数据智能体技术,必须构建更完整的能力栈。除了在线扩展,还需包含:
1. 离线扩展(Offline Scaling):对数据库的深度理解与知识结构化。
2. 人机交互(Human Interaction):智能体识别自身不确定性,主动与用户澄清意图,实现白盒化、可纠错的协作。
3. 自我进化(Self Evolution):通过“记忆”优化、工具(如UDF)创建与复用等“免调优”技术,使智能体能够从错误中学习,持续提升,降低对大量标注数据和专家调优的依赖。

  蚂蚁数科计划逐步将这些更全面的能力模块持续开源,如理解数据库的Agentar Profiling-SQL、实现免调优进化的Agentar TuningFree-SQL等。首期在线扩展框架Agentar-Scale-SQL开源内容已发布在arXiv、GitHub、ModelScope及Hugging Face等平台。

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
中东企业有望“接盘”极越,Robo.ai宣布报名参与 中东企业有望“接盘”极越,Robo.ai宣布报名参与

12 月 22 日消息,据美通社 12 月 19 日消息,Robo.ai Inc. 已正式向上海集度汽车有

互联网2025-12-22

涉及超300座尊享充电站,保时捷中国宣布明年3月 涉及超300座尊享充电站,保时捷中国宣布明年3月

12 月 22 日消息,保时捷中国宣布将逐步停止旗下尊享充电站的运营服务。 注意

互联网2025-12-22

拼多多宣布实行联席董事长制度,任命赵佳臻为 拼多多宣布实行联席董事长制度,任命赵佳臻为

12月19日消息,据媒体报道,今日拼多多集团在年度股东大会上宣布实行联席董

互联网2025-12-19

拉美成新增长极 起点国际宣布启动多语种孵化加 拉美成新增长极 起点国际宣布启动多语种孵化加

12月18日消息,在第四届上海国际网络文学周上,中国音像与数字出版协会发布

互联网2025-12-18

万宁宣布将关闭中国内地所有线下门店及线上商 万宁宣布将关闭中国内地所有线下门店及线上商

12月17日消息,据万宁中国官网发布消息,因公司业务战略调整需要,将关闭中

互联网2025-12-17

OpenAI宣布:苹果Apple Music即将与ChatGPT集成 OpenAI宣布:苹果Apple Music即将与ChatGPT集成

12 月 17 日消息,很快用户就能让 ChatGPT 快速创建 Apple Music 歌单,以及完成其他

互联网2025-12-17

蚂蚁集团旗下AI健康应用“蚂蚁阿福” 冲上苹果 蚂蚁集团旗下AI健康应用“蚂蚁阿福” 冲上苹果

12月16日消息,蚂蚁集团旗下AI健康应用“蚂蚁阿福”昨日发布后下载量猛增,今

互联网2025-12-16

Akamai宣布收购功能即服务公司Fermyon Akamai宣布收购功能即服务公司Fermyon

12月16日消息,负责支持和保护网络生活的云服务提供商阿卡迈技术公司(Akam

互联网2025-12-16

通用汽车宣布支持苹果钱包数字车钥匙功能,未 通用汽车宣布支持苹果钱包数字车钥匙功能,未

12 月 16 日消息,通用汽车(GM)今日宣布,将支持苹果钱包(Apple Wallet)应用中

互联网2025-12-16

蚂蚁集团AQ升级为“蚂蚁阿福” App月活超1500万 蚂蚁集团AQ升级为“蚂蚁阿福” App月活超1500万

12月15日消息,蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”,并发布

互联网2025-12-15