主页 > 豌豆AI > 正文

奇富科技发布首个信贷多模态评测基准,可全面评估信贷AI模型实战能力

2026-01-08 11:28:39来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  1月8日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷AI的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建AI基础设施提供关键支撑。

  据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷AI模型的实战能力。

  与传统侧重单一识别或理解能力的评测不同,FCMBench所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

  该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动AI更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域AI模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从“单点优化”迈向“产学研协同创新”。

  奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在FCMBench上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

  FCMBench-V1.0构建了与真实银行审核流程高度一致的评测框架,涵盖18类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含4043张合规图像和 8446个测试样本,问题覆盖信贷审核全链条。

  其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

  通过对23个主流多模态模型(来自14家顶尖AI企业及科研机构)的全面评测,FCMBench展现出强大的鉴别能力。结果显示, Google DeepMind的Gemini 3 Pro(64.61)位列商业模型榜首,阿里巴巴Qwen3-VL-235B(57.27)成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型Qfin-VL-Instruct以64.92的F1分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。

  目前,FCMBench的数据集、评测工具以及Qfin-VL-Instruct的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融AI技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

  技术报告链接:https://arxiv.org/abs/2601.00150

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
彩讯股份携手稳准智能发布垂直行业数据大模型 彩讯股份携手稳准智能发布垂直行业数据大模型

2月2日消息,日前,彩讯科技股份有限公司(简称:彩讯股份)与稳准智能(雄

豌豆AI2026-02-02

华为云发布“行业AI梦工厂”智慧医疗专区 加速 华为云发布“行业AI梦工厂”智慧医疗专区 加速

2月1日消息,今日,医疗人工智能协同创新论坛暨医疗人工智能联盟(筹)202

豌豆AI2026-02-01

斑陌易行发布首款智能配送机器人,以开放协同 斑陌易行发布首款智能配送机器人,以开放协同

1月29日,斑陌易行在iRIC智能制造与机器人国际联创中心(上海总部)举行品牌

豌豆AI2026-01-29

文远知行发布通用仿真模型WeRide GENESIS 文远知行发布通用仿真模型WeRide GENESIS

1月28日,自动驾驶公司文远知行(WeRide)正式发布自研通用仿真模型WeRide GENE

豌豆AI2026-01-28

长亭科技获国家人工智能产业投资基金等5亿元投 长亭科技获国家人工智能产业投资基金等5亿元投

1月27日消息,国内网络安全企业长亭科技宣布完成最新一笔融资。本轮融资总额

豌豆AI2026-01-27

腾讯百度AI红包神仙打架,多家机器人春晚整花活 腾讯百度AI红包神仙打架,多家机器人春晚整花活

1月27日消息,2026年的春节帷幕刚拉开,科技界已经吵得比庙会还热闹。 25日腾

豌豆AI2026-01-27

微软发布新定制AI芯片Maia 200:台积电3nm工艺,性 微软发布新定制AI芯片Maia 200:台积电3nm工艺,性

1 月 27 日消息,微软刚刚在官方博客正式发布了其定制 AI 加速芯片 Maia 200,旨

豌豆AI2026-01-27

官宣 宇树科技成为2026年春晚机器人合作伙伴 ​ 官宣 宇树科技成为2026年春晚机器人合作伙伴 ​

1月27日消息,据宇树科技官微消息,宇树科技成为“中央广播电视总台2026年春

豌豆AI2026-01-27

AI芯片企业燧原科技科创板IPO申请获受理,腾讯持 AI芯片企业燧原科技科创板IPO申请获受理,腾讯持

1月23日消息,科创板上市公司名单即将迎来又一家国产GPU企业。 1月22日,上海

豌豆AI2026-01-23

京东发布JoyInside软硬一体化方案,为玩具行业装 京东发布JoyInside软硬一体化方案,为玩具行业装

1月21日消息,京东在江苏宿迁举办AI玩具大会,发布专为智能硬件终端打造的

豌豆AI2026-01-21