主页 > 互联网 > 正文

奇富科技发布首个信贷多模态评测基准,可全面评估信贷AI模型实战能力

2026-01-08 11:26:05来源:Techweb编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  1月8日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷AI的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建AI基础设施提供关键支撑。

  据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷AI模型的实战能力。

  与传统侧重单一识别或理解能力的评测不同,FCMBench所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

  该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动AI更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域AI模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从“单点优化”迈向“产学研协同创新”。

  奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在FCMBench上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

  FCMBench-V1.0构建了与真实银行审核流程高度一致的评测框架,涵盖18类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含4043张合规图像和 8446个测试样本,问题覆盖信贷审核全链条。

  其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

  通过对23个主流多模态模型(来自14家顶尖AI企业及科研机构)的全面评测,FCMBench展现出强大的鉴别能力。结果显示, Google DeepMind的Gemini 3 Pro(64.61)位列商业模型榜首,阿里巴巴Qwen3-VL-235B(57.27)成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型Qfin-VL-Instruct以64.92的F1分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。

  目前,FCMBench的数据集、评测工具以及Qfin-VL-Instruct的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融AI技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

  技术报告链接:https://arxiv.org/abs/2601.00150

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
库克发布致苹果股东感谢信:我对未来的发展前 库克发布致苹果股东感谢信:我对未来的发展前

1 月 9 日消息,苹果公司今日发布 SEC 文件,官宣将于美东时间 2 月 24 日举行年

互联网2026-01-09

智源发布2026十大AI技术趋势:世界模型成为AGI 共 智源发布2026十大AI技术趋势:世界模型成为AGI 共

1月8日消息, 今日,北京智源人工智能研究院(以下简称“智源研究院”)发布

互联网2026-01-08

AI健康火了 蚂蚁阿福之后 ChatGPT今日发布健康服务 AI健康火了 蚂蚁阿福之后 ChatGPT今日发布健康服务

1月8日消息,蚂蚁集团最新数据显示,蚂蚁阿福新版发布一个月后,最新月活跃

互联网2026-01-08

被小米辞退的王腾成立睡眠健康科技公司“今日 被小米辞退的王腾成立睡眠健康科技公司“今日

1月8日消息,小米前高管王腾今日正式官宣创业项目,成立睡眠健康科技公司“

互联网2026-01-08

微信员工辟谣“封号新规”:从未发布,系不法 微信员工辟谣“封号新规”:从未发布,系不法

1 月 7 日消息,最近网上再次流出关于微信将实施所谓“封号新规”的传闻。对

互联网2026-01-07

NVIDIA、Intel、AMD、高通四巨头CEO齐聚联想发布会 NVIDIA、Intel、AMD、高通四巨头CEO齐聚联想发布会

1月7日消息,在今天的全球创新科技大会(Tech World)上,上演了一场罕见的“史

互联网2026-01-07

《网络交易平台规则监督管理办法》发布 不得强 《网络交易平台规则监督管理办法》发布 不得强

1月7日消息,今日,市场监管总局、国家网信办发布《网络交易平台规则监督管

互联网2026-01-07

新石器无人车亮相CES 2026 发布下一代无人驾驶物 新石器无人车亮相CES 2026 发布下一代无人驾驶物

1月7日消息,无人配送企业新石器无人车亮相2026年国际消费电子展(CES 2026),

互联网2026-01-07

两部门联合发布《直播电商监督管理办法》明确 两部门联合发布《直播电商监督管理办法》明确

1月7日消息,近日,市场监管总局和国家网信办联合发布《直播电商监督管理办

互联网2026-01-07

《网络交易平台规则监督管理办法》发布,平台 《网络交易平台规则监督管理办法》发布,平台

1月7日消息,近日,市场监管总局和国家网信办联合发布《网络交易平台规则监

互联网2026-01-07