主页 > 公司要闻 > 正文

Monkey 模型解析性能超越国际模型,WPS 365 加速企业数据知识化进程

2026-04-01 13:40:11来源:同花顺编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  1 月 27 日,在 WPS 365 上海 AI 协同办公峰会上,华中科技大学教授、博士生导师刘禹良介绍,Monkey OCR 模型的文档解析性能超越国际大参数模型。据悉,华中科技大学与金山办公联合推出的 MonkeyOCR 模型,在 3B 参数规模下斩获中英文文档解析任务的最佳性能;其最新迭代的 MonkeyOCR v1.5,更是在国际权威文档解析榜上拿下综合性能全球第一的成绩,超越 GPT-4o、Gemini-2.5 Pro 等大参数闭源模型。

  刘禹良同时强调了非结构化数据治理对于企业级 AI 应用的必要性。“数据质量治理必须置于企业 AI 战略的核心。”刘禹良认为,如果有朝一日真正实现通用人工智能,它首先必须要解决的问题是像人一样理解真实世界中的文本。

  刘禹良关注的文档解析与理解领域,是国家政策导向、全球大模型企业布局的核心赛道,也是人工智能技术的攻坚难点。真实场景中,企业文档常存在结构复杂、黑话、多语言混杂等问题,制约着 AI 的应用效果。金山办公 38 年深耕文档领域,在文档格式理解、复杂信息抽取等方面技术积累丰富,成为双方合作的基础。

  “在非结构文档数据治理上,Scaling Law(规模化法则)并不是一定成效的。我们通过实验发现,在一些简单任务上,如果只是把这个参数量不断地往前升,它的性能不但不会带来任何提升,甚至可能导致这个模型推理效率的大幅度下降。”刘禹良介绍。

  国际通用多模态大模型依赖海量参数提升泛化能力,非专为文档智能任务设计,缺乏对文字感知的细粒度优化。根据多模态大模型全新评测基准与数据集 OCRBench v2 的测试结果,揭示现有多模态大模型在复杂化、多样化 OCR 任务上的准确率不足 60%。

  Monkey 系列聚焦非结构化文档治理,通过自适应图像金字塔切分、循环漂移切分、多任务统一框架等手段,强化复杂文档的解析和理解能力,并在多个国际评测中超过主流模型。此外,华中科技大学团队凭借文档智能赋能甲骨文考释工作,斩获国际计算语言学年会(ACL 2024)最佳论文奖,这是国内高校首次摘得此殊荣。2025 年该奖项颁给 DeepSeek 团队。

  在研发过程中,由华中大和金山办公组建的项目团队采取结构优先的思路。刘禹良介绍,Monkey OCR 模型开创了文档解析新范式,其核心思想是将文档解析从传统的多模块拼接转向更统一的框架,将非结构化文档解析抽象成三个核心业务:结构、识别、关系。结构就是识别任何文档的段落、图片、标题,关系就是解析需要像人一样有阅读顺序,最后在结构约束下完成内容识别,建立元素之间的对应关系。

  在 MonkeyOCR v1.5 的研发上,金山办公作为主导单位,引入视觉一致性强化学习优化对复杂表格的理解。该模型支持表格内嵌图片还原、跨页表格合并等功能,是首个能够在这个复杂表格场景实现精度超越 90% 的模型。未来,双方将继续深化合作,计划推出史上最大的多语言文档解析数据集、OCR 视觉基座模型,让模型甚至能够在 CPU 上运行,执行任务又快又准。

  人工智能迈入千行百业,非结构化文档的数据治理是决定人类知识能否被持续转化为机器智能的关键。对于企业而言,内部散落的非结构化数据的收集和治理则是保障 AI 进入企业取得成效的关键。唯有将企业知识充分盘活,才能真正转化为驱动业务的生产力。

  除了双方联合开发文档模型强化对复杂文档的解析能力,金山办公此次推出一站式 AI 协同办公平台 WPS 365,还为企业提供从数据归集、智能解析、知识治理到场景应用的全链路解决方案,为企业构建全域知识基座。

  针对文档解析和治理难的痛点,金山办公创新性提出知识增强生成(Knowledge-Augmented Generation)架构。与传统的检索增强生成(Retrieval-Augmented Generation)仅让大模型“看到”文档不同,KAG 架构融合多模态、多结构的知识资产,让大模型“掌握”企业知识的内在逻辑与关联,真正强化企业知识的应用能力。

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
蜂助手获57家机构调研:公司可以把“AI模型+云终 蜂助手获57家机构调研:公司可以把“AI模型+云终

蜂助手(301382)1月28日发布投资者关系活动记录表,公司于2026年1月27日接受5

公司要闻2026-03-31

熵基科技获12家机构调研:公司以AI大模型技术推 熵基科技获12家机构调研:公司以AI大模型技术推

熵基科技(301330)1月28日发布投资者关系活动记录表,公司于2026年1月28日接受

公司要闻2026-03-31

昆仑万维涨超10% Mureka V8音乐大模型正式发布 昆仑万维涨超10% Mureka V8音乐大模型正式发布

上证报中国证券网讯(记者孙小程)1月29日,截至10:32,昆仑万维(300418)涨超1

公司要闻2026-03-30

非固定版式票据告别人工审核!INTSIG DocFlow升级大 非固定版式票据告别人工审核!INTSIG DocFlow升级大

财务数智化进程中,票据的处理效率与准确性直接关系到财务全链路的数据流转

公司要闻2026-03-30

科大讯飞:去年大模型相关项目中标额超23亿元 科大讯飞:去年大模型相关项目中标额超23亿元

1月28日,科大讯飞(002230)股份有限公司(以下简称“科大讯飞”)披露2025年业绩

公司要闻2026-03-29

华策影视:致力于训练具有中国审美特色的视频 华策影视:致力于训练具有中国审美特色的视频

证券日报网讯1月28日,华策影视(300133)在互动平台回答投资者提问时表示,公

公司要闻2026-03-28

蚂蚁灵波开源空间感知模型LingBot-Depth 与奥比中光 蚂蚁灵波开源空间感知模型LingBot-Depth 与奥比中光

上证报中国证券网讯(记者温婷)1月27日,蚂蚁集团旗下具身智能公司灵波科技宣

公司要闻2026-03-23

华阳AIBOX:独立计算单元驱动车端大模型高效落地 华阳AIBOX:独立计算单元驱动车端大模型高效落地

近日,由ADAYO华阳集团(002906)旗下全资子公司华阳通用推出的华阳AIBOX高性能

公司要闻2026-03-23

蚂蚁具身布局新进展:开源空间感知模型LingBot 蚂蚁具身布局新进展:开源空间感知模型LingBot

1月27日,蚂蚁集团旗下具身智能公司灵波科技宣布,正式开源高精度空间感知模

公司要闻2026-03-23

瑞芯微RK182X全面适配主流多模态大模型,引领端 瑞芯微RK182X全面适配主流多模态大模型,引领端

在全球端侧人工智能加速渗透的今天, “生态适配广度”与“场景落地深度”

公司要闻2026-03-20