大模型视觉测评榜单出炉:Gemini遥遥领先 豆包冲进前三
2025-12-31 10:27:44来源:Techweb编辑:李川峰
扫一扫
分享文章到微信

扫一扫
关注豌豆财经网微信公众号
12月31日消息,近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。
谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。
此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。
榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。
国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。
百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。
国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。

投稿邮箱:lukejiwang@163.com 详情访问豌豆财经网:http://www.wdyxw.com.cn
相关推荐
Anthropic最新Claude Opus 4.5大模型上市,API价格大降
11月25日消息,Anthropic最新的大模型Claude Opus 4.5今天上市。Anthropic团队表示,C
豌豆AI2025-12-05
头条资讯





















