您现在的位置是:欧亿 > 综合

中文大模型测评出炉:欧交易所app下载安卓豆包跻身全球第一梯队 小米MiMo上榜

欧亿2026-03-31 09:15:34【综合】2人已围观

简介欧亿交易所提供杠杆交易和期货交易,满足不同投资需求,下载APP,随时随地参与全球数字货币市场,把握投资机会。

快科技3月30日消息,中文中文大模型基准测评SuperCLUE发布2026年3月最新结果,大模22款国内外主流模型参与角逐。型测小米欧交易所app下载安卓

字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分拿下国内第一,评出成功跻身全球第一梯队;小米集团的炉豆MiMo-V2系列两款模型均顺利上榜。

本次测评覆盖数学推理、包跻科学推理、身全上榜代码生成等六大核心任务,球第全面检验模型综合能力。梯队海外闭源模型依旧占据总分前列,中文欧交易所app下载安卓Anthropic的大模Claude-Opus-4.6(max)、Google的型测小米Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。

豆包则紧随其后,评出总分仅与GPT-5.4相差0.95分,炉豆实现全方位追赶,包跻在智能体任务规划维度更是反超部分海外模型,跻身全球前五。

小米此次有两款模型入选测评榜单,其中MiMo-V2-Pro以60.67分位列闭源模型前列,在数学推理任务中取得84.03分的亮眼成绩;开源版本MiMo-V2-Flash虽以49.97分排名靠后,但在代码生成等细分场景中表现出一定潜力。

测评还显示,国产模型整体表现亮眼,开源赛道尤为突出,Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜前三,大幅领先海外同类模型。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:随心

很赞哦!(6326)