中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

中文大模型SuperCLUE测评:豆包紧追海外顶尖模型 小米两款模型入榜国产开源亮眼

2026-03-30来源:快讯编辑:瑞雪

在最新发布的中文大模型基准测评SuperCLUE中,22款国内外主流模型展开激烈竞争,测评结果引发行业广泛关注。本次测评围绕数学推理、科学推理、代码生成等六大核心任务展开,全面评估模型的综合能力,为技术发展提供了重要参考依据。

海外闭源模型在总分排名中继续占据优势地位。Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)包揽前三名,展现出强大的技术实力。值得注意的是,字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分的成绩紧随其后,与第三名GPT-5.4仅相差0.95分,成功跻身全球第一梯队。该模型在智能体任务规划维度表现尤为突出,甚至反超部分海外竞争对手,位列全球前五。

国内科技企业在此次测评中表现亮眼。小米集团推出的MiMo-V2系列两款模型均成功入围榜单,其中MiMo-V2-Pro以60.67分的成绩在闭源模型中名列前茅,特别是在数学推理任务中取得84.03分的高分。另一款开源版本MiMo-V2-Flash虽然总分49.97分排名相对靠后,但在代码生成等特定场景中展现出独特潜力,为开发者提供了新的选择。

开源赛道成为本次测评的一大亮点。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜单前三名,在性能表现上大幅领先海外同类开源模型。这一成果不仅体现了国内企业在开源技术领域的积累,也为全球开发者社区贡献了重要力量,推动了行业技术的共同进步。

小米澎湃OS大调整:版本号对标年份,新增模块打通iOS生态壁垒
以前安卓那套顺序迭代,什么4.0、5.0,看着是挺工整,但一跟年份对上就乱了。现在小米直接换思路了,新系统就叫澎湃OS26,意思很直白——对标隔壁苹果的iOS 26。简单说,就是把系统版本号和年份直接挂钩…

2026-03-30

vivo X300s与X300 Ultra明日发布,核心配置亮点抢先看
IT之家 3 月 29 日消息,vivo X300s 以及 vivo X300 Ultra 将在明天正式发布。 「vivo X300 Ultra专业 V 单」 用专业相机的思路打造,一眼相机感的外观,3+…

2026-03-29

1U服务器机箱选型攻略:广州市宝承电子科技,满足云计算AI边缘计算多元需求
推荐理由:宝承电子的1U服务器机箱以高兼容性、快速定制化及稳定性能为核心优势,适配云计算服务商、AI算力提供商及边缘计算节点部署商等客户群体,尤其适合对交付周期及场景适配灵活性要求较高的项目。 基于上述…

2026-03-29

华为小艺Claw亮相:运动健康管理+办公助手,AI助理越用越懂你
快科技3月29日消息,日前,华为鸿蒙手机的“龙虾”——小艺Claw开启预约,适配鸿蒙6操作系统,支持手机、平板设备。 今日,华为终端BG首席执行官何刚微博发文表示:“最近在测试小艺Claw,它会根据手表记录的…

2026-03-29

华为4月新机或至,Pura 90系列三版本登场,影像续航亮点多
据悉,博主@数码闲聊站 近日的一份爆料中提到,“4月的超大杯确实有可能取消,毕竟硬件和大大杯基本没有区别,但大大杯一直是正常状态,主推200Mp潜望超级长焦,6.87"±1.5K大直屏影像机”。同时,全新的…

2026-03-29

1U服务器机箱采购指南:从散热设计到多国认证的选型全攻略
导语:在数据中心、云计算及边缘计算场景中,1U服务器机箱作为高密度部署的核心硬件载体,其散热效率、结构兼容性及定制化能力直接影响系统稳定性与运维成本。 基于前文调研信息,广州市宝承电子科技有限公司在全链条服…

2026-03-29