由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0中文理解、数学等多能力全球第一。

评测显示,文心一言4.0表现优异,在中文推理、中文语言等评测上遥遥领先,和其他模型拉开明显差距。中文理解上,文心一言4.0领先优势明显,领先第二名GLM-4
0.41分,GPT-4系列模型表现较差,排在中下游,并且和第一名文心一言4.0分差超过1分。
在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一;
GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4
Turbo、Claude-3以及GLM-4拿下榜首。

在企业选择大模型最看重的安全性评测上,国内模型文心一言4.0表现亮眼,力压国际一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分),Claude-3仅列第四。
吴征博士荣获“2025福布斯中国行业发展领创者”称号
吴征博士荣获“2025福布斯中国行业发展领创者”称号 引领阳光七星投资集团迈向全球创新新高地2025年3月22日,在2025沙利文中国企业家年会暨“福布斯中国行业发展领创者评选”颁奖典礼上,阳光七星投资集团主席兼CEO吴征博士凭借其卓越的领导力、创新精神及对
2025-03-24
2025年呼叫中心品牌排行,如何选择智能呼叫系统?
呼叫中心已从传统电话接听演变为企业连接客户的核心枢纽,一套高效、稳定且智能的呼叫系统,是企业提升服务效率、优化用户体验的关键基建。本文将基于行业调研与市场反馈,梳理当前呼叫中心品牌排行的核心逻辑,并深度解析头部厂商的产品价值,为企业选型提供
2025-03-17
2025世俱杯奖杯重庆首秀 让球迷心动的竟是影院级激光电视
3月10日,2025海信X FIFA世俱杯奖杯中国行在重庆解放碑广场盛大举行,世俱杯奖杯首次亮相中国,点燃众多球迷参与的热情。作为2025国际足联俱乐部世界杯全球官方电视,海信激光电视现场演绎出如同比赛现场的沉浸氛围,足球名宿孙继海参与现场互动,将活动氛围
2025-03-13
米乔人体工学亮相第四届应用人因工效大会,共话人体工学产业应用新机遇
2024年11月15日,由环一科技(上海)有限公司与中国职场工效学专委会联合举办的「2024可持续发展高峰论坛」及第四届「应用人因工效学大会」在上海圆满举行。米乔人体工学作为合作伙伴,携人体工学创新产品精彩亮相,并在圆桌会议环节分享在人体工学领域的长期研
2025-02-05
正式签约!360为宁波城市大模型发展注入新动能
近日,由宁波市数据局、宁波市科技局、宁波市经信局、宁波通商控股集团有限公司指导,宁波市人工智能学会、宁波市大数据发展协会主办,三六零数字安全科技集团有限公司等单位承办的城市大模型发展交流主题活动在宁波举行。活动上,360数字安全集团与宁波人工
2025-01-16
服装电商困局何解?AI+3D赋能「上新」加速破局
众所周知,电商是一个极度快节奏领域,尤其是服装电商,想要获得高流量和高销量,关键在于不断上新和打造爆款。而对于商家来说,不断推新不仅考验其对市场的敏感度,更是挖掘爆款的好方法。「上新」 对于服装电商而言,如同GMV的肾上腺素。「爆款」亦是在持续
2025-01-16