中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

2023-11-06来源:互联网编辑:芳华

11 月 6 日,李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型 Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。

零一万物此次开源的Yi系列模型包含34B和6B两个版本。据 Hugging Face英文开源社区平台和C-eval中文评测的最新榜单,Yi-34B 预训练模型取得了多项 SOTA 国际最佳性能指标认可,成为全球开源大模型“双料冠军”。

零一万物创始人及 CEO 李开复博士表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World's No.1’的初衷和决心。”

魔搭社区开源地址:

https://www.modelscope.cn/models/01ai/Yi-34B/summary

https://www.modelscope.cn/models/01ai/Yi-6B/summary

魔搭社区最佳实践:

https://mp.weixin.qq.com/s/hy-ovRIkXGfv39RiNEHddw

Yi-34B 登顶全球英文及中文权威榜单 No.1

在 Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72 分位列全球第一,碾压 LLaMA2-70B 和 Falcon-180B 等众多大尺寸模型。

page2image28079936

Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜,Yi-34B高居榜首(2023 年 11 月 5 日)

在 C-eval中文权威榜单排行榜上, Yi-34B超越了全球所有开源模型。对比GPT-4,在 CMMLU、E-eval、Gaokao 三个主要的中文指标上,Yi-34B 也具有绝对优势。

page3image28040304

C-eval 排行榜:公开访问的模型,Yi-34B 全球第一(2023 年 11 月 5 日)

在全球大模型各项评测中最关键的 MMLU(Massive Multitask Language Understanding 大规模多任务语言理解)、BBH 等反映模型综合能力的评测集上,Yi-34B 同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。

page4image27946576

各评测集得分:Yi 模型 v.s. 其他开源模型

和 LLaMA2 一样,Yi 系列模型在 GSM8k、MBPP 的数学和代码评测表现略逊 GPT 模型。未来,零一万物的系列开源计划中将推出代码能力和数学能力专项的继续训练模型。

全球最长200K 上下文窗口

Yi-34B模型将发布全球最长、可支持200K超上下文窗口(context window)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要。

受限于计算复杂度、数据完备度等问题,上下文窗口规模扩充从计算、内存和通信的角度存在各种挑战。为此,零一万物技术团队实施了一系列优化,包括计算通信重叠、序列并行、通信压缩等,实现了在大规模模型训练中近100倍的能力提升,也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。

AI Infra实测实现 40%训练成本下降

李开复曾经表示,“做过大模型 Infra 的人比做算法的人才更稀缺”。超强的 Infra 能力是大模型研发的核心护城河之一。

AI Infra(AI Infrastructure 人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施,包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等。

零一万物 Yi系列大模型基于阿里云平台打造,阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。零一万物的Infra 技术通过“高精度”系统、弹性训和接力训等全栈式解决方案,确保训练高效、安全地进行。

凭借强大的 AI Infra,Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达 50%。目前,零一万物 Infra 能力实现故障预测准确率超过 90%,故障提前发现率达到 99.9%,不需要人工参与的故障自愈率超95%。

零一万物组建了由前 Google 大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评价、可扩展的智能数据处理管线;还自研出一套“规模化训练实验平台”,用来指导模型的设计和优化。数据处理管线和加大规模预测的训练能力建设,把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。

李开复宣布,零一万物已启动下一个千亿参数模型的训练。

接下来,零一万物将基于 Yi系列大模型,打造更多To C超级应用。李开复强调,“AI 2.0 是有史以来最大的科技革命,它带来的改变世界的最大机会一定是平台和技术,正如 PC 时代的微软 Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是 ToC 应用。零一万物邀请开发者社群跟我们一起搭建 Yi 开源模型的应用生态系,协力打造 AI 2.0 时代的超级应用。”


浪潮KaiwuDB V3.0发布:多模融合AI赋能,引领物联网数智化新篇章
KaiwuDB V3.0关系引擎新增大型对象支持,无论是传感器产生的二进制数据还是文本信息,都能实现高效管理;同时,支持高效跨模连接算子与时序算子并行处理,相较于2.2版本跨模查询性能提升5-10倍,打破了…

2025-11-13

中国电信2025年云网路由交换设备集采结果揭晓:新华三全标包,多家企业入围
C114讯 11月12日消息(水易)来自中国电信阳光采购网消息,中国电信云网路由交换设备(2025年)集中采购项目已完成评审。根据评审结果,新华三全标包入围,华为、中兴通讯、锐捷网络各入围3个标包。 根据此…

2025-11-13

物联网+AI赋能制造业边坡:构建“工业大脑”实现安全与效率双提升
物联网 + AI 构建的 “工业大脑”,通过全维度感知、智能化分析、精准化决策,让边坡管理实现了从 “事后补救” 到 “预测性维护” 的根本性转变,不仅破解了安全与效率、投入与效益的平衡难题,更重塑了制造业…

2025-11-13

Kernelcom“智能键盘”来袭:12.5英寸超宽屏,AMD/Intel双版本可选
快科技11月12日消息,近日一款名为Kernelcom的设备正在Kickstarter上众筹,虽然其本质上是一款功能完备的笔记本电脑,但制造商还是将其宣传为“智能键盘”。 这款设备最大的特点是其12.5英寸超…

2025-11-13

双11华为Mate70Pro+价格大跳水,16GB+1TB直降2570元,顶配旗舰入手正当时
华为Mate70 Pro+还做到了出色的拍摄体验,它搭载5000万像素主摄,搭配4000万像素超广角和4800万像素长焦,以及具备红枫原色摄像头,前置1300万像素镜头和3D深感镜头,相比华为Pura80系…

2025-11-10

畜牧实验室废水处理新突破:智能运维远程诊断预警系统赋能行业升级
随着物联网技术的发展,畜牧实验室废水处理设备进入智能运维新时代。 关键词:智能运维、远程诊断、预警系统、实验室废水处理设备、物联网、预测性维护终端层通过传感器实时采集设备运行数据;网络层利用4G/5G或物联网…

2025-11-10

易邮快递超市:以物流、电商、用户三网融合,开启服务生态新篇章
山东寿光的蔬菜种植基地,以往仅通过拼多多平台销售蔬菜,易邮接入后,将其蔬菜同步上架至平台,并借助顺丰的冷链物流网络,实现 “产地直发 + 次日达”,让北京、上海等城市的用户能以低价购买到新鲜蔬菜;同时,易邮还…

2025-11-10

苏州4KW八卡GPU服务器托管怎么选?优质机房与成功案例全解析
苏州作为长三角地区重要的数字经济城市,拥有多个优质的数据中心,苏州胜网IDC服务商将深入分析苏州地区适合托管高功率GPU服务器的机房选择标准,并分享成功案例,为有类似需求的用户提供参考。 总之,选择苏州地区…

2025-11-10

微信调研多手机登录功能,顺应多设备时代,用户期待早日上线
毕竟现在微信早就支持电脑、平板和手机同时登录了,唯独多台手机是块“禁区”,第三方多开还容易被封号,现在主动问用户,这功能离上线怕是不远了。 也有网友正经的提意见:现在微信在手机和平板上的同时登录已经够用了,要…

2025-11-08

2025乌镇峰会网络文化论坛将启,共探趋势成果,促互鉴共享
2025 年世界互联网大会乌镇峰会网络空间文化交流与发展论坛,邀请中外网络文化领域有关部门负责人、中外知名学者、互联网企业负责人、网络大V代表等广泛参加,在全球文明倡议的指引下,共同探讨网络文化领域的最新趋势…

2025-11-08