中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

摩尔线程Torch-MUSA v2.0.0升级:全面支持FP8与PyTorch 2.5.0

2025-05-09来源:ITBEAR编辑:瑞雪

摩尔线程公司近期正式揭晓了其面向PyTorch深度学习框架的MUSA扩展库新版本——Torch-MUSA v2.0.0。此次发布标志着摩尔线程在AI计算领域迈出了重要一步。

该新版本基于MUSA Compute Capability 3.1计算架构,带来了多项突破性升级。其中,最引人注目的是原生支持FP8数据类型。FP8作为一种前沿的低精度格式,对于大语言模型(LLM)的训练至关重要。在支持FP8的GPU上,采用FP8混合精度可以显著提升GPU的算力,并大幅降低显存占用。

摩尔线程的全功能GPU,凭借新一代MUSA Compute Capability 3.1计算架构,原生支持FP8计算。这一底层架构的优势为Torch-MUSA v2.0.0提供了坚实的基础,使其能够充分发挥FP8的计算效能,在大语言模型的训练和推理中展现出更高的效率。

除了对FP8的支持外,Torch-MUSA v2.0.0还引入了多项创新功能,以进一步提升深度学习任务的执行效率。其中包括新增的虚拟内存管理支持,该技术能够有效缓解GPU内存碎片化问题,并降低模型训练过程中的峰值内存占用。这对于FSDP、DeepSpeed和Megatron-LM等主流大模型训练框架来说,无疑是一个巨大的福音。

Torch-MUSA v2.0.0还新增了MUSA Graph支持。MUSA Graph技术将多个MUSA内核整合到一个图中,通过单次CPU调度大幅减少了启动开销,提升了计算效率。同时,该技术还与CUDA Graph接口高效兼容,为开发者提供了更多的选择和便利。

在性能优化方面,Torch-MUSA v2.0.0也取得了显著进展。通过多项针对MUSA计算平台的性能优化,该版本进一步提升了对AI模型和大规模数据处理的支持能力。这使得开发者能够在基于MUSA Compute Capability 3.1计算架构的全功能GPU上,无缝运行新版本的PyTorch,并享受更高效的性能表现。

Torch-MUSA v2.0.0不仅支持PyTorch 2.2.0,还新增了对PyTorch 2.5.0的支持。这意味着开发者可以更加灵活地选择适合自己项目的PyTorch版本,无需担心兼容性问题。

最后,Torch-MUSA v2.0.0已完全开源,开发者可以通过访问GitHub获取源代码。这一举措无疑将吸引更多的开发者参与到Torch-MUSA的生态建设中来,共同推动AI计算领域的发展。

企业禁用无线网卡攻略:三种方法详解,第二种助企业高效管控风险
对于中大型企业或对数据安全要求高的单位,域智盾终端安全管理系统提供了更智能、更彻底、更可追溯的无线网卡管控方案。在Windows专业版或企业环境中,IT人员可以用系统自带的组策略(Group Policy…

2025-11-15

中国电信AI赋能6G发展:创新技术引领通信变革,拓展产业融合新路径
中电信数智科技有限公司“一种基于6G的天地一体化传输优化及拓扑测绘的方法”获国家发明专利授权,这项专利涵盖卫星与地面网络协同通信、频谱资源共享、高效信号传输等多个核心技术领域,为6G的落地应用铺设了一条“高…

2025-11-12

山海星耀攻克超低轨难题,以硬核技术逐梦空天新蓝海
天虎科技了解到,虽然当前市场上有一些针对超低轨的吸气式推进器,但从气体收集率、推进效率、测试工作环境等维度上,山海星耀的电推进器均具备一定优势。 蔡东升表示,目前该产品是商业航天公司首次实现了“高真空运行环…

2025-11-12

量子安全网络新突破:CV-QKD可插拔模块开启高效规模化部署新篇
CUbIQ Technologies:开发了 CV-QKD 收发模块和量子安全架构HPE Juniper网络:将模块集成到其路由平台中,实现量子安全 MACsec 加密Coherent 高意:提供 400…

2025-11-12

企业宽带选不对,带宽再大也白费!这些关键因素决定实际网速
• 网速(用户感知):即实际访问体验,取决于 3 个核心因素 —— 带宽只是基础,更重要的是网络质量、路由优化和并发处理能力。 真正专业的服务商,会从企业实际业务场景出发提供解决方案,而非一味推销高带宽产品…

2025-11-12

物联网防逆流方案:10秒动态调节,光伏发电余电不上网更高效
防逆流柔性调节通过加装物联网网关与双向计量电表,监测市电总进线处的功率和逆变器实时的发电功率,通过网关内置的智能算法,以*快10秒为一个检测周期,持续跟踪负荷变化,动态调节逆变器的有功功率输出,既达到防逆流…

2025-11-11

Kinera Verdandi薇儿丹蒂TWS新品登场,双模连接续航持久,共赴听觉盛宴
在发布会前夕,Kinera广发“邀请函”,邀请耳机玩家来到现场先行一步体验这支旗舰TWS新品:现场共安排了两款配色的样机供试玩,分别是寰宇黑和阙夜紫,我自己就比较喜欢寰宇黑这个配色,低调奢华、质感非凡。 虽说…

2025-11-11

可编程网络中控系统:控制为核心基石,附属功能助力效能提升
AI算法在中控系统中的应用,并非为了追求技术噱头,而是通过分析设备运行状态数据,实现控制指令的预判与自适应调整——如根据会议室人数自动调节空调温度、根据室外光照强度自动调整室内照明亮度,让控制更智能、更贴合实…

2025-11-10

2025新质互联网:从“连接万物”到“智联万物”的智能化跃迁蓝图
该报告系统阐述了以IPv6+技术体系为底座、面向智能化时代的新一代互联网——"新质互联网"的内涵、架构与发展路径,指出其正从"连接万物"向"智联万物"跃迁,致力于构建可靠、高效、安全、智能、绿色的新型网络基础…

2025-11-10