中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

英伟达联手高校推出Fast-dLLM框架,AI推理速度大幅提升最高达27.6倍

2025-06-03来源:ITBEAR编辑:瑞雪

近期,科技界迎来了一项重要突破,英伟达携手麻省理工学院(MIT)及香港大学,共同推出了Fast-dLLM框架,这一创新成果旨在显著提升扩散模型(Diffusion-based LLMs)的推理速度,为语言生成任务带来了全新的可能性。

扩散模型,作为传统自回归模型的有力挑战者,凭借其双向注意力机制,理论上能够实现多词元同步生成,从而加速解码过程。然而,在实际应用中,扩散模型的推理速度却往往不尽如人意。原因在于,每次生成步骤都需要重新计算全部注意力状态,这导致了高昂的计算成本。多词元同步解码时,词元间的依赖关系容易受到破坏,进而影响生成质量,使得扩散模型难以满足实际应用的需求。

为了突破这一瓶颈,英伟达联合团队研发了Fast-dLLM框架,该框架引入了两大核心创新:块状近似KV缓存机制和置信度感知并行解码策略。这一创新设计,为扩散模型的推理速度和质量带来了显著提升。

在Fast-dLLM框架中,KV缓存机制通过将序列划分为块,预计算并存储其他块的激活值,以便在后续解码中重复利用,从而显著减少了计算冗余。而其DualCache版本更进一步,缓存了前后缀词元,利用相邻推理步骤的高相似性,进一步提升了效率。这一机制的实施,为扩散模型的推理速度带来了质的飞跃。

另一方面,置信度解码策略则根据设定的阈值,选择性解码高置信度的词元,从而避免了同步采样带来的依赖冲突,确保了生成质量。这一策略的实施,使得扩散模型在保持高质量生成的同时,进一步提升了推理速度。

Fast-dLLM框架在多项基准测试中均展现出了惊人的表现。在GSM8K数据集上,生成长度为1024词元时,其8-shot配置下实现了27.6倍的加速,准确率高达76.0%。在MATH基准测试中,加速倍数为6.5倍,准确率约为39.3%。而在Humaneval和MBPP测试中,分别实现了3.2倍和7.8倍的加速,准确率维持在54.3%和基线水平附近。这些测试结果表明,Fast-dLLM框架在加速推理的同时,仅牺牲了1-2个百分点的准确率,成功实现了速度与质量的平衡。

Fast-dLLM框架的成功推出,标志着扩散模型在实际语言生成任务中具备了与自回归模型竞争的实力。这一创新成果不仅解决了推理效率和解码质量问题,更为扩散模型的广泛应用奠定了坚实基础。未来,我们有理由相信,随着技术的不断进步和完善,扩散模型将在更多领域展现出其独特的优势和潜力。

光联携手利元亨,共话新能源制造AI时代网络新路径与新机遇
聚焦企业在全球范围内的多分支互联与云IDC接入问题,方案基于光联自建全球光纤骨干网络及华为SD-WAN设备,支持MPLS、Internet与4G/5G等多种链路融合,并可弹性部署多种拓扑模型,实现总部、分支…

2025-11-15

桥梁位移监测仪:精准感知位移 灵活部署续航 守护桥梁安全出行
这种方式能够利用清洁能源为设备持续供电,既体现了节能环保的理念,也巧妙地解决了在市政供电不便场景下的设备续航问题,保障了监测工作的不间断进行。为了便于现场操作与维护,桥梁位移监测仪还配备了便捷的配置方式。 …

2025-11-14

星闪智联引领未来:无线短距通信开启智能社会新篇章
为统一目标、保证质量,在国际星闪联盟组织与号召下,联盟领导、行业协会及合作伙伴的11位代表上台发起了《消费电子新短距产业共建倡议》,明确提出要“共建星闪技术新标准、共创智能连接新应用、共赢消费电子新未来”。 …

2025-11-13

苹果推进卫星功能研发:离线地图、第三方接入等拓展iPhone新可能
苹果还为第三方应用程序提供使用卫星连接的应用程序接口(API),这一举措意味着苹果允许开发者自愿将卫星连接功能集成到他们的应用中,为iPhone用户打造出更多创新应用。这一举措或许是苹果在卫星通信领域进一步…

2025-11-12

量子卫星引领通信变革:搭建全球高速安全互联的量子通信新桥梁
卫星可将纠缠光子发送到地面,实现长距离量子通信。 地面量子网络通过卫星互联全球量子密钥分发网络形成实现真正安全、分布式通信3. 军事与国防应用 随着技术成熟和全球布局加速,未来的互联网将不再依赖传统线路,而…

2025-11-12

Marantz与B&W组合:以多元功能承载家庭温情,让音乐共鸣融入日常
我在活动上最常遇到来宾,不管是男的,还是女的,他(她)问我:我手机上这些音乐能不能通过蓝牙,或Apple Airplay传到音响播放。 用高级音响回归音乐本身你会发现原来美好的东西就在身边最近我在电脑里找到了…

2025-11-12

中国互联网发展成果斐然:5G用户超11亿,AI与6G专利领跑全球
8日,由中国网络空间研究院牵头编撰的《中国互联网发展报告2025》和《世界互联网发展报告2025》蓝皮书在2025年世界互联网大会乌镇峰会上正式发布。 报告显示,截至2025年6月,我国固定宽带接入用户总数已…

2025-11-10

乌镇峰会:机器人炫技、AI赋能,共绘网络空间命运共同体新蓝图
潮新闻记者还与宇树科技G1机器人来了一场格斗赛,“小家伙”个头不大,拳脚功夫却耍得游刃有余。 在今年的乌镇峰会上,各类机器人不仅是一场炫技,更是已经逐渐走进大家的日常生活。在他看来,是全球共同努力,推动了人形…

2025-11-10

骁龙8Gen5定档11月发布:用旗舰架构“降维”中端,性能与性价比如何平衡?
不管是户外刷视频还是家里传大文件,都能减少卡顿和等待时间,这对依赖移动网络的用户来说是个不小的加分项。 总的来说,骁龙 8 Gen5 是一颗 “取舍明确的真香芯片”,它放弃了极限性能,却换来了更均衡的体验和更…

2025-11-10