中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

华为携手湖北移动完成全国运营商首例AI推理加速测试:性能显著提升

2026-06-26来源:快讯编辑:瑞雪

在2026 MWC上海展期间,华为携手中国移动通信集团湖北有限公司(以下简称“湖北移动”)共同宣布,双方已顺利完成全国运营商首个AI推理加速解决方案的现网测试,标志着AI技术在运营商领域的应用迈出重要一步。

此次测试依托华为OceanStor A800存储系统与昇腾A3超节点架构,并引入UCM(Unified Cache Manager,推理记忆数据管理)技术,在长序列AI推理场景中实现了显著突破。测试数据显示,Token吞吐率最高提升达372%,为运营商智算业务的高效部署提供了强有力的技术支撑。

测试在湖北移动现网环境中展开,采用vLLM-Ascend框架,针对MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K的长序列输入场景。这一设计旨在全面评估AI推理加速方案在不同长度上下文下的性能表现。

在MiniMax M2.5模型测试中,启用UCM技术后,首Token延迟(TTFT)优化幅度达到26%至62%,单NPU卡Token输出效率(TPS)显著提升。具体而言,在64K序列长度下,TPS提升58%;在128K序列长度下,TPS提升78%,展现了该方案在长序列推理中的高效性。

而在GLM-5.1模型测试中,UCM的加速效果更为突出。TTFT优化幅度高达51%至93%,TPS提升范围则达到56%至372%。特别是在64K序列长度下,TPS提升313%;在128K序列环境下,TPS最高提升372%,进一步验证了AI推理加速方案在复杂场景下的卓越性能。

华为方面表示,测试结果表明,随着上下文长度的增加,AI推理加速方案的优势愈发明显。该方案有效解决了长序列推理中的KV Cache容量瓶颈问题,为运营商在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中提供了更高效的资源利用方案,同时降低了长上下文推理带来的性能压力。

罗马尼亚Audiobyte Super HUB固件升级:新增Diretta协议,开启高保真音频串流新体验
它的设计目标是通过软件手段最小化并平均化接收端——协议桥(Target)的处理负载,使电流消耗保持平稳,从而减少内部噪声。作为网络音频接收端,无缝接入支持 Diretta 协议的播放系统;在现有网络环境下,…

2026-06-26

MWC26上海展会启幕 vivo携X Fold6折叠屏等多款新品惊艳亮相
vivo X Fold6具备全场景全面可靠性,采用了第三代半固态电池,拥有7000mAh大容量,在零下20度的低温环境下可提供稳定续航。在影像方面,vivo X Fold6在折叠屏层面实现突破,采用2亿像…

2026-06-26

科学管理手机后台程序,轻松减少电量消耗延长续航时间
手机电量消耗得越来越快,除了屏幕亮度和信号强度,后台运行的闲置程序也是影响续航的重要因素。对于安卓设备,还可以通过设置中的运行服务或应用管理来查看哪些程序在后台运行,并有选择地停止或限制其活动。每天抽出几秒钟…

2026-06-25

vivo TWS 5 Pro深度评测:从音质到降噪,开启TWS耳机全链路HiFi新体验
【ZOL中关村在线原创深度体验】对于HiFi爱好者来说,一直发愁没有一款能同时满足音质长续航、强降噪、便捷性的TWS耳机,直到体验到了vivoTWS 5 Pro才发现,无线耳机也能拥有专业级别的HiFi音质…

2026-06-25

MacBook Ultra来袭:六大亮点抢先看 M6芯片触控屏成焦点
全新一代M6芯片将于今年晚些时候登场,MacBook Ultra大概率是首款预装该系列芯片的设备。目前无法百分百确定MacBookUltra今年就会上线蜂窝版本,但苹果C2基带预计同期搭载于iPhone …

2026-06-25