中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

华为携手湖北移动完成全国运营商首个AI推理加速测试:性能显著提升

2026-06-27来源:快讯编辑:瑞雪

在2026 MWC上海展期间,华为与中国移动通信集团湖北有限公司共同宣布,双方成功完成全国运营商首个AI推理加速解决方案的现网测试。这一突破性成果标志着AI技术在运营商领域的应用迈入新阶段,为智能计算业务的高效部署提供了坚实的技术支撑。

此次测试依托华为OceanStor A800存储系统与昇腾A3超节点架构,结合UCM(Unified Cache Manager,推理记忆数据管理)技术,在长序列AI推理场景中实现了Token吞吐率最高提升372%的显著效果。测试团队在湖北移动现网环境中部署了vLLM-Ascend框架,针对MiniMax M2.5、GLM-5.1等主流大模型,模拟了8K至190K长序列输入场景,全面验证了方案的实际性能。

在MiniMax M2.5模型测试中,启用UCM技术后,首Token延迟(TTFT)优化幅度达26%至62%,单NPU卡Token输出效率(TPS)显著提升。具体数据显示,64K序列长度下TPS提升58%,128K序列长度下提升78%,验证了方案在不同长度序列下的稳定性与高效性。

GLM-5.1模型的测试结果更为突出,UCM技术带来的加速效果显著增强。TTFT优化幅度达51%至93%,TPS提升范围为56%至372%。其中,64K序列长度下TPS提升313%,128K序列长度下最高提升372%,充分展现了方案在复杂长序列推理场景中的优势。

华为相关负责人表示,测试数据表明,随着上下文长度的增加,AI推理加速方案的优势将进一步放大。该方案有效突破了长序列推理中的KV Cache容量瓶颈,为运营商在大模型推理、智能客服、内容生成、行业智能体等长序列AI业务场景中提供了高效解决方案,有助于提升现网智算资源的利用率,同时降低长上下文推理带来的性能压力。

中国移动携手多方发布OpenAN项目 推动自智网络向L4级演进提供中国方案
在实际网络运营工作中,多个智能体需要协同完成复杂任务,现有开源多智能体框架在适配网络运营场景时存在不足,如互联网暴露风险高、交互效率低,以及无法完全私有化部署等问题,限制了其大规模工程化应用。未来,中国移动将…

2026-06-27

高通阵营迭代新机8系芯片方案揭晓,多款新芯片性能升级亮点足
IT之家 6 月 26 日消息,博主 @数码闲聊站 今日曝光了高通阵营迭代新机的 8 系芯片方案: SM8975,2nm,命名暂定骁龙 8Elite Gen6 Pro,2+3+3 新一代 Oryan CP…

2026-06-26

中国移动携手伙伴发布OpenAN,为通信行业智能体协同提供开源新方案
在实际网络运营工作中,多个智能体需要协同完成复杂任务,现有开源多智能体框架在适配网络运营场景时存在不足,如互联网暴露风险高、交互效率低,以及无法完全私有化部署等问题,限制了其大规模工程化应用。未来,中国移动将…

2026-06-26

国芯思辰双通道14位250MHz模数转换器:智能天线系统接收链路优选方案
1.8V模拟/数字电源LVDS(ANSI-644电平)和CMOS输出片内精密电压基准三线SPI接口采样率高达250MSPSSNR典型值为69.4dBFS(185MHz)SFDR典型值为80dBc(185MH…

2026-06-26

机器人ETF嘉实(159526)午间微跌0.36% 半日成交额超2300万 重仓股表现分化
来源:新浪基金∞工作室 6月25日,截止午间收盘,机器人ETF嘉实(159526)跌0.36%,报1.676元,成交额2308.45万元。机器人ETF嘉实(159526)重仓股方面,科大讯飞截止午盘跌2.04…

2026-06-26

MWC26上海展会启幕 vivo携X Fold6等多款新品惊艳亮相
vivo X Fold6具备全场景全面可靠性,采用了第三代半固态电池,拥有7000mAh大容量,在零下20度的低温环境下可提供稳定续航。在影像方面,vivo X Fold6在折叠屏层面实现突破,采用2亿像…

2026-06-25