中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

中国移动首创智算推理集群“黄金标准” 引领行业迈向高质量发展新阶段

2025-12-30来源:快讯编辑:瑞雪

在人工智能技术加速从“模型训练”向“推理部署”转型的关键阶段,中国移动携手合作伙伴在智算运营领域实现重大创新,推出全球首个“智算推理集群运营黄金标准”。该标准通过构建可量化、可评估的集群效能评估体系,首次实现对AI推理算力服务质量的标准化度量,为行业破解“降本增效”与“服务保障”的双重挑战提供了系统性解决方案。

当前,AI推理应用已深度渗透政务、金融、制造、医疗等核心领域,驱动算力需求结构发生根本性转变。数据显示,推理算力在智算基础设施中的占比持续攀升,成为支撑智能体生态发展的核心负载。然而,用户对高性能、低成本、优体验的复合需求,与行业在资源调度、效能优化等方面的能力短板形成鲜明矛盾。如何在保障服务质量的前提下,实现推理系统的经济高效运行,成为智算基础设施建设的关键命题。

中国移动提出的“黄金标准”以“度量破局”为核心,创新构建四大维度评估体系:用户体验指标聚焦响应延迟、服务稳定性等关键参数;系统并发能力指标衡量集群处理峰值请求的能力;系统可用性指标确保服务连续性;硬件利用率指标则覆盖算力、显存、带宽等核心资源。通过实时监测集群运行状态,该体系可精准识别不同场景下最先触达性能瓶颈的“黄金指标”,为扩容优化提供科学依据。

在试点验证阶段,中国移动针对DeepSeek-R1等MoE稀疏模型、Qwen3-32B等稠密模型、Qwen2.5-VL-72B等多模态理解模型,以及Stable Diffusion等生成模型,开展全场景实测。测试发现,不同模型在算力利用率、显存带宽利用率等四项硬件指标上的增长速率存在显著差异,且各场景的性能瓶颈指标各不相同。例如,多模态生成模型在显存带宽利用率上更易达到临界点,而大语言模型则对算力利用率更为敏感。

基于“黄金指标”的动态监控机制,企业可实现精细化运营:当资源利用率低于阈值时,系统自动引入负载提升效能;当指标接近扩容临界点时,触发弹性扩容流程。实践表明,该机制可使扩容决策准确率提升至近100%,显著降低运营成本。以某金融场景为例,通过优化显存利用率指标,集群整体效能提升35%,同时将服务延迟控制在毫秒级。

作为国家“人工智能+”战略的践行者,中国移动正以“三位一体”定位(人工智能供给者、汇聚者、运营者)推动技术普惠。通过升级“AI+”行动计划,公司持续强化智算基础设施底座建设,创新运营模式,推动算力供给向绿色智能方向演进。目前,其开放的应用场景已覆盖千行百业,加速AI技术在实体经济中的规模化落地,为经济社会数字化转型注入新动能。

石头科技持续加码智能机器人创新 紧跟新技术实现用户“解放双手”愿景
证券日报网讯 12月29日,石头科技在互动平台回答投资者提问时表示,公司在智能机器人技术创新方面保持着持续的投入和前瞻性布局,对于行业内新技术的出现保持密切跟进,并最终应用于公司产品,实现“解放双手”的效果。…

2025-12-30

一加Turbo 6系列下周发布,超大电池+高帧性能外观颜值双在线
具体细节方面,官方介绍称其拥有超高帧的满帧性能、超巨量的电池、超防水超耐用的全面体验。 安兔兔近日发文显示,其在后台发现了型号为PLU110的新机,推测应该是即将发布的一加Turbo系列新机,搭载了高通骁龙…

2025-12-30

Infortrend GS U.2全闪阵列:GPUDirect赋能 助力AI与HPC高效运行
金融风控、实时推荐系统等应用,要求在毫秒级内完成复杂的数据分析和决策。 云厂商需要为客户提供最具竞争力的AI/HPC服务,而底层硬件的效能是核心卖点。GS U.2 GPU直通技术,可以作为差异化服务,吸引…

2025-12-30

黄土高原崛起数算高地:庆阳智能算力中心投运赋能“东数西算”新征程
以一期项目点亮投运为起点,庆阳电信将开启新篇章:一是全力保障新中心稳定运营,加快后续机房及变电站建设;二是深化与头部企业合作,推动“算力+行业”应用在庆阳落地;三是持续优化能耗与运维,打造国家级绿色数据中心…

2025-12-29

HMD Pulse 2+新机参数曝光:120Hz高刷屏配5000mAh大电池
IT之家 12 月 28 日消息,消息源 HMD_MEME'S 前天在 X 平台发文,曝光 HMD Pulse 2+ 手机的详细参数。据介绍,这台手机将搭载 6.7 英寸 IPS LCD 屏幕,支持 120…

2025-12-28