中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

Gartner:Token成本降不抵需,前沿智能普及仍面临成本挑战

2026-04-16来源:互联网编辑:瑞雪

据市场研究机构Gartner最新预测,到2030年,生成式人工智能领域中1万亿参数规模的大语言模型推理成本将较2025年下降超过90%。这一趋势主要得益于半导体技术突破、基础设施效率优化以及模型架构创新等多重因素的共同作用。其中专用推理芯片的广泛应用和边缘计算设备的普及被视为关键推动力。

在技术演进路径上,Gartner观察到芯片利用率提升和模型设计优化正在形成协同效应。研究显示,到2030年新开发的大语言模型在成本效益方面将达到2022年早期模型的100倍。这种指数级提升不仅体现在参数规模扩张上,更反映在单位算力消耗的显著降低。研究总监Will Sommer指出,半导体制造工艺的突破与算法效率的改进正在重塑AI基础设施的经济模型。

但成本下降的传导机制存在明显阻滞。尽管基础计算单元(AI Token)的单价将持续走低,但企业用户实际支付的费用未必同步下降。当前技术条件下,执行复杂任务所需的Token消耗量正呈现爆发式增长。以代理式AI模型为例,其单次任务处理的Token需求量是传统聊天机器人的5-30倍,这种差异在多模态交互场景中可能进一步扩大。

这种供需关系的动态变化正在引发新的经济挑战。虽然单位Token成本持续走低,但整体推理成本因需求激增反而可能上升。Gartner特别警示,某些企业可能陷入"伪优化"陷阱——用低廉的Token价格掩盖系统架构缺陷,这种做法在代理式AI规模化部署时将暴露严重问题。Sommer强调,高级推理任务所需的计算资源始终具有稀缺性,单纯依赖成本下降无法解决根本问题。

面对这种技术经济范式转变,企业需要重构AI部署策略。Gartner建议建立分层模型架构:将高频标准化任务分配给轻量化领域专用模型,这类模型经过针对性优化后,在特定场景的性能可超越通用大模型,且成本降低80%以上。同时,前沿大模型应严格限定在高价值复杂任务领域,通过精准的资源管控避免算力浪费。这种异构模型协同工作模式,正在成为下一代AI平台的核心竞争力。

苹果紧急提醒!iPhone用户快更新系统 防范网络攻击守护数据安全
刚刚,“苹果官方发布提醒”话题冲上热搜。 本月初工业和信息化部网络安全威胁和漏洞信息共享平台(NVDB)监测发现,有攻击者利用针对苹果公司终端产品的漏洞利用工具实施网络攻击活动,可导致信息窃取、系统受控等严重…

2026-04-16

小米17系列大屏新机获认证,超大电池与强劲配置或成大屏用户新选择
PChome4月15日消息,今日,一款型号为2605EPN8EC的小米新机通过了工信部SRRC认证,结合此前爆料来看即为17系列大屏新机,预计将命名为小米17Max(也有部分人称小米17S Pro)。 P…

2026-04-16

一加Ace 6至尊版「王牌觉醒」配色首秀,本月发布引期待
IT之家 4 月 15 日消息,一加 Ace 6至尊版的「王牌觉醒」配色首发亮相,官方今日释出了真机图赏。 据介绍,一加 Ace 6至尊版的「王牌觉醒」配色大面积使用深邃暗色,辅以 3D 立体刻光工艺,在机…

2026-04-16

物通博联方案破解车间难题:破数据孤岛 稳移动通信 提管理效能
1、在车间CNC、温控仪、PH监测仪等关键设备节点,部署工业智能网关实现数据采集与协议转换,采用WiFi上网与MQTT上行协议,实现新旧设备联网与MES系统的实时通信。 2、在AGV小车、天车等设备控制器P…

2026-04-16

南京大学团队突破:消色差超透镜提升深度传感效率与成像质量
该宽带消色差平面光学器件有效消除了现有双螺旋超透镜在1200–1400nm波长范围内深度传感过程中出现的色差,并实现了能量利用效率14.39倍的提升。 图2:ADH超透镜的设计 图4:在 1.2、2 和 5…

2026-04-15

词元经济浪潮涌动 中国电信云网基建赋能智能产业新飞跃
依托自主研发的“息壤”智算平台,中国电信构建了“算力、平台、数据、模型、应用”五位一体的智能云体系,实现跨域算力的灵活调度与智能编排。中国电信通过算网融合技术,将算力资源与网络资源深度协同,打造“算力高速公路…

2026-04-15

诺基亚Booklet X15三防笔记本来袭:1.8米抗摔 5G模块化全都有
快科技4月15日消息,继曝光诺基亚Mission-Safe Phone 2三防手机后,smashx_60又披露了诺基亚Booklet X15Enterprise三防笔记本的首张渲染图和详细规格。 这款产品将…

2026-04-15