中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

国产算力新突破!昇腾910C助力1.6万亿大模型全参数后训练成功

2026-06-08来源:互联网编辑:瑞雪

深圳河套学院携手哈尔滨工业大学(深圳)、深圳市大数据研究院及华为等团队,近日在国产AI算力领域取得重大突破。依托昇腾910C国产AI算力集群,该联合团队成功完成1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练,标志着中国半导体产业在复杂模型训练领域迈出关键一步。

在美方技术封锁背景下,此次突破具有特殊意义。此前业内普遍认为,国产芯片难以支撑世界级超大参数模型的全参数训练。而此次成功实践证明,国产AI算力已具备支撑万亿级模型训练的工业级能力。联合团队通过三项核心工程创新,将理论可能性转化为现实生产力。

全参数后训练的复杂性远超常规训练。该过程需同时调整1.6万亿个参数,相当于在单行道上构建多层立交桥。DeepSeek-V4-Pro采用的混合专家(MoE)架构更增加了训练难度——推理时仅需激活部分专家模块,训练时却需所有专家同步学习,数据交换量呈指数级增长。这种架构对算力分配和通信效率提出极端要求,此前被视为国产芯片的"禁区"。

联合团队通过三大技术突破破解难题:其一,创新分布式显存管理方案,将巨型模型拆解为可由多张芯片协同处理的模块,实现数据交换的毫秒级同步;其二,开发动态负载均衡算法,解决MoE架构中常见的算力分配不均问题,使跨卡通信效率提升40%;其三,构建全链路监控系统,确保1500余个训练步骤零中断运行,形成包含错误预测、自动修复的容错机制。

技术突破带来的性能提升显著。模型算力利用率突破30%,关键训练算子效率提升14%。这一数据已达到国际先进水平,即便使用顶级海外芯片,多数团队也仅能实现40%左右的利用率。更关键的是,此次突破验证了国产算力在复杂工程场景下的可靠性。

比技术突破更具战略价值的是人才梯队建设。深圳河套学院将此次攻关转化为实战教学场景,构建"青年教师-博士生-工程团队"三级培养体系。42名学生从环境搭建到故障排查全程参与,在真实万亿级集群中积累工程经验。这种"战训结合"模式,解决了高端AI人才培养中"理论脱离实践"的痛点。

当前国产算力在单卡性能和软件生态方面仍存差距,但此次突破证明,通过系统工程创新,完全可以在特定领域实现弯道超车。随着更多团队加入国产算力生态建设,中国AI产业正在构建涵盖芯片设计、模型训练、应用落地的完整技术体系。这场静悄悄的技术革命,正在改写全球AI竞争的底层逻辑。

安卓超大杯新机影像之路:OPPO坚守、vivo转向、小米夭折,未来何去何从?
不知道从什么时候开始,很多新机不是输在技术上,而是输给了成本、体积和量产可行性,导致没有办法和用户见面。 小米虽然暂时砍掉了18 Ultra,但磁吸外接镜头和多光谱技术的储备,暗示它可能在等一个更成熟的时机。…

2026-06-07

电脑加装无线网卡后仍搜不到WiFi?这些常见原因及解决方法请查收
电脑接入无线网卡后,无法直接开启联网功能,需要安装适配的驱动程序,如果缺少驱动或者安装的驱动与电脑系统不匹配,都会直接影响到电脑网络的连接,此时的网卡处于休眠的状态,自然无法搜索到周边的WiFi。 如果电脑…

2026-06-06

Computex 2026:Phison转型“AI赋能者” 超大容量SSD与自研NPU齐登场
【CNMO科技消息】在2026年中国台北国际电脑展Computex期间,存储解决方案厂商Phison集中展示了多款面向AI基础设施的新产品,并提出从传统存储供应商向“AI赋能者”转型的发展方向。相比以往重点展…

2026-06-06

AI浪潮下企业“精打细算”:从烧Token到算价值,谁将笑到最后?
部分大型企业开始限制员工调用高成本模型的次数;有企业在预算超支后,将开发工具自动切换至价格更低的模型;还有一些公司开始重新审核原本激进的AI全栈计划,把过去强调覆盖率和使用率的考核指标,改成投资回报率和成本…

2026-06-05

红魔游戏平板5 Pro即将登场:骁龙8E5芯片配9英寸OLED屏,6月发布引期待
根据最新消息显示,一款型号为NP06J的努比亚新机通过了3C认证,对应的就是红魔游戏平板5 Pro,博主@数码闲聊站爆料称该机将在6月正式发布,同时他还直接曝光了这款新机的详细配置,整体堆料十分强大。 那…

2026-06-05