近日,人工智能领域迎来一则重磅消息:技术专家孙天祥正式加入百度,担任基础模型研发部(BMU)负责人,并进入百度模型委员会(BMC)。这一人事变动标志着百度在AI基础模型领域的战略布局迈入全新阶段。此前,百度已分别成立基础模型研发部(BMU)和应用模型研发部(AMU),其中应用模型研发部由贾磊负责。
孙天祥出生于1997年,是大模型领域备受瞩目的青年才俊。他于2024年获得复旦大学计算机科学与技术博士学位,学术根基深厚。在学术研究方面,他成果斐然,累计在ICML、ICLR、NeurIPS、ACL等人工智能顶级会议上发表四十余篇论文。他不仅是国内首个公开邀请公众参与内测的类ChatGPT对话大模型MOSS的核心研发负责人与主导者,还在国际上较早提出Model-as-a-Service(MaaS,模型即服务)的概念,为行业发展提供了新的思路。
在产业实践领域,孙天祥同样有着丰富的履历。攻读博士学位期间,他先后在亚马逊上海人工智能实验室(2019 - 2020年)、阿里巴巴达摩院(2022年)和上海人工智能实验室(2023年)实习,积累了从自然语言处理到大规模语言模型训练与工程化的实战经验。博士毕业后,他投身创业,创办了大模型创业公司日行迹智能,其创业项目首轮投资人评价他“绝对是心中有火的人”。他还曾担任上海人工智能研究院的助理教授。
百度方面表示,孙天祥从研发MOSS到提出MaaS理念再到创业的学术与产业路径,与百度在基础模型上的战略投入方向高度契合,他的加入是百度在AI人才战略上的重要布局。
此次孙天祥的加盟,被视为百度AI组织架构持续迭代的关键一步。今年以来,百度已进行多次组织架构调整。1月合并百度文库与网盘,3月推动百度大模型与搜索融合,5月成立百度模型委员会,6月完成百度MEG商业与电商板块的整合。以AI大模型为技术底座,百度正打通内容、电商、数字人、广告等多元变现链路,通过组织扁平化加速决策与创新的战略主线愈发清晰。过去一段时间,百度在AI组织架构和人才梯队上持续发力,设立百度模型委员会、多批次引入年轻技术力量,围绕基础模型的系统性人才布局逐步成型。
在孙天祥加盟百度前不久,百度开源的端到端OCR模型Unlimited OCR引发业界广泛关注。在OmniDocBench v1.6基准测试中,Unlimited OCR以93.92%的综合成绩刷新端到端OCR最新纪录。在保持高精度解析能力的同时,真实文档场景推理速度较DeepSeek OCR提升约12.7%,输出长度达6000 tokens时速度优势扩大至35%。Unlimited OCR提出的参考滑动窗口注意力(Reference Sliding Window Attention, R - SWA)机制,让模型能够模仿人类抄书时的注意力模式,在一次前向推理中连续完成数十页文档解析,告别了传统OCR“逐页解析 + 结果拼接”的工程方案。
Unlimited OCR发布次日即登顶GitHub Daily Trending榜,5天内GitHub Star突破一万,并在HuggingFace全球模型总趋势榜和多模态模型趋势榜均排名第一,实现GitHub、HuggingFace四榜登顶。这一卓越表现引发了业界对Unlimited OCR核心作者“YY”的广泛关注和猜测。不过,百度方面并未将YY和孙天祥划等号,只是表示Unlimited OCR为百度的人才战略提供了直接验证,组织变革的成效正在产品侧加速兑现。
