10月17日消息,HuggingFace官网显示,百度昨晚发布的自研多模态文档解析模型PaddleOCR-VL,发布20小时内即登顶HuggingFace Trending全球第一。
据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单OmniBenchDoc V1.5中,它以92.6分获综合性能全球第一,四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录。
作为文心4.5衍生模型,PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,实现精度与效率双突破。

算力跃进与具身智能落地:AI推动“碳硅共生”愿景加速实现
在现场,21世纪经济报道记者观察发现,具身智能是本次展会的亮点之一,多家厂商都在现场展示了重点产品,这也印证了具身智能在今年正加速量产落地的趋势。王兴兴指出,机器人产品的发展,也要关注从底层软件到AI应用、…
2025-10-17
预付费管理云平台:赋能高校财务数字化,开启智慧管理新篇章
传统预付费管理多依赖实体卡片与分散的结算系统,存在数据处理效率有限、资金流向透明度不足、师生体验较为单一等情况。这种平台基于云计算技术,将预付费业务的各个环节整合在统一系统中,通过数字化手段提升管理效率与服务…
2025-10-17
昂瑞微:打破国际射频芯片垄断,以硬核实力冲刺科创板新征程
北京昂瑞微电子技术股份有限公司(简称 “昂瑞微”)的崛起,正为中国射频芯片产业撕开一道国产替代的口子 —— 这家国家级专精特新重点 “小巨人”企业,不仅在 5G 射频前端领域实现重大突破,更以全产业链布局和…
2025-10-15