中文科技资讯
业界资讯 互联网 手机资讯 电脑硬件 数码产品 家电产品 APP应用 手机游戏 美通快讯

百度千帆Qianfan-OCR模型发布:4B参数实现文档智能解析,多项评测成绩领先

2026-03-20来源:互联网编辑:瑞雪

百度千帆近日宣布推出全新端到端文档智能模型Qianfan-OCR,该模型采用统一的视觉语言架构,以40亿参数规模实现了文档解析、版面分析、文字识别与语义理解的一体化融合。在多项权威评测中,该模型展现出显著优势,标志着文档智能技术从多阶段流程向统一模型架构的跨越式发展。

在核心基准测试中,Qianfan-OCR表现尤为亮眼。在OmniDocBench v1.5评测中以93.12分位居端到端模型榜首,OCRBench评测成绩显著超越同规模通用视觉语言模型和专用OCR模型。在关键信息提取(KIE)领域,该模型在多个公开榜单总分上力压Google Gemini 3-Pro等国际商用模型,展现出强大的技术竞争力。

针对图表理解等复杂场景,Qianfan-OCR在ChartQA、ChartBench等6项国际权威评测中斩获5项最佳成绩。其独特的结构理解与多模态推理能力,能够精准解析包含复杂表格、混合图表的文档内容,在金融报表、科研论文等场景中具有显著应用价值。

传统OCR系统普遍采用"检测-识别-大模型"三段式架构,这种串联处理方式容易导致误差累积,且在文本分块提取过程中会破坏原始文档的空间结构与视觉上下文。例如复杂表格的行列关系、图表的坐标对应等关键信息,在传统流程中往往出现理解偏差。

Qianfan-OCR通过底层架构创新,构建了端到端的视觉语言模型。该模型直接从文档图像生成结构化输出,完整保留视觉信息与空间关系,实现从像素到语义的直接映射。这种技术路径不仅提升了处理效率,更在结构理解与推理任务中达到更高精度,有效解决了传统方案的固有缺陷。

目前,Qianfan-OCR已在百度千帆平台全面开放,同时通过HuggingFace开源模型权重。开发者与企业用户可自由调用该模型,应用于金融、医疗、教育等领域的文档智能化处理,推动行业数字化转型进程。

GPT5.4架构革新:混合专家模型与推理优化如何重塑AI未来
细粒度Checkpoint:每15分钟保存模型状态,仅保留最近20个 故障预测:基于GPU温度、错误率日志的预测性维护,提前迁移任务 弹性重启:自动从最近Checkpoint恢复,平均恢复时间从45分钟优…

2026-03-19

小米新一代SU7官图亮相:4大色系9款外饰,智能配置全面升级
IT之家 3 月 19 日消息,小米春季新品发布会正在进行中。小米创办人、董事长兼 CEO 雷军正式公开了新一代 SU7 的 4 大色系 9款外饰颜色官图。小米汽车官方表示,每一款,都极具高级感与质感。 …

2026-03-19

华为三款新机蓄势待发:Mate探新技、nova求均衡、畅享拼续航
从目前的爆料来看,这会是Mate系列里第一次引入主动散热结构。 再配合它可能搭载的麒麟9030Pro芯片,这台Mate80青云版,很明显是冲着“极限性能稳定性”去的。 特别是那些对性能要求不高,但对外观、…

2026-03-19

vivo X300 Ultra与X300s首发蓝图原生色彩,影像配置革新引领创作新风潮
这一次,专业V单在色彩方面做了极致重构,我们将发布全新的色彩科学体系,包括底层硬件、软件、体验分享都做了全链路的设计,让大家在影像的创作更自由!这一次专业V单#vivo X300 Ultra# 拥有全焦…

2026-03-19

OPPO折叠屏Find N6重磅登场:2亿像素四摄+6000mAh大电池,9999元起售
折叠屏手机是这几年高端市场最热门的产品,以前国产高价手机总是被人看不起,阿维在写相关产品的评论区中总能看到有网友吐槽,有这个预算为什么不买苹果手机,但折叠屏手机出现后就没这个问题了,售价万元左右的国产折叠屏手…

2026-03-18

中国电信推出天翼智安三款产品 为AI智能体安全保驾护航共筑新生态
龙虾小卫士实现了全流程闭环防护,覆盖事前-事中-事后全生命周期,从源头排查、过程阻断到事后溯源,形成完整安全防护闭环;其采用轻量化部署模式,依托插件式架构,无需大幅改造现有OpenClaw,可适配macOS/…

2026-03-18