百度智能云

【重磅上线】文档解析(PaddleOCR-VL)企业级API服务正式上线
发布日期:2025-10-31 06:27浏览量:4967次

服务介绍:

PaddleOCR-VL是百度近期发布的新一代多模态文档解析模型方案专为应对复杂文档解析任务而设计。能够精准识别图像中的印刷文本、手写文本、表格、公式和图表等复杂元素,覆盖多达109种语言;在权威评测榜单OmniDocBench中,PaddleOCR-VL在文本识别、表格识别、公式识别和图表识别四大核心任务上均取得SOTA成绩,综合排名位列第一
 
PaddleOCR-VL方案架构图
 
文档解析(PaddleOCR-VL)基于PaddleOCR-VL最新模型,通过标准化的API服务,提供开箱即用、免部署的快捷接入方式,助您轻松实现智能文档解析查看产品详情>>
 
功能亮点
  • 页面级解析通过前置模型精准定位文档中的文本块、公式、图表等各类元素,自动分类并智能推断符合人类阅读习惯的排列顺序,将复杂的页面内容转化为有序、带标签的元素序列
  • 元素级识别针对手写体、公式、图表等复杂元素进行专项优化。支持印刷体与手写体混合识别;可识别复杂数学公式(包括手写公式),并转换为规范的LaTeX代码;深度解析表格结构,准确还原数据关系;识别统计图并输出结构化数据,让图表从“图片”变为可读、可用的信息
  • 多语言支持:涵盖全球109种主要语言,包括但不限于中文、英语、日语、拉丁语、韩语,以及俄语(西里尔字母)、阿拉伯语、印地语(梵语)和泰语等不同文字体系的语言。具备特殊字符、重音符号、简繁混合的识别能力,满足全球化多语种文档处理需求

应用场景:

  • 企业文档场景高效解析商业报告、财务报表、合同文件、招投标标书、幻灯片等企业常用文档,实现关键信息的自动提取与归档,为企业的分析与决策提供可直接使用的数据基础
  • 教育科研场景支持学术论文、考试试卷、教材教辅、学习笔记等材料的自动解析与结构化处理,助力科研数字化与教育信息化。
  • 图书档案场景适用于现代横排图书、竖排古籍、多栏版式的报刊、创意编排的杂志等,实现对各类文献版式的精准解析与内容还原,为文化行业数字化提供可靠的技术支持

产品价格:

最高可享1000页免费测试资源,立即领取>>
 
按量后付费【开通付费
月调用量
 
文档解析(PaddleOCR-VL)价格(元/页)
 
不限量
0.18
 
 
资源包【购买
规格(页)
 
文档解析(PaddleOCR-VL)价格(元)
 
单价(元/页)
 
1000
 
180
 
0.18
 
5000
 
850
 
0.17
 
1万
 
1600
 
0.16
 
5万
 
7500
 
0.15
 
10万
 
14000
 
0.14
 
20万
 
26000
 
0.13
 
50万
 
55000
 
0.11
 
100万
 
90000
 
0.09
 
500万
 
350000
 
0.07
 
 
 
百度OCR现已推出:通用场景文字识别卡证文字识别财务票据文字识别交通场景文字识别教育场景文字识别医疗票据文字识别iOCR自定义模板文字识别智能文档分析平台等80+项细分能力,满足各种场景的文字识别和信息提取需求。提供在线APIHTTP SDK离线SDK私有化部署等多种部署方式,接入便捷、稳定可靠。