PPOCR-v5 PP-OCRv5是一种具备多场景、多语言的文字识别解决方案,具备中英复杂手写体、竖排文本、生僻字等多种挑战性场景的识别能力 立即使用 技术文档 功能介绍 多语言识别 可精准识别简体中文、中文拼音、繁体中文、英文及日文这5类语言 多场景识别 能够识别中英复杂手写体、竖排文本、生僻字等各类长尾场景下的文字内容 坐标定位输出 依托 OCR 定位检测,精准输出字符位置,让信息可定位、可追溯
识别语言类型 中英文 英文 是否检测图像朝向 是 否 是否返回每行识别结果的置信度 是 否 文字类型 手写印刷混排识别 印刷文字识别 手写文字识别 是否分析文档版面 是 否 是否识别公式 是 否 Params image= 图片的Base64编码 type=https://aip.baidubce.com/rest/2.0/ocr/v1/doc_analysis language_type=CHN_ENG
户口本识别 结构化识别户口本内常住人口登记卡的全部 22 个字段,以及户主页的5个关键字段,包括户号、姓名、与户主关系、性别、出生地、民族、出生日期、身份证号、曾用名、籍贯、宗教信仰等 优惠 人工智能品类特惠,文字识别产品低至1折!
支持扫描和拍照场景,支持印刷、手写文字的分类与识别,支持公式识别和手写竖式识别。适用于智能批改、题目检索等智慧教育场景 办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持表格识别和印章识别 手写作文识别(多模态) 基于多模态大模型实现手写体作文内容的精准识别。
二手车销售发票识别 可结构化识别二手车销售发票的25个关键字段,包括发票代码、发票号码、开票日期、买方、卖方、车牌号、车辆类型、二手车市场等 优惠 人工智能品类特惠,文字识别产品低至1折!
超出部分按时长计费 收费标准 通用场景模型 免费版 适用于测试对接和效果体验 噪声识别 背景音下精准识别 多场景分析 直播网课会议适用 额度试用 测试详情咨询商务 申请测试 音视频场景模型 付费版 适用于业务环境下持续、稳定使用 噪声识别 背景音下精准识别 多场景分析 直播网课会议适用 定价咨询 产品定价详询商务 合作咨询 音视频场景模型 相关推荐 短语音识别极速版 60秒语音快转文字,适用于输入
办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本、印章、栏、页眉、页脚和脚注等位置和分版块内容的OCR识别结果,支持表格识别,印章识别和单字置信度输出,支持中、英、日、韩、法等 20+ 语言类型,手写、印刷体混排多种场景 优惠 人工智能品类特惠,文字识别产品低至1折!
超出部分按时长计费 收费标准 开始使用识别服务 注册即可领取产品免费体验套餐 立即使用 相关推荐 短语音识别极速版 将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景 语音自训练平台 使用业务场景文本语料,零代码自助训练语音识别语言模型,精准识别语音内容,有效提升业务领域识别准确率 音频文件转写 将批量上传的音频文件识别为文字,12小时内返回识别结果。
ocr/v1/doc_analysis_office?
可识别中、英、日、韩、法、俄、西、葡、德、意等20+种语言 表格文字识别 识别图片/PDF格式文档中的表格内容,返回表头表尾、单元格文字及其行列位置,支持有线表格、无线表格、含合并单元格表格 办公文档识别 对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持手写、印刷体混排场景 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化