默认:印刷文字识别 = handwring_only:手写文字识别 = handprint_mix: 手写印刷混排识别 layout_analysis 否 string true/false 是否分析文档版面:包括layout(图、表、标题、段落、目录);attribute(栏、页眉、页脚、页码、脚注)的分析输出 recg_formula 否 string true/false 是否检测并识别公式,
使用流程 使用说明 本文档主要说明如何在 iOCR 财会版的可视化界面中完成模板、分类器及字段类型的自定义,同时对模板图片预处理、框选表格识别区等高级功能进行说明。 自定义模板 创建自定义模板的基本流程如下图所示,仅需上传一张规范的模板图片,通过简单框选,5 分钟即可完成结构化识别模板的制作。
简介 Hi,欢迎您使用百度 iOCR 通用版。 iOCR 通用版是 iOCR 自定义模板文字识别针对通用场景下固定版式的卡证票据、文件资料提供的一款 OCR 定制化产品,您仅需上传一张模板图片,即可通过框选参照字段及识别区快速制作结构化识别模型;同时,还可针对制作的多个模板训练自定义分类器,一步完成图片的自动分类和结构化识别。
使用流程 使用说明 本文档主要说明如何在 iOCR 通用版的可视化界面中完成模板、分类器及字段类型的自定义,同时对模板图片预处理、框选表格识别区等高级功能进行说明。视频教程请参见 iOCR通用版使用教程 。 自定义模板 创建自定义模板的基本流程如下图所示,仅需上传一张规范的模板图片,通过简单框选,5 分钟即可完成结构化识别模板的制作。
更新记录 更新记录 时间 更新说明 2020-03-27 iOCR通用版新增 QPS 叠加包售卖,详情参见 价格文档 2020-03-26 iOCR通用版及iOCR财会版整体升级,新增预置模板功能及关键词辅助分类功能 - 预置模板无需制作或编辑即可直接在“模板管理”中查看或进行 API 调用 - 关键词辅助分类功能可支持基于关键词的分类器训练,将图片中的特异性文字作为分类依据 2019-11-07
如果持续出现此类错误,请在控制台 提交工单 联系技术支持团队 282000 internal error 服务器内部错误,如您使用的是通用文字识别系列接口(高精度版、高精度含位置版、标准版、标准含位置版),报此错误的原因可能是您上传的图片中文字过多,识别超时导致的,建议您对图片进行切割后再识别,其他情况请再次请求, 如果持续出现此类错误,请在控制台 提交工单 联系技术支持团队 282003 missing
Q:同时识别多张卡证/票据,如何收费? A:一般情况下,按照调用接口的次数收费。但调用混贴识别类接口,如 智能财务票据识别 和 iOCR财会版 中的混贴票据识别,则按照识别对象的数量计费。例如,一张粘贴单上粘贴 4 张火车票,则计费次数计作 4 次。具体计费说明可参考各接口 计费文档 。 Q: 为什么两次账单中的调用次数基本相同,费用却差距很大?
例如,传递参数{ sealRecognition :true, handWritingRecognition :true}将分别启用印章识别与手写体识别功能 + sealRecognition 否 bool true/false 是否识别印章信息(识别印章信息有额外的时间开销),支持电子签章差异比对。
模型名称 模型功能 支持部署环境 对应云端能力 通用场景文字识别 通用文字识别 识别图片中的文字信息及文字区域的坐标信息,支持中文简体、中文繁体、英文识别 CPU/GPU 通用文字识别 通用文字识别(多语种版) 识别图片中的文字信息及文字区域的坐标信息,支持 20 种语种识别,包含 中英文混合、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、丹麦语、荷兰语、马来语、瑞典语、印尼语、
行程单识别模型升级,识别准确率提升约 30%,并增加票价、民航发展基金、燃油附加费、其他税费、填开日期 5 个新字段,详情参照 技术文档 2019-10-26 火车票识别模型升级,识别准确率提升约 20%,各字段平均识别准确率可达 97% 以上 2019-09-21 新增次数包售卖方式,通用文字识别(高精度版)及通用文字识别(高精度含位置版)已支持 购买 2019-06-05 新增 iOCR财会版