接口能力 接口名称 接口能力简要描述 通用场景文字识别 对各类通用场景、文件的识别接口,按行返回识别结果 通用文字识别(标准版) 识别图片中的文字信息 通用文字识别(高精度版) 更高精度地识别图片中的文字信息 通用文字识别(标准含位置版) 识别图片中的文字信息(包含文字区域的坐标信息) 通用文字识别(高精度含位置版) 更高精度地识别图片中的文字信息(包含文字区域的坐标信息) 网络图片文字识别 针对网络图片进行专项优化
识别图片中的文字信息(包含对常见字和生僻字的识别) 网络图片文字识别 识别一些网络上背景复杂,特殊字体的文字 身份证识别 识别身份证正反面的文字信息,并支持端上数据加密 银行卡识别 识别银行卡的卡号并返回发卡行和卡片性质信息,并支持端上数据加密 驾驶证识别 识别机动车驾驶证所有关键字段 行驶证识别 识别机动车行驶证所有关键字段 车牌识别 对小客车的车牌进行识别 营业执照识别 对营业执照进行识别 通用票据识别
图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别;识别区的框选直接影响最终识别效果,框选区域需完全覆盖文字可能出现的范围 字段类型: 针对不同识别区内容类型进行专项优化的切片识别模型,如小写金额、日期、纯数字等,可根据需求选择合适的字段类型以提升识别准确率也可通过穷举可能的输出值范围
iOCR 财会版是 iOCR 自定义模板文字识别针对财会报销场景提出的专项解决方案,预置多种财务场景常用识别模板及财务票据分类器,无需制作或训练即可直接使用;并提供混贴票据识别功能,可对粘贴在一张报销单上的多张不同种类发票进行切分识别;同时支持对未预置的固定版式票据可定制结构化识别模板和分类器。
增值税发票识别 接口描述 支持对增值税普票、专票、全电发票(新版全国统一电子发票,专票/普票)、卷票、区块链发票的所有字段进行结构化识别,包括发票基本信息、销售方及购买方信息、商品信息、价税信息等,其中五要素字段的识别准确率超过 99.9%; 同时,支持对增值税卷票的 21 个关键字段进行识别,包括发票类型、发票代码、发票号码、机打号码、机器编号、收款人、销售方名称、销售方纳税人识别号、开票日期、购买方名称
该产品提供三大自定义功能,分别为: 自定义模板 针对需要识别的图片版式,上传一张模板图片,通过框选参照字段和识别区即可自助制作一个识别模板,并建立图片中文字的 Key-Value 对应关系,实现对相同版式图片的结构化识别。
核心功能 iOCR 全场景识别提供以下两大自定义功能: 自定义项目空间、自定义抽取模型 ,结合使用,可实现对全场景不同类型文档的自动分类与结构化识别,分类准确率可达 99%,识别准确率可达 95%,详细介绍如下。 自定义项目空间 可基于业务需求,自主创建项目空间并配置识别规则,不同空间下,任务数据完全隔离,有效保障数据隐私性。
开户许可证识别 接口描述 支持对开户许可证进行结构化识别,包括公司名称、开户银行、核准号、法人、编号、账号,全部 6 个字段。 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页 请求代码示例 提示一 :使用示例代码前,请记得替换其中的示例Token、图片地址或Base64信息。
Q: demo工程为何提示token还未获取成功,无法使用识别功能? A:识别需要token作为参数,token需要通过网络获取,网络环境较差的情况下返回较慢。 Q:关于身份证识别的两种模式? A:身份证识别依赖本地库,如果您不需要本地能力可以在传入activity的参数中选择关闭,并且移除ui模块中的本地so文件和ui模块中assets下的模型文件。