接口能力 接口名称 接口能力简要描述 通用场景文字识别 对各类通用场景、文件的识别接口,按行返回识别结果 通用文字识别(标准版) 识别图片中的文字信息 通用文字识别(高精度版) 更高精度地识别图片中的文字信息 通用文字识别(标准含位置版) 识别图片中的文字信息(包含文字区域的坐标信息) 通用文字识别(高精度含位置版) 更高精度地识别图片中的文字信息(包含文字区域的坐标信息) 网络图片文字识别 针对网络图片进行专项优化
并支持端上数据加密 驾驶证识别 识别机动车驾驶证所有关键字段 行驶证识别 识别机动车行驶证所有关键字段 车牌识别 对小客车的车牌进行识别 营业执照识别 对营业执照进行识别 通用票据识别 对各类票据图片(医疗票据,保险保单等)进行文字识别,并返回文字在图片中的位置信息 增值税发票识别 对增值税普票、专票、卷票、电子发票进行识别 出租车发票识别 识别全国各大城市出租车票 VIN码识别 对车辆挡风玻璃处的车架号码进行识别
识别图片中的文字信息(包含对常见字和生僻字的识别) 网络图片文字识别 识别一些网络上背景复杂,特殊字体的文字 身份证识别 识别身份证正反面的文字信息,并支持端上数据加密 银行卡识别 识别银行卡的卡号并返回发卡行和卡片性质信息,并支持端上数据加密 驾驶证识别 识别机动车驾驶证所有关键字段 行驶证识别 识别机动车行驶证所有关键字段 车牌识别 对小客车的车牌进行识别 营业执照识别 对营业执照进行识别 通用票据识别
图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别;识别区的框选直接影响最终识别效果,框选区域需完全覆盖文字可能出现的范围 字段类型: 针对不同识别区内容类型进行专项优化的切片识别模型,如小写金额、日期、纯数字等,可根据需求选择合适的字段类型以提升识别准确率也可通过穷举可能的输出值范围
iOCR 财会版是 iOCR 自定义模板文字识别针对财会报销场景提出的专项解决方案,预置多种财务场景常用识别模板及财务票据分类器,无需制作或训练即可直接使用;并提供混贴票据识别功能,可对粘贴在一张报销单上的多张不同种类发票进行切分识别;同时支持对未预置的固定版式票据可定制结构化识别模板和分类器。
港澳台证件识别 接口描述 支持识别4类港澳台出入境证件,包含港澳通行证正/反面、台湾通行证正/反面、台胞证(台湾居民来往大陆通行证)正/反面、返乡证(港澳居民来往内地通行证)正/反面,支持识别以上4类证件的全部字段信息。 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
使用产品 人脸识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 人脸识别让社区居民“喜刷刷” 价值成果 1、应用人脸识别门禁之后,业主只要做好门禁人脸信息的注册登记即可,无需手动刷卡、刷指纹或者输密码等繁琐操作,从此不再需要随身携带门禁卡。 2、人脸门禁的应用更是有效降低了各类社区人口的流动管理成本,尤其是对陌生人、高危人员还能进行识别预警,更加安全便捷。
small 时存返回该字段 ++ char 否 string 单字符识别结果 ++ candidates 否 array[] 单字符识别结果的候选词内容 +++ word 否 string 单字符识别结果的候选词文字 +++ prob 否 string 单字符识别结果的候选词置信度 ++ location 否 object 位置数组(坐标0点为左上角) +++ left 否 uint32 表示定位位置的长方形左上顶点的水平坐标
Q: demo工程为何提示token还未获取成功,无法使用识别功能? A:识别需要token作为参数,token需要通过网络获取,网络环境较差的情况下返回较慢。 Q:关于身份证识别的两种模式? A:身份证识别依赖本地库,如果您不需要本地能力可以在传入activity的参数中选择关闭,并且移除ui模块中的本地so文件和ui模块中assets下的模型文件。
使用产品 增值税发票识别 通用文字识别 自定义模板文字识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 OCR技术推动正保教育票据识别智能化 价值成果 1、利用百度OCR文字识别技术,实现票据内容识别服务自动化,识别准确率达到90%以上; 2、为自动化验证增值税发票真伪服务提供了关键、核心的技术支持,有效节省了人力成本,大大提升了服务标准和效率。