接口能力 接口名称 接口能力简要描述 通用场景文字识别 对各类通用场景、文件的识别接口,按行返回识别结果 通用文字识别(标准版) 识别图片中的文字信息 通用文字识别(高精度版) 更高精度地识别图片中的文字信息 通用文字识别(标准含位置版) 识别图片中的文字信息(包含文字区域的坐标信息) 通用文字识别(高精度含位置版) 更高精度地识别图片中的文字信息(包含文字区域的坐标信息) 网络图片文字识别 针对网络图片进行专项优化
并支持端上数据加密 驾驶证识别 识别机动车驾驶证所有关键字段 行驶证识别 识别机动车行驶证所有关键字段 车牌识别 对小客车的车牌进行识别 营业执照识别 对营业执照进行识别 通用票据识别 对各类票据图片(医疗票据,保险保单等)进行文字识别,并返回文字在图片中的位置信息 增值税发票识别 对增值税普票、专票、卷票、电子发票进行识别 出租车发票识别 识别全国各大城市出租车票 VIN码识别 对车辆挡风玻璃处的车架号码进行识别
识别图片中的文字信息(包含对常见字和生僻字的识别) 网络图片文字识别 识别一些网络上背景复杂,特殊字体的文字 身份证识别 识别身份证正反面的文字信息,并支持端上数据加密 银行卡识别 识别银行卡的卡号并返回发卡行和卡片性质信息,并支持端上数据加密 驾驶证识别 识别机动车驾驶证所有关键字段 行驶证识别 识别机动车行驶证所有关键字段 车牌识别 对小客车的车牌进行识别 营业执照识别 对营业执照进行识别 通用票据识别
相关案例 PonyCar 交通出行 PonyCar搭载人脸核身方案上路 嘀嗒出行 交通出行 嘀嗒出行平台大规模应用语音合成技术 查看更多案例 > 合作咨询 售前咨询 填写您的业务需求,专属客户经理会尽快联系您,提供1对1咨询服务 售后智能助手 智能诊断,快速解决使用问题 联系销售 更多咨询,请拨打 400-920-8999 转 1 体验AI Web端 前往 AI能力体验中心 移动端 打开百度APP
支持拍照识别和视频扫描识别。可集成于PDA、高拍仪、电脑以及手机APP中,常用于文档识别、包装信息识别、工业铭牌识别等场景。
图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别;识别区的框选直接影响最终识别效果,框选区域需完全覆盖文字可能出现的范围 字段类型: 针对不同识别区内容类型进行专项优化的切片识别模型,如小写金额、日期、纯数字等,可根据需求选择合适的字段类型以提升识别准确率也可通过穷举可能的输出值范围
iOCR 财会版是 iOCR 自定义模板文字识别针对财会报销场景提出的专项解决方案,预置多种财务场景常用识别模板及财务票据分类器,无需制作或训练即可直接使用;并提供混贴票据识别功能,可对粘贴在一张报销单上的多张不同种类发票进行切分识别;同时支持对未预置的固定版式票据可定制结构化识别模板和分类器。
港澳台证件识别 接口描述 支持识别4类港澳台出入境证件,包含港澳通行证正/反面、台湾通行证正/反面、台胞证(台湾居民来往大陆通行证)正/反面、返乡证(港澳居民来往内地通行证)正/反面,支持识别以上4类证件的全部字段信息。 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
批量修改设备绑定的识别任务的识别间隔 接口描述 批量地设置设备绑定的识别任务的识别间隔。 请求结构 PUT /console/api/v1/device/ai/elapse 请求头域 请求头名称 描述 示例 Authorization 认证头。
small 时存返回该字段 ++ char 否 string 单字符识别结果 ++ candidates 否 array[] 单字符识别结果的候选词内容 +++ word 否 string 单字符识别结果的候选词文字 +++ prob 否 string 单字符识别结果的候选词置信度 ++ location 否 object 位置数组(坐标0点为左上角) +++ left 否 uint32 表示定位位置的长方形左上顶点的水平坐标