简介

Hi,您好,欢迎使用百度OCR文字识别API服务。

本文档主要针对API开发者,描述百度OCR文字识别接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

  • 在百度云控制台内提交工单,咨询问题类型请选择人工智能-文字识别
  • 百度AI社区--文字识别官方版块:http://ai.baidu.com/forum/topic/list/164
  • 具有免费调用额度的接口,超过每天的免费额度后会返回错误码:17,错误信息:Open api daily request limit reached(每天流量超限额);
  • 所有图片均需要base64编码后再进行urlencode。
  • 请注意:上传的图片使用JPG格式可以一定程度上提高识别准确率!

接口能力

接口名称 接口能力简要描述
通用文字识别 识别图片中的文字信息
通用文字识别(高精度版) 更高精度地识别图片中的文字信息
通用文字识别(含位置信息版) 识别图片中的文字信息(包含文字区域的坐标信息)
通用文字识别(高精度含位置版) 更高精度地识别图片中的文字信息(包含文字区域的坐标信息)
通用文字识别(含生僻字版) 识别图片中的文字信息(包含对常见字和生僻字的识别)
网络图片文字识别 识别一些网络上背景复杂,特殊字体的文字
身份证识别 识别身份证正反面的文字信息
银行卡识别 识别银行卡的卡号并返回发卡行和卡片性质信息
驾驶证识别 识别机动车驾驶证所有关键字段
行驶证识别 识别机动车行驶证所有关键字段
车牌识别 对小客车的车牌进行识别
营业执照识别 对营业执照进行识别
表格文字识别 自动识别表格线及表格内容,结构化输出表头、表尾及每个单元格的文字内容
通用票据识别 对各类票据图片(医疗票据,保险保单等)进行文字识别,并返回文字在图片中的位置信息

请求格式

POST方式调用

注意:Content-Type为application/x-www-form-urlencoded,然后通过urlencode格式化请求体。

返回格式

JSON格式

请求限制

请求图片需经过base64编码:图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后再进行urlencode。

注意:图片的base64编码是不包含图片头的,如(data:image/jpg;base64,)

请求格式支持:PNG、JPG、JPEG、BMP

接口名称 图片编码后大小限额
通用文字识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
通用文字识别(高精度版) base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
通用文字识别(含位置信息版) base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
通用文字识别(高精度含位置版) base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
通用文字识别(含生僻字版) base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
网络图片文字识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
身份证识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
银行卡识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
驾驶证识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
行驶证识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
车牌识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
营业执照识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
表格文字识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px
通用票据识别 base64编码urlencode后大小不超过4M,最短边至少15px,最长边最大4096px