文字识别

    简介

    Hi,您好,欢迎使用百度文字识别(OCR)服务。

    本文档主要针对API开发者,描述百度OCR文字识别接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

    • 在百度云控制台内提交工单,咨询问题类型请选择人工智能-文字识别
    • 关注公众号“百度OCR文字识别”(同时能及时获取接口升级等信息)
    • 百度AI社区--文字识别官方版块:http://ai.baidu.com/forum/topic/list/164
    • 具有免费调用额度的接口,超过每天的免费额度后会返回错误码:17,错误信息:Open api daily request limit reached(每天流量超限额);
    • 所有图片均需要base64编码、去掉编码头后再进行urlencode。
    • 请注意:上传的图片使用JPG格式可以一定程度上提高识别准确率!
    • 强烈建议:如果您使用OCR的服务,请从文字识别的控制台进入并创建应用

    注意!请拒绝使用任何第三方插件使用百度OCR服务

    使用第三方非法插件会导致您的AK SK泄露,导致别人可以盗用您的账户进行任意消费! 切勿使用任何第三方插件! 因此导致的账号泄露、恶意消费,请用户自行承担责任。如果您已经使用了相关的插件,建议您立即删除对应appid、更换账户密码、更新所有appid的token,或更换账号!

    接口能力

    接口名称 接口能力简要描述
    通用场景文字识别 对各类通用场景、文件的识别接口,按行返回识别结果
    通用文字识别(标准版) 识别图片中的文字信息
    通用文字识别(高精度版) 更高精度地识别图片中的文字信息
    通用文字识别(标准含位置版) 识别图片中的文字信息(包含文字区域的坐标信息)
    通用文字识别(高精度含位置版) 更高精度地识别图片中的文字信息(包含文字区域的坐标信息)
    文档版面分析与识别 可对文档版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果
    网络图片文字识别 针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果
    数字识别 识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景
    表格文字识别 对单据或报表中的表格内容进行结构化识别,并以JSON或Excel形式返回
    二维码识别 对二维码、条形码中对应的文字内容进行识别
    卡证文字识别 对各类卡片、证照进行结构化识别,按字段返回识别结果
    身份证识别 对二代居民身份证正反面所有8个字段进行结构化识别
    银行卡识别 对银行卡的卡号、有效期、发卡行、卡片类型进行结构化识别
    营业执照识别 对营业执照进行识别
    护照识别 支持对中国大陆居民护照的资料页进行结构化识别,包含国家码、姓名、性别、护照号、出生日期、签发日期、有效期至、签发地点
    港澳通行证识别 对港澳通行证证号、姓名、姓名拼音、性别、有效期限、签发地点、出生日期字段进行识别
    台湾通行证识别 对台湾通行证证号、签发地、出生日期、姓名、姓名拼音、性别、有效期字段进行识别
    户口本识别 对出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码字段进行识别
    名片识别 提供对各类名片的结构化识别功能,提取姓名、邮编、邮箱、电话、网址、地址、手机号字段
    出生医学证明识别 对出生时间、姓名、性别、出生证编号、父亲姓名、母亲姓名字段进行识别
    多卡证类别检测 【请点击申请邀测提交需求申请开通该接口使用权限】对同一张图片中的多种卡证进行类别检测和定位,支持身份证正反面、行驶证正副页、驾驶证正副页、银行卡、营业执照5类常见卡证、8种版式
    财务票据文字识别 对财务及金融场景各类票据进行结构化识别,按字段返回识别结果(通用票据识别除外)
    混贴票据识别 对增值税发票、卷票、火车票、出租车票、行程单等7类票据混贴的图片进行切分识别
    银行回单识别 对各大银行的收/付款人户名、账号、开户银行、金额、日期等关键字段进行结构化识别
    增值税发票识别 对增值税发票进行文字识别,并结构化返回字段信息,支持增值税专票、普票、电子发票
    定额发票识别 对各类定额发票、过路过桥费专用发票代码、号码、金额进行识别
    通用机打发票识别 【请点击申请邀测提交需求申请开通该接口使用权限】对国家/地方税务局发行的横/竖版通用机打发票的号码、代码、日期、合计金额、类型、商品名称字段进行结构化识别
    火车票识别 支持对大陆火车票的车票号、始发站、目的站、车次、日期、票价、席别、姓名进行结构化识别
    出租车票识别 针对全国各大城市出租车票的发票号码、发票代码、车号、日期、时间、金额进行结构化识别
    行程单识别 对飞机行程单中的姓名、始发站、目的站、航班号、日期、票价字段进行结构化识别
    汽车票识别 【请点击申请邀测提交需求申请开通该接口使用权限】对全国范围内不同版式的汽车票进行结构化识别,包括发票代码、发票号码、到达站、出发站、日期、时间、金额、身份证号、姓名9个字段
    通行费发票识别 【请点击申请邀测提交需求申请开通该接口使用权限】对全国范围内不同版式的过路费、过桥费发票进行结构化识别,包括发票代码、发票号码、入口、出口、日期、时间、金额7个字段
    彩票识别 【请点击申请邀测提交需求申请开通该接口使用权限】对大乐透、双色球彩票进行识别,并按行返回识别结果
    保险单识别 对各类人身保险保单中投保人、受益人的各项信息、保费、保险名称等字段进行结构化识别
    通用票据识别 对各类票据图片进行文字识别,并按行(半结构化)返回文字在图片中的位置信息
    医疗票据文字识别 对医疗场景各类票据进行结构化识别,按字段返回识别结果
    医疗发票文字识别 【请点击申请邀测提交需求申请开通该接口使用权限】支持识别全国各地门诊/住院发票的业务流水号、发票号、住院号、病例号、姓名、性别、社保卡号、金额大/小写等 16 个关键字段
    医疗费用结算单识别 【请点击申请邀测提交需求申请开通该接口使用权限】支持识别全国各地病案首页的病案号、姓名、性别、出生日期、身份证号、出/入院科别、住院次数、药物过敏情况等 15 个关键字段
    病案首页识别 【请点击申请邀测提交需求申请开通该接口使用权限】支持识别全国各地病案首页的病案号、姓名、性别、出生日期、身份证号、出/入院科别、住院次数、药物过敏情况等 15 个关键字段
    教育场景文字识别 针对教育相关场景所涉及的文字、数字、符号进行识别
    手写文字识别 对手写汉字或手写数字进行识别
    公式识别 对试卷中的数学公式及题目内容进行识别
    汽车场景文字识别 针对汽车相关场景的各类证件、票据结构化识别
    车牌识别 对机动车蓝牌、绿牌、单/双行黄牌的车牌号码进行识别,并能同时识别图像中的多张车牌
    VIN码识别 对车辆车架、挡风玻璃上的VIN码进行识别
    驾驶证识别 对机动车驾驶证正本所有9个字段进行结构化识别
    行驶证识别 对机动车行驶证主页及副页所有21个字段进行结构化识别
    机动车销售发票识别 对机动车销售发票的号码、代码、日期、价税合计等26个关键字段进行结构化识别
    车辆合格证识别 对车辆合格证的编号、车架号、排放标准、发动机编号等23个关键字段进行结构化识别
    其它场景文字识别 对一些特殊场景所涉及图片中的文字内容进行识别
    智能结构化识别 【请点击申请邀测提交需求申请开通该接口使用权限】结构化识别各类卡证、票据,无需配置结构化对应关系、无需提取关键词、无需定制开发,直接上传图片即可获得结构化识别信息
    仪器仪表盘读数识别 广泛适用于各类血糖仪、血压仪、燃气表、电表等,可识别表盘上的数字、英文、符号
    印章检测 【请点击申请邀测提交需求申请开通该接口使用权限】对合同文件或常用票据中的印章进行检测,并返回其位置信息
    上一篇
    购买指南
    下一篇
    调用方式