文字识别

    医疗发票识别

    接口描述

    支持识别全国各地门诊/住院发票的 业务流水号、发票号、住院号、病例号、姓名、性别、社保卡号、金额大/小写 等 16 个关键字段,其中北京地区票据识别效果最佳

    申请试用

    该接口正在邀测中,在正式使用之前,请先提交合作咨询,或者提交工单,提供公司名称、appid、应用场景,工作人员协助开通权限后方可使用。

    请求说明

    请求示例

    HTTP 方法:POST

    请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/medical_invoice

    URL参数:

    参数
    access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

    Header如下:

    参数
    Content-Type application/x-www-form-urlencoded

    Body中放置请求参数,参数详情如下:

    请求参数

    参数 是否必选 类型 可选值范围 说明
    image string - 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
    location string true/false 是否返回字段的位置信息,默认为 false,可缺省
    - false:不返回字段位置信息
    - true:返回字段的位置信息,包括上边距(top)、左边距(left)、宽度(width)、高度(height)
    probability string true/false 是否返回字段识别结果的置信度,默认为 false,可缺省
    - false:不返回字段识别结果的置信度
    - true:返回字段识别结果的置信度,包括字段识别结果中各字符置信度的平均值(average)和最小值(min)

    返回说明

    返回参数

    字段 是否必输出 类型 说明
    log_id uint64 调用日志id,用于问题定位
    words_result_num uint32 识别结果数,表示words_result的元素个数
    InvoiceType string 票据种类
    words_result object 识别结果
    +BusinessNum object 业务流水号
    + InvoiceNum object 发票号码
    + HospitalNum object 住院号
    + RecordNum object 病例号
    + HospitalDay object 住院天数
    + AdmissionDate object 入院时间
    + DischargeDate object 出院时间
    + Name object 姓名
    + Sex object 性别
    + HospitalType object 医疗机构类型
    + SocialSecurityNum object 社保卡号
    + InsuranceType object 医保类型
    + Payee object 收款单位
    + Date object 开票日期
    + AmountInWords object 大写合计金额
    + AmountInFiguers object 小写合计金额
    ++ word string 字段识别结果,以上各字段均包含此参数
    ++ location object 字段位置信息,当请求参数 location=true 时,以上各字段均包含此参数
    +++ top int 字段的上边距
    +++ left int 字段的左边距
    +++ height int 字段的高度
    +++ width int 字段的宽度
    ++ probability object 字段识别结果置信度,当请求参数 probability=true 时,以上各字段均包含此参数
    +++ average float 字段识别结果中各字符的置信度平均值
    +++ min float 字段识别结果中各字符的置信度最小值
    上一篇
    财务票据文字识别
    下一篇
    医疗费用结算单识别