医疗发票识别
更新时间:2021-01-26
接口描述
支持识别全国各地门诊/住院发票的 业务流水号、发票号、住院号、门诊号、病例号、姓名、性别、社保卡号、金额大/小写、收款单位、省市、医保统筹支付、个人账户支付 等关键字段,其中北京/广东/河北/河南/江苏/山东/上海/天津/浙江等地区票据识别效果较佳。支持识别收费项目明细,并可根据不同省市地区返回对应的识别参数。
申请试用
该接口正在邀测中,在正式使用之前,请先提交合作咨询,或者提交工单,提供公司名称、appid、应用场景,工作人员协助开通权限后方可使用。
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/medical_invoice
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/x-www-form-urlencoded |
Body中放置请求参数,参数详情如下:
请求参数
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
image | 和url二选一 | string | - | 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式 |
url | 和image二选一 | string | - | 图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式,当image字段存在时url字段失效请注意关闭URL防盗链 |
location | 否 | string | true/false | 是否返回字段的位置信息,默认为 false,可缺省- false:不返回字段位置信息- true:返回字段的位置信息,包括上边距(top)、左边距(left)、宽度(width)、高度(height) |
probability | 否 | string | true/false | 是否返回字段识别结果的置信度,默认为 false,可缺省- false:不返回字段识别结果的置信度- true:返回字段识别结果的置信度,包括字段识别结果中各字符置信度的平均值(average)和最小值(min) |
返回说明
返回参数
字段 | 是否必输出 | 类型 | 说明 |
---|---|---|---|
log_id | 是 | uint64 | 调用日志id,用于问题定位 |
words_result_num | 是 | uint32 | 识别结果数,表示words_result的元素个数 |
InvoiceType | 是 | string | 票据种类 |
Province | 是 | string | 省市:支持返回以下省市 北京/广东/河北/河南/江苏/山东/上海/天津/浙江等 |
words_result | 是 | object | 识别结果 |
BusinessNum | 是 | object | 业务流水号 |
InvoiceNum | 是 | object | 发票号码 |
HospitalNum | 是 | object | 住院号 |
HospitalName | 是 | object | 医院名称 |
RecordNum | 是 | object | 病例号 |
HospitalDay | 是 | object | 住院天数 |
AdmissionDate | 是 | object | 入院时间 |
DischargeDate | 是 | object | 出院时间 |
Name | 是 | object | 姓名 |
Sex | 是 | object | 性别 |
HospitalType | 是 | object | 医疗机构类型 |
SocialSecurityNum | 是 | object | 社保卡号 |
InsuranceType | 是 | object | 医保类型 |
ChargingUnit | 是 | object | 收款单位 |
Payee | 是 | object | 收款人 |
Date | 是 | object | 开票日期 |
AmountInWords | 是 | object | 大写合计金额 |
AmountInFiguers | 是 | object | 小写合计金额 |
InsurancePayment | 是 | object | 医保统筹支付 |
PersonalPayment | 是 | object | 个人账户支付 |
PrepayAmount | 是 | object | 预缴金额 |
PaymentAmount | 是 | object | 补缴金额 |
RefundAmount | 是 | object | 退费金额 |
ClinicNum | 是 | object | 门诊号 |
+ word | 是 | string | 字段识别结果,以上各字段均包含此参数 |
+ location | 否 | object | 字段位置信息,当请求参数 location=true 时,以上各字段均包含此参数 |
++ top | 否 | int | 字段的上边距 |
++ left | 否 | int | 字段的左边距 |
++ height | 否 | int | 字段的高度 |
++ width | 否 | int | 字段的宽度 |
+ probability | 否 | object | 字段识别结果置信度,当请求参数 probability=true 时,以上各字段均包含此参数 |
++ average | 否 | float | 字段识别结果中各字符的置信度平均值 |
++ min | 否 | float | 字段识别结果中各字符的置信度最小值 |
CostCategories | 是 | Array | 项目大类:治疗费、检查费等项目大类 |
CostDetail | 是 | Array | 明细类别:药物/检查的明细类别 |
RegionSupplement | 是 | Array | 地区字段:根据省市返回改地区特有的字段 |
CostCategories字段包含多个Array,每个数组包含多个object,见以下参数
字段 | 说明 |
---|---|
name | 字段名,包括:收费项目、金额 |
word | name字段对应的识别结果 |
CostDetail字段包含多个Array,每个数组包含多个object,见以下参数
字段 | 说明 |
---|---|
name | 字段名,包括:编码、项目、规格、数量、单价、金额 |
word | name字段对应的识别结果 |
RegionSupplement字段包含多个object,不同省市返回字段不同,见以下参数
省市 | 返回参数(name) |
---|---|
北京 | 个人支付金额、其他医保支付、交易流水号、基金支付、单位补充险[原公疗]支付、年度门诊大额累计支付、本次医保范围内金额、本次支付后个人账户余额、残军补助支付、累计医保内范围金额、自付一、自付二、自费、起付金额、超封顶金额、退休补充支付、门诊大额支付 |
广东 | 个人支付金额、其他医保支付 |
河北 | 个人账户余额、统筹累计支付、自负、自费、起付标准 |
河南 | 个人支付金额、其他医保支付 |
江苏 | 个人支付金额、其他医保支付 |
山东 | 个人支付金额、其他医保支付 |
上海 | 分类自负、历年余额、本年余额、现金支付、自负、自费、附加支付 |
天津 | 个人支付金额、其他医保支付 |
浙江 | 历年余额、历年支付、基金支付、本年余额、本年支付、现金支付 |