增值税发票识别

接口描述

识别并结构化返回增值税发票的各个字段及其对应值,包含了发票基础信息9项,货物相关信息12项,购买方/销售方的名称、识别号、地址电话、开户行及账号,共30项结构化字段。

更新记录

时间 更新说明
2018.08.28 新增accuracy参数,能选择使用高精度模型或普通精度模型
2018.08.23 接口从邀测状态转为公测状态
2018.06.27 发票号码、发票代码准确率提升到99%左右
2018.05.14 发票四要素准确率提升到90%左右
2018.04.23 新增CheckCode校验码字段
2018.02.08 接口邀测上线

请求说明

请求示例

HTTP 方法:POST

请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/vat_invoice

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

Header如下:

参数
Content-Type application/x-www-form-urlencoded

Body中放置请求参数,参数详情如下:

请求参数

参数 是否必选 类型 可选值范围 说明
image string - 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
accuracy string normal、high normal(默认配置)对应普通精度模型,识别速度较快,在四要素的准确率上和high模型保持一致,high对应高精度识别模型,相应的时延会增加,因为超时导致失败的情况也会增加(错误码282000)

请求代码示例

参考通用文字识别(含位置信息版)

返回说明

返回参数

字段 是否必选 类型 说明
log_id uint64 唯一的log id,用于问题定位
words_result_num uint32 识别结果数,表示words_result的元素个数
words_result array 识别结果数组
InvoiceType string 发票种类
InvoiceTypeOrg string 发票名称
InvoiceCode string 发票代码
InvoiceNum string 发票号码
CheckCode string 校验码
InvoiceDate string 开票日期
PurchaserName string 购方名称
PurchaserRegisterNum string 购方纳税人识别号
PurchaserAddres string 购方地址及电话
PurchaserBank string 购方开户行及账号
Password string 密码区
CommodityName object 货物名称
- row uint32 行号
- word string 内容
CommodityType object 规格型号
- row uint32 行号
- word string 内容
CommodityUnit object 单位
- row uint32 行号
- word string 内容
CommodityNum object 数量
- row uint32 行号
- word string 内容
CommodityPrice object 单价
- row uint32 行号
- word string 内容
CommodityAmount object 金额
- row uint32 行号
- word string 内容
CommodityTaxRate object 税率
- row uint32 行号
- word string 内容
CommodityTax object 税额
- row uint32 行号
- word string 内容
SellerName string 销售方名称
SellerRegisterNum string 销售方纳税人识别号
SellerAddress string 销售方地址及电话
SellerBank string 销售方开户行及账号
TotalAmount uint32 合计金额
TotalTax uint32 合计税额
AmountInWords string 价税合计(大写)
AmountInFiguers uint32 价税合计(小写)
Payee string 收款人
Checker string 复核
NoteDrawer string 开票人
Remarks string 备注

返回示例

{    
  "log_id": "5425496231209218858",
    "words_result_num": 29,
    "words_result": {
        "InvoiceNum": "14641426",
        "SellerName": "上海易火广告传媒有限公司",
        "CommodityTaxRate": [
            {
                "word": "6%",
                "row": "1"
            }
        ],
        "SellerBank": "中国银行南翔支行446863841354",
        "Checker": ":沈园园",
        "TotalAmount": "94339.62",
        "CommodityAmount": [
            {
                "word": "94339.62",
                "row": "1"
            }
        ],
        "InvoiceDate": "2016年06月02日",
        "CommodityTax": [
            {
                "word": "5660.38",
                "row": "1"
            }
        ],
        "PurchaserName": "百度时代网络技术(北京)有限公司",
        "CommodityNum": [
            {
                "word": "",
                "row": "1"
            }
        ],
        "PurchaserBank": "招商银行北京分行大屯路支行8661820285100030",
        "Remarks": "告传",
        "Password": "074/45781873408>/6>8>65*887676033/51+<5415>9/32--852>1+29<65>641-5>66<500>87/*-34<943359034>716905113*4242>",
        "SellerAddress": ":嘉定区胜辛南路500号15幢1161室55033753",
        "PurchaserAddress": "北京市海淀区东北旺西路8号中关村软件园17号楼二属A2010-59108001",
        "InvoiceCode": "3100153130",
        "CommodityUnit": [
            {
                "word": "",
                "row": "1"
            }
        ],
        "Payee": ":徐蓉",
        "PurchaserRegisterNum": "110108787751579",
        "CommodityPrice": [
            {
                "word": "",
                "row": "1"
            }
        ],
        "NoteDrawer": "沈园园",
        "AmountInWords": "壹拾万圆整",
        "AmountInFiguers": "100000.00",
        "TotalTax": "5660.38",
        "InvoiceType": "专用发票",
        "SellerRegisterNum": "913101140659591751",
        "CommodityName": [
            {
                "word": "信息服务费",
                "row": "1"
            }
        ],
        "CommodityType": [
            {
                "word": "",
                "row": "1"
            }
        ]
    }
}