智能结构化识别
所有文档

          文字识别

          智能结构化识别

          接口描述

          结构化识别各类卡证、票据,无需配置结构化对应关系、无需提取关键词、无需定制开发,直接上传图片即可获得结构化识别信息

          申请试用

          该接口正在邀测中,在正式使用之前,请先提交合作咨询,或者提交工单,提供公司名称、appid、应用场景,工作人员协助开通权限后方可使用。

          请求说明

          请求示例

          HTTP 方法:POST

          请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/intelligent_ocr

          URL参数:

          参数
          access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

          Header如下:

          参数
          Content-Type application/x-www-form-urlencoded

          Body中放置请求参数,参数详情如下:

          请求参数

          参数 是否必选 类型 可选值范围 说明
          image 和url二选一 string - 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
          url 和image二选一 string - 图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式,当image字段存在时url字段失效
          请注意关闭URL防盗链
          detect_direction string true/false 是否进行方向检测及矫正,默认为 false,可缺省
          - false:不进行方向矫正,返回参数 direction 固定为 0
          - true:开启自动方向矫正功能,可识别旋转90/180/270度的图片,并返回 direction 检测数值
          detect_null_word string true/false 是否返回未成功匹配的Key/Value值,缺少的对应 Value/Key 置为 NULL,默认为 false,可缺省
          - false:不返回未匹配成功的单独 Key/Value,仅返回成功匹配的 KV 结果组
          - true:返回未匹配成功的单独 Key/Value,缺少的对应 Value/Key 置为 NULL
          probability string true/false 是否返回字段识别结果的置信度,默认为 false,可缺省
          - false:不返回字段识别结果的置信度
          - true:返回字段识别结果的置信度,包括字段识别结果中各字符置信度的平均值(average)、最小值(min)和方差(variance)

          返回说明

          返回参数

          字段 是否必输出 类型 说明
          log_id uint64 调用日志id,用于问题定位
          direction int 图片旋转角度,当请求参数 detect_direction=true 时,返回图片方向检测结果 0/1/2/3 分别代表 不旋转、逆时针旋转 90/180/270度
          words_result_num uint32 识别结果数,表示words_result的元素个数
          words_result array 识别结果数组
          + key object 关键词信息,与 value 一一对应,形成 key:value 结构化识别结果组
          ++ word string 识别结果
          ++ location object 字段位置信息
          +++ top int 字段的上边距
          +++ left int 字段的左边距
          +++ height int 字段的高度
          +++ width int 字段的宽度
          ++ probability object 字段识别结果置信度,当请求参数 probability=true 时,以上各字段均包含此参数
          +++ average float 字段识别结果中各字符的置信度平均值
          +++ min float 字段识别结果中各字符的置信度最小值
          +++ variance float 字段识别结果中各字符的置信度方差
          + value object 字段内容,与 key 一一对应,形成 key:value 结构化识别结果组
          ++ word string 识别结果
          ++ location object 字段位置信息
          +++ top int 字段的上边距
          +++ left int 字段的左边距
          +++ height int 字段的高度
          +++ width int 字段的宽度
          ++ probability object 字段识别结果置信度,当请求参数 probability=true 时,以上各字段均包含此参数
          +++ average float 字段识别结果中各字符的置信度平均值
          +++ min float 字段识别结果中各字符的置信度最小值
          +++ variance float 字段识别结果中各字符的置信度方差

          返回示例

          {
          	"words_result": [
          		{
          			"value": {
          				"probability": {
          					"average": 0.99977076053619,
          					"min": 0.99970018863678,
          					"variance": 4.9803929869086e-9
          				},
          				"location": {
          					"top": 146,
          					"left": 365,
          					"width": 50,
          					"height": 25
          				},
          				"word": "丛齐"
          			},
          			"key": {
          				"probability": {
          					"average": 0.99997997283936,
          					"min": 0.99997985363007,
          					"variance": 1.4210854715202e-14
          				},
          				"location": {
          					"top": 149,
          					"left": 311,
          					"width": 40,
          					"height": 20
          				},
          				"word": "姓名"
          			}
          		},
          		{
          			"value": {
          				"probability": {
          					"average": 0.9999588727951,
          					"min": 0.9999588727951,
          					"variance": 0
          				},
          				"location": {
          					"top": 190,
          					"left": 366,
          					"width": 20,
          					"height": 21
          				},
          				"word": "男"
          			},
          			"key": {
          				"probability": {
          					"average": 0.99983507394791,
          					"min": 0.99969410896301,
          					"variance": 1.9871126966109e-8
          				},
          				"location": {
          					"top": 192,
          					"left": 312,
          					"width": 39,
          					"height": 19
          				},
          				"word": "性别"
          			}
          		},
          		{
          			"value": {
          				"probability": {
          					"average": 0.99964165687561,
          					"min": 0.99964165687561,
          					"variance": 0
          				},
          				"location": {
          					"top": 228,
          					"left": 366,
          					"width": 22,
          					"height": 20
          				},
          				"word": "汉"
          			},
          			"key": {
          				"probability": {
          					"average": 0.99994975328445,
          					"min": 0.99993216991425,
          					"variance": 3.0917490789761e-10
          				},
          				"location": {
          					"top": 228,
          					"left": 310,
          					"width": 41,
          					"height": 20
          				},
          				"word": "民族"
          			}
          		},
          		{
          			"value": {
          				"probability": {
          					"average": 0.99989211559296,
          					"min": 0.9996235370636,
          					"variance": 1.0301564046244e-8
          				},
          				"location": {
          					"top": 262,
          					"left": 356,
          					"width": 158,
          					"height": 21
          				},
          				"word": "1989年7月28日"
          			},
          			"key": {
          				"probability": {
          					"average": 0.99828881025314,
          					"min": 0.99683433771133,
          					"variance": 0.0000021154903606657
          				},
          				"location": {
          					"top": 264,
          					"left": 312,
          					"width": 40,
          					"height": 19
          				},
          				"word": "出生"
          			}
          		},
          		{
          			"value": {
          				"probability": {
          					"average": 0.99985313415527,
          					"min": 0.99945932626724,
          					"variance": 1.7040544975089e-8
          				},
          				"location": {
          					"top": 315,
          					"left": 343,
          					"width": 297,
          					"height": 25
          				},
          				"word": "370441198907287001"
          			},
          			"key": {
          				"probability": {
          					"average": 0.99995613098145,
          					"min": 0.99990141391754,
          					"variance": 1.089595969006e-9
          				},
          				"location": {
          					"top": 320,
          					"left": 191,
          					"width": 140,
          					"height": 21
          				},
          				"word": "社会保障号码"
          			}
          		}
          	],
          	"log_id": "8733452781125821952",
          	"words_result_num": 5,
          	"direction": 0
          }
          上一篇
          其他场景文字识别
          下一篇
          错误码