英语答题卡识别(多模态版)
更新时间:2025-10-22
接口描述
基于多模态大模型,实现英语答题卡中手写内容的精准识别。最大程度还原原始手写内容,严格区分单词的大小写与单词之间的空格,并按照结构化进行输出。
英语答题卡识别(多模态)API服务为异步接口,需要先调用提交请求接口获取 task_id,然后调用获取结果接口进行结果轮询,建议提交请求后 5~10 秒轮询。提交请求接口QPS为2,获取结果接口QPS为10。
在线调试
您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
申请试用
该接口正在邀测中,请您先提交 合作咨询 或 提交工单,提供公司名称、appid、应用场景等信息,工作人员协助开通权限后方可使用。
提交请求接口
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/engcard/create_task
URL参数:
| 参数 | 值 |
|---|---|
| access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
| 参数 | 值 |
|---|---|
| Content-Type | application/json |
Body中放置请求参数,参数详情如下:
请求参数
| 参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
|---|---|---|---|---|
| image | 和 url/pdf_file 三选一 | string | - | 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过10M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式优先级: image > url > pdf_file,当image字段存在时,url、pdf_file字段失效 |
| url | 和 image/pdf_file 三选一 | string | - | 图片完整url,url长度不超过1024字节,url对应的图片base64编码后大小不超过10M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式优先级: image > url > pdf_file,当image字段存在时,url字段失效请注意关闭URL防盗链 |
| pdf_file | 和 image/url 三选一 | string | - | PDF文件,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过10M,最短边至少15px,最长边最大4096px优先级: image > url > pdf_file,当image字段存在时,url字段失效 |
| pdf_file_num | 否 | string | - |
请求代码示例
提示:使用示例代码前,请记得替换其中的示例Token、文档地址或Base64信息。
1curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/engcard/create_task?access_token=【调用鉴权接口获取的token】'
2 -H 'Content-Type: application/json'
3--data '{
4 "url": "https://data.wylkyj.com/AnswerSheet/168512/168512003英语/7091/7091243416A.png?x-oss-process=image/crop,x_84,y_1543,w_1505,h_673"
5}'
1# encoding:utf-8
2
3import requests
4import base64
5
6'''
7英语答题卡提交请求
8'''
9
10request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/engcard/create_task"
11# 二进制方式打开图片文件
12f = open('[本地文件]', 'rb')
13img = base64.b64encode(f.read())
14
15params = json.dumps({
16 "image": img
17})
18
19access_token = '[调用鉴权接口获取的token]'
20request_url = request_url + "?access_token=" + access_token
21headers = {'content-type': 'application/json'}
22response = requests.post(request_url, data=params, headers=headers)
23if response:
24 print (response.json())
返回说明
返回参数
| 字段 | 类型 | 说明 |
|---|---|---|
| log_id | uint64 | 唯一的log id,用于问题定位 |
| error_code | int | 错误码 |
| error_msg | string | 详情 |
| result | dict | 返回的结果列表 |
| + task_id | string | 发送提交请求时返回的 task_id |
返回示例
成功返回示例:
JSON
1{
2 "result": {
3 "task_id": "1980477206527747650"
4 },
5 "log_id": 1980477206527747650
6}
失败返回示例(详细的错误码说明见API文档-错误码):
JSON
1{
2 "log_id": 1965746008642488944,
3 "error_msg": "并发超限",
4 "error_code": 15
5}
获取结果接口
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/engcard/get_result
URL参数:
| 参数 | 值 |
|---|---|
| access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
| 参数 | 值 |
|---|---|
| Content-Type | application/json |
Body中放置请求参数,参数详情如下:
请求参数
| 参数 | 是否必选 | 类型 | 说明 |
|---|---|---|---|
| task_id | 是 | string | 发送提交请求时返回的task_id |
请求代码示例
提示:使用示例代码前,请记得替换其中的示例Token、task_id。
1curl --location 'https://aip.baidubce.com/rest/2.0/ocr/v1/engcard/get_result?access_token=【调用鉴权接口获取的token】' \
2--header 'Content-Type: application/json' \
3--data '{
4 "task_id": "1978071075535233212"
5}'
1# encoding:utf-8
2
3import requests
4import base64
5
6'''
7英语答题卡获取请求
8'''
9
10request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/engcard/get_result"
11
12
13params = json.dumps({
14 "task_id": "1978071075535233212"
15})
16access_token = '[调用鉴权接口获取的token]'
17request_url = request_url + "?access_token=" + access_token
18headers = {'content-type': 'application/json'}
19response = requests.post(request_url, data=params, headers=headers)
20if response:
21 print (response.json())
1package com.baidu.ai.aip;
2
3import com.baidu.ai.aip.utils.HttpUtil;
4import com.google.gson.Gson;
5
6import java.util.HashMap;
7import java.util.Map;
8
9/**
10* 英语答题卡获取请求
11*/
12public class EngcardGetResult {
13
14 /**
15 * 重要提示代码中所需工具类
16 * HttpUtil,GsonUtils请从
17 * https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
18 * https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
19 * 下载
20 */
21 public static String engcardGetResult() {
22 // 请求url
23 String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/engcard/get_result";
24 try {
25 // task_id 来自提交请求的返回结果
26 Map<String, Object> map = new HashMap<>();
27 map.put("task_id", "1978071075535233212");
28 String param = new Gson().toJson(map);
29
30 String accessToken = "[调用鉴权接口获取的token]";
31
32 String result = HttpUtil.post(url, accessToken, "application/json", param);
33 System.out.println(result);
34 return result;
35 } catch (Exception e) {
36 e.printStackTrace();
37 }
38 return null;
39 }
40
41 public static void main(String[] args) {
42 EngcardGetResult.engcardGetResult();
43 }
44}
返回说明
返回参数
| 字段 | 类型 | 说明 |
|---|---|---|
| log_id | uint64 | 唯一的log id,用于问题定位 |
| error_code | int | 错误码(任务成功时统一返回0) |
| error_msg | string | 错误描述信息(任务成功时统一返回空值) |
| result | dict | 返回的结果列表 |
| + task_id | string | 任务ID |
| + status | string | 任务状态,pending:排队中;processing:运行中;success:成功;failed:失败 |
| + created_time | string | 任务创建时间 |
| + started_time | string | 任务开始时间 |
| + finished_time | string | 任务结束时间 |
| + duration | string | 任务执行时长 |
| + word | string | 答题卡识别结果,示例结果:[{"number":"1","answer":"Wag its tail"},{"number":"2","answer":"her heart racing"}, {"number":"3","answer":"her blood rushing"}, {"number":"4","answer":"A wave of"},{"number":"5","answer":"swept over"},{"number":"6","answer":"words failing him"},{"number":"7","answer":"were keen on"}] 参数说明:number为题号,answer为作答内容 |
| pdf_file_size | string | 传入PDF文件的总页数,当 pdf_file 参数有效时返回该字段 |
返回示例
成功返回示例:
JSON
1{
2 "error_code": "0",
3 "error_msg": "",
4 "result": {
5 "task_id": "1980477206527747650",
6 "status": "Success",
7 "created_time": 1760988737000,
8 "started_time": 1761017538000,
9 "finished_time": 1761017549896,
10 "duration": 11896,
11 "words": "[{"number":"1","answer":"Wag its tail"},{"number":"2","answer":"her heart racing"}, {"number":"3","answer":"her blood rushing"}, {"number":"4","answer":"A wave of"},{"number":"5","answer":"swept over"},{"number":"6","answer":"words failing him"},{"number":"7","answer":"were keen on"}]"
12 },
13 "log_id": 1980477394082166537
14}
失败返回示例(详细的错误码说明见API文档-错误码):
JSON
1{
2 "log_id": 1980539085136046096,
3 "error_msg": "输入的 task_id 无效",
4 "error_code": 282004
5}
