词典笔文字识别

更新时间：2026-02-26

该接口已停止更新且即将下线，为避免影响您目前的业务使用，请您及时进行相关迁移工作

接口描述

面向词典笔应用场景，是词典笔的基本功能之一，主要用于扫描文字并识别，为字词查询和翻译提供文本信息支撑。支持中英文识别、印刷手写混排识别，满足多种复杂背景下的文字扫描识别。

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP 方法：POST

请求URL： https://aip.baidubce.com/rest/2.0/ocr/v1/pen

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token，参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/x-www-form-urlencoded

Body中放置请求参数，参数详情如下：

请求参数

参数	是否必选	类型	可选值范围	说明
image	和 url/pdf_file 三选一	string	-	图像数据，base64编码后进行urlencode，要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px，支持jpg/jpeg/png/bmp格式优先级：image > url > pdf_file，当image字段存在时，url、pdf_file字段失效
url	和 image/pdf_file 三选一	string	-	图片完整url，url长度不超过1024字节，url对应的图片base64编码后大小不超过4M，最短边至少15px，最长边最大4096px，支持jpg/jpeg/png/bmp格式优先级：image > url > pdf_file，当image字段存在时，url字段失效请注意关闭URL防盗链
pdf_file	和 image/url 三选一	string	-	PDF文件，base64编码后进行urlencode，要求base64编码和urlencode后大小不超过4M，最短边至少15px，最长边最大4096px 优先级：image > url > pdf_file，当image、url字段存在时，pdf_file字段失效
pdf_file_num	否	string	-	需要识别的PDF文件的对应页码，当 pdf_file 参数有效时，识别传入页码的对应页面内容，若不传入，则默认识别第 1 页
recognize_granularity	否	string	big/small	是否定位单字符位置，big：不定位单字符位置，默认值；small：定位单字符位置
detect_direction	否	string	true/false	是否检测图像朝向，默认不检测，即：false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true：检测朝向； - false：不检测朝向。
probability	否	string	true/false	是否返回识别结果中每一行的置信度

返回说明

返回参数

字段	是否必选	类型	说明
log_id	是	uint64	唯一的log id，用于问题定位
direction	否	int32	图像方向，当 detect_direction=true 时返回该字段。 - - 1：未定义， - 0：正向， - 1：逆时针90度， - 2：逆时针180度， - 3：逆时针270度
words_result_num	是	uint32	识别结果数，表示words_result的元素个数
words_result	是	array[]	识别结果数组
+ words	否	string	识别结果字符串
+ location	是	array[]	位置数组（坐标0点为左上角）
++ left	是	uint32	表示定位位置的长方形左上顶点的水平坐标
++ top	是	uint32	表示定位位置的长方形左上顶点的垂直坐标
++ width	是	uint32	表示定位位置的长方形的宽度
++ height	是	uint32	表示定位位置的长方形的高度
+ chars	否	array[]	单字符结果，当 recognize_granularity=small 时返回该字段
++ char	否	string	单字符识别结果，当 recognize_granularity=small 时返回该字段
++ location	否	array[]	位置数组（坐标0点为左上角），当 recognize_granularity=small 时返回该字段
+++ left	否	uint32	表示定位位置的长方形左上顶点的水平坐标，当 recognize_granularity=small 时返回该字段
+++ top	否	uint32	表示定位位置的长方形左上顶点的垂直坐标，当 recognize_granularity=small 时返回该字段
+++ width	否	uint32	表示定位位置的长方形的宽度，当 recognize_granularity=small 时返回该字段
+++ height	否	uint32	表示定位位置的长方形的高度，当 recognize_granularity=small 时返回该字段
+ probability	否	object	识别结果中每一行的置信度值，包含average：行置信度平均值，variance：行置信度方差，min：行置信度最小值，当 probability=true 时返回该字段
pdf_file_size	否	string	传入PDF文件的总页数，当 pdf_file 参数有效时返回该字段

返回示例

                JSON
                
            

                {
    "words_result_num": 1,
    "words_result": [
        {
            "probability": {
                "average": 0.9977043867,
                "min": 0.974070549,
                "variance": 0.00003904080586
            },
            "words": "了文献研究法和调查问卷法。广泛收集和查阅国内外相关文",
            "location": {
                "top": 848,
                "left": 98,
                "width": 1087,
                "height": 47
            }
        }
    ],
    "direction": 0,
    "log_id": 1663011878006764485
}
            

评价此篇文章

有帮助没帮助

食品经营许可证识别

公式识别