产品使用问题

更新时间：2026-06-05

Q: 文字识别的并发量上限是多少？
A: 大部分文字识别接口在未开通付费时提供2QPS额度，开通付费后提升至10QPS，如果您有更高并发需求，可购买QPS叠加包进行扩充。对于已上线但没有价格的产品，暂属于测试状态，当测试额度不足时，您可以提交工单进行申请，您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的并发量。

Q：如何购买/提升调用次数？
A：已上线计费的接口，您可以直接在控制台购买次数包或开通按量后付费，计费价格参见产品价格；未上线计费的接口，您可以提交工单进行申请，您需要在工单提供您的appid、业务场景描述、需要的接口名称和申请的调用次数。

Q：文字识别对上传的文件格式和大小有哪些要求？
A：图片格式：支持 JPG、JPEG、BMP、TIF、WebP 等格式图片及PDF文档，暂不支持 GIF 类型的动图识别。具体以相应接口的API文档中的请求参数为准。

图片大小：一般情况下，图像base64编码后大小必须小于4M，建议不要超过1M；最小边长不小于15 px，最大边长不超过4096 px，建议不要超过1024（编码后大于1M或最大边长超过1024的图像会被等比压缩，建议控制输入图像大小，有助于减少网络传输及接口处理耗时）。但是不同的功能接口，对于图片大小的要求可能不同，具体以相应接口的API文档中的 Image 和 url 参数说明为准。

Q：什么是base64编码，如何提供？
A：图片的base64编码指将一副图片数据编码成一串字符串，各种编程语言均包含Base64编码函数，可直接调用使用。

注：图片base64编码后需去除图片头，如（data:image/jpg;base64,），并进行urlencode后方可上传。

Q：怎么提高识别的准确率和识别速度？
A：文字识别的准确率跟拍摄光照、背景、清晰度等因素有关。推荐上传JPG图片格式，图片大小建议1M以内。可在图片采集端尽量扩大要识别文字的区域，并保证图片内文字清晰人眼可辨认、倾斜度不得小于30%。同时，适当压缩图片大小，可大幅缩短图片识别时间。

Q：文字识别支持的语言？
A：不同的功能接口，所支持的语言都不同。常见多语言识别接口如下：

通用文字识别（标准版）、通用文字识别（标准含位置版）：支持中文简体、中文繁体、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语。
通用文字识别（高精度版）、通用文字识别（高精度含位置版）：支持中文简体、中文繁体、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语。
其他接口（除国内专用卡证票据外）基本均可支持中、英文内容识别。详细参见API文档。

如果您对于产品支持识别的语言有特殊需求，您可以提交合作咨询联系我们。

Q：文字识别是否支持方向旋转/不同朝向的图片文字识别？
A：文字识别大部分能力均已支持图像方向自动校正功能，可对旋转的图片进行正确的识别，也可通过控制参数【direction】为true/false控制该功能是否开启。如果您在使用中存在部分旋转图片无法正确识别的问题，您可以提交工单告知我们

Q：文字识别有无区分卡证、票据原件和复印件的功能？
A：身份证识别含风险检测功能，可区分身份证原件及复印件。详情参考API文档。

如果您对其他文字识别服务有区分原件、复印件功能的需求，您可以提交合作咨询告知我们。

Q：文字识别有无区分卡证、票据真伪的功能？
A：身份证识别具备翻拍、PS、复印件告警功能，您也可以使用人脸核身的公安验证接口，用于校验姓名和身份证号的真实性和一致性。增值税发票验真可快速对接国家税务机关发票查验平台，支持全部9类增值税发票的信息核验。

如果您对其他文字识别服务有区分卡证、票据真伪功能的需求，您可以提交合作咨询告知我们。

Q：文字识别是否可以批量识别吗？
A：暂不支持，单次调用仅可识别单张图片，但您可在QPS允许范围进行多线程调用。

Q：可以识别PDF、Word、Excel等格式文件吗？
A：支持 JPG、JPEG、BMP、TIF、WebP 等格式图片及PDF文档，暂不支持 Word、Excel等格式，如果您对这部分文本格式存在识别需求，可以先将其转为图片格式或PDF文档后再进行上传。

Q：识别结果可以转化为Word或者TXT吗？
A：OCR提取之后返回的结果是JSON格式，需要您通过进行业务处理将结果保存为Word或者TXT格式。

Q：可否在文字识别的应用界面添加扫描框？
A：百度仅提供文字识别API接口，应用界面可根据您的需求进行自行开发。

Q：是否支持识别验证码？
A：对验证码进行识别涉及网络安全问题，百度不提供验证码识别专项服务。

Q: 文字识别的响应速度是多少？
A: 一般在1s内，识别时间会受图片大小、字数多少影响，但最长不超过7s，一旦超过将自动返回『超时』错误，相应调用不计费。

注：但由于数据传输的网络情况不同，且为百度不可控范围，实际您感受到的响应时间为百度模型识别时间+数据来往传输时间，如出现大量耗时过长情况，请您排查服务器网络状况，适当扩充带宽或对图片进行压缩后上传，如有需要也可提交工单联系我们。

Q：在国外，也可以在线调用文字识别的接口吗？
A：可以的，但延时会大些。

Q：为什么文字识别结果不准确？
A：有以下几个原因：

（1）图片尺寸过小，图片尺寸小于15px，无法进行识别。

（2）图片画质太差，例如图片过暗，文字内容不可辨识。

（3）文字内容存在水印、印章、褶皱等遮挡。

（4）图片样式与接口支持类型不符。例如，身份证识别只支持识别二代居民身份证，不支持识别护照、银行卡等。

（5）如果有返回错误码，请参考错误码排查问题。

如果仍然无法确定原因和解决问题，您可以提交工单，您需要在工单提供误识别的原图及返回的log_id（log_id为调用接口返回时，在返回结果中出现的一长串数字）。举例如下：

Q：调用文字识别API服务失败时，应该怎么处理？

A：排查原因：

（1）根据API调用返回结果或错误码查找原因。

（2）检查API调用方法是否正确（您可以参考AI接入指南或OCR调用教学视频进行操作）。

如果仍然无法确定原因和解决问题，您可以提交工单联系我们。

遇到其他相关问题，您可提交工单寻求帮助，会有专人跟进处理。

评价此篇文章

有帮助没帮助

售前咨询

计费问题