检测识别图片中的二维码(包括QR_CODE、DATA_MATRIX、AZTEC、PDF_417 4类),自动返回存储的内容 条形码识别 检测识别图片中的条形码(包括CODE_128、UPC_A、EAN_13、ITF、CODABAR 等9类),自动返回存储的内容 应用场景 物品信息管理 解析识别各类物品的二维码或条形码信息,应用于商品、药品出入库管理及货物运输管理等场景 我们能提供 轻松一扫即可快速完成对物品信息的读取
结合大语言模型,可应用于看图问答、视觉推理等场景 物体和场景全识别 识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景,支持拼接返回大类及细分类名称 图片文字全识别 检测并识别图片内的全部文字信息,涵盖文档、证件等常见场景,支持输出文字内容及文字位置 应用场景 多模态组件提供 趣味看图对话 内容智能推荐 多模态组件提供 支持作为 AI 能力组件,结合大语言模型无缝理解图像信息
多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、印章、数字、二维码等 iOCR通用版 针对固定版式的卡证票据可自主创建识别模板和分类器,完整平台可私有化部署,支持 CPU/GPU 环境及国产化操作系统部署
品牌logo识别 识别超过2万类商品logo,支持创建自定义品牌logo图库,可准确识别图片中品牌logo的名称,适用于需要快速获取品牌信息的业务场景 立即使用 技术文档 产品价格 功能介绍 应用场景 产品价格 相关推荐 功能介绍 商品logo识别 识别超过2万类商品logo,可准确识别图片中品牌logo的名称和所在图片中的位置 自建品牌logo图库 快速创建专属品牌logo图库,通过调用入库接口上传图片
支持识别艺术字体或背景复杂的文字内容,还可返回文字的位置信息、行置信度、单字符内容和位置等 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等 手写文字识别 针对不规则的手写字体进行专项优化,支持对图片中的手写中文、手写数字进行检测和识别 办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的
产品详情> 接口名称 产品规格 计费方式 有效期 限购一单 实名用户专享 55 元 原价元 立即抢购 确定 首购特惠 通用文字识别(标准版) 检测和识别图片中的全部文字,支持10种语言。 产品详情> 接口名称 产品规格 计费方式 有效期 限购一单 实名用户专享 10 元 原价元 立即抢购 确定 首购特惠 通用文字识别(高精度版) 识别图片中的全部文字,支持20种语言及中文生僻字识别。
查看详情 > 技术文档 开放百度人脸识别技术开发文档,帮助使用API或SDK的开发者赋能产品 查看详情 > AI社区 在百度AI 开发者社区了解 AI 技术的最新动态,与开发者们一起学习和交流 AI 技术 查看详情 > 即刻免费体验人脸识别能力 立即使用 相关推荐 人脸实名认证解决方案 提供活体检测、身份核验、人脸比对等多项组合能力,确保用户是「真人」且为「本人」 人脸考勤解决方案
标准版)的基础上,提供更高精度的识别服务,支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语、泰语、越语、阿拉伯语、印地语及部分中国少数民族语言),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字 标准版 对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言,并支持中、英、日、韩四语种的类型检测
10万类常见物体和场景,接口返回图片内1个或多个物体的名称,并可获取识别结果对应的百科信息 图像增强与特效 基于领先的深度学习技术,对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 图像主体检测 检测出图片主体的坐标位置,可使用该接口裁剪出图像主体区域,配合图像识别接口提升识别精度
金额等7个关键字段 了解详情 产品优势 适用范围广 支持对各大银行不同版式的金融单据进行识别,并结构化返回关键字段识别结果,能够满足对不同种类金融单据进行信息提取的需求 效果领先 针对各类金融单据据特定的字体、打印样式专项优化,关键字段准确率可达90%以上 应用场景 财税记账 使用金融单据识别技术,可应用于企业内部做账及税务核算等场景,能够有效控制业务风险,提升财务核算效率 我们能提供 各类银行单据凭证进行识别和信息录入