结合大语言模型,可应用于看图问答、视觉推理等场景 物体和场景全识别 识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景,支持拼接返回大类及细分类名称 图片文字全识别 检测并识别图片内的全部文字信息,涵盖文档、证件等常见场景,支持输出文字内容及文字位置 应用场景 多模态组件提供 趣味看图对话 内容智能推荐 多模态组件提供 支持作为 AI 能力组件,结合大语言模型无缝理解图像信息
gt;共享资源包 >按量后付费,详情请查看 产品价格文档 > 多接口共用,业务灵活性提升 10QPS保证 7*24小时客服响应 购买选择 按共享资源包购买 规格 10万点 有效期 12 月 购买数量 个 ¥330 立即购买 使用方式 公有云服务 提供各类文字识别的云端PaaS接口,可直接调用API或使用HTTP SDK对图片中的文字进行识别,可前往控制台免费试用 立即使用 API文档
车牌识别 识别中国大陆各类机动车车牌信息,支持蓝牌、黄牌(单双行)、绿牌、大型新能源(黄绿)、领使馆车牌、警牌、武警牌(单双行)、军牌(单双行)、港澳出入境车牌、农用车牌、民航车牌,并能同时识别图像中的多张车牌 立即使用 技术文档 产品价格 离线SDK 软硬一体方案 功能演示 应用场景 特色优势 产品价格 使用方式 支持交流 相关推荐 功能演示 图片解析中… 检测 或 本地上传 此处仅供功能展示,
果蔬识别 识别近千种水果和蔬菜的名称,适用于识别只含有一种果蔬的图片,可自定义返回识别结果数,适用于果蔬介绍相关的美食类APP中 【案例】识菜君-AI智能图像识别 口袋里的健康营养师 > 立即使用 技术文档 产品价格 功能演示 应用场景 产品价格 相关推荐 功能演示 图片解析中… 检测 或 本地上传 此处仅供功能展示,图片类型支持PNG、JPG、JPEG、BMP,大小不超过2M。
医疗费用结算单、病案首页、保险单等单据 立即体验> 教育场景文字识别 识别教育场景所涉及的作业及试卷中公式、手写文字、题目等内容,可用于智能阅卷、搜题 立即体验> 文档图像处理 对文档图片进行方向矫正、效果增强、去摩尔纹、擦除手写文字等操作,提升图片质量 立即体验> iOCR自定义模板文字识别 1 张图片,5 分钟即可制作识别模板,实现对固定版式卡证票据的自动分类及结构化识别 立即体验
英、法、俄、西、葡、德、意、日、韩等20+常用语种,并支持中、英、日、韩4个语种的类型检测 使用方式 公有云服务 提供各类文字识别的云端服务接口,可直接调用API或使用HTTP SDK进行识别应用 API文档 离线识别SDK 集成到移动设备中(Windows、Android),在无网、弱网环境下离线完成文字识别功能 申请免费试用 查看详情 私有化部署 部署至本地服务器或专有云,在局域网/内网中实现文字识别功能
并能同时识别图像中的多张车牌 申请试用 更多产品 百度OCR线上所有产品均可提供私有化部署服务,更多产品请点击了解详情 了解详情 应用场景 文档电子化 政务审批 财务报销 文档电子化 快速识别录入各类纸质文档、报表,用于文件分类归档、信息统计分析、知识图谱构建等,可广泛应用在电子政务信息系统、电子档案管理系统、企业办公文件管理系统、图书管理系统等场景 合作案例 特色优势 快捷部署 容器化打包,支持本地物理机
驾驶证识别 识别机动车驾驶证正页及副页所有15个字段,支持驾驶证正副页、行驶证正副页在同一张图片上的混贴场景 车牌识别 识别中国大陆各类机动车车牌信息,并能同时识别图像中的多张车牌,支持夜间、弱光、高拍等复杂场景 iOCR通用版 针对固定版式的卡证票据可自主创建识别模板和分类器,仅需上传一张模板图片,5 分钟即可完成定制 文字识别离线SDK 面向无网或弱网环境下,在手机、摄像头、执法记录仪等设备终端上集成文字识别能力
gt; 立即使用 技术文档 产品价格 私有化部署 商务咨询 功能演示 应用场景 特色优势 产品价格 使用方式 相关推荐 功能演示 图片解析中… 检测 或 本地上传 此处仅供功能展示,图片类型支持PNG、JPG、JPEG、BMP,大小不超过8M。
gt; 立即使用 技术文档 产品价格 私有化部署 功能介绍 应用场景 特色优势 产品价格 使用方式 支持交流 相关推荐 功能介绍 自定义模板 只需上传一张模板图片,即可自助制作识别模板,建立图片中文字的Key-Value对应关系,实现对相同版式图片的结构化识别 自定义分类器 为需要分类的卡证、票据每类上传30张训练图片即可创建分类器,实现对不同版式图片的自动分类 自定义字段类型 针对输出值为有限集的字段