可直接调用API或使用HTTP SDK对图片中的文字进行识别 API文档 私有化部署 部署至本地服务器或专有云,在局域网/内网中实现文字识别功能,保障数据私密性,提供一体机和软件部署包两种私有化方案 申请免费试用 方案详情 支持交流 新手指南 接入AI服务的基本介绍,包括账号认证、应用创建与管理、鉴权机制、常见问题等 查看详情 > 技术文档 针对使用在线API或HTTP SDK的开发者,提供百度文字识别技术开发文档
应用场景——计算机视觉 图像语义分割 图片/视频分类 图片框选 人脸骨骼打点 3D点云/2D3D融合标注 连续帧标注 图像语义分割 图像语义分割是基于区域的多边形标注,对复杂不规则的图片进行区域划分并标注对应属性,助力图像识别模型训练,多应用于人体分割、场景分割和自动驾驶道路分割,可应用于智能驾驶、智能设备、智能安防场景落地。
飞机行程单识别 对飞机行程单的24个字段进行结构化识别,包括电子客票号、印刷序号、姓名、始发站、目的站、航班号、日期、时间、票价、身份证号、承运人、保险费、燃油附加费、其他税费、合计金额、订票渠道等;同时,可识别单张行程单上的多航班信息 立即使用 技术文档 产品价格 功能演示 应用场景 产品价格 使用方式 支持交流 相关推荐 功能演示 图片解析中… 检测 或 本地上传 此处仅供功能展示,图片类型支持
了解更多 相关推荐 iOCR财会版 针对财会报销场景推出的专项解决方案,可对各类财务票据、报销单、银行回单、对账单进行自动分类及结构化识别 iOCR通用版 针对固定版式的卡证、票据,可自助创建识别模板和分类器,实现图片自动分类并结构化输出识别结果 增值税发票识别 结构化识别增值税普票、专票、电子发票、卷票的所有关键字段,其中四要素识别准确率超过99% 银行回单识别 对各大银行的收付款回单关键字段进行结构化识别
增强图片可阅读性,提高文字识别效果,可至 图像增强与特效控制台 开通使用 立即使用 文档图片去底纹 支持识别并去除文档图片中的底纹,提升图片质量,减少底纹对阅读的影响,可至 图像增强与特效控制台 开通使用 立即使用 产品优势 技术领先 模型针对图片倾斜、弯曲等情况进行专项优化,鲁棒性强,在处理图像的同时,可完整保留原有文档内容 能力丰富 提供文档图片矫正、增强、去手写等多项能力,全方位提升图像质量
立即使用 相关推荐 通用文字识别 多场景、多语种、高精度的整图文字检测和识别服务,可识别20种语言,最高可享每天50000次免费调用 iOCR自定义模板文字识别 提供识别模板及图像分类器的自定义功能,并整合多种预置能力,可快速实现对各类卡证、票据的自动分类及结构化识别 通用票据识别 对医疗票据、银行兑票、购物小票等各类票据的票面内容进行识别,并按行返回结果 增值税发票识别 结构化识别增值税普票、专票
高精度的整图文字检测和识别服务,多项 ICDAR 指标居世界第一 iOCR通用版 结合多项图像处理技术,对各类票据卡证自动分类,并结构化输出识别结果 EasyDL OCR 定制训练 OCR 模型,结构化输出关键字段内容,满足多版式场景卡证、票据识别需求并可持续模型迭代
总金额等关键字段,支持识别费用明细项目清单 医疗费用结算单识别 支持识别全国医疗费用结算单的姓名、出/入院时间、发票总金额、自费金额、医保支付金额等 6 个关键字段 通用文字识别 提供多场景、多语种、高精度的整图文字检测和识别服务,多项 ICDAR 指标居世界第一 iOCR通用版 结合多项图像处理技术,对各类票据卡证自动分类,并结构化输出识别结果 EasyDL OCR 定制训练 OCR 模型,结构化输出关键字段内容
通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、印章、数字、二维码等;可用于纸质文档电子化、办公文档/报表识别、图像内容审核、快递面单识别等场景。
车辆分析 准确识别图像中的车辆相关信息,包括车型识别、车辆检测、车辆属性识别、车辆外观损伤识别等能力,支持服务器端私有化部署,并提供边缘侧软硬一体方案 立即使用 技术文档 产品价格 合作咨询 软硬一体 产品列表 应用场景 特色优势 使用方式 支持交流 相关推荐 产品列表 车型识别 识别近3000款常见车型,输出图片中主体车辆的品牌型号、年份、颜色、百科词条信息 了解详情 车辆检测 检测图像中的车辆