查看详情 SDK下载 支持Android、iOS、Java、PHP、Python、C++、C#、Node.js多种编程语言 立即下载 相关产品 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等 教育场景文字识别 识别教育场景所涉及的作业及试卷中公式、手写文字、题目等内容,应用于智能阅卷、书摘笔记电子化等业务场景 财务票据文字识别
可以部署到本地服务器的纯软件服务,提供人脸检测、人脸比对、人脸搜索、活体检测等基础功能,支持百万级超大型人脸库 人体分析私有化部署包 可以部署到本地服务器的人体识别模型包,支持人体检测、属性识别、关键点定位、人流量统计、手势识别、人像分割等功能 iOCR自定义模板文字识别 提供模板识别及图像分类器的自定义功能,整合多种预置能力,高效、低成本地对固定版式的卡证票据进行自动分类及结构化识别
iOCR等各类模型,在专有网络环境下部署应用,保障数据私密性 人脸离线识别 SDK 提供设备端本地化的人脸检测与采集、多模态活体检测、人脸对比与识别等功能,可在无网络环境下离线完成身份验证、驾驶员状态分析、注意力检测等功能 离线语音合成 SDK 在无网或弱网环境下,可在手机APP或故事机、机器人等智能硬件设备终端进行语音播报,将文字合成为声音,提供稳定一致、流畅自然的合成体验
提供车型识别、车辆检测、车流统计、车辆属性识别、车辆外观损伤识别、车辆分割等能力 通用文字识别 多场景、多语种、高精度的整图文字检测和识别服务,多项 ICDAR 指标居世界第一 iOCR通用版 提供识别模板及图像分类器的自定义功能,可对固定版式卡证、票据进行自动分类及结构化识别
包括账号认证、应用创建与管理、鉴权机制、常见问题等 查看详情 离线SDK 支持Android、iOS、Java、PHP、Python、 C++、C#、Node.js多种编程语言 立即下载 社区交流 丰富的技术版块和精华内容,与数以万计的开发者在线交流,快速上手 查看详情 相关产品 身份证识别 结构化识别二代居民身份证正反面所有8个字段,识别准确率超过99% 手写文字识别 检测识别图片中的手写中文、
整合百度百科及百度搜索,输出高时效性、多维度的答案 通用物体和场景识别 可识别超过10万类常见物体和场景,接口返回大类及细分类的名称,并支持获取识别结果对应的百科信息 植物识别 识别超过2万种通用植物和近8千种花卉,接口返回植物的名称,并获取百科信息,适用于拍照识图类APP中 图像主体检测 检测图片中的主体,支持单主体检测、多主体检测,可识别出图片中主体的位置和标签 图像增强与特效 对质量较低的图片进行去雾
整合百度百科及百度搜索,输出高时效性、多维度的答案 通用物体和场景识别 可识别超过10万类常见物体和场景,接口返回图片内1个或多个物体的名称,并可获取识别结果对应的百科信息 图像增强与特效 基于领先的深度学习技术,对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 图像主体检测 检测出图片主体的坐标位置,可使用该接口裁剪出图像主体区域,配合图像识别接口提升识别精度
智能结构化 基于业界领先的深度学习技术和图像检测技术,支持智能提取图片中的字段结构化信息,无需训练灵活提取,用于各类证照、票据、表单等版式中的结构化信息录入场景 优惠 人工智能品类特惠,文字识别产品低至1折!
可部署至「本地服务器」或「专有云服务器」的文字识别服务,支持通用场景、卡证、票据、iOCR等各类模型 了解详情 人脸离线识别SDK 提供离线设备端的人脸检测与采集、活体检测、人脸对比与识别等功能,可在无网络环境下本地运行处理 了解详情 离线语音合成SDK 支持在无网或弱网环境下进行语音播报,为手机应用或AI玩具、机器人等智能硬件终端提供稳定一致、流畅自然的合成体验 了解详情 即刻体验 申请可获免费试用权限
立即抢购 > 立即使用 技术文档 产品价格 商务咨询 功能介绍 功能体验 应用场景 产品价格 使用方式 相关推荐 功能介绍 识别植物名称 可识别超过2万种常见植物和近8千种花卉,接口返回植物名称和置信度信息 获取百科信息 支持获取识别结果的百科信息,返回百科词条URL、图片和描述,可自定义返回词条数 EasyDL定制植物识别 通过EasyDL定制图像分类、物体检测模型,自定义识别标签,实现定制植物识别功能