品牌logo识别 识别超过2万类商品logo,支持创建自定义品牌logo图库,可准确识别图片中品牌logo的名称,适用于需要快速获取品牌信息的业务场景 立即使用 技术文档 产品价格 功能介绍 应用场景 产品价格 相关推荐 功能介绍 商品logo识别 识别超过2万类商品logo,可准确识别图片中品牌logo的名称和所在图片中的位置 自建品牌logo图库 快速创建专属品牌logo图库,通过调用入库接口上传图片
C++、C#、Node.js多种编程语言 立即下载 相关产品 身份证识别 结构化识别二代居民身份证正反面所有8个字段,识别准确率超过99%;支持识别混贴身份证和检测头像 办公文档识别 对办公类文档的版面进行分析,输出图、表、印章、栏、页眉、页脚、页码和脚注等位置,并输出分版块内容的OCR识别结果 表格文字识别 支持识别图片/PDF文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息
云端服务 提供各类文字识别的云端Paas服务接口,用户可直接调用API或使用SDK对图片中的文字进行识别 私有化部署 部署至客户本地服务器,在客户内网中实现文字识别功能,保障数据私密性,提供一体机和软件部署包两种私有化方案 支持交流 新手指南 接入AI服务的基本介绍,包括账号认证、应用创建与管理、鉴权机制、常见问题等 查看详情> 技术文档 针对使用API或HTTP SDK的开发者,提供百度文字识别技术开发文档
EasyDL文本 文心大模型 分类任务 匹配任务 序列标注任务 以文心大模型为基座,提供多种NLP模型的零门槛定制与应用能力,广泛适用于咨询分类、内容审核、内容生产等各类文本处理与分析的场景 EasyDL语音 语音识别 声音分类 定制语音识别模型,精准识别业务专有名词,适用于数据采集录入、语音指令、呼叫中心等场景,以及定制声音分类模型,用于区分不同声音类别 EasyDL OCR 文字识别 定制化训练文字识别模型
10万类常见物体和场景,接口返回图片内1个或多个物体的名称,并可获取识别结果对应的百科信息 图像增强与特效 基于领先的深度学习技术,对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 图像主体检测 检测出图片主体的坐标位置,可使用该接口裁剪出图像主体区域,配合图像识别接口提升识别精度
百科信息等综合信息 自定义菜品识别 支持自建菜品图库,适用于识别含有多个菜品的图片,接口返回菜品的名称、位置、相关性等综合信息 功能演示 图片解析中… 检测 或 本地上传 此处仅供功能展示,图片类型支持PNG、JPG、JPEG、BMP,大小不超过2M。
果蔬识别 识别近千种水果和蔬菜的名称,适用于识别只含有一种果蔬的图片,可自定义返回识别结果数,适用于果蔬介绍相关的美食类APP中 【案例】识菜君-AI智能图像识别 口袋里的健康营养师 > 立即使用 技术文档 产品价格 功能演示 应用场景 产品价格 相关推荐 功能演示 图片解析中… 检测 或 本地上传 此处仅供功能展示,图片类型支持PNG、JPG、JPEG、BMP,大小不超过2M。
应用场景 商品售卖信息统计 购物中心积分兑换 商品售卖信息统计 应用于商品售卖信息统计等场景,方便后续的数据比对,有效降低人工输入成本 我们能提供 消费商品明细、数量、金额等信息自动识别和录入 快速统计门店及商品销售数据 使用方式 公有云服务 提供各类文字识别能力的云端Paas服务接口,可直接调用API对图片中的文字进行识别,快速接入,稳定可靠 私有化部署 可部署至本地服务器,在局域网/内网中实现文字识别功能
应用创建与管理、鉴权机制、常见问题等 查看详情 技术文档 针对使用API或HTTP SDK的开发者,提供百度文字识别技术开发文档 查看详情 SDK下载 支持Android、iOS、Java、PHP、Python、C++、C#、Node.js多种编程语言 立即下载 即刻免费体验OCR文字识别能力 即刻免费体验OCR文字识别能力 立即使用 相关产品 医疗发票识别 支持识别全国各地门诊/住院发票的业务流水号
适用于企业宣传、营销推广、知识科普等场景,帮助创作者实现精美视频的快速产出 新品 智能混剪支持上传视频素材,智能化完成视频分析与编排,快速成片,立即体验 > 立即选购 立即使用 技术文档 产品价格 功能介绍 应用场景 技术特色 相关推荐 功能介绍 智能化图文解析 AI智能化理解用户输入的图文素材,智能匹配图片与文字,保障视频内容清晰有逻辑 全自动化视频生产 图文素材全自动化生成视频,无需手动剪辑