内容更丰富 组合接口API调用 可通过入参自由选择需要的垂类识别服务,一次传图,多垂类同时识别 使用方式 新手指南 新手操作指引 如何用可视化工具调用 如何用代码调用服务 API接口 百度图像识别接口服务的相关技术内容 通用物体和场景识别API 图像单主体检测API SDK文档 图像识别JavaSDK文档 图像识别PHPSDK文档 图像识别PHPSDK文档 相关产品 EasyDL零门槛AI开发平台
图像主体检测 检测图片中的主体,支持单主体检测、多主体检测。可识别出图片中主体的位置和标签,方便裁剪出对应主体的区域,用于后续图像处理、海量图片分类打标等场景。
应用场景 海量图片优化 视频监控 彩印照片美化 场景概述 提升网站图片、手机相册图片、视频封面图片的质量,解决图像偏小、不清晰、被拉伸、过暗或过亮等问题 相关产品 图像去雾 图像对比度增强 拉伸图像恢复 相关产品 图像识别 基于深度学习及大规模图像训练,准确识别图片中的物体类别、位置、置信度等综合信息 图像搜索 以图搜图,在指定图库中搜索出相同或相似的图片,适用于图片精确查找、相似素材搜索、拍照搜同款商品
含小汽车、卡车、巴士、摩托车、三轮车),返回每辆车的坐标位置 申请试用 车流统计 根据视频抓拍图像序列,进行车辆检测和追踪,识别指定区域内车辆的驶入、驶出数量 申请试用 通用物体与场景识别 可识别超过10万类常见物体和生活场景,返回图片内物体/场景的名称及置信度 合作咨询 图像增强 对质量较低的图片进行去雾、清晰度增强、拉伸恢复等多种优化处理,重建高清图像 合作咨询 应用场景 版权保护 作业监督
对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 图像特效 包含黑白图像上色、图像风格转换、人像动漫化等多项特效能力,可用于美颜相机、营销互动等应用 图像审核 准确识别图片和视频中的涉黄、涉暴、涉恐、政治敏感、微商广告、恶心等内容 文字识别 多场景、多语种、高精度的文字检测与识别服务,多项ICDAR指标居世界第一
结合大语言模型,可应用于看图问答、视觉推理等场景 物体和场景全识别 识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景,支持拼接返回大类及细分类名称 图片文字全识别 检测并识别图片内的全部文字信息,涵盖文档、证件等常见场景,支持输出文字内容及文字位置 应用场景 多模态组件提供 趣味看图对话 内容智能推荐 多模态组件提供 支持作为 AI 能力组件,结合大语言模型无缝理解图像信息
公有云API最高可享1500次免费测试资源 立即使用 相关推荐 图像风格转换 将图像转换成卡通画或素描风格,可用于开展趣味活动或集成到美图应用 拉伸图像恢复 自动识别过度拉伸的图像,将图像内容恢复成正常比例 黑白图像上色 智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活
公有云API最高可享3000次免费测试资源 立即使用 相关推荐 图像对比度增强 调整过暗或者过亮图像的对比度,使图像更加鲜明 图像无损放大 将图像在长宽方向各放大两倍,保持图像质量无损 拉伸图像恢复 自动识别过度拉伸的图像,将图像内容恢复成正常比例
并使用背景内容进行填充;也可用于内容生产平台批量优化图像质量 图像识别 精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各类开发者和企业用户的应用需求 功能丰富 支持定制化识图 同步返回百科信息 通用物体和场景识别 支持超过10万类物体和场景识别,返回图片内物体的名称及对应物体的百科信息 图像主体检测 支持单主体检测、多主体检测,可识别出图片中主体的位置和标签
输出天空和其余背景的灰度图和二值图,可用于图像二次处理,进行天空替换、抠图等图片编辑场景