图像主体检测 检测图片中的主体,支持单主体检测、多主体检测。可识别出图片中主体的位置和标签,方便裁剪出对应主体的区域,用于后续图像处理、海量图片分类打标等场景。
内容更丰富 组合接口API调用 可通过入参自由选择需要的垂类识别服务,一次传图,多垂类同时识别 使用方式 新手指南 新手操作指引 如何用可视化工具调用 如何用代码调用服务 API接口 百度图像识别接口服务的相关技术内容 通用物体和场景识别API 图像单主体检测API SDK文档 图像识别JavaSDK文档 图像识别PHPSDK文档 图像识别PHPSDK文档 相关产品 EasyDL零门槛AI开发平台
应用场景 海量图片优化 视频监控 彩印照片美化 场景概述 提升网站图片、手机相册图片、视频封面图片的质量,解决图像偏小、不清晰、被拉伸、过暗或过亮等问题 相关产品 图像去雾 图像对比度增强 拉伸图像恢复 相关产品 图像识别 基于深度学习及大规模图像训练,准确识别图片中的物体类别、位置、置信度等综合信息 图像搜索 以图搜图,在指定图库中搜索出相同或相似的图片,适用于图片精确查找、相似素材搜索、拍照搜同款商品
对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 图像特效 包含黑白图像上色、图像风格转换、人像动漫化等多项特效能力,可用于美颜相机、营销互动等应用 图像审核 准确识别图片和视频中的涉黄、涉暴、涉恐、政治敏感、微商广告、恶心等内容 文字识别 多场景、多语种、高精度的文字检测与识别服务,多项ICDAR指标居世界第一
含小汽车、卡车、巴士、摩托车、三轮车),返回每辆车的坐标位置 申请试用 车流统计 根据视频抓拍图像序列,进行车辆检测和追踪,识别指定区域内车辆的驶入、驶出数量 申请试用 通用物体与场景识别 可识别超过10万类常见物体和生活场景,返回图片内物体/场景的名称及置信度 合作咨询 图像增强 对质量较低的图片进行去雾、清晰度增强、拉伸恢复等多种优化处理,重建高清图像 合作咨询 应用场景 版权保护 作业监督
结合大语言模型,可应用于看图问答、视觉推理等场景 物体和场景全识别 识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景,支持拼接返回大类及细分类名称 图片文字全识别 检测并识别图片内的全部文字信息,涵盖文档、证件等常见场景,支持输出文字内容及文字位置 应用场景 多模态组件提供 趣味看图对话 内容智能推荐 多模态组件提供 支持作为 AI 能力组件,结合大语言模型无缝理解图像信息
公有云API最高可享1500次免费测试资源 立即使用 相关推荐 图像风格转换 将图像转换成卡通画或素描风格,可用于开展趣味活动或集成到美图应用 拉伸图像恢复 自动识别过度拉伸的图像,将图像内容恢复成正常比例 黑白图像上色 智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活
公有云API最高可享3000次免费测试资源 立即使用 相关推荐 图像对比度增强 调整过暗或者过亮图像的对比度,使图像更加鲜明 图像无损放大 将图像在长宽方向各放大两倍,保持图像质量无损 拉伸图像恢复 自动识别过度拉伸的图像,将图像内容恢复成正常比例
并使用背景内容进行填充;也可用于内容生产平台批量优化图像质量 图像识别 精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各类开发者和企业用户的应用需求 功能丰富 支持定制化识图 同步返回百科信息 通用物体和场景识别 支持超过10万类物体和场景识别,返回图片内物体的名称及对应物体的百科信息 图像主体检测 支持单主体检测、多主体检测,可识别出图片中主体的位置和标签
输出天空和其余背景的灰度图和二值图,可用于图像二次处理,进行天空替换、抠图等图片编辑场景