通用物体和场景识别 可识别超过10万类常见物体和场景,接口返回大类及细分类的名称,并支持获取识别结果对应的百科信息;还可使用EasyDL定制训练平台,定制识别分类标签。
旁路直播 可以将RTC房间的音视频内容转推到CDN直播,通过混流服务将RTP协议转换为标准的直播RTMP协议,观众通过直播系统拉流观看,支持单路转推和混流转推模式,并提供混流转码能力 云播放器 支持向RTC房间输入在线媒体流,房间内其他用户可以观看该媒体流,输入源支持直播流和文件类型 内容审核 支持对音视频内容进行审核,有效识别音视频中的色情、涉政、暴恐、广告等多种违规内容,并将审核结果回调给业务方
产品演示 查看更多智感超清Demo Demo展示 智感超清 内容自适应转码(CAE vs VBR ) Demo展示 智感超清 老片修复(修复后 vs 修复前) Demo展示 智感超清 超分辨率(360p -> 1080p) 文档与工具 查看更多音视频处理MCP文档 新手入门 音视频处理 MCP简介、功能及优势介绍 音视频处理MCP计费方式说明 快速开通音视频处理MCP服务 快速使用音视频处理MCP
通用物体和场景识别 可识别超过10万类常见物体和场景,接口返回图片内1个或多个物体的名称,并可获取识别结果对应的百科信息 菜品识别 识别超过9千种常见菜品,支持自定义菜品图库,可准确识别图片中的菜品名称、位置,并可获取识别结果对应的百科信息 地标识别 支持识别约12万中外著名地标、热门景点,广泛应用于拍照识图、图片分类等场景
2022.06.01 视频专区 快速入门 产品介绍 音视频直播LSS 音视频直播LSS服务简介 服务指南 音视频直播LSS 音视频直播LSS服务开通 新手入门 音视频直播LSS 音视频直播新手入门 文档与工具 查看更多产品文档 新手指南 音视频直播LSS简介 新手快速入门指南 服务等级SLA协议 创建推流和播放域名 操作指南 控制台-域名管理指导 快速使用流管理平台 控制台-模板管理指导 控制台-安全策略使用指南
适用于只含有一种果蔬的图片,可自定义识别结果返回数量,适用于各类美食应用 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 植物识别 可识别超过2万种常见植物和近8千种花卉,接口返回植物名称,并支持获取识别结果对应的百科词条信息 动物识别 识别近八千种动物,接口返回动物名称,并可获取识别结果对应的百科信息,适用于拍照识图、幼教科普等应用
申请免费试用 查看详情 支持交流 新手指南 接入AI服务的基本介绍,包括账号认证、应用创建与管理、鉴权机制、常见问题等 查看详情 > 技术文档 针对使用API或HTTP SDK的开发者,提供百度文字识别技术开发文档 查看详情 > SDK下载 支持Android、iOS、Java、PHP、Python、C++、C#、Node.js多种编程语言 查看详情 > 即刻体验iOCR自定义模板文字识别
方案优势 知识沉淀和传承 创新性的引入知识图谱产品 实现电力运维体系的知识沉淀和传承 故障智能诊断 应用知识图谱和大数据AI技术 智能学习和构建诊断规则和模型 全方位的运行保障 对设备健康度进行评价 智能故障定位并推荐处置建议 智慧输电系统故障诊断解决方案咨询 立即咨询
完成多轮语料训练,构建医药翻译系统,精准满足客户对生物医学场景的翻译需求 合作案例 特色优势 可视化工作流 提供从语料、模型、训练、部署、应用全流程可视化管理,过程中无需人工干预 数据管理有序 提供语料数据管理、模型训练部署管理等工具,方便管理模型和数据 训练效果精准 基于高精度通用模型和领先的领域定制化技术,保障出色效果和性能 呵护数据安全 提供本地私有化部署,根据客户需求可数据不落盘,极致安全保障
AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 车辆检测 检测图像中的所有车辆,返回各类车辆的数量、以及每辆车的位置信息 车辆属性识别 检测图像中的各类车辆,并针对小汽车识别11种属性,如是否有车顶架、副驾是否有人 车辆外观损伤识别 针对常见小汽车车型,识别外观受损部件及损伤类型,可识别数十种部件、五大类损伤