图像识别

精准识别超过十万种物体和场景，包含10余项高精度的识图能力并提供相应的API服务，充分满足各类开发者和企业用户的应用需求

立即使用领取免费资源技术文档产品价格私有化部署

信号检测与图像重建技术内容精选

实时语音识别-websocket API - 语音技术
实时语音识别-websocket API 接口描述实时语音识别接口采用websocket协议的连接方式，边上传音频边获取识别结果。可以将音频流实时识别为文字，也可以上传音频文件进行识别；返回结果包含每句话的开始和结束时间，适用于长句语音输入、音视频字幕、直播质检、会议记录等场景。 WebSocket简介 WebSocket 是基于TCP的全双工协议，即建立连接后通讯双方都可以不断发送数据。 We
查看更多>>
将图像分类模型部署至边缘 - 智能边缘BIE | 百度智能云文档
将图像分类模型部署至边缘本文介绍如何在AI中台的模型中心导入原始模型，然后通过模型转换，生成适配通用X86芯片/通用ARM芯片的图像分类模型，并部署至设备边缘。
查看更多>>

信号检测与图像重建技术更多内容

我们如何使用-Cookie-和同类技术 - 协议 | 百度智能云文档
我们如何使用-Cookie-和同类技术 Cookie和匿名标识符工具。Cookie是支持服务器端（或者脚本）在客户端上存储和检索信息的一种机制。当您使用【百度智能云】产品或服务时，我们会向您的设备发送一个或多个Cookie或匿名标识符。当您与【百度智能云】服务进行交互时，我们允许Cookie或者匿名标识符发送给百度公司服务器。Cookie 通常包含标识符、站点名称以及一些号码和字符。
查看更多>>
语音识别 HarmonyOS SDK - 语音技术
错误码映射错误事件鸿蒙错误码对应安卓事件安卓错误码描述 ERROR_VAD_NO_SPEECH 1001 ERROR_AUDIO_VAD_NO_SPEECH 3101 没有检测到说话开始 ERROR_VAD_INIT_ERROR 1002 ERROR_AUDIO_VAD_INCORRECT 3100 VAD初始化失败 ERROR_NETWORK_FAIL_CONNECT 2001 ERROR_NETWORK_FAIL_CONNECT
查看更多>>
图像审核接口对象存储（BOS）
图像审核接口接口说明此接口用于请求图像审核服务。图像审核服务是百度智能云对外提供的图像智能审核服务，支持对图像的多个维度进行审核，包括色情识别、暴恐识别、政治敏感识别、恶心图识别、广告识别等。说明: 使用本接口需要先在控制台开通图像审核服务。 url：固定取值为 $(img-censor)，不需要修改。 parameters：此项值是对图像审核功能参数进行 base64 编码而成。
查看更多>>
图像分类API调用文档 - EasyDL零门槛AI开发平台 | 百度智能云文档
图像分类API调用文档本文档主要说明定制化模型发布后获得的API如何使用，如有疑问可通过以下方式联系我们：在百度智能云控制台内提交工单进入 EasyDL社区交流 ,与其他开发者进行互动接口描述基于自定义训练出的图像分类模型，实现个性化图像识别。
查看更多>>
[AI行业案例]-图像搜索助力纺织行业设计工作轻松高效
解决方案布凡科技旗下研发品牌——“有数派”在解决方案中加入了百度图像搜索技术中的相似图片搜索能力后，充分满足了设计师高效搜索适合的图案和花型匹配布料的需求，极大提高了设计师的工作效能。
查看更多>>
[AI行业案例]-语音技术助力罗湖区党建工作
使用产品长语音识别语音唤醒支持与交流 AI社区教学视频文档中心 SDK下载语音技术助力罗湖区党建工作价值成果 1、罗湖区政府党群服务中心报告厅、综合展厅，通过加设融合百度语音技术的魔屏智能显示设备，实现了重点语音发言可以实时转化、记录成可编辑的文本，展示在魔屏智能会议平板上，并可扫码保存。
查看更多>>
开源VAD音频切分工具 - 语音技术
开源VAD音频切分工具简介由于百度rest api接口有60s的音频时长限制，使用此demo可以粗略地按照静音切分音频。项目地址： https://github.com/Baidu-AIP/speech-vad-demo 集成 webrtc 开源项目，vad模块，具体算法 GMM (Gaussian Mixture Model)。注意这个是开源项目，效果远不如与百度语音LInux C++
查看更多>>
长文本在线合成API - 语音技术
长文本在线合成API 接口描述长文本在线合成接口可以将10万字以内文本一次性合成，异步返回音频。支持多种优质音库，将超长文本快速转换成稳定流畅、饱满真实的音频。适用于阅读听书、新闻播报等客户。步骤： 1、根据文本内容、音频格式、音库等参数创建语音合成任务，获取task_id参数。 2、根据task_id的数组批量查询语音合成任务结果。在线调试&示例代码您可以在示例代码中心中
查看更多>>

图像识别

实时语音识别-websocket API - 语音技术

将图像分类模型部署至边缘 - 智能边缘BIE | 百度智能云文档

我们如何使用-Cookie-和同类技术 - 协议 | 百度智能云文档

语音识别 HarmonyOS SDK - 语音技术

图像审核接口对象存储（BOS）

图像分类API调用文档 - EasyDL零门槛AI开发平台 | 百度智能云文档

[AI行业案例]-图像搜索助力纺织行业设计工作轻松高效

[AI行业案例]-语音技术助力罗湖区党建工作

开源VAD音频切分工具 - 语音技术

长文本在线合成API - 语音技术

热门活动

新闻动态

最新活动

相关主题

热门产品

图像识别

实时语音识别-websocket API - 语音技术

将图像分类模型部署至边缘 - 智能边缘BIE | 百度智能云文档

我们如何使用-Cookie-和同类技术 - 协议 | 百度智能云文档

语音识别 HarmonyOS SDK - 语音技术

图像审核接口 对象存储（BOS）

图像分类API调用文档 - EasyDL零门槛AI开发平台 | 百度智能云文档

[AI行业案例]-图像搜索助力纺织行业设计工作轻松高效

[AI行业案例]-语音技术助力罗湖区党建工作

开源VAD音频切分工具 - 语音技术

长文本在线合成API - 语音技术

热门活动

新闻动态

最新活动

相关主题

热门产品

图像审核接口对象存储（BOS）