图像技术

集识别、搜索、特效、增强于一体，广泛适用于拍照识物、拍照搜书、海量图片优化等应用场景，提供稳定易用的在线API、离线SDK、软件部署包等多种服务形式

领取免费资源进入控制台技术文档价格计算器合作咨询

迪士尼运用增强现实技术内容精选

[AI行业案例]-嘀嗒出行平台大规模应用语音合成技术
在产品的设计上，设计师不仅需要在UI设计上引入特殊的字体和设计元素来强化，增加语音作为交互方式也会增强司机对订单信息的辨识力。另外一个重要原因是安全性。绝大多数司机实在行车过程中听单，视觉交互不仅是不安全的，在很多国家的安全法规中都是不允许的。【场景二】：顺风车业务听单功能+派单服务在顺风车业务中，私家车主认证后，可以选择实时听单功能来接收最新的顺路订单需求。
查看更多>>
语音合成 HarmonyOS SDK - 语音技术
语音合成 HarmonyOS SDK 1. 文档说明文档名称语音合成集成文档所属平台 HarmonyOS 提交日期 2024-12-24 概述百度语音合成客户端Harmony版SDK（以下简称BDTTSClient）是一种面向HarmonyOS设备的语音合成解决方案，以Har包的形式发布。目前版本已支持SDK内部直接播放合成语音和从SDK获取语音数据，并支持男女声、语速、音调、音量、音频码
查看更多>>

迪士尼运用增强现实技术更多内容

语音识别 HarmonyOS SDK - 语音技术
语音识别 HarmonyOS SDK 1. 文档说明文档名称语音识别集成文档所属平台 HarmonyOS 提交日期 2024-12-30 概述本文档是百度语音开放平台HarmonyOS SDK的用户指南，描述了短语音识别、长语音识别等相关接口的使用说明。SDK内部均为采用流式协议，即用户边说边处理。区别于Restapi需要上传整个录音文件。 2. 版本说明名称版本号语音识别 1.0.
查看更多>>
音频文件转写API - 语音技术
音频文件转写API 接口描述音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景，一般12小时内返回识别接口。步骤： 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务，获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。在线调试&示例代码您可以在示例代码中心
查看更多>>
如何用可视化工具调用 - 语音技术
如何用可视化工具调用如何使用 Postman 调用语音技术服务 API 本文提供了通过可视化工具 Postman 调用短文本语音合成 API 的样例，帮助您零编码快速体验并熟悉语音技术服务。 1.
查看更多>>
短文本在线合成API - 语音技术
短文本在线合成API 接口描述百度短文本在线合成服务，基于HTTP请求的REST API接口，将文本转换为可以播放的音频文件。本文档描述了使用语音合成服务REST API的方法。在线调试&示例代码您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 Demo 语音合成示例代码： https://github.com/Baid
查看更多>>
短语音识别REST-API-JavaSDK - 语音技术
短语音识别REST-API-JavaSDK 安装Speech Java SDK Speech Java SDK目录结构 com.baidu.aip ├── auth //签名相关类 ├── http //Http通信相关类 ├── client //公用类 ├── exception //exception类 ├── speech │ └── AipSpeech //AipSpeech类 └──
查看更多>>
语言处理技术NLP价格详情
文字识别语言处理技术图像识别图像搜索图像增强全功能AI开发平台 BML 零门槛AI开发平台 EasyDL 知识理解内容审核平台 MapReduce 流式计算 BSC 数据可视化 Sugar BI Elasticsearch 数据仓库 Palo Doris版日志服务 BLS 消息服务数据湖管理与分析平台EasyDAP 短信服务 SMS 号码隐私保护服务 PNS 号码认证服务音视频处理
查看更多>>
呼叫中心语音-音频文件转写（8K） - 语音技术
呼叫中心语音-音频文件转写（8K）接口描述音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景，一般12小时内返回识别接口。步骤： 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务，获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。在线调试&示例代码您可以在
查看更多>>
开源VAD音频切分工具 - 语音技术
开源VAD音频切分工具简介由于百度rest api接口有60s的音频时长限制，使用此demo可以粗略地按照静音切分音频。项目地址： https://github.com/Baidu-AIP/speech-vad-demo 集成 webrtc 开源项目，vad模块，具体算法 GMM (Gaussian Mixture Model)。注意这个是开源项目，效果远不如与百度语音LInux C++
查看更多>>

图像技术

[AI行业案例]-嘀嗒出行平台大规模应用语音合成技术

语音合成 HarmonyOS SDK - 语音技术

语音识别 HarmonyOS SDK - 语音技术

音频文件转写API - 语音技术

如何用可视化工具调用 - 语音技术

短文本在线合成API - 语音技术

短语音识别REST-API-JavaSDK - 语音技术

语言处理技术NLP价格详情

呼叫中心语音-音频文件转写（8K） - 语音技术

开源VAD音频切分工具 - 语音技术

热门活动

新闻动态

最新活动

相关主题

热门产品