语音识别

采用国际领先的流式端到端语音语言一体化建模算法，将语音快速准确识别为文字，支持手机应用语音交互、语音内容分析、机器人对话等多个场景

查看详情立即使用技术文档

调语音识别内容精选

音色列表 - 语音技术
音色列表页面描述本页面为调用发音人所属音库、发音人名称、调用per参数等信息。试听demo 试听demo请点击发音人详情音库类型发音人名称 per参数场景支持语言调用权限基础音库度小美-标准女主播 0 资讯中文/英文直接调用基础音库度小宇-亲切男声 1 对话助手中文/英文直接调用基础音库度逍遥-情感男声 3 小说中文/英文直接调用基础音库度丫丫-童声
查看更多>>
如何用可视化工具调用 - 语音技术
如何用可视化工具调用如何使用 Postman 调用语音技术服务 API 本文提供了通过可视化工具 Postman 调用短文本语音合成 API 的样例，帮助您零编码快速体验并熟悉语音技术服务。 1.
查看更多>>

调语音识别更多内容

SDK信息保护合规指引 - 语音技术
关于【语音识别】SDK收集、使用的个人信息类型、目的及用途，以及【语音识别】SDK将如何保护所收集、使用的个人信息，请您仔细阅读《【语音识别】SDK隐私政策》了解。
查看更多>>
语音交互 - 机器人开放平台 | 百度智能云文档
返回语音识别的结果。
查看更多>>
长文本在线合成API - 语音技术
步骤： 1、根据文本内容、音频格式、音库等参数创建语音合成任务，获取task_id参数。 2、根据task_id的数组批量查询语音合成任务结果。在线调试&示例代码您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
查看更多>>
开源VAD音频切分工具 - 语音技术
注意这个是开源项目，效果远不如与百度语音LInux C++ SDK ，Android及iOS SDK自带的VAD功能，切割的文件需为pcm(16000采样率小端序 16bits)的格式，其他格式需要提前转换，切割后也是pcm文件原理一个FRAME时长默认10s，通过webrtc的vad计算这个FRAME是否是活动（ACTIVE: 有声音， INACTIVE：静音）。
查看更多>>
音频文件转写极速版API-邀测 - 语音技术
音频文件转写极速版API-邀测接口描述支持提取视频、音频文件中的语音内容，极速返回识别结果及时间戳，适用于对实时性有一要求的内容分析、字幕生产、录音转写场景。
查看更多>>
千帆AI加速器_线上加速营_免费大模型案例课程_电商场景下大模型应用的构建
第一章客服对话多标签生成器第二章商品分析小助手第三章商品推荐小助手第四章营销文案生成小助手第一章客服对话多标签生成器 0 1 客服对话多标签生成器案例介绍及难点分析整体介绍客服对话多标签生成器案例的背景意义、功能及难点去学习 0 2 基于千帆AppBuilder平台创建Agent 创建初始版本Agent，实现基础功能去学习 0 3 基于千帆ModelBuilder平台模型精调
查看更多>>
车辆结构化识别 - 度目软硬一体DUMU | 百度智能云文档
车辆结构化识别一、功能描述车辆结构化检测技能包旨在通过AI对视频中划定区域内的出现的车辆进行检测、抓拍和识别，通过视频采集设备获取车辆特征信息，经过预处理之后，馈入后端的识别算法并与车辆底库进行对比，快速识别车辆身份和属性。进行分别针对每个接入的视频通道进行车辆的信息分析，并最终通过平台记录抓拍图片的方式展示和告知用户。
查看更多>>
千帆AI加速器_线上加速营_免费大模型案例课程_教育场景下大模型应用的构建
去学习 0 6 职业教育专业咨询助手手机端发布应用实现应用的发布并在手机端使用去学习第二章英语口语对练助手 0 1 英语口语对练助手案例介绍介绍英语口语对练助手项目的背景意义及功能去学习 0 2 基于千帆AppBuilder平台创建英语口语对练Agent 基于百度智能云千帆AppBuilder平台创建英语口语对练Agent 去学习 0 3 基于千帆ModelBuilder平台进行模型精调
查看更多>>

语音识别

音色列表 - 语音技术

如何用可视化工具调用 - 语音技术

SDK信息保护合规指引 - 语音技术

语音交互 - 机器人开放平台 | 百度智能云文档

长文本在线合成API - 语音技术

开源VAD音频切分工具 - 语音技术

音频文件转写极速版API-邀测 - 语音技术

千帆AI加速器_线上加速营_免费大模型案例课程_电商场景下大模型应用的构建

车辆结构化识别 - 度目软硬一体DUMU | 百度智能云文档

千帆AI加速器_线上加速营_免费大模型案例课程_教育场景下大模型应用的构建

热门活动

新闻动态

最新活动

相关主题

热门产品