配置成虚拟主机  内容精选
  • 音色列表 - 语音技术

    音色列表 页面描述 本页面为调用发音人所属音库、发音人名称、调用per参数等信息。 试听demo 试听demo请点击 发音人详情 音库类型 发音人名称 per参数 场景 支持语言 调用权限 基础音库 度小美-标准女主播 0 资讯 中文/英文 直接调用 基础音库 度小宇-亲切男声 1 对话助手 中文/英文 直接调用 基础音库 度逍遥-情感男声 3 小说 中文/英文 直接调用 基础音库 度丫丫-童声

    查看更多>>

  • 实时语音识别-websocket API - 语音技术

    实时语音识别-websocket API 接口描述 实时语音识别接口采用websocket协议的连接方式,边上传音频边获取识别结果。可以将音频流实时识别为文字,也可以上传音频文件进行识别;返回结果包含每句话的开始和结束时间,适用于长句语音输入、音视频字幕、直播质检、会议记录等场景。 WebSocket简介 WebSocket 是基于TCP的全双工协议,即建立连接后通讯双方都可以不断发送数据。 We

    查看更多>>

配置成虚拟主机  更多内容
  • 用量及历史调用查询 - 语音技术

    用量及历史调用查询 用量查询 登录百度智能云控制台- 语音能力引擎 页面 在概览页-服务列表查看用量及余量: 历史调用查询 登录百度智能云控制台-语音能力引擎- 监控报表 页面 在监控报表页面选择产品服务、应用、API、时间段等选项进行查询: 注意事项: 数据约有15分钟延迟 查询调用量时,选择API接口请定位到具体接口,例如:语音技术-短语音识别-中文普通话(语音技术产品计算单位有次数、时间、字

    查看更多>>

  • 计费概述 - 语音技术

    计费概述 短语音识别计费概述 短语音识别目前有语音识别标准版(包含输入法、英语、粤语、四川话)及短语音识别极速版接口。 短语音识别标准版 :可购买次数包,也可按调用量阶梯后付费。每个账号可享200万次免费调用,开通付费后并发限额可从5扩展至50。 短语音识别极速版 :可购买次数包,也可按调用量阶梯后付费。每个账号可享5万次免费调用,开通付费后并发限额可从5扩展至50。 补充说明 : 并发可 通过合

    查看更多>>

  • 产品更新动态 - 语音技术

    产品更新动态 2024-04-02 【远场语音识别模型下线公告】 尊敬的百度语音客户您好!百度远场语音识别产品历史接口及模型资源整合升级,为您提供更优质的产品效果及使用体验。 以下模型资源将于4月30日下线 ,为避免影响您的服务,请您尽快将服务切换升级: dev_pid=1936(1936、19361、19362、19363) 升级方式: 远场语音识别相关合作需求,您可提交 合作咨询 ,我们将尽快

    查看更多>>

  • 短语音识别标准版API - 语音技术

    短语音识别标准版API 接口描述 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。 调用流程 创建账号及应用: 在 ai.baidu.com 控制台中,创建应用,勾选开通 “语音技术”—“短语音识别”、“短语音识别极速版” 能力。获取AppID、API Key、Secret Key,并通过请求鉴权接口换取 token ,详细见 “ 接入指南

    查看更多>>

  • 开源VAD音频切分工具 - 语音技术

    开源VAD音频切分工具 简介 由于百度rest api接口有60s的音频时长限制,使用此demo可以粗略地按照静音切分音频。 项目地址: https://github.com/Baidu-AIP/speech-vad-demo 集成 webrtc 开源项目,vad模块,具体算法 GMM (Gaussian Mixture Model)。 注意这个是开源项目,效果远不如与百度语音LInux C++

    查看更多>>

  • 呼叫中心语音-音频文件转写(8K) - 语音技术

    呼叫中心语音-音频文件转写(8K) 接口描述 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。 步骤 : 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。 在线调试&示例代码 您可以在

    查看更多>>

  • 语音识别极速版API - 语音技术

    语音识别极速版API 接口描述 将60秒以内的完整音频文件识别为文字,专有GPU服务集群,识别响应速度较标准版API提升2倍及识别准确率提升15%。适用于近场短语音交互,如手机语音搜索、聊天输入等场景。 支持上传完整的录音文件,录音文件时长不超过60秒,实时返回识别结果。 调用流程 创建账号及应用: 在 ai.baidu.com 控制台中,创建应用,勾选开通 “语音技术”—“短语音识别”、“短语音

    查看更多>>

  • 音频文件转写API - 语音技术

    音频文件转写API 接口描述 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。 步骤 : 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。 在线调试&示例代码 您可以在 示例代码中心

    查看更多>>