百度智能云

端到端语音语言大模型 视频介绍
基于Cross-Attention技术打造跨模态语音大模型,通过极速响应、超拟人音色,实现真人式交互,支持深度需求理解与复杂任务执行。
功能介绍
特色优势
应用场景
产品价格
相关推荐
功能介绍
特色优势
超低时延
基于业内创新的Cross-Attention技术,在对话过程中将用户等待时长从行业常见的3-5秒大幅缩短至1秒左右,实现了比拟真人对话的即时响应速度,树立行业标杆
极致共情
基于真正的端到端跨模态语音大模型,能够感知原始语音携带的情绪与语气信息,充分理解用户意图与情境要求,更好地服务情感陪伴、 社交娱乐等场景
超拟人音色
通过融入大语言模型,成就高自然度高表现力的语音合成效果,助力合成音频听感更加自然流畅,语气更加符合情景,情感更加接近真人,语调更加具有韵律
应用场景
语音助手
情感陪伴
呼叫中心
在线教育
智能硬件
语音助手
支持实时联网查询与复杂指令遵循,通过超高双商加持,实现用户需求深度理解,打造智能全知助手。
合作案例
文小言
产品价格
端到端语音语言大模型(Pro)预付费
免费额度
500千tokens
有效期
1年
并发量
10并发(支持扩容)
技术支持
7*24小时
200万tokens
350
立即购买
端到端语音语言大模型(Pro)后付费
免费额度
500千tokens
并发量
10并发(支持扩容)
技术支持
7*24小时
输入-音频
0.064
元/千tokens
开通付费
搜索增强预付费
适用于调用量可预估的企业
免费调用量
1000次
有效期
1年
技术支持
7*24小时
10000次
352
立即购买
搜索增强后付费
适用于不便预估调用时长的企业
免费调用量
1000次
技术支持
7*24小时
按使用量后付
0.036
元/次
开通付费