这是通过 3D 真人全身高精度特征采集等 AI 克隆人技术,对人物进行声音克隆,通过 TTS( 从文本到语音 ) 训练让其开口说话交流,塑造出可以实时互动说话的虚拟数字人。小浦还通过人脸表情识别技术,实时感知用户情绪变化,再通过严谨的业务逻辑和内容的配置,幽默诙谐的闲聊话术,让语音对话生动起来。小浦的实时交互得到了质的跨越。与其他只会单向传播的虚拟主播不同,小浦实现了从数字主播到数字柜员的跨越。
DocDB for MongoDB 云数据库 HBase 云数据库 GaiaDB 分布式数据库 GaiaDB-X 数据传输服务 DTS 云数据库 TableStorage 消息服务 for RabbitMQ 云原生微服务应用平台 函数计算 CFC 容器实例BCI 容器镜像服务CCR DDoS防护服务 应用防火墙 WAF 主机安全 密钥管理服务 SSL证书 云堡垒机 应用加固与安全检测 人脸识别 人体分析 语音技术
DocDB for MongoDB 云数据库 HBase 云数据库 GaiaDB 分布式数据库 GaiaDB-X 数据传输服务 DTS 云数据库 TableStorage 消息服务 for RabbitMQ 云原生微服务应用平台 函数计算 CFC 容器实例BCI 容器镜像服务CCR DDoS防护服务 应用防火墙 WAF 主机安全 密钥管理服务 SSL证书 云堡垒机 应用加固与安全检测 人脸识别 人体分析 语音技术
活体检测方案 :(推荐使用H5动作活体检测) 数字活体检测 :通过语音验证码的形式(用户朗读屏幕上的随机语音验证码并录制视频)判断拍摄视频的用户是否为活体。 支持对语音验证码的长度进行限制,支持设置指定3~6位语音验证码 支持增加唇语的辅助校验,目前唇语识别能力当前为Beta版本,识别准确率较低,仅用于辅助验证。 动作活体检测 :通过用户做指定动作来验证当前拍摄视频的用户是否为活体。
活体检测方案 :(推荐使用H5动作活体检测) 数字活体检测 :通过语音验证码的形式(用户朗读屏幕上的随机语音验证码并录制视频)判断拍摄视频的用户是否为活体。 支持对语音验证码的长度进行限制,支持设置指定3~6位语音验证码 支持增加唇语的辅助校验,目前唇语识别能力当前为Beta版本,识别准确率较低,仅用于辅助验证。 动作活体检测 :通过用户做指定动作来验证当前拍摄视频的用户是否为活体。
当前支持的音效列表如下: 音效名称 效果说明 扬声器原声模式 原声,保留多声道听感 扬声器电影模式 使用扬声器虚拟环绕技术,增加声场宽度,使声场以及某些声像不仅仅局限于两个喇叭之间,而能扩展至两个扬声器外侧,提高声音的沉浸感 扬声器音乐模式 音乐相对于电影来说,更需要注重声音的音质,此模式采用最佳的频率响应,不加任何环绕处理,增强了语音的清晰度,使音乐声音更加自然 耳机原声模式 原声,保留多声道听感
多语种审核 语音审核覆盖中英文,可跨语种审核。
接口说明 包含在SDK中的百度AI平台在线API能力有文字识别,图像识别,人脸识别,语音识别以及语音识别。各个API的调用方式以及调用参数,返回详细数据请参考相应的百度AI平台API C++文档: 文字识别 图像识别 人脸识别 语音识别 语音合成
DocDB for MongoDB 云数据库 HBase 云数据库 GaiaDB 分布式数据库 GaiaDB-X 数据传输服务 DTS 云数据库 TableStorage 消息服务 for RabbitMQ 云原生微服务应用平台 函数计算 CFC 容器实例BCI 容器镜像服务CCR DDoS防护服务 应用防火墙 WAF 主机安全 密钥管理服务 SSL证书 云堡垒机 应用加固与安全检测 人脸识别 人体分析 语音技术
DocDB for MongoDB 云数据库 HBase 云数据库 GaiaDB 分布式数据库 GaiaDB-X 数据传输服务 DTS 云数据库 TableStorage 消息服务 for RabbitMQ 云原生微服务应用平台 函数计算 CFC 容器实例BCI 容器镜像服务CCR DDoS防护服务 应用防火墙 WAF 主机安全 密钥管理服务 SSL证书 云堡垒机 应用加固与安全检测 人脸识别 人体分析 语音技术