平台操作指引
百度智能云数字员工-开放平台面向企业及个人开发者,提供高性能、易集成和多样化的数字员工组件能力,满足数字人形象定制、视频合成、交互对话、直播等应用需要,支持公有云调用与私有化部署。帮助开发者快速集成数字人能力,助力企业打造全场景应用。
地址:https://xiling.cloud.baidu.com/open/overview
账号:使用已完成认证的百度智能云账号密码登录
激活:登录平台后可以领取权益体验组件功能试用,免费额度消耗完后需在「组件商店」进行购买续费
平台功能主要包含以下功能模块:
- 概览
- 应用广场
- 组件商店
- 配置中心
- 组件管理
- 应用管理
- 数据统计

平台人像类型:
定制人像:
- 生成式数字人(视频组件)
- 2D小样本数字人(视频组件、端渲染交互组件、云渲染交互组件、直播组件)
- 照片数字人(视频组件、端渲染交互组件)
- 3D数字人(视频组件、端渲染交互组件、云渲染交互组件)
人像库:
- 2D小样本数字人(视频组件、云渲染交互组件、直播组件)
- 2D精品数字人(视频组件、云渲染交互组件)
- 3D数字人(视频组件、云渲染交互组件)
- 端渲染数字人(端染交互组件-2D数字人)
一、应用广场
「应用广场」是百度智能云数字员工 - 开放平台的场景化解决方案枢纽,面向企业及个人开发者提供数字人成品应用的展示,覆盖口语陪练、理财顾问、游戏主播等多元落地场景。
用户登录平台后,进入「应用广场」即可查看各类公开应用,涵盖基于不同数字人类型(2D数字人、3D 数字人等)的场景化方案,可通过应用类型进行筛选。

点击卡片可与数字人进行互动、购买同款组件。

二、组件商店
「组件商店」是百度智能云数字员工 - 开放平台的能力选购中枢,面向企业及个人开发者提供数字人全类型组件的展示与购买服务,覆盖形象定制、视频合成、交互对话、音色克隆等多元技术能力场景。
用户登录平台后,可以进入「组件商店」了解各项组件能力并查看相关文档。

在购买页中,用户可根据需要选择组件类型和对应数量。

三、配置中心
「配置中心」包含「配置台」和「任务管理」两个模块,可在「配置台」中快速体验音色定制、视频组件、交互组件。

配置台-音色定制
「配置中心 - 配置台 - 音色定制」用于快速生成专属定制音色,支持上传音频文件、设置声音名称与性别等参数,可在线克隆生成并试听文本,一键复制代码即可集成至应用,助力在语音交互、智能播报、内容配音等场景实现个性化声音输出。
操作流程:

- 进入「配置中心——配置台——音色定制」
完成组件商品购买、应用创建及应用组件能力配置后,点击导航栏中的「配置中心」、通过下拉栏找到「配置台」功能、随后点击「音色定制」即可开始使用此功能。

- 在线填写表单
(1)选择应用
请先点击下拉框、选择其中用于音色克隆的目标应用;若暂无相关应用,可前往「应用管理」模块创建。

(2)上传音频文件
请录制并上传用于音色克隆的音频文件,支持 mp3、m4a、wav 格式,时长需在 10 秒至 5 分钟之间,文件大小不超过 20MB,可将文件拖动至此区域或点击上传。

(3)命名声音名称
输入声音名称(字数限制 10 字以内),用于标识您克隆的专属音色。

(4)输入试听文本
输入用于试听克隆音色的文本(字数限制 100 字以内),该文本将用于演示您的专属克隆音色效果。

(5)选择声音性别(非必填项)
选择您克隆音色的性别(可选 “男” 或 “女”),用于辅助定义音色的风格属性。

(6)输入声音描述(非必填项)
输入对声音的描述(如音色特质、风格等)。

(7)填写回调URL(非必填项)
填写回调 URL,用于接收音色克隆任务的进展相关消息。

- 在线克隆或复制代码
(1)在线克隆
完成表单填写后即可在线克隆。

克隆任务成功提交后可在「配置中心-任务管理」中找到播报试听文本的克隆音色任务,可选择在线试听、下载以及分享相关链接。

(2)复制代码
完成表单填写后,看到“复制代码”字样亮起即可点击,一键复制接入代码,支持自由开发集成。

配置台-视频组件
「配置中心-配置台 - 视频组件」用于快速配置数字人视频并生成接入代码,可选择数字人形象、设置声音参数(驱动模式、音色、语速音量等),一键获取代码集成至应用,助力快速构建数字人视频能力。
操作流程:

- 配置台进入与基础选择
完成组件商品购买、应用创建及应用组件能力配置后,点击左侧「配置中心」下的「配置台」,即可进入配置界面。在配置台顶部,选择「视频组件」标签页,可通过下拉框选择具体的视频组件类型(如 “视频组件 - 2D 小样本数字人”)。

- 基础信息配置
(1)选择形象
在「形象」区域,支持选择系统库中的数字人形象与已定制的数字人形象。

(2)选择驱动模式
在「声音输出设置」区域,可选择「文本驱动」或「音频驱动」模式:
- 若选择「文本驱动」,需在下方选择声音、填写播报文案;

- 若选择「音频驱动」,需准备符合要求的音频链接(如 MP3 格式的公开访问链接)进行驱动。

(3)选择并调整音色
若选择「文本驱动」,在「声音」区域,可选择系统库中音色及用户定制音色,同时可设置:
- 语言:根据需求选择,默认 “自动”;
- 语速:通过滑块或输入框调整,范围从慢到快;
- 音量:通过滑块或输入框调整,范围从小到大。
- 音调:通过滑块或输入框调整,范围从低到高。

(4)输入播报文案
在「播报文案」区域,输入数字人需要播报的文本内容,文本字数限制为 1-20000 字。输入完成后,可点击 “生成试听” 按钮免费试听 “播报文案” 中前 500 字符,以便调整文案内容和声音表现。

(5)配置输出设置
在「基础输出设置」区域,可进行以下配置:
- 输出画面:支持选择画面比例,有 16:9(19201080)和 9:16(10801920)两种规格,可根据横屏直播、竖屏短视频等应用场景选择;
- 视频格式:提供 MP4 和 webM 两种格式选项,MP4 兼容性强,适用于多数平台播放;webM 在网页端加载更高效,可根据集成需求选择。
在「高级输出设置」区域,可配置:
- 自定义参数(如 callbackUrl):用于设置数字人视频生成后的回调地址,方便在视频生成完成后接收任务消息进展。

- 展示调整
在「展示调整」区域,点击中部数字人画面后可拖动调整数字人位置和大小,若调整有误可点击 “还原” 按钮恢复默认布局。

- 输出代码
(1)选择应用
在「应用选择」区域支持下拉切换已绑定该组件的个人应用。

(2)预览视频生成效果
点击「开发文档」按钮可查看接口详细信息;右侧代码区根据左侧信息调整实时更新,可参考操作指南查看视频生成效果。

配置台-交互组件
「配置中心 - 配置台 - 交互组件」用于快速配置数字人交互组件并生成接入代码,可选择数字人形象及声音,调整输出画面比例等,一键获取 React、Vue 框架的代码包,助力快速构建数字人交互能力。
操作流程:

- 配置台进入与基础选择
完成组件商品购买、应用创建及应用组件能力配置后,点击左侧「配置中心」下的「配置台」,即可进入配置界面。在配置台顶部,选择「交互组件」标签页,可通过下拉框选择具体的交互组件类型(如 “云渲染交互组件 - 2D 数字人”)。

- 基础信息配置
(1)选择形象
在「形象」区域,支持选择系统库中的数字人形象与已定制的数字人形象。

(2)选择声音
在「声音」区域,支持选择系统库中音色及用户定制音色。

(3)配置输出设置
在「基础输出设置」区域,可配置:
- 输出画面:支持选择画面比例,有 16:9(19201080)和 9:16(10801920)两种规格,可根据横屏直播、竖屏短视频等应用场景选择。
在「高级输出设置」区域,可配置:
- 自定义参数(如 callbackUrl):用于设置数字人视频生成后的回调地址,方便在视频生成完成后接收任务消息进展。

- 展示调整
在「展示调整」区域,点击中部数字人画面后可拖动调整数字人位置和大小,若调整有误可点击 “还原” 按钮恢复默认布局。

- 输出代码
点击“开发文档”按钮可查看接口详细信息。
(1)选择应用
在「应用选择」区域支持下拉切换已绑定该组件的个人应用。

(2)选择代码框架
可选择 React 或 Vue 代码框架,完成框架选择后,下方关键代码会实时同步更新;

(3)效果预览
下载代码包后,复制代码并将关键代码替换到本地文件 Iframe/index.vue 中,即可快速预览。

点击「效果预览」按钮,可预览文本驱动播报(可自定义播报文本)、流式文本播报、流式音频播报效果。

任务管理
「配置中心 - 任务管理」用于集中管理音色定制任务,可查看任务 ID、生成时间等信息,支持对任务进行下载、分享操作,助力用户高效管理定制任务。
(1)新增定制任务
点击「新增」按钮即可快速跳转「配置中心-配置台-音色定制」模块进行音色定制。

(2)信息查看与基础操作
可查看声音定制状态、声音名称、声音ID、生成时间;
点击卡片左侧即可在线试听音色克隆效果;

将鼠标移至声音卡片,点击卡片右上角按钮即可展开操作列表,点击「下载」可下载wav格式试听音频、点击「分享」可复制音频链接。

四、组件管理
用户完成组件商品下单支付后,可在「组件管理」中查看已购买组件以及剩余时长、有效期等信息。
点击“购买”可快速跳转组件详情页进行选购,点击“查看详情”可查看订单的具体信息。

五、应用管理
用户完成组件商品购买后,可进入「应用管理」进行应用创建及配置。

点击“编辑”可编辑应用名称并绑定所需组件能力。

完成应用创建后可在页面中获取应用鉴权码,通过专属鉴权码进行数字人能力调用。

六、数据统计
用户可以在数据统计中分类型、分时段查看组件调用量、服务时长等相关信息。

在「应用概览」区域可查看各应用的组件使用情况,点击“使用详情”可查看详细信息。

