快速入门
登录
曦灵数字人SaaS平台支持在未登录状态下浏览部分页面,浏览更多页面及进行一些页面操作需进行账号登录;用户可使用百度账号/百度智能云账号登录
首页+数字人
首页
首页展示克隆入口模块、我的形象&我的音色模块、我的应用模块;
点击页面中2D数字人克隆可进入2D数字人克隆页;点击页面中照片数字人克隆可进入照片数字人克隆页;点击页面中音色克隆可进入音色克隆页。“我的形象”展示我克隆的2D极速克隆、2D精品克隆和照片克隆的人像;未定制时展示极速克隆、精品克隆、照片克隆三种示例人像,点击示例人像点击跳转对应的人像克隆页面;
我的应用模块展示数字人直播、数字人视频、数字人对话三个核心功能的相关数据 点击极速开播按钮进入直播工作台页面;点击开始创作按钮进入视频工作台页面;点击快速搭建按钮进入对话工作台页面
数字人管理页
当用户使用曦灵进行了人像克隆和声音克隆后,对应资产会显示在该页面中,支持用户进行编辑管理。 平台还提供了800+个公共人像和150+个公共音色供用户在直播、视频、对话应用中使用。
2D数字人克隆
曦灵平台提供两种2D数字人克隆能力:「极速克隆」和「精品克隆」。
- 精品克隆:训练完的形象像可以完全还原口型特征,适用于需要对真人进行数字分身克隆且要高度还原真人的应用场景,例如:真人IP短视频生产、企业总裁产品宣推等。训练视频需张口录制,并需要保留视频的音频,4小时可完成训练。
- 极速克隆:训练完的形象口型特征为大模型匹配结果,适用于需要真人形象进行内容生产,但无需固定人像,追求人像克隆效率的应用场景。例如:品牌直播、广告营销短视频等。训练视频需闭口录制,无需保留音频,30分钟即可完成训练。
照片数字人克隆
曦灵平台可以实现将一张单帧照片秒级生成2D数字人。适用于需要大批量生成数字人,缺乏底板视频拍摄条件,通过照片克隆人像进行简单内容播报。例如:AI名片、保险经纪人的应用场景。
3D数字人生成
用户仅需要输入一句想要的人像风格的文案,就可以模仿人类思路自动生成3D数字人,全程只要10分钟。适用于需要使用3D超写实风格的数字人打造企业IP、文旅IP、娱乐IP等应用场景。
音色克隆
仅需10s录音,1分钟之内就能生成自己的定制音色,用于数字人的播报和内容生产。
直播工作台
为匹配直播客户「先授权-再开播」的使用习惯,支持用户授权美团、快手、抖音、淘宝、京东等多个平台,并支持用户直接在平台中查看自己的直播间数据。
选品并一键创建直播间
选择一个授权账号点击去开播即可进入直播首页,点击极速开播即可通过选品面板选取直播平台商品,然后点击生成直播间即可智能生成一个完整的直播间,包括直播间装修、脚本文案及问答库;未授权账号也可使用体验模式通过添加自建商品实现智能生成直播间。
直播间编辑界面
可在左侧商品单模块进行商品的添加、复制、删除等操作,拖动商品可调整商品顺序,可调整文案、模板、主播人像以及图片、视频、文本等素材;还可进入问答库编辑该商品的问答内容;如需保存某个商品脚本,可选中商品后,点击保存到脚本库方便下次直接使用
直播中真人接管
点击“开始直播”后即可开启数字人直播画面,直播过程中点击“麦克风”即可开启真人接管功能,真人接管状态下可实现通过真人声音驱动数字人口型,适合于需要人工回答问题的场景。
由于各平台数字人直播政策的差异,建议您开播时先用小号试播,待稳定开播后再切换账号
视频工作台
视频工作台包含四种制作视频的方式:裂变视频、精编视频、分身视频、AI卡片,分别适用于不同的制作视频的场景
裂变视频生产界面:
裂变视频适用于广告投放、招聘、加盟等需批量生产营销视频的场景。用户通过上传裂变视频主体素材,选择数字人、音色,填写产品名称和产品卖点后,通过大模型的理解能力对视频进行混剪和制作,最终批量生成裂变后的营销视频
精编视频生产界面:
根据不同的播报场景需求,可快速布置播报场景、搭配精美形象、设置播报声音、编辑播报内容等,借力于百度AI成像和TTS前沿技术,以及丰富的制作模板,实现用户无门槛上手,快速帮您制作精美专业的播报视频,适用于培训课程、新闻资讯、产品介绍等需要定制化背景样式展示的场景
分身视频生产界面:
上传一段无需讲话的真人视频,由百度AI能力为您训练出精美数字人形象。利用人脸建模技术、语音合成技术,为创作者定格最专业的形象状态。适用于无需更换背景的数字人口播内容的场景
AI卡片生产界面:
AI卡片提供海量优质的预置模板供您选择。选择模板,上传一张证件照,由百度AI驱动能力为您分钟级生成2D数字人形象,轻松获得个性化的AI名片、贺卡、宣传页、邀请函和明信片。
对话工作台
曦灵对话工作台,基于百度文心大模型以及生成式AI技术打造,可以一站式配置和应用数字人智能体。在这里,你可以轻松构建有知识、有技能、有人格的新一代交互型数字人,将数字人应用在公众号、小程序、网站等多种终端场景,为终端用户提供7x24小时的专业服务,可以面对面对话的、具有智慧和人格的数字人将大大提升用户体验和企业运营效率。
对话工作台配置界面
选择一个交互模板,交互模板分为横版和竖版,可以根据自己的使用场景进行选择,如果最后想要将数字人放到PC网页上与人对话则选择横版,如果想要将数字人放到公众号、小程序等移动端上与人对话则选择竖版;选择后进入智能体配置页面,通过配置数字人的人像、机位、音色定义数字人形象,通过配置角色技能及关联知识库实现技能的关联;技能和知识可通过在知识库中上传文档由大模型进行学习。确认数字人智能体的配置ok后,可以将其发布为一个H5链接进行分享或放置到公众号、小程序、网页等场景中服务终端用户