2D端渲染数字人(拍摄指南)
更新时间:2025-12-22
定制2D端渲染数字人时,我们需要您提供一段10秒-4分钟的闭嘴动作底板视频及对应mask视频,和一段4分钟以内的真人口播唇动视频,为了提升最终生成的数字人效果,我们特别准备了以下拍摄指南,供您参考:
示例视频部分片段:
- 底板视频:一段10秒-4分钟的闭嘴视频,用于人像动作训练,视频需保留音轨,训练出的数字人动作会与该底板完全一致
- mask视频:底板视频所对应的mask视频,若底板视频为实景非绿幕,则mask视频为与底板视频分辨率一致的等长纯白视频
- 唇动视频:一段4分钟内的真人口播视频,用于数字人口型训练,视频需保留音轨,音画同步,模特声音清晰无环境噪音
1 拍摄准备
-
模特服饰
- 可按照模特喜好选择,与背景颜色风格协调、适合实际应用场景即可
- 合身,不能过大或过紧
- 整洁大方,无明显褶皱
- 穿低领衣服,露出脖子
- 避免碎花、格纹、条纹等大面积花纹的衣服,避免摩尔纹产生
- 建议着深色服装,或者选择其他与背景颜色反差大的服饰颜色
- 不建议选择白色、反光材质、过于光滑面料,避免金属配饰,会反绿(绿幕拍摄需注意)
- 服饰中不存在绿色系服饰,不存在纱质材料,会漏绿(绿幕拍摄需注意)
-
模特妆造
- 无美颜情况下上镜效果好,眉毛无遮挡
- 妆容自然大方,有亲和力,无明显突兀感
- 面部白皙且有立体感,但不宜有过重阴影
- 如果存在瑕疵,例如皮肤不平整,长痘,手部存在血丝,需要遮瑕
- 嘴唇过薄可通过口红补救
- 露出双耳,可佩戴固定耳饰,不建议佩戴易晃动耳饰
- 演员应避免带眼镜,镜片极易反绿,影响后期抠图效果
- 注意手部、脖子、腿等部位,需要保持与面部肤色一致
- 头发正面看无碎发、无毛刺、无镂空,饱满有弧度(绿幕拍摄需注意)
-
布景:
- 实景拍摄:背景整洁、无密集纹理,适合实际应用场景
- 绿幕拍摄:绿幕颜色统一,且平整无褶皱;建议人物和绿幕距离大于2米,避免人物反绿
-
灯光:
- 用灯光从斜前侧方照亮模特面部,使主播在画面中更突出
- 在灯光下,模特皮肤白皙透亮,避免脸部反光、肤色暗沉或曝光
- 模特光线均匀,尤其注意脸部,颈部,手部,腿部的光照一致性
- 背景光照均匀,并与人像轮廓形成清晰边界
- 灯光一旦确定,切勿再次调整,否则全部重拍
-
设备:
- 建议拍摄的分辨率不低于1080P,关闭HDR模式,关闭log模式
- 需准备提词器,放映预先准备的播报文本
- 比例:竖屏9:16
- 角度:镜头高度与主播眼睛保持同一水平线,模特在头部保持自然的情况下平视镜头,建议正对镜头,侧身不超过10度,不要仰头、低头、仰视、俯视
- 构图:将主播放置于画面中间,确保五官清晰、面部无遮挡
- 可使用三脚架或稳定器固定拍摄设备,以减少画面抖动,确保视频流畅稳定
2 形象拍摄
底板视频:
- 头部保持相对稳定,模仿说话状态轻微晃动,面带微笑,面部肌肉放松,注意眼睛一直看镜头,避免张口露齿、抿嘴、眼睛四处看(无需说话),动作需选择聆听,播报均适用的动作,避免明显的播报动作,生成的数字人姿态动作将与底板视频完全一致,请确保拍摄时的姿态可用于后续内容创作
- 手势动作避免遮挡嘴巴、面部、脖子周围,也避免出画面
唇动视频:
- 4分钟以内,唇动视频模特形象、机位、灯光等需与底板视频完全一致,视频需收音清晰,音画同步,无杂音,无除模特外其他人的声音
- 牙齿整齐,说话嘴张开上下牙齿全部漏出,避免讲话不漏牙齿或者只漏上牙或下牙。
- 播报文本:
- 文本内容最好贴合实际应用场景
- 建议模特在录制前熟读文本
3 AE抠绿教程(绿幕拍摄)
以下为AE(Adobe After Effects)抠绿方式及导出视频规格,也可选择其他软件进行抠绿处理。
- 对视频添加超级键效果:
- 调整各种参数:抠除绿色背景,去除模特脸部以及⾝上绿⾊反光
- 检查抠绿效果:抠绿后可换浅灰色背景,检查抠绿是否干净以及是否有该保留的部分被抠除
- 导出视频: 导出浅灰色背景的底板视频和mask视频,选择【mask模式】方式如下,视频规格要求如本文【4 视频规格要求】
4 视频规格要求
| 动作底板 | mask视频 | 唇动视频 |
|---|---|---|
| 1. 拍摄内容:嘴巴闭上,身体为自然状态(头部、身体有轻微的律动),无嘴部动作、不露牙2. 视频时长:10s~4min(最大)3. 视频格式:mp44. 分辨率:建议1080p5. 尺寸: 竖屏9:166. 帧率: 25FPS7. 大小:700M以内8. 高码率(具体数值不做限制) | 1. 内容与动作视频保持一致,用上述动作视频制作导出透明通道视频2. 视频格式:mp4(最大)3. 分辨率:建议1080p4. 尺寸: 竖屏9:165. 帧率: 25FPS6. 大小:700M以内7. 高码率(具体数值不做限制) | 1. 拍摄内容:人物身体+嘴部为自然说话状态,可以提前准备一个4分钟的演讲稿(自我介绍、讲故事),最好能脱稿,脸部清晰,无遮挡2. 视频时长:10s~4min(最大)3. 视频格式:mp44. 分辨率:建议1080p5. 尺寸: 竖屏9:166. 帧率: 25FPS7. 大小:700M以内8. 高码率(具体数值不做限制) |
