2D小样本数字人(专属口型)拍摄指南
更新时间:2024-12-18
定制2D小样本数字人(专属口型)时,我们需要您提供一段10秒-4分钟的闭嘴动作底板视频,和一段4-8分钟的真人口播唇动视频,为了提升最终生成的数字人效果,我们特别准备了以下拍摄指南,供您参考:
示例视频部分片段:
绿幕拍摄:训练透明背景数字人(可替换任意背景)
- 底板视频:一段10秒-4分钟的闭嘴视频,用于人像动作训练,训练出的数字人动作会与该底板完全一致
- 唇动视频:一段4-8分钟的真人口播视频,用于数字人口型训练,视频需保留音轨,音画同步,模特声音清晰无环境噪音
1 拍摄准备
-
模特服饰
- 可按照模特喜好选择,与背景颜色风格协调、适合实际应用场景即可
- 合身,不能过大或过紧
- 整洁大方,无明显褶皱
- 穿低领衣服,露出脖子
- 避免碎花、格纹、条纹等大面积花纹的衣服,避免摩尔纹产生
- 建议着深色服装,或者选择其他与背景颜色反差大的服饰颜色
- 不建议选择白色、反光材质、过于光滑面料,避免金属配饰,会反绿(绿幕拍摄需注意)
- 服饰中不存在绿色系服饰,不存在纱质材料,会漏绿(绿幕拍摄需注意)
-
模特妆造
- 无美颜情况下上镜效果好,眉毛无遮挡
- 妆容自然大方,有亲和力,无明显突兀感
- 面部白皙且有立体感,但不宜有过重阴影
- 如果存在瑕疵,例如皮肤不平整,长痘,手部存在血丝,需要遮瑕
- 嘴唇过薄可通过口红补救
- 露出双耳,可佩戴固定耳饰,不建议佩戴易晃动耳饰
- 演员应避免带眼镜,镜片极易反绿,影响后期抠图效果
- 注意手部、脖子、腿等部位,需要保持与面部肤色一致
- 头发正面看无碎发、无毛刺、无镂空,饱满有弧度(绿幕拍摄需注意)
-
播报文本:
- 准备4-8分钟约1500字以上可读性较强的语料
- 文本内容最好贴合实际应用场景
- 建议模特在录制前熟读文本
-
布景:
- 实景拍摄:背景整洁、无密集纹理,适合实际应用场景
- 绿幕拍摄:绿幕颜色统一,且平整无褶皱;建议人物和绿幕距离大于2米,避免人物反绿
-
灯光:
- 用灯光从斜前侧方照亮模特面部,使主播在画面中更突出
- 在灯光下,模特皮肤白皙透亮,避免脸部反光、肤色暗沉或曝光
- 模特光线均匀,尤其注意脸部,颈部,手部,腿部的光照一致性
- 背景光照均匀,并与人像轮廓形成清晰边界
- 灯光一旦确定,切勿再次调整,否则全部重拍
-
设备:
- 建议拍摄的分辨率不低于1080P,关闭HDR模式,关闭log模式
- 需准备提词器,放映预先准备的播报文本
- 比例:横屏为16:9,竖屏为9:16(若最终的场景用于竖屏,建议使用竖屏拍摄;横屏同理)
- 角度:镜头高度与主播眼睛保持同一水平线,模特在头部保持自然的情况下平视镜头,建议正对镜头,侧身不超过10度,不要仰头、低头、仰视、俯视
- 构图:将主播放置于画面中间,确保五官清晰、面部无遮挡
- 可使用三脚架或稳定器固定拍摄设备,以减少画面抖动,确保视频流畅稳定
2 形象拍摄
底板视频:
- 面部神情:头部保持相对稳定,模仿说话状态轻微晃动,面带微笑,面部肌肉放松,注意眼睛一直看镜头,避免张口露齿、抿嘴、眼睛四处看(无需说话)
- 模特动作:越自然越好,以下建议仅供参考
- 尽量选择通用的小幅动作,比如摊手、合手、上下叠手等(细微的手部动作会更自然),注意避免摆手、摇头、比数字等不通用动作,动作的含义需适配数字人播报的所有文本及场景,生成的数字人姿态动作将与视频完全一致,请确保拍摄时的姿态可用于后续内容创作
- 手势动作避免遮挡嘴巴、面部、脖子周围,也避免出画面
-
可根据应用场景决定动作
- 视频场景:更适合把动作幅度控制在身前,增加一些自然的手部小动作、偶尔有摊手等较大幅度动作会更有聊天感
- 交互场景:面带微笑,头部微微⾃然晃动、身体稳定、手部自然放在身前,偶尔左右手交替/手放下再端起即可,不需要做过多动作,因为交互场景某些时候数字人处于聆听静默状态,这时数字人不需要做过多动作
- 直播场景:可自然闭嘴模拟一场真实的直播,可让主播假装在介绍产品、与用户互动等
唇动视频:
- 唇动视频模特形象、机位、灯光等需与底板视频完全一致,建议模特连续拍摄底板视频与唇动视频,后期剪辑
- 牙齿整齐,说话嘴张开上下牙齿全部漏出,避免讲话不漏牙齿或者只漏上牙或下牙。在句与句之间多停顿,停顿时自然闭嘴
tips:
- 可以连续拍摄10分钟左右,为剪辑提供更多的素材
3 后期处理
3.1 剪辑-调色美颜
- 需掐头去尾剪辑,最终提供的底板视频需全程无拼接,跳帧对视频效果影响较大
- 开头保留2-3秒没有手势的静默状态,可以使动作自然开始
-
片段删减说明
- 不建议保留:不通用动作、指向性动作、否定动作、眼神乱瞟、笑场等不合时宜的动作,有较大噪音、其他人说话等片段
- 可以保留:录制过程中微小卡顿,偶尔念错对训练效果基本没影响
-
如果主播有美颜需求,也可以在剪辑时用美颜软件还原美貌,数字人训练效果会与视频素材保持一致
- 若无需抠绿,可直接导出视频,实景拍摄的底板视频规格要求如本文【4.2 视频规格要求】
3.2 抠绿(绿幕拍摄)
以下为AE(Adobe After Effects)抠绿方式及导出视频规格,也可选择其他软件进行抠绿处理。
- 对视频添加超级键效果:
- 调整各种参数:抠除绿色背景,去除模特脸部以及⾝上绿⾊反光
- 检查抠绿效果:抠绿后可换浅灰色背景,检查抠绿是否干净以及是否有该保留的部分被抠除
- 导出视频:
方案一(推荐):
-
第一步:导出透明背景的带alpha通道(预乘模式)的视频
- 格式:mov(Apple Prores 4444或Apple Prores 4444 XQ编码)
- 帧率:25fps
- 分辨率:1080P、2K、4K(2K、4K人像训练限时免费,只支持用于视频合成场景,不支持交互、直播等实时渲染推流场景)
- 第二步:使用ffmpeg将mov转换成带alpha通道的webm视频,webm视频规格要求如本文【4.2 视频规格要求】
ffmpeg -i input.mov -c:v libvpx-vp9 -pix_fmt yuva420p -lossless 1 -b:v 0 output.webm
方案二:导出浅灰色背景的底板视频和mask视频,选择【mask模式】方式如下,视频规格要求如本文【4.2 视频规格要求】
4 视频自检
在提交视频前,请务必逐条确认视频素材是否满足以下要求。
4.1 内容要求:
- 动作自然,无指向性动作
- 在句与句之间多停顿,停顿时自然闭嘴
- 头部无大角度转动,脸部全程无遮挡
- 提供的视频全程无拼接、无跳帧
- 视频音画同步,无明显噪音
- 人像边缘平滑自然,没有绿色残留或锯齿状边缘(若抠绿需注意)
- 穿低领衣服,露出脖子
- 光线充足,脸部整体光线均匀
- 保持妆造、光线、景别不变