视频生成
更新时间:2025-09-01
百度蒸汽机(MuseSteamer)简介
百度蒸汽机(MuseSteamer)是由百度商业研发团队自主研发的视频生成模型。通过多模态信息的精准同步与自然交互,支持多人对话音视频一体化生成,电影级质感画面、大师级运镜,同时基于海量中文语料深度训练,中文语音细节高度还原。在突破性的技术创新下,为全球视频创作者带来高效、专业的视频生成能力,实现需求即成片。
模型优势
- 深度适配中文场景:海量中文语料深度训练,中文语音细节高度还原;中文语境情感表达自然流畅。
- 电影级画质,真实细腻人物表现力:通过多条件协同建模,端到端人物生成,双重注意力融合音频+视觉,人体姿态极致自然,情绪预测表情预测及3D面部生成;
- 支持大师级复杂运镜:通过百万级专业运镜数据微调,支持数十种运镜语言,在多粒度条件建模下达到视觉细节与文本精确对齐。通过prompt 增强模型,强化学习用户意图,实现极致指令遵循;
- 音视一体化生成:一张图+提示词,画面、环境音效与多人对话一体化生成,无需人工干预,实现音画同步、情境完整的沉浸式内容输出,从“流水线作业”升级为“一键式搞定”,大幅提升创作效率与成片质量。
- 首创Latent Multi-Modal Planner:由模型自主规划潜在生成空间中多角色身份、台词情感与互动逻辑,保障模型在生成过程中,视觉画面与音频生成的一致性,呈现更真实、更具表现力的多人对话互动,让多角色互动场景真实如电影实拍!
- 音画同步生成:蒸汽机突破音视对齐生成技术,精准对齐语音,对人形(唇形、面部表情、动作)进行全局生成,保障人物语言行为与语音节奏、画面动态随环境音效变化,确保每位说话者的口型与语音波形在毫秒级对齐,并在侧脸、遮挡等复杂场景表现稳定全面提升视频的沉浸感与真实感。
模型版本介绍
百度蒸汽机2.0(MuseSteamer 2.0)全系模型家族,通过不同版本差异化设计满足各类用户不同创作需求,带来视频创作的无限可能。
版本 | MuseSteamer-2.0-Turbo-I2V | MuseSteamer-2.0-Turbo-I2V-Audio | MuseSteamer-2.0-Turbo-I2V-Effect | MuseSteamer-2.0-Lite-I2V | MuseSteamer-2.0-Pro-I2V |
---|---|---|---|---|---|
像素 | 720p | 720p | 720p | 720p | 1080p |
特性 | 全能 | 环境音+台词 | 特效风格+音效 | 极致性价比 | 超高画质 |
生成视频时长 | 5s | 5s/10s | 5s | 5s | 5s |
model入参 | musesteamer-2.0-turbo-i2v | musesteamer-2.0-turbo-i2v-audio | musesteamer-2.0-turbo-i2v-effect | musesteamer-2.0-lite-i2v | musesteamer-2.0-pro-i2v |
应用场景
有声demo合集展示
商业广告制作
影视创作
UGC创作
评测效果
百度蒸汽机(MuseSteamer)视频生成模型在全球权威的VBench Leaderboard图生视频榜单中,以89.38%的总分登上Vbench-I2V榜首!
调用示例
视频是根据输入示例调用百度蒸汽机(MuseSteamer)模型创建视频任务接口产出的真实视频,每次生成可能有随机性,无法保障效果完全一致。 如需了解更多百度蒸汽机系列视频生成模型服务Prompt编写技巧,请查看说明文档。
无声视频
调用示例1
curl --location 'https://qianfan.baidubce.com/video/generations' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer your-key' \ --data '{ "model": "musesteamer-2.0-turbo-i2v", "content": [ { "type": "text", "text": "母子俩在厨房用耳机看视频,桌上有咖啡和玩偶,阳光洒在桌上,温馨互动。" }, { "type": "image_url", "image_url": { "url": "https://bj.bcebos.com/aigc-tools/user_upload/edcd9e3f-7e12-4a54-aa9d-4fb5d1e60fdd.png" } } ] }'
结果展示
调用示例2
curl --location 'https://qianfan.baidubce.com/video/generations' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer your-key' \ --data '{ "model": "musesteamer-2.0-turbo-i2v", "content": [ { "type": "text", "text": "夕阳下,骑手与马匹飞跃障碍,背景是壮丽的山脉和落日,动态捕捉马术运动的优雅与力量。" }, { "type": "image_url", "image_url": { "url": "https://bj.bcebos.com/aigc-tools/user_upload/c297b952-97ea-4713-bd1c-74d19850c2c1.png" } } ] }'
结果展示
有声视频
调用示例1
curl --location 'https://qianfan.baidubce.com/video/generations' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer your-key' \ --data '{ "model": "musesteamer-2.0-turbo-i2v-audio", "content": [ { "type": "text", "text": "身穿古代盔甲的盘发男子在工业化车间内专注缝制带花卉图案的布料,背景可见悬吊的金属吊钩与正在进行器械操作的工人。主角说道:\"俺飞飞是个粗人,可大哥为什么偏偏让俺做这种绣工活。\"" }, { "type": "image_url", "image_url": { "url": "https://bj.bcebos.com/aigc-tools/user_upload/cfe02dad-89ad-46bc-9b13-ca35211e3021.png" } } ] }'
结果展示
调用示例2
curl --location 'https://qianfan.baidubce.com/video/generations' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer your-key' \ --data '{ "model": "musesteamer-2.0-turbo-i2v-audio", "content": [ { "type": "text", "text": "女性穿着浅色衬衫,黑色齐肩短发侧身站在海滩边,面朝大海凝望远方,天空中多只海鸥展开翅膀在飞翔,海风吹拂导致人物头发和衬衫产生飘动。" }, { "type": "image_url", "image_url": { "url": "https://bj.bcebos.com/aigc-tools/user_upload/0eac3120-2ad3-460d-a429-6aa3017644fb.png" } } ] }'
结果展示
模型价格
视频生成模型采用积分定价方式,单次调用消耗=单位积分价格×消耗积分数,不同模型单位积分价格不同。
百度蒸汽机2.0
单位积分价格:1元/积分,不同模型和配置消耗积分数不同,详见价格说明文档。
接口示例
接口文档请查看:
创建视频生成任务
请求示例:
Bash
1curl --location 'https://qianfan.baidubce.com/video/generations' \
2 -H "Content-Type: application/json" \
3 -H "Authorization: Bearer $QIANFAN_API_KEY"
4 -d '{
5 "model": "musesteamer-2.0-turbo-i2v-audio",
6 "content": [
7 {
8 "type": "text",
9 "text": "一位身穿古代盔甲的武士坐在开阔场地的木桌两侧,手持麻将牌进行牌局对战,两人嘴唇微动进行对话。麻将牌整齐排列在桌面的深色棋盘纹布上,背景可见随风飘动的军队旗帜。左边人物说话:\"将军,大棚外战火纷飞,咱们在这打麻将不太好吧?\" 右边人物说话:\"松弛一点!你是不是输钱输怕了?!\""
10 },
11 {
12 "type": "image_url",
13 "image_url": {
14 "url": "https://qianfan-document.bj.bcebos.com/images/itv-input-image.png"
15 }
16 }
17 ],
18 "duration": 10
19}
20'
返回示例:
JSON
1{
2 "id": "as-***",
3 "task_id": "67c999d***8e8c05a4"
4}
查询视频生成任务
请求示例:
Bash
1curl --location 'https://qianfan.baidubce.com/video/generations?task_id=67c999d***8e8c05a4' \
2--header 'Content-Type: application/json' \
3--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
返回示例:
JSON
1{
2 "id": "as-***",
3 "task_id": "67c999d***8e8c05a4",
4 "model": "musesteamer-2.0-turbo-i2v-audio",
5 "status": "succeeded",
6 "created_at": 1743414619,
7 "updated_at": 1743414673,
8 "content": {
9 "video_url": "https://fc-***.mp4"
10 },
11 "duration": 10,
12 "width": 1280,
13 "height": 704
14}