简介:国内首个纯自研的视频大模型Vidu全球上线,提供文生视频、图生视频两大功能,分辨率最高达1080P。Vidu在模型训练层面采用了百度百舸·AI异构计算平台,实现了高效稳定的模型训练。未来,Vidu将逐步通过百度智能云千帆平台开放模型服务。
随着人工智能技术的飞速发展,视频大模型领域迎来了新的突破。近日,国内首个纯自研的视频大模型Vidu( www.vidu.studio )正式上线,标志着我国在视频生成技术方面取得了重要进展。这款由生数科技联合清华大学推出的视频大模型,自今年4月底首次亮相以来,便凭借其媲美国际顶尖产品的文生长视频能力,迅速在国内外引起了广泛关注。
Vidu的全面上线,不仅意味着用户无需申请即可直接注册体验,更带来了文生视频、图生视频两大功能的全面开放。用户可以根据需求选择4秒或8秒的视频时长,分辨率最高可达1080P。这一突破性的技术成果,不仅延续了Vidu在四月份展示的高动态性、高逼真度、高一致性等优势,还在新版本中新增了角色一致性(Character To Video)、动漫风格、文字与特效画面生成等特色能力。这些功能的加入,使得Vidu在视频生成领域更加多元化和个性化。
在用户体验方面,Vidu同样表现出色。其实现了业界最快的实测推理速度,生成一段4秒片段仅需30秒。相比之下,市面上的主流AI视频工具在生成类似长度的视频片段时,用户通常需要等待1到5分钟甚至更长。Vidu的高效推理不仅为用户带来了接近于无缝的创作体验,更短的处理时间还意味着它能够轻松应对大量用户的需求,提供个性化的服务。
Vidu之所以能够取得如此显著的成果,离不开其在模型训练方面的深厚积累。在模型训练层面,Vidu采用了百度百舸·AI异构计算平台。这一平台是百度智能云基于多年在AI方面的沉淀,以GPU为核心搭建的异构计算平台,更适合大模型训练,能够保障模型训练的稳定性和效率。通过芯片性能优化、自动芯片选型、潮汐混合等技术手段,百舸大幅提升了智能算力效能,使得Vidu在模型训练过程中能够充分发挥其潜力。
除了高效的模型训练能力外,百度百舸·AI异构计算平台还提供了丰富的运维和可观测工具以及容错保障能力。这些功能提升了大规模集群长期运行的稳定性,降低了因故障导致训推任务异常终止的概率,从而减少了业务损失。在多芯混合训练任务中,百舸更是能够将单芯片利用率、芯片间通信效率、集群整体效能发挥到极致,为Vidu的高效训练提供了有力保障。
随着Vidu的全球上线,其将逐步通过百度智能云千帆平台开放模型服务。这一举措将使得更多用户能够享受到Vidu带来的高效、便捷的视频生成体验。同时,也将进一步推动视频大模型技术在各行业的应用和发展。
展望未来,随着人工智能技术的不断进步和应用场景的不断拓展,视频大模型将在更多领域发挥重要作用。而生数科技也将继续基于百度百舸·AI异构算力计算平台持续训练、提升模型能力,为用户带来更加优质、高效的视频生成服务。同时,我们也期待更多像Vidu这样的优秀产品涌现出来,共同推动人工智能技术的创新和发展。
值得注意的是,Vidu的上线也展示了中国技术在全球AI竞争中的领先地位。与海外大模型相比,国产大模型在产品化和商业化方面更具优势。它们不仅注重产品的实用性和用户体验,还积极探索盈利模式,为AI技术的可持续发展提供了有力支持。相信在未来,国产大模型将在全球AI领域发挥更加重要的作用。