字节跳动推出两款视频生成大模型

字节跳动在2024年9月24日的火山引擎AI创新巡展上，发布了两款视频生成大模型，标志着其正式进入AI视频生成领域。

图片[1]-字节跳动推出两款视频生成大模型 - AI资源导航站-AI资源导航站

火山引擎发布豆包视频生成模型

火山引擎总裁谭待在巡展上宣布，推出了豆包视频生成-PixelDance和豆包视频生成-Seaweed两款模型。这两款新模型的发布，预示着字节跳动在AI视频生成领域的深入探索。

谭待在活动现场展示了新模型的视频生成效果，展示了其在语义理解、主体运动交互、多镜头切换等方面的领先能力。

商业化应用前景

谭待指出，豆包视频生成模型在设计之初就考虑了商业化应用，其应用领域包括电商营销、动画教育、城市文旅和微剧本等，如音乐MV、微电影和短剧。

火山引擎表示，豆包视频生成模型基于DiT架构，通过高效的DiT融合计算单元，实现了视频与文本的压缩编码，使得视频能够在大动态和运镜中自由切换，具备了变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。

此外，豆包视频生成模型采用了全新设计的扩散模型训练方法，解决了多镜头切换的一致性问题，并使用了深度优化的Transformer结构，提升了视频生成的泛化能力。

逐步向用户开放

目前，豆包视频生成模型正在即梦AI内测版进行小范围测试，未来计划逐步向所有用户开放。

剪映和即梦AI市场负责人陈欣然提到，AI与创作者的互动能够带来新的创作灵感，即梦AI旨在成为用户的智慧创作伙伴。

AI视频生成领域的竞争

国内AI视频生成领域竞争激烈，各大互联网企业纷纷推出自己的视频生成模型。

图片[2]-字节跳动推出两款视频生成大模型 - AI资源导航站-AI资源导航站

今年2月，OpenAI发布了视频大模型Sora，开启了AI视频新时代。随后，国产AI视频大模型也相继问世。

6月，快手推出了视频生成大模型“可灵”，支持文生视频、图生视频、视频续写等功能。

紧接着，LumaAI发布了Dream Machine 1.5，能够快速生成电影级别的视觉效果视频片段。

9月，阿里云发布了全新视频生成模型，美图公司也宣布了美图奇想大模型的视频生成能力全面升级。

业内人士认为，随着技术的进步，AI视频生成领域将迎来新的发展机遇。

文章版权归作者所有，未经允许请勿转载。

THE END