返回

站长之家 - 业界 2024-09-24 19:49

豆包视频生成大模型发布：突破多主体互动难关

**字节跳动发布AI视频生成大模型**

字节跳动近日宣布进军AI视频生成领域，推出两款面向企业市场的AI大模型：PixelDance和大模型Seaweed。

这些模型以其出色的语义理解能力和复杂的交互画面的精准捕捉而闻名。它们不仅可以理解并响应复杂的指令，还能在不同镜头切换下保持内容的一致性。

值得一提的是，这些模型得益于字节跳动自主研发的DiT（动态集成变压器）架构。DiT融合计算单元实现了视频在大动态场景下的无缝切换，赋予其变焦、环绕、平摇、缩放和目标跟随等多镜头语言能力，为视频创作提供了更大的自由度。

为了提升视频的专业性和观赏性，字节跳动采用了创新的扩散模型训练方法。该方法解决了多镜头切换中保持主体、风格和氛围一致性的技术难题，确保了视频在切换瞬间的和谐统一，为观众带来身临其境的体验。

目前，PixelDance和大模型Seaweed已在即梦AI内测版中进行了小范围测试，以收集用户反馈并优化产品性能。

相关话题

字节跳动 AI视频生成豆包视频生成视频大模型 PixelDance模型发布 Seaweed模型邀测

推荐关键词

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

字节跳动发布豆包视频生成模型Seedance 2.5 预计7月初上线

2026-06-232.8万阅读

字节跳动视频生成模型Seedance 2.0宣布支持4K高分辨率

2026-06-232.6万阅读

豆包视频生成模型Seedance 2.5发布：原生直出翻倍至30秒

2026-06-232.4万阅读

从图文生成到视频生成：LIGHT NUTS一站式AI工具解析

2026-06-262.6万阅读

豆包音频生成模型1.0正式发布：一次性直出影视级的成品音效

2026-06-233.0万阅读

降低内容制作成本90%：LIGHT NUTS的图文与视频生成方案

2026-06-262.6万阅读

AI日报：豆包音频生成模型1.0发布；企业微信内测AI Agent大圆；Cursor发布全自主训练大模型

2026-06-242.6万阅读

蚂蚁灵波定义视频生成第二赛道，开源LingBot-Video，融合7万小时具身数据

2026-07-091.4万阅读

AI日报：火山引擎发布豆包Seedance2.5等模型；生数Vidu Q3上线华为云；百川智能发布M4 模型

2026-06-231.3万阅读

可灵AI估值千亿，快手“母凭子贵”：国产视频模型三强争霸

2026-07-132.8万阅读

如何提升AI生成3D模型的可用性？企业为什么需要系统化布局

2026-07-061.5万阅读

豆包视频通话背后，火山引擎重构 Agent 时代多模态传输底座

2026-07-155906阅读

从生成到交付，音视频 Agent 要有生产级开发套件

2026-07-021.8万阅读

小米发布并开源Xiaomi-Robotics-U0：380亿参数具身生成大模型！生成效率提升83倍

2026-07-154501阅读

豆包图像创作模型Seedream 5.0 Pro发布：随手画出精美设计图

2026-06-232.0万阅读

AI3D模型生成会出现结构不完整吗？会，但大多能通过流程控制降到可用范围

2026-07-063465阅读

蚂蚁灵波世界模型2.0正式发布！两大首创：小时级实时生成+Agent实时“陪玩”

2026-07-091.1万阅读

当大模型公司开始造手机

2026-07-172.4万阅读

苹果研发AI模型压缩技术：把270亿参数大模型装进iPhone

2026-07-155629阅读

AI日报：MiniMax Code 2.0桌面端发布；Kimi K3模型预热视频流出；通义千问正式接入苹果生态

2026-07-164679阅读