站长之家 - 业界 2024-06-07 09:20

媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频

站长之家(ChinaZ.com) 6月7日消息:昨天，快手公司推出了一款名为「可灵」的全新视频生成大模型，该模型采用了与Sora相似的技术路线，并结合了快手自研的多项技术创新。这款模型不仅能够生成长达2分钟、30fps、1080p分辨率的超长视频，支持多种宽高比，还能模拟物理世界的特性，精准建模复杂运动。

QQ截图20240607094153.jpg

亮点:

1、生成能力强大:

支持长达2分钟的30fps高清视频生成，分辨率高达1080p。

支持多种宽高比，包括竖版视频，非常适合快手的短视频生态。

2、运动和物理模拟:

准确刻画复杂、大幅度的运动，如公路上奔跑的老虎、宇航员在月球上行走等。

能够模拟物理特性，如重力、液体流动和光学反射等，生成的画面更符合真实物理规律。

3、应用场景广泛:

从娱乐到教育，可灵的应用场景广泛。

支持文本转视频、多种控制信息输入、以及丰富的内容控制能力。

「可灵」大模型够准确刻画复杂、大幅度的时空运动，如公路上高速奔跑的老虎，画面连贯，动作协调，甚至奔跑过程中躯干的抖动也得到了细致展现。它还能模拟真实物理世界的特性，比如倒牛奶时的重力规律和液面上升，以及光学上的反射规律。此外，「可灵」还能真实反映与真实物理世界的交互，如小男孩吃汉堡时齿印的变化等。

以下是官方发布的视频案例及提示词：

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

prompt:一名宇航员在月球表面奔跑，低角度镜头展现了月球的广阔背景，动作流畅且显得轻盈

一只戴着眼镜的兔子在看报纸

厨师正在切菜

一只蓝色的鹦鹉

技术特点

1、原生视频生成技术:

采用类似Sora的DiT结构，用Transformer代替传统的卷积网络U-Net。

3D VAE网络用于时空同步压缩，提高重建质量和训练性能。

3D Attention机制用于时空建模，提升复杂时空运动的建模能力。

2、高质量数据支持:

构建了完备的标签体系，对训练数据进行精细化筛选和分布调整。

专用的视频描述模型生成精确、详尽的结构化视频描述，提升模型的文本指令响应能力。

3、高效训练策略:

使用分布式训练集群和优化策略提高运算效率。

分阶段训练策略:初期低分辨率阶段侧重数量，后期高分辨率阶段侧重质量，确保模型在各阶段的优化。

实际应用

1、快影APP:

可灵大模型已在快影APP中开启邀测，当前版本支持生成720P视频，竖版视频生成能力即将开放。

2、其他应用:

“AI舞王”:上传全身照，生成人物跟随音乐跳舞的视频。

“AI唱跳”:生成跳舞并唱歌的视频。

未来还将推出图生视频功能。

快手在大模型技术方面动作迅速，与多个高校或科研机构合作发布了多项关键技术，为「可灵」大模型积累了深厚的技术沉淀。现在，快手的文生视频功能已正式亮相，期待其在短视频场景中的应用落地。

对AI视频创作感兴趣的用户，可以在快影APP中体验「可灵」大模型的功能。

体验方法：快影 APP-AI 玩法-AI 视频生成中申请。

官网地址：https://top.aibase.com/tool/kelingdamoxing

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频

推荐关键词

24小时热搜

大家正在看

AI视频生成的2024，Sora务虚、即梦和可灵务实

可灵AI推出创意特效、可控生图新功能助力玩转趣味内容创作

AI日报：字节豆包大模型1.5Pro发布；可灵AI推多图参考功能；微信秒剪新增多项AI功能；特朗普启动“星际之门”AI计划

伊利、恰恰、娃哈哈......今天头条留给它们

AI“硬控”拜年

盘点年度AI假新闻：山寨的AI顶流们，骗了爸妈一整年

AI霸屏的第二年，硅谷大佬们都Pick哪些AI产品？

周鸿祎参演AI短剧开拍纳米AI搜索节约大量拍摄成本

我们需要什么样的AI搜索？

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUX Pro微调API可定制AI模型

登顶全球AI生图榜首 “国货之光”SeaArt AI超越MJ

DeepSeek带动AI搞钱热潮？我们总结了用AI做副业的几个方向

中国AI硬件，正在占领CES

颠覆传统！谷歌搜索测试AI模式：第一页完全由AI生成

岩山科技：位列胡润AI企业榜第7名，AI创新实力获肯定

国产AI「快」到火爆外网！10秒生成一个视频，网友：我见过最快的AI

一个行业的AI样板：教培的不同环节怎么被改写

用AI搞钱，春节狂赚10万

AI创作的“开放世界”，来了

AI最靠谱的用处，混霸王餐

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

媲美Sora？快手文生视频模型可灵开放测试 更懂物理，最长可生成2分钟视频

推荐关键词

24小时热搜

大家正在看

AI视频生成的2024，Sora务虚、即梦和可灵务实

可灵AI推出创意特效、可控生图新功能 助力玩转趣味内容创作

AI日报：字节豆包大模型1.5Pro发布；可灵AI推多图参考功能；微信秒剪新增多项AI功能；特朗普启动“星际之门”AI计划

伊利、恰恰、娃哈哈......今天头条留给它们

AI“硬控”拜年

盘点年度AI假新闻：山寨的AI顶流们，骗了爸妈一整年

AI霸屏的第二年，硅谷大佬们都Pick哪些AI产品？

周鸿祎参演AI短剧开拍 纳米AI搜索节约大量拍摄成本

我们需要什么样的AI搜索？

AI日报：字节豆包全新上线AI编程功能；腾讯大模型检测工具打假AI；FLUX Pro微调API可定制AI模型

登顶全球AI生图榜首 “国货之光”SeaArt AI超越MJ

DeepSeek带动AI搞钱热潮？我们总结了用AI做副业的几个方向

中国AI硬件，正在占领CES

颠覆传统！谷歌搜索测试AI模式：第一页完全由AI生成

岩山科技：位列胡润AI企业榜第7名，AI创新实力获肯定

国产AI「快」到火爆外网！10秒生成一个视频，网友：我见过最快的AI

一个行业的AI样板：教培的不同环节怎么被改写

用AI搞钱，春节狂赚10万

AI创作的“开放世界”，来了

AI最靠谱的用处，混霸王餐

媲美Sora？快手文生视频模型可灵开放测试更懂物理，最长可生成2分钟视频

可灵AI推出创意特效、可控生图新功能助力玩转趣味内容创作

周鸿祎参演AI短剧开拍纳米AI搜索节约大量拍摄成本