站长之家 - 业界 2024-12-03 16:03

迄今视频开源模型!腾讯混元文生视频上线:一句话生成视频

<a href="//m.chinaz.com/tags/tengxun.shtml" target="_blank">腾讯</a><a href="//m.chinaz.com/tags/806757.shtml" target="_blank">混元大模型</a>突破:一句话生成视频

腾讯混元大模型再创先河:文生视频功能震撼登场

腾讯混元大模型今日迎来重大更新,隆重推出文生视频功能。这项革命性技术只需一句文字指令,即可生成令人惊叹的视频内容。

行业领先的视频生成模型

此次发布的视频生成大模型拥有130亿的参数量,使其成为目前业界规模最大的开源视频模型。该模型已在Hugging Face平台和Github上公开发布,包含模型权重、推理代码和完整算法,供企业和个人开发者免费使用和开发生态插件。

便捷的接入方式

用户可以通过腾讯元宝APP中的AI视频功能提交试用申请。企业客户可通过腾讯云提供服务接入,API同步开放内测申请。

腾讯混元文生视频:一句话生成视频

多功能视频生成

腾讯混元视频生成大模型支持中英文双语输入,可生成多种视频尺寸和清晰度。

卓越的视频质量

该模型能够生成超写实的高品质视频,即使在大动作场景(如冲浪、跳舞)中,画面也能保持自然合理,不易变形。此外,镜面反射动作和光影效果也高度符合物理规律。

创新的架构设计

腾讯介绍称,腾讯混元视频生成大模型采用了DiT架构,并进行了多项架构升级。新一代文本编码器增强了语义理解能力,使模型能够准确遵循指令,生成更细节丰富的画面。

先进的图像视频混合VAE(3D变分编码器)显著提升了细节表现,特别是在小人脸和高速镜头场景中。

推荐关键词

24小时热搜

查看更多内容

大家正在看

大模型拿单江湖