腾讯混元大模型再创先河:文生视频功能震撼登场
腾讯混元大模型今日迎来重大更新,隆重推出文生视频功能。这项革命性技术只需一句文字指令,即可生成令人惊叹的视频内容。
行业领先的视频生成模型
此次发布的视频生成大模型拥有130亿的参数量,使其成为目前业界规模最大的开源视频模型。该模型已在Hugging Face平台和Github上公开发布,包含模型权重、推理代码和完整算法,供企业和个人开发者免费使用和开发生态插件。
便捷的接入方式
用户可以通过腾讯元宝APP中的AI视频功能提交试用申请。企业客户可通过腾讯云提供服务接入,API同步开放内测申请。
多功能视频生成
腾讯混元视频生成大模型支持中英文双语输入,可生成多种视频尺寸和清晰度。
卓越的视频质量
该模型能够生成超写实的高品质视频,即使在大动作场景(如冲浪、跳舞)中,画面也能保持自然合理,不易变形。此外,镜面反射动作和光影效果也高度符合物理规律。
创新的架构设计
腾讯介绍称,腾讯混元视频生成大模型采用了DiT架构,并进行了多项架构升级。新一代文本编码器增强了语义理解能力,使模型能够准确遵循指令,生成更细节丰富的画面。
先进的图像视频混合VAE(3D变分编码器)显著提升了细节表现,特别是在小人脸和高速镜头场景中。