站长之家 - 业界 2025-11-21 16:30

腾讯混元发布全新视频生成模型:14G消费级显卡流畅运行 生成5-10秒高清视频

11月21日,腾讯混元团队宣布推出开源视频生成模型HunyuanVideo 1.5。该模型采用Diffusion Transformer架构,参数规模达8.3B,可生成5-10秒高清视频内容。

目前该模型已在"元宝"平台开放体验,用户可通过两种方式使用:输入文字描述直接生成视频,或上传静态图片配合文字描述转换为动态视频。

该模型全面支持中英文输入的文字生成视频与图片生成视频功能。

在图片生成视频方面,模型能保持视频内容与原始图像在色调、光影、场景布局等要素的高度一致性。

该工具展现出优秀的指令理解能力,可准确实现包括镜头运动、流畅动作、物理规律模拟、人物表情刻画等多种创作需求。

腾讯混元视频生成模型展示:支持消费级显卡运行,可生成5-10秒高清视频 元宝平台支持文字和图片生成视频功能

模型支持写实、动画、积木等多种视觉风格,并能在视频内容中嵌入中英文字幕,满足不同场景的内容创作需求。

在视频质量方面,可原生生成480p和720p分辨率视频,通过画质增强技术可进一步提升至1080p电影级画质。

与行业内通常需要50GB以上显存的主流视频生成模型相比,

HunyuanVideo 1.5实现了技术突破,仅需14G显存的消费级显卡即可流畅运行,大幅降低了使用门槛。

该模型通过多层次技术创新,在生成效果、运行效率和模型体积之间取得了良好平衡。

其采用的创新注意力机制配合多阶段训练策略,在运动连贯性、语义理解准确性等关键指标上已达到商业应用标准。

推荐关键词

24小时热搜

查看更多内容

大家正在看

长视频,要MCN化?

云南人,如何统治短视频?