站长之家 - 业界 2025-12-17 15:37

腾讯混元世界模型1.5发布!开源业界最全面实时世界模型框架

12月17日,腾讯旗下混元系列产品迎来重要更新。其最新发布的世界模型1.5版本,允许用户通过输入文字描述或图片,快速构建出专属的、可交互的动态场景。

在该模型构建的场景中,用户能够通过键盘、鼠标或手柄等设备,实时控制观察视角的移动与转向,从而获得类似探索开放世界游戏般的沉浸式体验。

腾讯混元世界模型1.5发布

腾讯发布新一代世界模型技术框架

此次发布的技术框架,被业界视为目前覆盖链路最为完整的实时世界模型解决方案之一。该框架公开了从数据处理、模型训练到流式推理部署的全套环节,并整合了多项创新算法,包括重构记忆力机制、长上下文信息蒸馏以及基于三维空间的自回归扩散模型强化学习模块。

据悉,新版本模型主要聚焦于三大技术特性的提升:

  • 实时交互生成:通过独创的上下文约束蒸馏方案与流式推理优化,模型能够以每秒24帧的速率生成720P高清动态画面。
  • 长序列三维一致性:借助重构记忆机制,模型在生成长达数分钟的内容时,能保持场景几何结构的稳定与连贯,为构建高质量三维空间模拟环境提供了基础。
  • 多样化交互支持:该模型能够适配多种不同风格的游戏或现实场景,支持第一人称与第三人称视角切换,同时具备通过实时文本触发事件以及动态视频续写等功能。

技术资料显示,该模型的核心基于名为WorldPlay的自回归扩散模型架构。它采用下一帧预测的视觉自回归任务进行训练,旨在实现长序列内容中几何结构的一致性与实时交互的流畅性,这一直是相关技术领域面临的关键挑战。

推荐关键词

24小时热搜

查看更多内容

大家正在看