站长之家 - 业界 2024-03-01 09:12

DeepMind推Genie模型,可用图像制作类似马里奥的游戏

**划重点:**

1. 🎮 Genie可以从图像中创建2D视频游戏,类似于流行的超级马里奥兄弟游戏。

2. 🌐 Genie是Generative Interactive Environments的缩写,通过在互联网视频上进行训练,能够从图像、视频甚至以前未见过的草图中创建可玩的场景。

3. 🤖 Google DeepMind认为Genie的生成模型对于处理各种AI任务的通用代理具有潜在影响,可能是通往AGI的一个垫脚石。

站长之家(ChinaZ.com)3月1日 消息:在Google DeepMind的最新研究中,他们推出了名为Genie的模型,该模型能够从图像中生成类似于超级马里奥兄弟游戏的2D视频游戏。Genie是Generative Interactive Environments的缩写,经过在互联网视频上的培训,它能够从图像、视频,甚至以前未见过的草图中创建可玩的游戏场景。

image.png

该模型不仅仅是一个有趣的AI模型,Google DeepMind认为它具有潜在的通用代理(Generalist Agents)影响,这是专为处理各种AI任务设计的AI系统。Genie的设计理念是通过学习从视频等媒体中提取的潜在动作,并将其转移到人工设计的环境中,从而实现对其他领域的应用,而无需额外的领域知识。

团队表示,Genie项目只是“刚刚触及未来可能性的表面”。该模型通过对其输入的20万小时的互联网视频进行训练,包括2D平台游戏(如超级马里奥)和机器人数据(RT-1)。尽管互联网视频通常没有标签,但它学到了细粒度的控制,包括可控制输入的哪些部分,还能推断在生成的环境中一致的潜在动作。

Genie的体积达到了110亿参数,Google DeepMind将其称为“基础世界模型” - 一个从世界运作中学习的系统。Genie能够从观看数千个互联网视频中学到动作,理解像跳跃这样的动作,并将其应用于类似游戏的环境中。与人类从视频中学习的方式相似,Genie也能理解人类绘制的草图,并将其转化为类似游戏的表现形式。

对于Genie模型是否将提供给公众,或者是否会在未来的Google产品中应用,目前尚无消息。但感兴趣的读者可以在Genie展示页面上查看示例生成。这一创新展示了深度学习在创造性领域的潜在应用,也许为实现通用人工智能迈出了一步。

Genie论文网址:https://arxiv.org/pdf/2402.15391.pdf

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看

Kimi向Open AI发起冲击