站长之家 - 业界 2023-07-28 09:11

伦敦帝国理工学院和 DeepMind联合设计AI框架 统一强化学习智能体

站长之家(ChinaZ.com)7月28日 消息:伦敦帝国理工学院和 DeepMind 的研究人员设计了一个 AI 框架,将语言作为强化学习智能体的核心推理工具。

该框架利用了大型语言模型和视觉语言模型,能够有效解决强化学习中的几个基本问题,包括在奖励稀疏环境中的高效探索、顺序学习中的数据重用、新任务的能力调度以及从专家智能体的观察中学习。

人工智能 AI 数字人

该框架通过使用语言模型和视觉语言模型作为基本推理工具,提高了强化学习智能体在理解复杂任务和环境中的能力。研究结果表明,语言模型和视觉语言模型可以有效地成为强化学习智能体推理的核心组件。

image.png

论文地址:https://arxiv.org/abs/2307.09668

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看