划重点:
1. 💡 研究人员提出了一种低成本的整体远程操作系统,名为 Mobile ALOHA,用于收集关于整体远程操作的数据。
2. 💡 Mobile ALOHA 通过将其放在轮式底座上,扩展了原始 ALOHA 的功能,使其具有移动能力。
3. 💡 研究人员使用静态 ALOHA 数据集进行模仿学习,通过预训练和联合训练,实现了在移动操作任务中的良好性能。
站长之家(ChinaZ.com)1月11日 消息:研究人员从斯坦福大学对使用模仿学习进行整体远程操作的任务进行了研究。然而,这种方法在许多日常情况下需要整体远程操作的协调,包括移动和灵巧操作,而不仅仅是单个的移动或操作行为。
这项研究解决了在实现双臂移动操作的模仿学习中的两个关键问题。首先,他们引入了一种名为 Mobile ALOHA 的整体远程操作系统,该系统成本低廉,并设计用于收集双臂移动操作的数据。通过将 Mobile ALOHA 放置在轮式底座上,用户可以在物理连接状态下通过推动车轮来使底座移动,从而实现底座的独立移动,同时用户可以双手控制 ALOHA。研究人员通过同时记录手臂操作和底座速度数据来创建整体远程操作系统。
研究团队指出,通过简单地连接底座和手臂的动作,然后进行直接模仿学习,可以获得模仿学习中的出色表现。他们通过将移动底座的线性和角速度与 ALOHA 的14个自由度关节位置结合起来,创建了一个16维动作向量。这种表达方式几乎不需要实现改变,使得 Mobile ALOHA 能够直接受益于之前的深度模仿学习方法。
研究人员指出,目前几乎没有可用的双臂移动操作数据集。然而,受到在各种机器人数据集上进行预训练和联合训练以进一步提高模仿学习性能的最近成功的启发,他们开始使用静态双臂数据集。具体而言,他们通过引入 RT-X 来使用静态 ALOHA 数据集,该数据集包含825个与 Mobile ALOHA 任务无关的活动,并且两只手臂分开安装。
尽管任务和形态上存在差异,但研究表明,在几乎所有移动操作任务中都可以实现积极的迁移,达到与仅使用 Mobile ALOHA 数据训练的策略相当或更高的性能和数据效率。此外,这一观察结果也适用于其他类别的最先进的模仿学习技术,如 Diffusion Policy 和 ACT。
这种模仿学习的结果对于许多复杂的活动也很有效,包括拉椅子、联系电梯、打开两门壁柜来存放沉重的烹饪锅,以及清理溢出的酒。每项任务只需50个人类示例,协同训练就可以让我们获得超过80% 的性能,与没有协同训练相比,平均绝对提高34%。
项目网址:https://mobile-aloha.github.io/