新的人工智能策略使机器人能够快速适应现实世界环境


送货服务或许能够克服雪、雨、热和夜晚的阴霾 , 但一种新型的有腿机器人也不甘落后 。由加州大学伯克利分校、Facebook 和卡内基梅隆大学的一组研究人员开发的人工智能算法正在为腿式机器人配备增强的实时适应和导航陌生地形的能力 。
他们的测试机器人成功地穿越了沙子、泥泞、远足小径、高草和泥土堆而没有摔倒 。在适应被扔在顶部的加重背包或滑溜、油滑的斜坡方面 , 它的表现也优于其他系统 。当走下台阶并爬过成堆的水泥和鹅卵石时 , 它分别达到了 70% 和 80% 的成功率 , 鉴于缺乏模拟校准或先前在不稳定环境中的经验 , 这仍然是一项令人印象深刻的壮举 。
机器人不仅可以适应新环境 , 而且还可以在几分之一秒内完成 , 而不是几分钟或更长时间 。这对于现实世界中的实际部署至关重要 。
【新的人工智能策略使机器人能够快速适应现实世界环境】研究团队将于下周在2021 年机器人:科学与系统 (RSS) 会议上展示新的人工智能系统 , 称为快速运动适应 (RMA)。
“我们的见解是变化无处不在 , 所以从第一天起 , RMA 政策就假设环境将是新的 , ”研究首席研究员 Jitendra Malik 说 , 他是加州大学伯克利分校电气工程和计算机科学系的教授 , 也是加州大学伯克利分校的研究科学家 。Facebook 人工智能研究 (FAIR) 小组 。“这不是事后的想法 , 而是事前的想法 。那是我们的秘方 。”
以前 , 腿式机器人通常会针对它们可能遇到的环境条件进行预编程 , 或者通过计算机模拟和手动编码策略的混合来指导它们的行为 。这可能需要数百万次试验——和错误——并且仍然达不到机器人在现实中可能面临的情况 。
“计算机模拟不太可能捕捉到一切 , ”主要作者、加州大学伯克利分校的博士 Ashish Kumar 说 。马利克实验室的学生 。“我们支持 RMA 的机器人对以前看不见的环境表现出很强的适应能力 , 并且完全通过与周围环境互动和从经验中学习来学习这种适应能力 。那是新的 。”
RMA 系统将基本策略(机器人确定如何移动的算法)与自适应模块相结合 。基本策略使用强化学习来开发对环境中的外在变量集的控制 。这是在模拟中学习的 , 但仅凭这一点还不足以让有腿机器人为现实世界做好准备 , 因为机器人的板载传感器无法直接测量环境中所有可能的变量 。为了解决这个问题 , 适应模块指示机器人使用基于其自身身体运动的信息自学周围环境 。例如 , 如果机器人感觉到它的脚伸得更远 , 它可能会推测它所处的表面是柔软的 , 并会相应地调整它的下一个动作 。
基本策略和适配模块以不同频率异步运行 , 这使得 RMA 只需使用小型机载计算机即可稳健运行 。

    推荐阅读