用户中心

资讯 > 自动化软件

开发机器学习新方法,使机器人控制更容易

www.cechina.cn2023.08.09阅读 5145

  
  麻省理工学院和斯坦福大学的研究人员设计了一种新的机器学习方法,可用于在条件可能快速变化的动态环境中更有效地控制机器人,如无人机或自动驾驶汽车。
  这种技术可以帮助自动驾驶汽车学会补偿湿滑的路况以避免打滑,允许机器人自由飞行器在太空中拖曳不同的物体,或者让无人机在受到强风吹袭的情况下仍能紧紧跟随下坡滑雪者。
  新的机器学习方法将控制理论中的某些结构纳入学习模型的过程中,从而产生一种控制复杂动态的有效方法,例如由风对飞行器轨迹的影响。将这种结构视为提示的一种方式,有助于指导如何控制系统。
  “我们工作的重点是学习系统动力学中的内在结构,以用来设计更有效、更稳定的控制器。” 麻省理工学院机械工程系和数据、系统与社会研究所(IDSS)助理教授、信息与决策系统实验室(LIDS)成员Navid Azizan说,“通过从数据中共同学习系统的动态和这些独特的面向控制的结构,我们能够自然而然地创造出在现实世界中更有效运行的控制器。”
  利用新学习模型中的这种结构,研究人员可以立即从模型中提取有效的控制器CONTROL ENGINEERING China版权所有,而其他机器学习方法则需要通过额外的步骤单独推导或学习控制器。新方法还能比其他方法使用更少的数据来学习有效的控制器。这有助于他们基于学习的控制系统在快速变化的环境中更快地实现更好的性能。
  “这项工作试图在识别系统中的结构和从数据中学习模型之间取得平衡,”该项研究的论文主要作者,斯坦福大学研究生Spencer M. Richards说,“我们的方法受到机器人专家如何使用物理学为机器人推导出更简单模型的启发。对这些模型的物理分析通常会产生一个有用的控制结构——如果你只是试图天真地将模型拟合到数据中,你可能会错过这个结构。相反,我们尝试从指示如何实现控制逻辑的数据中识别出类似的有用结构。”
       
  学习控制器
  确定控制机器人完成给定任务的最佳方法可能是一个难题,即使研究人员知道如何对系统的所有内容进行建模。
  例如,控制器是使无人机能够遵循所需轨迹的逻辑。该控制器将告诉无人机如何调整其旋翼力以补偿风的影响,风可能会将其从稳定的路径上撞到到达目标。
  这架无人机是一个动态系统——一个随着时间的推移而演变的物理系统。在这种情况下,它在环境中飞行时CONTROL ENGINEERING China版权所有,位置和速度都会发生变化。如果这样的系统足够简单,工程师可以手动推导出控制器。
  手工建模从本质上捕捉到了基于系统物理的某种结构。例如,如果使用微分方程对机器人进行手动建模,就可以捕捉到速度、加速度和力之间的关系。加速度是速度随时间的变化率www.cechina.cn,由机器人的质量和作用力决定。
  但通常系统太复杂,无法手动精确建模。Richards解释说,空气动力学效应控制工程网版权所有,就像旋转的风推动飞行器的方式一样控制工程网版权所有,是出了名的难以手动推导。相反,研究人员会随着时间的推移测量无人机的位置、速度和转子速度,并使用机器学习将这个动态系统的模型拟合到数据中。但这些方法通常不会学习基于控件的结构。这种结构有助于确定如何最好地设置旋翼速度以指导无人机随时间推移的运动。
  一旦他们对动态系统进行了建模,许多现有方法还可以使用数据来学习系统的单独控制器。“其他试图将动力学和控制器作为独立实体从数据中学习的方法,在哲学上有点脱离我们通常为较简单系统所采用的方法。我们的方法更像是从物理学中手工推导出模型,并将其与控制联系起来。”Richards说。
  识别模型的结构
  麻省理工学院和斯坦福大学的团队开发了一种技术,该技术使用机器学习来学习动力学模型,但学习的方式是使模型具有一些对控制系统有用的规定结构。
  通过这种结构,他们可以直接从动力学模型中提取控制器,而不是使用数据为控制器学习一个完全独立的模型。
  “我们发现,除了学习动力学之外,学习支持有效控制器设计的面向控制的结构也很重要。我们学习与状态相关的动力学系数因式分解的方法,在数据效率和跟踪能力方面都优于基线方法,证明它能成功地有效控制系统的轨迹。”Azizan说。
  当他们测试这种方法时,他们的控制器紧跟所需的轨迹,其表现超过了所有基线方法。从他们学习的模型中提取的控制器几乎与地面实况控制器的性能相匹配,后者是使用系统的精确动力学构建的。
  “通过做出更简单的假设,我们得到了一些实际上比其他复杂的基线方法更有效的东西。” Richards说。
  研究人员还发现,他们的方法具有数据效率高的特点,这意味着即使数据很少,也能实现很高的性能。例如,只需使用 100 个数据点,它就能有效地为高度动态的转子驱动车辆建模。而使用多个学习组件的方法,在数据集较小的情况下,性能下降得更快。
  在无人机或机器人需要在瞬息万变的条件下快速学习时,这种高效率使他们的技术特别有用。
  此外,他们的方法具有通用性,可应用于多种类型的动态系统,从机械臂到在低重力环境中工作的自由飞行航天器等。
  Richards说,研究人员致力于在未来开发出在物理上更易于解释的模型,这些模型将能够识别有关动态系统的非常具体的信息。这样就能开发出性能更好的控制器。
       
版权声明:版权归控制工程网所有,转载请注明出处!

频道推荐

关于我们

控制工程网 & CONTROL ENGINEERING China 全球工业控制、自动化和仪器仪表领域的先锋媒体

CE全球

联系我们

商务及广告合作
任小姐(北京)                 夏小姐(上海)
电话:010-82053688      电话:18616877918
rendongxue@cechina.cn      xiashuxian@cechina.cn
新闻投稿:王小姐

关注我们的微信

关于我们 | 网站地图 | 联系我们
© 2003-2020    经营许可编号:京ICP证120335号
公安机关备案号:110102002318  服务热线:010-82053688