开发机器学习新方法，使机器人控制更容易

　　麻省理工学院和斯坦福大学的研究人员设计了一种新的机器学习方法，可用于在条件可能快速变化的动态环境中更有效地控制机器人，如无人机或自动驾驶汽车。

　　这种技术可以帮助自动驾驶汽车学会补偿湿滑的路况以避免打滑，允许机器人自由飞行器在太空中拖曳不同的物体，或者让无人机在受到强风吹袭的情况下仍能紧紧跟随下坡滑雪者。

　　新的机器学习方法将控制理论中的某些结构纳入学习模型的过程中，从而产生一种控制复杂动态的有效方法，例如由风对飞行器轨迹的影响。将这种结构视为提示的一种方式，有助于指导如何控制系统。

　　利用新学习模型中的这种结构，研究人员可以立即从模型中提取有效的控制器，而其他机器学习方法则需要通过额外的步骤单独推导或学习控制器。新方法还能比其他方法使用更少的数据来学习有效的控制器。这有助于他们基于学习的控制系统在快速变化的环境中更快地实现更好的性能。

　　“这项工作试图在识别系统中的结构和从数据中学习模型之间取得平衡，”该项研究的论文主要作者，斯坦福大学研究生Spencer M. Richards说，“我们的方法受到机器人专家如何使用物理学为机器人推导出更简单模型的启发。对这些模型的物理分析通常会产生一个有用的控制结构——如果你只是试图天真地将模型拟合到数据中，你可能会错过这个结构。相反，我们尝试从指示如何实现控制逻辑的数据中识别出类似的有用结构。”

　　学习控制器

　　确定控制机器人完成给定任务的最佳方法可能是一个难题，即使研究人员知道如何对系统的所有内容进行建模。

　　例如，控制器是使无人机能够遵循所需轨迹的逻辑。该控制器将告诉无人机如何调整其旋翼力以补偿风的影响，风可能会将其从稳定的路径上撞到到达目标。

　　这架无人机是一个动态系统——一个随着时间的推移而演变的物理系统。在这种情况下，它在环境中飞行时，位置和速度都会发生变化。如果这样的系统足够简单www.cechina.cn，工程师可以手动推导出控制器。

　　但通常系统太复杂，无法手动精确建模。Richards解释说，空气动力学效应，就像旋转的风推动飞行器的方式一样，是出了名的难以手动推导。相反，研究人员会随着时间的推移测量无人机的位置、速度和转子速度，并使用机器学习将这个动态系统的模型拟合到数据中。但这些方法通常不会学习基于控件的结构。这种结构有助于确定如何最好地设置旋翼速度以指导无人机随时间推移的运动。

　　一旦他们对动态系统进行了建模，许多现有方法还可以使用数据来学习系统的单独控制器。“其他试图将动力学和控制器作为独立实体从数据中学习的方法，在哲学上有点脱离我们通常为较简单系统所采用的方法。我们的方法更像是从物理学中手工推导出模型，并将其与控制联系起来。”Richards说。

　　识别模型的结构

　　麻省理工学院和斯坦福大学的团队开发了一种技术，该技术使用机器学习来学习动力学模型，但学习的方式是使模型具有一些对控制系统有用的规定结构。

　　通过这种结构，他们可以直接从动力学模型中提取控制器，而不是使用数据为控制器学习一个完全独立的模型。

　　当他们测试这种方法时，他们的控制器紧跟所需的轨迹，其表现超过了所有基线方法。从他们学习的模型中提取的控制器几乎与地面实况控制器的性能相匹配，后者是使用系统的精确动力学构建的。

　　“通过做出更简单的假设，我们得到了一些实际上比其他复杂的基线方法更有效的东西。” Richards说。

　　研究人员还发现，他们的方法具有数据效率高的特点，这意味着即使数据很少，也能实现很高的性能。例如，只需使用 100 个数据点，它就能有效地为高度动态的转子驱动车辆建模。而使用多个学习组件的方法，在数据集较小的情况下，性能下降得更快。

　　在无人机或机器人需要在瞬息万变的条件下快速学习时，这种高效率使他们的技术特别有用。

　　此外www.cechina.cn，他们的方法具有通用性，可应用于多种类型的动态系统，从机械臂到在低重力环境中工作的自由飞行航天器等。

　　Richards说，研究人员致力于在未来开发出在物理上更易于解释的模型，这些模型将能够识别有关动态系统的非常具体的信息。这样就能开发出性能更好的控制器。

AI 视觉与传统机器视觉：制造商为何要转向基于AI的质量控制？

【CEC观察】和利时新近发布的XMagital，究竟是个啥？

AI 算力爆发！ifm 浸没槽冷却技术如何攻克数据中心散热难题？

图说工控

频道推荐

在线研讨会

关于我们

CE全球

网站地图

新闻中心

子站

技术频道

社区

社区

联系我们

友情链接