昨天刷屏的宇树B2W轮足机器人,给你各种上山下海,后空翻托马斯全旋无所不能的

真的不是郑小康 2024-12-24 11:26:57

昨天刷屏的宇树 B2W 轮足机器人,给你各种上山下海,后空翻托马斯全旋无所不能的感觉,其实背后的秘诀是用强化学习做的运动控制算法。

强化学习和一个人学骑自行车的路径很类似。一个不会骑自行车的人逐渐学会骑车,其实是一个排除错误骑法的过程,或者如果没有人辅助,基本上是摔了无数跤摔出来的过程。

强化学习也是一种通过「试错」来学习最优策略的机器学习方法,对于机器人运动控制来说,它允许机器人在仿真环境中不断尝试各种动作,不断试错,再通过奖励函数不断引导学习方向,逐渐学习到完成特定动作(比如后空翻或者跑酷)的最佳策略。

并且这整个过程在前期是在仿真环境里尝试的,当然后期上真机实操也还是免不了摔一些,但摔得少很多了。不像人类,学个骑车跑酷体操杂技,就只能硬摔了。[泪]

今天波士顿动力放出了 Atlas 后空翻的视频,因为穿了衣服,一度让人怀疑是人还是机器...其实这个工作宇树在今年 3 月展示过了。当然了因为过了 3 个季度,波士顿动力的姿态控制要好了很多。这两个视频也都是强化学习做的。

但无论宇树还是波士顿动力,目前大家做的都是运动控制算法,也就是人的小脑,还没涉及到大脑,这个大家能理解吧?也就是目前的机器人都是遥控器控制运行写好的算法,不是完全自主感知规划决策的算法。

0 阅读:35
真的不是郑小康

真的不是郑小康

感谢大家的关注